随着时代的发展,制药业正在经历翻天覆地的变化。2018年,一部现实主义电影《我不是药神》让仿制药的话题引起了人们的关注。让我们来看看一组原始的研究数据,根据PharmaIntelligence根据公司在2021年提供的报告,在过去的十年里,只有不到10%的药物能够顺利完成临床实践I,II,III期间实验,并在NDA/BLA后来获准上市。
那么,作为仿制药的对象,原研究药物的重点是什么呢?原研发工作风险巨大,投资时间长,投资成本高,所以所谓的行业流传“双十定律”也就是说,制药企业在开发创新药物时,通常需要花费超过10亿$,开发周期往往需要十年甚至更长的时间,从药物设计到临床实验,再到申请上市。
也正因此,大量制药企业正在期待利用计算机辅助药物设计,降低研发成本、缩短研发周期,并最终提高成功率。
数字技术加速新药研发
药物的研发一般起始于药物探索与发现,随后进行临床前研究与临床实验,在成功后进行相关审批,通过审批的药物则可以进入商业化生产与药物销售流通环节。在药物探索阶段,靶点的发现可谓至关重要,如果靶点不是创新的,这便不能被称作一款真正意义上的创新药。为此,很多制药企业选择与国内知名的转化医学中心进行合作,进行临床数据挖掘与生物信息分析。
早在2017年,瑞金医院国家转化医学研究中心已经开始着手打造一个集存、传、算、用(即:数据存储、数据传输、数据分析计算和数据的整合应用)为一体的定制化高密度计算平台——ASTRA。
ASTRA拥有4000个CPU计算核心,存储系统为总容量10PB的高性能并行文件存储系统,同时配备了200GB的HDR IB网卡以及15 PetaFLOPS的AI计算能力。其采用的第三代英特尔® 至强® 可扩展处理器更适用于需要兼顾生产和科研的平台,能够灵活满足相关需求。同时,借助英特尔开发的DAOS(Distributed Asynchronos Object Storage,分布式异步对象存储)开源文件系统,使得瑞金医院的ASTRA系统能够突破存储瓶颈,充分发挥性能,满足实时、高频和高效的数据访问和处理需求。
借助这一平台,瑞金医院针对某基因组的变异分析耗时和某肿瘤全基因组分析的时长都大大降低。通过这样的提升,此前的很多医学设想也得以照进现实。
在瑞金医院的技术应用实践之外,借助AlphaFold2与GROMACS,科学计算在转化医学和新药研发等领域的关键性驱动作用也愈发明显。前者是DeepMind提出的深度神经网络蛋白质形态预测方法,也被称为迄今为止准确度最高的蛋白质三维结构预测模型;后者则是一个分子动力学软件包,用于模拟设计新药物的蛋白质、脂质和核酸。这些模拟为研究人员提供了所需的生物大分子结构信息,以了解结构与功能关系,用于指导药物研发和设计过程。基于显著提升了人工智能与深度学习性能的第三代英特尔® 至强® 可扩展处理器,辅以英特尔AI套件的转换与优化,上述工具突破性地实现了23倍的性能提升,每日可预测的蛋白质长度从4.56大幅提升至105.35,这也意味着药物研发的试错过程能够被显著缩短。因此,这一进步也在医药行业大分子药物研究领域产生了不小的震动。
而在小分子药物的发现中,以晶泰科技为代表的本土研发团队则更有发言权——借助阿里云第七代云服务器ECS的计算单元,以及英特尔® oneAPI提供的编译器数学库和优化能力,包括GATK,NAMD,LAMMPS,RELION和GROMACS在内的诸多生命科学领域的前沿应用运行速度大幅度提升,部分增长高达60%以上,结构晶体预测与碳化合物构成的研究变得更加容易。对于晶泰科技们而言,这有助于研究人员更有效地设计和评估新药,并能够显著节约资源。
化解隐私安全疑虑
当一种药物的靶点和化合物,包括化合物优化完成后,新药就已具雏形。不过距离来到患者手中,它还要经历六到七年的临床试验阶段。在临床药物试验过程中,第三代英特尔® 至强® 可扩展处理器的一种独特安全技术——英特尔® 软件防护扩展(SGX)——也在简化和加速流程方面发挥着重要作用。
英特尔® 软件防护扩展(SGX)的核心是一组指令,可提高应用代码和数据的安全性,从而为它们提供更好的保护,以防止泄露或修改。
2020年7月,国家药品监督管理局发布了《新冠肺炎疫情期间药物临床试验管理指导原则(试行) 》,这意味着通过远程智能的临床实验,患者可以足不出户,通过冷链配送获取药物,同时利用可穿戴设备完成数据的采集与上传。在这种情况下,保护患者隐私与数据安全就可能形成一个巨大的技术挑战。
但现在,情况出现了转机。英特尔® 软件防护扩展(SGX)能在CPU的支持下,在内存等特定硬件环境中构建出一个可信安全的飞地。这种飞地独立于操作系统、虚拟机以及BIOS系统之外,也就是说,即便这些比客户应用程序更底层的基础软件或系统在恶意攻击中沦陷,由英特尔® 软件防护扩展(SGX)技术生成的飞地也可以通过基于硬件的、增强型的安全防护更有效地阻断这些攻击,尽力避免其中的数据或代码被窃取或篡改。这有助于确保数据完整性和隐私,提供了在各方之间安全共享私有信息的工具,并创建一个协作、实时的临床信息系统。而基于这一加密计算能力,阿里云ECS安全增强通用型g7t服务器持信息以更快、更安全的方式进行共享和验证,相关治疗方法可以更快地提供给有需求的人。
算力加速新药落地
多年之后,终于来到新药上市前的生产与流通环节,算力也在持续提供着加速。
如今,制药企业可以利用机器视觉替代检测人员,不仅减少了在整个生产环节的人工成本,更提升了检测的准确率与效率。目前,通过阿里云与英特尔等公司的合作,此类应用已经在部分企业率先落地。经过简单模型与复杂特征的多重训练后,机器视觉与人工标注的一致率已经高达98.879%。
而在最终的药物流通上,数据仍然蕴含着大量亟待挖掘的价值。因此,大量的AI算法应运而生,药物需求的预测正在成为可能。凭借第三代英特尔® 至强® 可扩展处理器强大的AI加速能力,以及英特尔在边缘计算上的全面布局,药物流通行业的参与者们也得以乘上数字化转型的东风,通过边缘实时的计算进行更精准的预测,从而制订更科学合理的药物销售与存储策略。
工具的极大丰富与快速迭代使医疗机构与制药企业从数字技术中获得强大的助推力。借助算力与算法诞生的颗颗新药,也正在为人类的健康提供更坚实的守卫。