回顾 | AI加速新药研发新思路

长久以来,成本高、风险大、周期长是药物研发领域无法回避的挑战。尽管困难重重,但幸运的是,人类已在这一领域积累了丰富的知识和数据。在科技高速发展的当下,AI技术正逐渐成为一种新的解决方法,尝试改进医药研发面临的困境。

7月4日,望石智慧创始人&CEO周杰龙先生受邀出席由中国IT社区CSDN在线举办的2020 AI开发者大会(AI ProCon 2020),分享了望石智慧利用 AI技术加速药物研发的新思路,以及推动应用落地的具体实践方法。本文整理了直播中的重点摘要内容,希望能借助AI的力量,让更多的疾病有药可医。

数据、算法与系统架构有效整合,实现精准药物设计

Tufts研究中心的数据显示,研发一种新药的平均耗时高达12年,平均耗费高达26亿美元。如何提高效率,降低成本和失败率?这是业界当前共同面对的难题。

“当低成本的实验过程越能精准预测高成本的实验过程的时候,整体的效率就会越高。”在周杰龙看来,AI技术可以在药物研发早期阶段,通过精准预测药物分子,加速新药研发漫长之路,降低高成本的动物实验和人体试验阶段的失败率。

在这一过程中,最关键的技术目标是要形成一个能够与药物设计科学家交互并能精准预测的AI设计“大脑”。望石智慧在实践中不断探索总结,认为数据、算法和系统架构是构成“大脑”中最重要的三个组成部分。其中,数据相当于血液,源源不断的数据输入持续刷新“大脑”的认知能力,单一算法针对数据单一或者多个特征的学习构成特定的预测模型,而系统架构则要将若干个精准的模型有机的整合才能形成一个完整药物分子问题的思考回路。

在这里,数据是指结构化处理并清洗后的高质量的结构和生物活性,以及其他成药性数据的对应关系。目前,医药研发领域已积累了大量的数据,仅化合物数据库ChEMBL和ZINC15就达到了百万千万规模的级别。然而,如专利这样的开源数字化文件却并非结构化的数据,望石智慧很早就意识到高质量数据的重要性,从成立之初就拥有专业团队开发利用图像识别和NLP进行数据提取和清洗。

从算法角度可以看到,化学语言和自然语言之间有很多的相似之处。例如,成药分子常用的化学元素约为10个,可以类比为10个字母,原子构成基团,字母构成词。当计算机去处理语言时,也会先将句子进行分词,进一步训练获得词的向量,再通过分析向量来得到分子语义内在的关系。因此,望石智慧可以根据数据特征,做到对分子指纹等子模型的精准预测。 

系统架构则基于大量的统计学和专家验证反复摸索中搭建,而并非简单几个子模型预测指数的加和。例如,药物设计中的骨架跃迁过程需要用一个系统来实现的,要先用生成模型去生成新的分子,但新分子的生成可以有很多的生成模型可以使用,比如VAE、GAN、增强学习等。

由此可见,通过数据、算法与系统架构的有效整合,AI可以有效输出和预测人类基于“大脑”储备特征的提问,从而实现精准药物设计。

推动AI应用落地,两大产品覆盖药物早期研发流程

基于AI技术及融合药物化学、计算化学、计算生物学等知识,望石智慧目前已构建了面向小分子新药发现的智能化药物分子设计及知识图谱两大平台。

其中,智能化分子设计平台可为药物化学专家提供基于骨架的全新分子生成和推荐功能、基于属性的分子优化功能,以更快的速度、更低的成本推荐出最优候选药物分子,目前已在学术界和工业界推广使用。

“一个分子可以认为是由骨架和药效团两部分构成,类似于树干和树枝的关系。在药物设计中,对树干部分进行改变,可以看作为骨架跃迁。”周杰龙介绍,医药领域通常是以知识产权为核心来运作的,在很多的热门靶点下,有非常多的竞争者免不了要相互借鉴,而智能化分子设计平台中的骨架跃迁模块可以突破专利,帮助药物化学专家高效找到新的药物分子。

知识图谱则为智能化分子设计平台提供了庞大的数据源。借助知识图谱,我们可以从多种可靠数据源的数十亿不同数据点中提炼整合疾病、靶点、小分子等相关信息,构建医药知识图谱数据库。

基于知识网络,我们可以一键获取跟实际相关联的多种维度和数据间的关联,同时也可以对这些分子、靶点、适应症等多种实体的关联进行分析,从而帮助药化专家在药物设计立项时进行信息收集。此外,在药物研发中,我们还可以基于这些网络探索不同蛋白、不同亚型等各种大分子的异同,发现药物分子必要的骨架和片段。

结语

“当前,AI+行业已成为不可逆转的趋势。”周杰龙表示,医药行业虽然目前受到了效率的挑战,但随着AI的介入,未来十年将会是医药领域的黄金十年。

与此同时,随着近年来医改不断深化,中国监管机构对创新药给出了积极的信号,尤其是“4+7带量采购”政策对国内仿制药价格施压,促进了国内医药产业的发展路径由仿制药向创新药领域转型。这为AI的介入带来了更多的机遇。

此外,越来越多的大型跨国药企(如强生、诺华等)积极与AI公司合作进行新药研发,AI正日益参与到药物发现的各个环节。

可以预见,AI正在成为推动药物研发的新引擎。我们有理由相信,这个在其他领域已经大放异彩的技术在提高创新药研发效率和成功率上也大有可期。

发表回复

您的电子邮箱地址不会被公开。