人工智能和机器学习
早在2011年,IBM的沃森(Watson)超级计算机便在美国电视游戏节目《绝地求生》(Jeopardy)中获胜,并引起了公众的关注。
当时,智能手机还没有内置Siri或Google Assistant,而且很少有人相信诸如Google Home和Amazon Alexa这类设备将变得如此日常。沃森的获胜立即使数以百万计的人认识到了人工智能的进步。
人工智能有很多不同类型,但最常见的是“机器学习”。在机器学习过程中,会进行输入,例如一幅图像。然后,将使用复杂的功能把该图像与观察连接起来,例如“猫”。在以上示例中,系统能够自动从一组图像中进行筛选,以找到猫的图像。
从以上例子[3]中的图像分类到自动驾驶,人工智能和机器学习如今已用于诸多应用当中。但是,人工智能研究领域中的一项尚未被完全开发的潜在能力,便是研究如何将其应用于医药健康和药物研究。
由于对不同疾病背后分子机制的了解有了突飞猛进的发展,正在有越来越多的极具发展前景的药物设计靶标获得确定。
但是,药物研究背后的过程可能极具挑战性。人工智能和机器学习能否帮助突破部分传统瓶颈,从而使我们能够更快地为患者提供更有效的新型药物?
您知道么?
-
26亿美元
这是将新药推向市场的当前成本。[1]
-
10%
一期试验后进入市场的候选药物比例。[2]
-
300
由默克开发、用于化合物特性的人工智能预测模型的数量。[6]
为何在药物研究中使用人工智能?
为了找到这些分子,研究人员传统上会对分子库进行大规模筛选,以识别有潜力成为药物的分子。然后,他们会进行无数轮测试,将其开发为具有发展前景的化合物。
最近,基于结构、因而更合理的药物设计方法变得越来越普遍。这些避免了最初的筛选阶段,但仍然需要化学家通过设计、合成和评估多种化合物来创造潜在的新型药物。
由于通常不知道哪种化学结构会同时具有所需的生物学效果和成为有效药物所需的特性,因此将具有发展前景的化合物精制为候选药物的过程,可能既昂贵又耗时。最新数据显示,当前将新药推向市场的成本平均为26亿美元。[1]
此外,即使新的候选药物在实验室测试中显示出治疗潜力,当将其用于临床试验时,仍然可能会失败。事实上,一期试验后进入市场的候选药物比例不到10%。[2]
考虑到这一点,专家们如今正在探索人工智能系统无与伦比的数据处理潜力,以此加速新型药物研究的速度并降低成本,也就不足为奇了。据市场研究公司Bekryl称,到2028年,人工智能有可能为药物研究流程节省超过700亿美元。[4]
人工智能如何应用于药物研究?
由于新候选药物筛选所需的数据库十分庞大,因此单独研究人员几乎无法自己审查所有内容,而这正是人工智能和机器学习可以提供帮助的地方。
这些先进技术使研究人员能够从庞大的数据集当中找到隐藏的解决方案。这一方法具有众多优势:
- 预测潜在化合物的特性,意味着仅选择具有所需特性的化合物进行合成,由此避免将时间和资金浪费在不太可能起效的化合物上。
- 获得关于全新化合物的概念,且其中“发明”的分子预计可以具有取得成功所需的所有特性,这可能会极大地促进有效新药的研究。
- 减少重复性任务,例如分析数千个组织学图像,这可在实验室中节省数百个人工时。
这些只是人工智能在药物开发流程早期阶段的部分潜在优势。
通过合作完善药物研究中的人工智能
为了了解人工智能在实践中的应用方式,让我们看一下我们目前正在进行的一些创新研究吧。
“预测模型是我们工作的核心。”默克计算化学与生物学总监Friedrich Rippmann说,“这些统计模型可以预测复合物(尚未合成的分子)概念是否会产生所需的活性。
我们正在使用的技术主要与机器学习有关。特别是,我们正在使用各种类型的深度神经网络。不仅如此,我们还探索了其他更为经典的统计技术,并为其取了有趣的名称,例如‘随机森林’和‘支持向量机’。”
大约在2012年左右,多伦多大学的研究人员赢得ImageNet大规模视觉识别挑战赛(ILSVRC),推动了深度神经网络的快速推广。[1]
近年来,关于机器学习技术的主题已经革新了多个领域,例如计算机视觉、自然语言处理和游戏。现在,它在鉴定新型化合物方面同样显示出令人兴奋的潜力。
“我们正在推动可解释深度神经网络领域的创新研究。”Rippmann继续说道,
“我们的预测不再仅仅告诉我们‘是,这会起效’或者‘不,这不会起效’。现在,它们还可以通过突出显示分子中负责某种活性的区域,来告诉我们它们为什么会起作用或不起作用。这可以立即为化学家展示出如何去除某些有害活性的方法。”
他们的发现在最近广受称赞的文章《药物研究中的可解释性深度学习》(Interpretable Deep Learning in Drug Discovery)中获得了更详细的描述。[5]
到目前为止,就实际成果而言,Friedrich Rippmann团队和默克合作进行的研究已经提供了将近300种用以评估化合物特性的新模型,这些可以帮助预测化合物结合特定疾病相关靶标的能力。
“我们的化学家已经开始使用这些模型来检查其复合物概念,然后再决定是否进行合成。”Rippmann补充说。
通过合作完善药物研究中的人工智能
在这一领域取得进展本质上是一个协作的过程。
“我们很少能够独自开发出新颖方法。”Rippmann说,“我们所有的工作都是与领先的学术团体和初创公司合作完成的。”
迄今为止,值得关注的合作包括与奥地利林茨大学Sepp Hochreiter教授的合作,后者是该研究领域顶级学术团队之一的负责人。
此外,我们还与多伦多Cyclica合作,使用其预测技术来识别化合物可能发挥功效的人类蛋白质(例如在表型筛选的去卷积中)。
而且,我们同样正在与总部位于巴黎的初创公司Iktos展开合作,利用他们的技术自动“发明”符合药物预定义要求的新型分子,包括与药物靶标的结合、特定毒性、溶解度等等。
不仅如此,用以增强药物研究中人工智能的合作也在大规模开展之中。
人工智能分析的质量与所使用的数据集的质量息息相关。因此,制药行业越来越多地寻求通过合并数据展开协作。
最近的一项发展促进倡议——MELLODDY项目——便汇集了欧盟创新药物倡议委员会,以及包括默克在内的十多家制药公司。它旨在通过所谓的“联合学习”来改进预测模型,并借助新颖的区块链系统将数据储存在安全的分类帐中,同时保护各个公司的商业秘密。
未来将有何新发展?
在Friedrich Rippmann看来,最大的未来潜力在于通过加速药物研究并降低消耗率,最终更快地为患者提供更多新药。
“将人工智能应用于药物研究所能带来的好处太多了。”他说,“但是目前,我们有时会因所产生的高昂费用而退缩。随着越来越多的竞争出现,成本将会下降,由此为不同领域的新发现提供令人兴奋的可能性。”
我们的承诺
2012年,联合国制定了17项可持续发展目标(SDG),以应对全球面临的紧迫的环境、政治和经济挑战。三年后,这些规则被所有成员国采纳。我们努力使自身工作有助于实现这些宏伟目标。我们在药物研发领域开发人工智能符合“目标9——产业、创新和基础设施;子目标9.5——加强科研。”从可以预测药物是否具有理想特性的模型,到确定药物可能影响哪些蛋白质,在人工智能方面所取得的进展是一个合作的过程。我们正在与其他公司合作,打造更好的人工智能和机器学习工具,由此令新药能够更快速地送达患者手中。
深入了解数据来源
[1] https://papers.nips.cc/paper/4824-imagenet-classification-with-deep-convolutional-neural-networks.pdf
[2] https://www.sciencedirect.com/science/article/abs/pii/S0167629616000291?vi a%3Dihub
[3] https://www.bio.org/sites/default/files/legacy/bioorg/docs/Clinical%20Development%20Success%20Rates%202006-2015%20-%20BIO,%20Biomedtracker,%20Amplion%202016.pdf
[4] https://bekryl.com/industry-trends/ai-artificial-intelligence-in-drug-discoverymarket-size-analysis
[5] https://link.springer.com/chapter/10.1007/978-3-030-28954-6_18
[6] http://www.merckgroup.com/en/research/science-space/presentations/practical-impact-of-ai-on-drug-discovery.html