技术平台(Technology platform)

我们使用机器学习技术,主要是深度神经网络(Deep Neural Network, DNN),开发算法以提高药物发现的效率和成功率。我们目前开发的算法覆盖靶点选择、分子生成、分子筛选等多个环节。在人工智能算法的基础上,我们以蛋白激酶家族为目标,构建了包括分子生成、分子筛选、有机合成、生物表征在内的AI驱动药物发现平台,并应用于激酶小分子抑制剂的发现。

靶点选择(Target Identification)

靶点选择是所有药物发现项目的起点,也是最为关键的环节之一。选择正确的靶点,通常意味着项目已经成功了一半。在智药科技,我们使用机器学习模型,通过搜集海量的数据,来评估靶点是否“具有开发前景(promising target)”。如果一个靶点被机器学习模型判定为“promising”,那针对该靶点开发的药物具有很高的上市可能性。我们的算法模型是由陈宇综教授和朱峰教授在2009年开发(Zhu et al. 2009),经过10年验证,具有很高的预测准确性(Zhu et al. 2018)。

分子生成(Molecular Generation)

近些年,深度学习领域的生成模型(Generative Model), 例如GAN和VAE的快速发展,使得使用人工智能技术设计化合物成为可能。在智药科技,我们主要使用VAE模型,通过学习数亿类药化合物的SMILES,使得机器掌握正确的SMILES“语法”。在此基础上,针对特定靶点,我们将靶点家族以及靶点已知活性化合物输入模型,使其能够高效地针对特定靶点设计虚拟分子库(virtual library)。虚拟库的分子具有很高的潜在活性和成药性。

分子筛选(Molecular Screening)

从虚拟分子库中挑选合适的分子进行合成是至关重要的一步。在智药科技,我们充分利用已有的大量数据,使用随机森林(Random Forest)、支持向量机(Support Vector Machine)以及深度学习网络(Deep Neural Network)来构建高准确性的分类器,从多个方面(靶点亲和力、类药性、可合成性、ADME、毒性等)进行分子筛选。我们已经开发了基于结构的(Structure-based)”靶点-化合物”结合预测算法DeepDock,对普适靶点预测准确度高达0.93(BIBM2019, Regular Paper),对蛋白激酶靶点预测准确度高达0.98。

AI驱动药物发现平台(AI-driven Drug Discovery Platform)

在使用人工智能算法进行靶点选择、分子生成、分子筛选的基础上,我们结合有机合成和生物表征等实验技术,构建了新一代AI驱动药物发现平台。该平台实现了算法与实验的紧密结合,并通过闭环反馈,不断提到AI算法的准确率和效率。目前,我们正在以蛋白激酶家族为目标,进行多个项目的药物发现工作。 了解更多...

相关论文

1.Liao, Z.R., You, R.H., Huang, X.D., Yao, X.J., Huang, T., Zhu, S.F. DeepDock: Enhancing Ligand-protein Interaction Prediction by a Combination of Ligand and Structure Information. IEEE BIBM 2019.

相关专利

1.深圳智药信息科技有限公司. 一种虚拟药物筛选方法、装置、计算设备及存储介质. 申请号:201910050902.9. 申请日:2019年01月20日.