超维分子信息表征
分子表征的重要性

如何从一个分子的化学结构中提取出它的各种性质是科学家梦寐以求的目标。到目前为止,人们先后发明了5000种以上的不同描述符去表征一个化学分子的结构。

传统的机器学习模型就围绕这些预定义的描述符,通过特征工程选取不同的组合,对小分子的各种性质进行建模预测。

有效的分子表征对于统计和机器学习至关重要。几十年来在定量构效关系(QSAR)研究和分子相似性分析方面的药物发现研究表明,准确的预测依赖于分子特征(也称为分子描述符)的选择,超维知药自主研发的分子图神经网络模型能以较少的特征描述符作为输入,得到明显更优的预测结果,是人工智能在分子表征领域的重要尝试

超维知药分子表征的总括

超维知药自主研发的分子表征体系,综合运用了群论、矩阵论、拓扑学等相关数学理论,基于十亿级已合成分子库训练分子特征提取模型,在保证分子特征提取无误的前提下,将基于图结构的原始分子信息映射到一个高维流形空间中,得到分子的深度表征信息。

在筛选过程中,以某靶点已知hits分子的深度表征信息为锚点,即可精准定位到对应靶点的活性分子空间区域。之后,再结合ADMET模型评价,得到兼具高活性和良好成药性质的PCC 。

覆盖更广泛的化学空间
深度神经网络,具有更强的表征能力,并可以学习特定任务分子相似性的概念;超维可运用统一的算法理论覆盖已合成化学小分子的全部分子结构。
超高维数据表 征,分表率更高,分子性质描述更精准
基于图理论,利用相关数学工具:如群论、矩阵论、拓扑学等理论模型构建图信息的描述体系,从分子结构出发,实现更精准的分子性质描述,提高预测模型的可解释性。
具有靶点或者其他性质的聚类效果

通过深度学习,在保证分子特征不损失的情况下,将分子指纹映射在一个高维的空间,使分子中的细微差异得以准确地捕捉,并通过平滑的连续表示法实现更好的预测性能,可实现超脱人类专家经验同靶点活性分子的聚类效果。

不依赖专家编码特性, 可摆脱人类专家经验束缚

基于大规模训练集学习出来的分子编码,由多种药学特性任务引导。

可迁移、可扩展, 可实现小样本学习

基于深度图神经网络,可自然地学习独特的连续表示,具有更强的表征能力,并可以学习特定任务分子相似性的概念,实现小分子的灵活表征学习。

结合强化学习, 可探索未知化学空间

锻造高性能强化学习工具,为生成网络提供有力的向导和生成策略指导。

联系我们

地址:北京市朝阳区东三环北路丙2号A座511

电话:010-64613947 / 18101051285

邮箱:info@hyper-d.com

微信公众号