生物活性环在环化学空间的分布

chem 7491 0

大多数生物活性分子或多或少都包含复杂的环作为核心结构元素。这个核心决定了基本的分子形状以及取代基的位置,并且影响整个分子的性质,在许多情况下直接与目标蛋白相互作用,决定着母体分子的生物活性。大量作用于相同靶点的药物具有相同或者相似的环结构,仅在取代基上存在差异。母体具有生物活性的环在化学空间中的分布是否会存在某种规律?诺华生物医学研究所Peter Ertl博士通过提取ChEMBLZINC数据库分子结构中的不同类型的环,并且根据其母体分子是否具有生物活性构建数据集。利用主成分分析研究具有生物活性的环在化学空间中的分布。相关工作以“Magic Rings: Navigation in the Ring Chemical Space Guided by the Bioactive Rings”为题,发表在美国化学会出版社的计算化学核心期刊Journal of Chemical Information and Modeling (DOI: 10.1021/acs.jcim.1c00761)1】。

作者首先以生物活性为10 μM 作为阈值,区分ChEMBL数据库中分子是否具有活性,然后提取这些分子中环的结构,并依据ChEMBL数据库中的靶标进行分类,将具有生物活性的环分为9类。然后作者从ZINC数据库的分子中提取环的结构,并根据母体分子是否具有生物活性以及ChEMBLZINC数据库中环出现的频率识别出“真正的”具有生物活性的环以及非生物活性的环。并将具有生物活性的环用不同的颜色表示其主要靶标类型,如1所示。

生物活性环在环化学空间的分布  第1张

1. 具有生物活性的环;用不同的颜色表示生物活性环的靶标类型 (洋红色- GPCRs, 蓝色- kinases,红色- proteases, 绿色- other enzymes,棕色-nuclear receptors, 黄色- ion channels, 黄绿色- epigenetic targets, 钢青色- other targets, 灰色- multiple targets)

为了获得生物活性环在整体环化学空间中的可视化分布,作者首先将所有收集得到的环的特征通过骨架特征描述符进行表征,然后通过主成分分析进行降维处理,并将超过标准差两倍的描述符通过取对数处理,在不影响二维PCA图的整体形状的情况下,使离群的单点更靠近中心,从而得到紧凑、清晰的二维图。2显示了包含39361个环结构的PCA图,x轴大致表示环的大小(左小,右大)y轴表示特征丰富度,主要是杂原子密度。图的底部含有不太复杂的分子,而顶部含有更多杂原子的复杂分子。

生物活性环在环化学空间的分布  第2张

2. 39361个环的主成分分析图 (用不同颜色表示不同靶标类型的生物活性环)

维度减少至两个主成分后保留了原始42个骨架特征描述符46.5%的信息。生物活性环在图上以颜色标记,其中不同颜色表示含有这个特征环的分子的主要靶标类型。该图表明具有生物活性的环分布在整个化学空间,但并不均匀,在某些区域较为集中,尤其是边缘区域。同时还可以看到具有相似靶标类型的生物活性环分布在同一区域。该区域既包括已知活性的环也包括未知活性的环,且它们结构相似,因此未知活性的环可能作为生物活性环的生物电子等排体作用于同一靶标 (3)

生物活性环在环化学空间的分布  第3张

3. 不同靶标环的结构 (具有生物活性的环用不同颜色表示;生物活性环周围未被标记的环与其具有相似的结构特征,是潜在的生物电子等排体)

2虽然可以很好的可视化整个环化学空间,但其结果太过于碎片化,无法得出一般性的结论,也无法应用于虚拟筛选。于是作者利用scikit-learn包中的四种分类模型进行训练,发现只有神经网络模型具有较好的分类精度和均衡准确率,表明区分环是否具有生物活性是由所有参数间的复杂关系控制的,而不是简单的由某一参数决定。神经网络模型的分类结果表明生物活性环主要集中在三环组成的稠合环区域以及邻近的双环和单环区域 (4)

生物活性环在环化学空间的分布  第4张

总结

环结构在药物化学中具有重要的作用,分析生物活性环在化学空间的分布有助于定位其作用靶标以及寻找新骨架类型的生物活性环。并且由于含有特定结构的环在某一靶标中出现的频率较高,可以利用这一性质针对靶标设计对应的化合物库,提高虚拟筛选的效率。作者通过提取数据库分子结构中的环并依据母体分子是否具有活性绘制生物活性环在化学空间中的分布图,并提供了web服务器可以定位环化学空间和骨架替换,其访问网址为https://bit.ly/magicrings

参考文献
1Ertl P. Magic Rings: Navigation in the Ring Chemical Space Guided by the Bioactive Rings. J. Chem. Inf. Model. 2022, 62, 9, 2164–2170.

发布评论 0条评论)

您需要 登录账户 后才能发表评论

还木有评论哦,快来抢沙发吧~