天然产物为生物活性分子中的亚结构提供了丰富的来源。早期研究发现,许多天然产物中的亚结构在传统合成类药化合物中出现的频率较低。过去15年间,ChemBridge公司针对先导化合物及类药化合物的设计持续优化升级,逐步融入了一系列新特征——包括更常见于天然产物的亚结构元素。该公司采用已发表的评分方法筛选出最具天然产物特征的化合物,由此构建出天然产物特征最显著的化合物库。该"类天然产物库"(NPL)收录了ChemBridge库存中约5万种化合物,这些合成化合物在结构空间上与天然产物具有最高相似度。
方法
本研究采用Ertl等人(《化学信息与建模杂志》2008年第48卷第1期68-74页)发表的评分方法,对ChemBridge公司的小分子先导化合物及类药化合物库进行筛选,旨在基于天然产物特征(相较于传统合成化合物更常见的结构特征)识别出具有更高天然产物相似性的子集。选择天然产物相似性评分≥0作为截断值,原因在于:该文献中使用的绝大多数天然产物评分≥0(多数集中在0至4.0区间),而分析所用的100万种传统合成化合物中多数评分为≤-1.0。虽然合成化合物与天然产物中均有少量化合物评分介于-1.0至0之间,但该评分区间对两类化合物的区分能力最弱。
特性
天然产物类似物(NPL)库中的化合物具有类先导化合物和类药特性,其理化性质及计算参数的平均值与范围如下:
• 分子量:平均值 326
• Fsp3 值:平均值 0.6
• clogP 值:平均值 2.4
• 拓扑极性表面积(TPSA):平均值 62
• 氢键供体数量:平均值 1.2
• 氢键受体数量:平均值 4.0