虚拟筛选-6|虚拟筛选为何存在假阳性?
2025-09-23
导语
在虚拟筛选(Virtual Screening, VS)的世界里,算法看似能精准预测分子活性,但实际实验中却常出现 “预测有效,实测无效” 的尴尬局面 —— 这类 “假阳性” 结果如同隐藏的陷阱,困扰着药物研发人员。为什么计算机模拟会 “看走眼”?
一、分子描述符的 “片面视角”:用二维指纹看三维世界
虚拟筛选依赖分子描述符将结构转化为数据,但描述符的选择可能导致信息偏差:
- 二维指纹的局限性:
二维指纹(如 Daylight、MACCS Keys)仅记录分子碎片的有无,却忽略空间构象。例如,两个分子可能拥有相同的芳环和羟基碎片(指纹相似),但羟基的空间取向不同(一个朝上、一个朝下),导致与受体结合时无法形成有效氢键。 - 三维特征的简化误差:
药效团模型虽考虑空间特征,但预设的距离阈值(如氢键允许 ±0.5Å 偏差)可能过于宽松。
二、构象灵活性:分子的 “变形记” 与 “活性构象失踪”
多数小分子并非刚性结构,单键旋转可产生数十至数万种构象,而虚拟筛选可能漏掉关键的 “活性构象”:
- 构象预生成的覆盖不足:
筛选前若仅生成10种低能构象,可能漏掉在溶液中占比不足 5% 但与受体结合最佳的构象。 - 动态结合的模拟缺失:
受体与配体结合时可能发生 “诱导契合”(如受体活性位点残基侧链旋转),而静态对接(如早期 DOCK 算法)无法模拟这种动态过程,导致预测的结合模式与实际不符。
三、评分函数的 “理想主义”:忽视真实世界的复杂热力学
虚拟筛选通过评分函数(如 GOLD Score、ChemScore)量化结合能,但现有模型难以准确模拟真实环境中的热力学效应:
- 溶剂化效应的忽略:
评分函数常忽略水分子在结合中的作用。例如,某分子与受体结合时需排出 3 个水分子(释放能量),但模型未计算这部分熵增,导致低估结合亲和力,反之则可能高估无溶剂环境下的 “假阳性” 分子。 - 熵变的简化处理:
小分子与受体结合后,其自由旋转和移动的熵损失(ΔS)难以精确计算。评分函数通常用 “每个旋转键罚 0.3 kcal/mol” 的经验值,但若实际熵损失为 1.0 kcal/mol,将导致活性预测显著偏差。
四、数据偏差与模型的 “过度自信”:从 “训练集” 到 “真实世界” 的鸿沟
机器学习模型(如随机森林、神经网络)在虚拟筛选中日益普及,但其性能受限于数据质量:
- 训练集的 “幸存者偏差”:
模型若仅基于已知活性分子(如专利化合物)训练,可能过度拟合 “已验证结构”,而漏掉全新骨架的活性分子。例如,模型通过含氮杂环活性分子训练,却将不含杂环但功能基团排列相似的分子判定为 “非活性”。 - 负样本的缺失:
非活性分子(Decoys)的选择是否合理直接影响模型泛化能力。若负样本包含大量 “类药但无活性” 分子,模型可能将 “非活性” 特征误判为 “毒性特征”,导致真阳性分子被错误排除。
五、如何降低假阳性?
1. 多维度描述符融合
结合二维指纹(快速筛选相似结构)、三维药效团(捕捉空间互补)和物理化学性质(如 logP、PSA),通过 “数据融合”(Data Fusion)综合评分,减少单一描述符的偏差。
2. 动态模拟与实验验证结合
- 构象动态搜索:使用遗传算法(如 GOLD)或分子动力学(MD)生成更多构象,覆盖潜在活性形态。
- 虚拟 - 实验循环验证:筛选出的前 100 个分子中,随机选取 20 个进行初步活性测试,根据结果调整模型参数(如相似性阈值、对接评分 cutoff)。
3. 引入 “反筛选” 机制
在筛选流程中加入 “毒性预测”(如 hERG 结合风险)和 “合成可行性”(如碎片可连接性)过滤,排除 “可预测但无成药潜力” 的假阳性分子。
结语
虚拟筛选中的假阳性,本质是 “计算模型的简化假设” 与 “生物系统的复杂性” 之间的矛盾。从二维指纹的“片面认知”到动态构象的“捕捉难题”,这些挑战推动着技术不断迭代
如今,结合深度学习(如 AlphaFold2 预测受体动态构象)和高通量实验(如微流控筛选)的 “干湿结合” 模式,正逐步缩小预测与实测的差距。未来,随着计算生物学的进步,虚拟筛选将更接近“精准导航”的终极目标,但理解其局限性,仍是驾驭这一工具的关键。
参考资料
- Ferreira RS, Simeonov A, Jadhav A, Eidam O, Mott BT, Keiser MJ, McKerrow JH, Maloney DJ, Irwin JJ, Shoichet BK. Complementarity between a docking and a high-throughput screen in discovering new cruzain inhibitors. J Med Chem. 2010 Jul 8;53(13):4891-905.
- Su M, Yang Q, Du Y, Feng G, Liu Z, Li Y, Wang R. Comparative Assessment of Scoring Functions: The CASF-2016 Update. J Chem Inf Model. 2019 Feb 25;59(2):895-913.