虚拟筛选-8|越大越好,还是小而美?

虚拟筛选

2026-03-27

导语

  在虚拟筛选的世界里,一场关于规模的争论正在悄然上演。当云计算推动筛选规模突破数十亿分子时,有人惊呼越大越好;但现实中,一些仅用数十万分子的小规模筛选却同样催生了临床候选药物。这场大象与麻雀的较量,究竟谁更胜一筹?本文结合 David E. Clark 教授的观点,带你看透虚拟筛选的规模逻辑。


一、当虚拟筛选进入巨无霸时代

近年来,虚拟筛选的军备竞赛愈演愈烈:

  • 超大规模案例

  某研究对 9900 万至 1.38 亿个按需合成分子进行对接,成功发现 AmpC β- 内酰胺酶抑制剂(Ki=77 nM)和多巴胺 D4 受体激动剂(180 pM),仅耗时 1.2 天(动用 1500 CPU)。

更震撼的千兆对接案例中,14.3 亿分子针对 PNP HSP90 靶点的筛选,最快 18 小时完成(消耗 55 CPU 时间), top 化合物抑制活性达 4 μM

  • 技术诱惑

  支持者认为,更大的数据库意味着更丰富的化学多样性,结合云计算的算力,能覆盖更多潜在活性结构,甚至突破传统筛选的偏见


二、小而美的逆袭:两个经典案例

当业界为规模神话惊叹时,David E. Clark 教授用两个真实案例证明:成功未必依赖海量数据

案例 1:糖皮质激素受体拮抗剂的精准筛选

背景:已知药物米非司酮虽能缓解精神病性重度抑郁(PMD),但因缺乏糖皮质激素受体(GR)选择性而受限。当时无 GR X 射线结构,需依赖基于配体的虚拟筛选方法。
策略

  • 71.8 万商业化合物中,通过分子性质过滤(如分子量、logP)和聚类,浓缩至 862 个分子。
  • 首轮虚拟筛选仅购买 18 个化合物测试,即发现非甾体类苗头化合物(Ki=4.5 μM)。
  • 后续两轮二维相似性搜索(新增 38 个化合物),迅速优化出高活性分子(Ki=16 nM),最终开发出临床候选药物 CORT118335,目前进入 II 期临床试验。

案例 2:纤溶酶抑制剂的层层过滤

挑战:现有药物氨甲环酸(TXA)药代动力学和活性不足,且高通量筛选(HTS)因检测通量限制不可行。
策略

  • 10 个已知抑制剂(含 TXA)为起点,先用四种二维指纹相似性方法从 100 万化合物中筛选出 1000 个分子。
  • 再通过三维静电和形状相似性筛选(参考 TXA X 射线结构),最终测试 68 个化合物,发现苗头化合物 4-PIOL,优化后得到临床候选药物 AZD6564


三、规模迷思:大数据的陷阱与成本考量

1. 更大更好的三大理由

  • 化学空间的冰山效应
    类药化学空间估计有 10³ 种分子,即便最大的虚拟库(如默克 MASSIV 10²分子)也仅是沧海一粟。盲目扩大规模可能让 “needle in a haystack” 变成 “needle in a galaxy”,反而降低效率。
  • 相关性缺失
    海量分子中,大量结构与靶点无关。Hoffmann 等指出:化学空间的大小不保证与特定靶点的相关性或多样性。
  • 成本黑洞

生成 10¹分子的构象集成本约 2 万美元,每年更新数据库需持续投入。单次三维形状搜索成本约 100 美元,加上云存储(10¹分子的 SMILES 1TB 存储)和软件许可费,大规模筛选对中小企业可能成为烧钱游戏

2. 小规模筛选的核心优势

  • 聚焦性
    通过预过滤(如分子性质、聚类)剔除噪音,让有限资源集中于高潜力分子。例如第一个案例中,862 个分子的精挑细选比随机筛选效率提升近千倍。
  • 人为经验的价值
    计算化学家的直觉至关重要。如在纤溶酶抑制剂筛选中,选择三维静电相似性策略而非盲目扩大数据库,正是基于对靶点特性的深入理解。

四、未来趋势:平衡的艺术

David E. Clark 并非否定大规模筛选的价值,而是强调合适才是最好

  • 硬靶点的特殊需求
    对于难成药靶点(如蛋白 - 蛋白相互作用),大规模筛选可能通过广撒网突破传统限制。
  • 资源分层策略

中小企业:聚焦小规模、高针对性筛选,利用二维指纹 + 三维相似性的组合拳,降低成本。

大型药企:可探索大规模筛选,但需结合实验验证(如优先测试前 1000 个分子),避免算力浪费。

  • 技术融合

无论规模大小,高质量的分子预处理(如构象生成、质子化状态校正)和多方法融合(如指纹 + 对接 + 机器学习)都是成功关键。


结语

  虚拟筛选的本质是用智慧替代蛮力。正如 Schumacher 在《小即是美》中所言:真正的效率源于对本质的洞察,而非规模的堆砌。从数十万到数十亿分子,选择的核心在于你是在寻找大海里的针,还是针尖上的宝石 对于多数药物研发项目,或许一块精心雕琢的璞玉,比一吨未经筛选的矿石更有价值。


参考资料
1. Clark DE. Virtual Screening: Is Bigger Always Better? Or Can Small Be Beautiful? J Chem Inf Model. 2020 Sep 28;60(9):4120-4123.