虚拟筛选-8|越大越好,还是小而美?
2026-03-27
导语
在虚拟筛选的世界里,一场关于 “规模” 的争论正在悄然上演。当云计算推动筛选规模突破数十亿分子时,有人惊呼 “越大越好”;但现实中,一些仅用数十万分子的小规模筛选却同样催生了临床候选药物。这场 “大象与麻雀” 的较量,究竟谁更胜一筹?本文结合 David E. Clark 教授的观点,带你看透虚拟筛选的规模逻辑。
一、当虚拟筛选进入 “巨无霸” 时代
近年来,虚拟筛选的 “军备竞赛” 愈演愈烈:
- 超大规模案例:
某研究对 9900 万至 1.38 亿个 “按需合成” 分子进行对接,成功发现 AmpC β- 内酰胺酶抑制剂(Ki=77 nM)和多巴胺 D4 受体激动剂(180 pM),仅耗时 1.2 天(动用 1500 个 CPU)。
更震撼的 “千兆对接” 案例中,14.3 亿分子针对 PNP 和 HSP90 靶点的筛选,最快 18 小时完成(消耗 55 年 CPU 时间), top 化合物抑制活性达 4 μM。
- 技术诱惑:
支持者认为,更大的数据库意味着更丰富的化学多样性,结合云计算的算力,能覆盖更多潜在活性结构,甚至突破传统筛选的 “偏见”。
二、小而美的逆袭:两个经典案例
当业界为 “规模神话” 惊叹时,David E. Clark 教授用两个真实案例证明:成功未必依赖海量数据。
案例 1:糖皮质激素受体拮抗剂的 “精准筛选”
背景:已知药物米非司酮虽能缓解精神病性重度抑郁(PMD),但因缺乏糖皮质激素受体(GR)选择性而受限。当时无 GR 的 X 射线结构,需依赖基于配体的虚拟筛选方法。
策略:
- 从 71.8 万商业化合物中,通过分子性质过滤(如分子量、logP)和聚类,浓缩至 862 个分子。
- 首轮虚拟筛选仅购买 18 个化合物测试,即发现非甾体类苗头化合物(Ki=4.5 μM)。
- 后续两轮二维相似性搜索(新增 38 个化合物),迅速优化出高活性分子(Ki=16 nM),最终开发出临床候选药物 CORT118335,目前进入 II 期临床试验。
案例 2:纤溶酶抑制剂的 “层层过滤”
挑战:现有药物氨甲环酸(TXA)药代动力学和活性不足,且高通量筛选(HTS)因检测通量限制不可行。
策略:
- 以 10 个已知抑制剂(含 TXA)为起点,先用四种二维指纹相似性方法从 100 万化合物中筛选出 1000 个分子。
- 再通过三维静电和形状相似性筛选(参考 TXA 的 X 射线结构),最终测试 68 个化合物,发现苗头化合物 4-PIOL,优化后得到临床候选药物 AZD6564。
三、规模迷思:大数据的陷阱与成本考量
1. 更大≠更好的三大理由
- 化学空间的 “冰山效应”:
类药化学空间估计有 10⁶³ 种分子,即便最大的虚拟库(如默克 MASSIV 的 10²⁰分子)也仅是沧海一粟。盲目扩大规模可能让 “needle in a haystack” 变成 “needle in a galaxy”,反而降低效率。 - 相关性缺失:
海量分子中,大量结构与靶点无关。Hoffmann 等指出:“化学空间的大小不保证与特定靶点的相关性或多样性。” - 成本黑洞:
生成 10¹⁰分子的构象集成本约 2 万美元,每年更新数据库需持续投入。单次三维形状搜索成本约 100 美元,加上云存储(10¹⁰分子的 SMILES 需 1TB 存储)和软件许可费,大规模筛选对中小企业可能成为 “烧钱游戏”。
2. 小规模筛选的核心优势
- 聚焦性:
通过预过滤(如分子性质、聚类)剔除 “噪音”,让有限资源集中于高潜力分子。例如第一个案例中,862 个分子的 “精挑细选” 比随机筛选效率提升近千倍。 - 人为经验的价值:
计算化学家的直觉至关重要。如在纤溶酶抑制剂筛选中,选择 “三维静电相似性” 策略而非盲目扩大数据库,正是基于对靶点特性的深入理解。
四、未来趋势:平衡的艺术
David E. Clark 并非否定大规模筛选的价值,而是强调 “合适才是最好”:
- 硬靶点的特殊需求:
对于难成药靶点(如蛋白 - 蛋白相互作用),大规模筛选可能通过 “广撒网” 突破传统限制。 - 资源分层策略:
中小企业:聚焦小规模、高针对性筛选,利用二维指纹 + 三维相似性的组合拳,降低成本。
大型药企:可探索大规模筛选,但需结合实验验证(如优先测试前 1000 个分子),避免算力浪费。
- 技术融合:
无论规模大小,高质量的分子预处理(如构象生成、质子化状态校正)和多方法融合(如指纹 + 对接 + 机器学习)都是成功关键。
结语
虚拟筛选的本质是 “用智慧替代蛮力”。正如 Schumacher 在《小即是美》中所言:“真正的效率源于对本质的洞察,而非规模的堆砌。” 从数十万到数十亿分子,选择的核心在于你是在寻找 “大海里的针”,还是 “针尖上的宝石”? 对于多数药物研发项目,或许一块精心雕琢的 “璞玉”,比一吨未经筛选的矿石更有价值。
参考资料
1. Clark DE. Virtual Screening: Is Bigger Always Better? Or Can Small Be Beautiful? J Chem Inf Model. 2020 Sep 28;60(9):4120-4123.