虚拟筛选-9|ROCS用基于形状技术进行高效的虚拟筛选

虚拟筛选

2026-03-27

导语

  在药物研发领域,如何从海量化合物中精准锁定潜在活性分子,始终是科研人员面临的核心挑战。传统基于序列或二维结构的筛选方法,常因忽略分子三维构象差异导致假阳性率高。而ROCSRapid Overlay of Chemical Structures)作为基于形状匹配的虚拟筛选标杆工具,通过小分子构象的三维空间精准比对,开启高效药物发现的新范式。本文将深入拆解其核心原理,揭示形状相似性背后的数学逻辑与算法设计。 


一、ROCS 简介

  ROCS OpenEye Scientific 公司开发的一款功能强大的虚拟筛选工具。它可以快速识别具有与已知先导化合物形状类似的潜在活性化合物,能够在整体性和一致性方面与基于结构的虚拟筛选方法相媲美,甚至在很多情况下更具优势。通过ROCS,科研人员可以筛选出与已知先导化合物形状相似的新分子骨架,为药物研发提供更多的候选分子。


 

二、ROCS 基于形状虚拟筛选的原理与数学基础

🔹 形状匹配的原理:分子体积叠合

    ROCS 基于这样一个核心思想:如果分子的体积重叠良好,则分子具有相似的形状,任何体积不匹配都是不相似的度量。它使用一个平滑的高斯函数来表示分子体积,通过这种方式,可以常规地将分子形状匹配最小化到最佳全局匹配。

ROCS 在进行虚拟筛选时,会以一个已知的活性分子(或其特定构象)作为查询分子。然后,将数据库中的其他分子与该查询分子进行形状比对,计算它们之间的形状相似性得分。通过设定合适的阈值,筛选出与查询分子形状相似性较高的化合物,这些化合物就被认为具有潜在的生物活性,可能是理想的药物候选分子。同时,ROCS 不仅能分析分子的三维形状,还可以考虑分子表面的化学特性,从而更准确地评估药物分子的功能相似性,为筛选结果提供更可靠的依据。

🔹 形状匹配的数学基础:从原子分布描述到相似性度量

  1. 原子分布描述

ROCS将分子视为一个连续的电子密度分布,通过高斯函数叠加描述其三维形状。每个原子i的电子密度用高斯函数表示:

其中:

pi是原子类型相关的权重(如原子范德华半径)

ri是原子坐标

β是衰减系数(控制函数的宽度

分子整体形状是各原子高斯函数的叠加:

这种表示法避免了传统表面定义的离散性,使形状比对可微且计算高效。

 

  1. TanimotoTversky系数

ROCS通过最大化两个分子形状的重叠度(overlap)计算相似性,核心公式为:

  1. 重叠积分(Overlap

 分子AB的形状重叠定义为:

实际计算中通过数值积分(如格点法)实现。

  1. Tanimoto系数(对称相似性)

其中:

  • selfA = ∫ρ2A(r)dr(分子A的自重叠)
  • selfB同理

该值范围在[0,1],值越接近1表示形状越相似。

  1. Tversky系数(非对称相似性)

为突出参考分子的重要性,引入非对称权重:

RefTversky(偏向参考分子):α=0.95, β=0.05

FitTversky(偏向数据库分子):α=0.05, β=0.95

该设计使相似性计算更灵活,适用于“参考分子为中心”的虚拟筛选场景

 

  1. 化学特征匹配:颜色相似性(Color Score

ROCS不仅考虑形状,还引入药效团特征(如氢键供体、受体、疏水基团),称为颜色,其基础思想为:

  1. 将化学特征映射到分子表面;
  2. 计算特征重叠的相似性(公式同形状相似性,但使用特征密度函数);
  3. 最终颜色相似性(Color Tanimoto/Color Tversky)与形状相似性独立计算

 

三、ROCS 基于形状虚拟筛选的应用案例

案例一:发现 F.tularensis 关键酶 Fabl 的抑制剂

美国伊利诺伊大学芝加哥分校的 Johnson 课题组采用OpenEye 程序包中的 ROCSEON,基于配体的形状和电性匹配进行虚拟筛选,成功发现了 F.tularensis 关键酶 Fabl 的全新高活性抑制剂。研究者先针对不同类别选取高活性分子,构建形状问询式和静电问询式,然后经过验证和选择,确定最佳的问询式组合。接着利用 ROCS 进行形状匹配筛选,再经 EON 静电问询式进一步过滤,最终筛选出具有潜在活性的化合物,为相关药物研发奠定了基础。

 

案例二:靶向 FtsZ 蛋白的先导物发现 

研究人员基于已知抑制剂的三维形状,利用 ROCS 进行形状相似性筛选。首先对化合物结构进行筛选,选择形状相似性值(Shape Tanimoto)大于0.85的化合物。经过筛选,命中了一批与抑制剂结构三维形状相似的化合物。随后,研究人员对这些化合物进行结构分析,排除骨架结构与抑制剂相似的部分,得到29个结构新颖的化合物进行生物活性测定。结果发现,其中3个化合物表现出较好的生物活性,可作为靶向 FtsZ 蛋白的先导物进行深入研究。

 

案例三:鉴定新型 Hsp90 抑制剂

科研人员利用 ROCS 通过形状比较,鉴定出了一类新型 Hsp90 抑制剂。根据计算出的最有效命中化合物的结合模式,研究人员设计并合成了一系列类似物。经过测试,其中最有效的化合物57hHsp90的抑制效果显著,其IC50达到0.10 ± 0.01μM,同时还显示出良好的细胞效力和配体效率,证明了ROCS 在鉴定新型抑制剂核心结构方面的高效性。

 


 

参考资料:

  1. Hevener KE, Mehboob S, Su PC, Truong K, Boci T, Deng J, Ghassemi M, Cook JL, Johnson ME. Discovery of a novel and potent class of F. tularensis enoyl-reductase (FabI) inhibitors by molecular shape and electrostatic matching. J Med Chem. 2012 Jan 12;55(1):268-79. doi: 10.1021/jm201168g. Epub 2011 Dec 5. PMID: 22098466; PMCID: PMC3266168.
  2. Sun HP, Jia JM, Jiang F, Xu XL, Liu F, Guo XK, Cherfaoui B, Huang HZ, Pan Y, You QD. Identification and optimization of novel Hsp90 inhibitors with tetrahydropyrido[4,3-d]pyrimidines core through shape-based screening. Eur J Med Chem. 2014 May 22;79:399-412. doi: 10.1016/j.ejmech.2014.03.061. Epub 2014 Mar 21. PMID: 24763261.