计算机辅助药物设计(computer-aided drug design,CADD)利用计算机快速存取能力和对海量数据的快速分析能力来提高药物设计的效率[1].
药效团虚拟筛选是药物虚拟筛选最流行的方法之一[2].其中基于受体的药效团虚拟筛选方法存在打分函数粗略、忽略蛋白质柔性等缺点[3],而基于配体的虚拟筛选则优化了打分函数[4].同时,虚拟筛选过程中分子的微观性和复杂性给用户观察分子结构和数据分析带来了很大的挑战.很多CADD软件更多的关注于科学细节而忽略了实用性[5],所以在软件交互性和信息传达直观性方面存在不足.
因此,笔者将可穿戴式VR技术与微观药物虚拟筛选技术有机结合,基于Unity3D引擎和HTC Vive设备,设计实现了“VR+药效团”的虚拟筛选系统.该系统主要功能包括:虚拟环境中分子和药效团的数据解析与建模;药效团的可视计算过程;虚拟环境下分子和药效团的交互设计.通过构建“VR+药效团”的虚拟筛选系统为药效团的设计分析带来新的视角,增强药物设计者的交互体验[6].
VR技术与基于配体的药效团虚拟筛选技术[7]的结合涉及3个主要方面的工作:基于配体药效团的虚拟筛选、VR技术应用和交互设备.
基于配体的药效团虚拟筛选技术通过对活性分子的结构和活性数据进行发掘和分析,提取出重要的药效特征[8],并利用药效特征发现新化合物的线索[9].
VR技术是一种可以创建和体验虚拟世界的计算机仿真系统.它具有沉浸感、交互性、构想性等特点,在军事、教育等宏观领域得到了广泛的应用[10-11].VR也逐渐应用于药物、生物等微观领域.通过对分子进行三维建模,用户可以清晰地观察分子的特性并进行实时交互.
目前流行的VR交互性设备主要有Oculus Rift、PS VR、HTC Vive等.Oculus Rift、PSVR设备存在一定延迟、追踪距离短等问题.HTC Vive设备的定位器能同时追踪显示器和手柄的位置,并且头戴显示器使用一块2 K分辨率屏幕降低了画面的颗粒感,不会产生延迟和眩晕[11].
根据上节的综合阐述,提出了“VR+药效团”虚拟筛选系统,使用基于配体的药效团虚拟筛选技术路线,并选用HTC Vive作为交互设备,在VR环境中解决药效团虚拟筛选过程交互性和可视性不足的问题.系统框架如图1所示,主要实现了分子解析与模型构建、药效团计算和VR交互等功能.
图1 VR+药效团虚拟筛选系统框架
Fig.1 VR + pharmacophore virtual screening
system framework
模型构建功能主要包括:①载入数据,系统将用户载入的分子文件作为提问分子;②格式判断,系统通过文件后缀区分分子文件和药效团文件;③数据解析,系统根据不同的文件类型,采用不同的数据提取方式,并将数据记录在文件中;④模型构建,系统根据数据自动构建原子模型和化学键模型并初始化模型属性.
药效团计算功能主要包括:①载入分子,系统将用户选定的分子文件读取到系统中;②生成三维结构,系统使用OpenBabel对分子进行三维构建;③生成构象,系统使用多目标优化算法给三维结构的分子生成构象[12];④生成药效团,系统对配体分子提取药效特征及其三维空间结构形成药效团;⑤虚拟筛选,系统将药效团模型在数据库中进行药效特征匹配得到筛选结果.
交互控制功能主要包括:①定位器利用激光和光敏传感器确定运动物体的位置;②控制器通过两个单手操作手柄来进行系统功能的操作;③触发手柄,用户可以通过不同的按钮进行不同的系统操作;④显示头盔可以让用户观察虚拟环境中的分子结构和特性.
配体分子能够通过自身的化学特征识别生物大分子的活性位点并进行反应.由于结构和化学属性相似的分子具有相似的生物活性.所以系统通过配体的药效特征来找出数据库中功能相似的化合物或预测新化合物属性.主要功能模块和操作流程如图2所示.
图2 基于配体的药效团虚拟筛选流程图
Fig.2 Ligand-based pharmacophorevirtual
screening flowchart
用户新建一个作业并载入配体分子后,系统使用OpenBabel将分子转化成三维结构.然后系统将范德华力、二面角扭转力、几何结构差异、回转半径作为4个目标函数对分子生成构象.生成构象之后,系统使用华东理工大学刘晓峰老师的构象优化模型来剔除冗余构象[12],具体算法如下.
采用可变能量阈值窗口剔除高能构象[12],
Ecutoff=Ew+k×Nrot,
(1)
式中:Ew为能量阈值;Nrot为可旋转键数目;k为尺寸因子.
为了剔除几何结构相似的冗余构象,系统将去除所有均方根偏差(RMSD)小于式(2)阈值的构象[12],
(2)
式中:c为用户定义的尺度因子;Nrot为分子中可旋转键的数目.
完成构象优化后,系统将对分子构象提取药效特征和空间排列结构形成药效团.最后,系统使用球壳匹配、向量特征匹配筛选出具有药物活性的化合物.
Mol2格式分子文件以块为存储单位,两个@
表1 分子文件数据
Tab.1 Molecular file data
数据符号符号含义atom_id原子编号atom_name原子名称x、y、z坐标atom_type原子种类subst_id残基名称charge电荷status_bit状态位疏水基团青色药效团特征氢键给体绿色药效团特征氢键受体紫色药效团特征O氧N氮H氢C碳
系统的Atom类对mol2文件中原子信息初始化并存储.Bond类对解析获得的化学键信息按照源坐标和目标坐标进行存储.
药效团格式文件和分子格式文件类似,虽然,药效团中的原子都为非标准残基序列的原子,但药效团文件比分子文件仅多了元素符号一个属性.因此,药效团格式文件与mol2格式分子文件归为一类,在初始化时稍作区分,即可满足系统需求.
系统通过判别文件格式,采用不同的方法对文件信息进行读取和存储,数据解析流程如图3所示.
图3 数据解析流程
Fig.3 Data analysis process
判断类别:在mol2格式中,文件信息以块为单位划分,每一块记录的是一个原子的结构信息.为了便于解析,将药效团转化为pdb格式,该格式以行为单位划分,每一行都有信息类别标记.
正则划分:系统进行数据解析时,通过空格正则划分将分隔的信息一一获取.
按类存储:系统将提取的数据添加到对应类别的列表中存储.
判断是否为文件末尾:系统若判断数据是最后一行,则停止数据读取.否则,继续读取数据.
数据解析完成后,系统通过数据列表中的数据完成原子和键模型的绘制工作,模型绘制主要包括以下几步.
获取数据和模型构建:系统根据数据列表里的数据绘制原子和键模型.
命名规则:模板采用原子元素种类命名的方法,保证存储到模板列表中的模板都是唯一的.
查找模板:系统在绘制模型之前先在模板库中查找是否已存在模板.如果存在,执行下一步,否则,新建模板.
设置信息:根据表1设置模型的大小、颜色、形状等基本信息.
存储模板:完成原子和键模型绘制之后,系统将模型作为模板存入模板列表.
完成模型绘制后,系统得到的是以单个原子和单个化学键为对象的结构.为了让用户对整个分子操控,系统将模型对象进行分组管理.然后,借助Stream VR设备的控制手柄使用户能够对Unity3D构建的分子进行旋转、放缩、控制虚拟筛选的流程[13].
在交互过程中,系统对模型进行分组管理和动态更新,以避免虚拟场景中视图的延迟,保证手柄控制分子的移动是在模型分组的基础上对整个分组的坐标进行变换.
VR+药效团虚拟筛选系统载入分子acheligand.mol2,系统构建的三维分子模型如图4所示.用户可以通过头显观察到分子的特性并进行交互式操作.
图4 配体分子模型
Fig.4 Ligand molecular model
用户通过HTC Vive的控制手柄触发药效团生成操作.转换成pdb格式的药效团自动构建的模型如图5所示.
图5 转化成pdb格式后的药效团模型
Fig.5 Pharmacophore model after conversion to pdb
系统将药效团与包含acheligand.mol2分子的数据库进行匹配.筛选的结果是acheligand.mol2分子本身,如图6所示.
图6 筛选结果分子模型
Fig.6 Screening results molecular model
为了测试药效团计算的可靠性,笔者使用e4ey7.hypoedit作为输入药效团,actives_final.mol2作为筛选数据库.actives_final.mol2分子集文件中共有464个分子.设置输出6个匹配结果,最后输出打分最高的6个分子,虚拟筛选结果如表2所示.
表2 虚拟筛选结果
Tab.2 Virtual screening results
编号分子名称分值1CHEMBL759536.062 022CHEMBL4025485.516 083CHEMBL1396535.449 934CHEMBL822435.191 415CHEMBL4244695.112 756CHEMBL2795905.048 57
通过对筛选结果6个分子中的化学特征和提问分子中的化学特征进行对比,发现它们化学特征相似性符合试验分值.说明笔者基于配体进行药效团虚拟筛选的可靠性.
为了验证VR+药效团虚拟筛选系统的可靠性,进行了系统体验评测.试验设计如下:8位受试同学分为3组,戴上头盔设备,分别进行时间长度为1 h、2 h和3 h的操作测试.在测试前和测试后,试验员对参加测试的同学进行了心跳、血压(舒张血压)测量,如图7所示.同时,通过识图游戏和询问来查验使用系统后的眩晕情况.通过测试数据发现,经过长时间操作后,用户各项生理指标均在正常范围内,且均未产生眩晕等症状.实践证明了系统在用户体验上有着不错的表现.
图7 测试前后体验者的心跳、血压数据
Fig.7 Heartbeat and blood pressure before and
after test
将VR技术和基于配体的药效团虚拟筛选技术相结合,设计实现了面向药物设计的虚拟交互体验系统.通过对分子文件进行解析和建模,解决了虚拟现实环境中分子的实时和真实感绘制问题;通过集成多目标优化构象生成算法和基于三角哈希查找匹配算法,在VR计算环境中实现并验证了基于配体药效团虚拟筛选技术;利用HTC Vive设备设计了交互控制方法,使得用户能够便捷使用“VR+药效团”虚拟筛选系统.试验表明所提系统能够增强用户在微观世界探索知识和分析解决问题的体验.未来将继续对微观分子领域中虚拟环境交互手段和人机交互界面进行改进,进一步提升用户的沉浸感和较长工作时间的用户体验,并在现有可穿戴设备基础上,应用手势识别的研究成果进行功能完善和优化.
[1] CHEN C Y.A novel integrated framework and improved methodology of computer-aided drug design[J]. Current topics inmedicinal chemistry, 2013, 13(9):965-969.
[2] SIJU E N. CADD:Pharmacological approaches in drug and drug discovery[J].World journal of pharmacy &pharmaceuticalences, 2017(17):892-908.
[3] LI H J, LEUNG K S,WONG M H,et al.Correcting the impact of docking pose generation error on binding affinity prediction[M].Springer international publishing, 2016.
[4] 黄琦,康宏,张端峰,等.基于配体、受体和复合物指纹的虚拟筛选方法比较[J].化学学报,2011, 69(5):515-522.
[5] WANG X,CHEN H,YANG F,et al.Idrug:a web-accessible and interactive drug discovery and design platform[J].Journal of cheminformatics,2014, 6 (1):28-35.
[6] 王栋,张晓晴.基于虚拟现实技术的锻造过程仿真实现[J].郑州大学学报(工学版),2016,37 (3):74-78.
[7] MCGANN M.FRED pose prediction and virtual screening accuracy[J].Journal of chemical information & modeling, 2011, 51(3):578-596.
[8] 王梦禹.基于机器学习的药物蛋白虚拟筛选方法研究[D].哈尔滨:哈尔滨理工大学计算机科学与技术学院,2016.
[9] 孙银雪.基于受体和配体的虚拟筛选整合平台研究[J]. 通化师范学院学报, 2015,36(4): 7-8.
[10] 郝艳娥,曾德骅.虚拟现实(VR)技术在数字化校园建设中的应用及前景展望[J]. 电子测试, 2014(5):136-138.
[11] 田东. 虚拟现实, 从未如此真实 HTC Vive开发者峰会体验手记[J].微型计算机, 2016(2):64-67.
[12] 刘晓峰.基于多种策略的虚拟筛选程序设计及其在药物发现中的应用[D].北京:中国科学院大学研究生院, 2010.
[13] 陶阳.基于Unity在Android平台上开发游戏的方法[J]. 电脑编程技巧与维护, 2012(19):73-77.