人工智能藥物篩選、藥物設(shè)計(jì)及毒性預(yù)測(cè)算法
本成果采用最新的深度學(xué)習(xí)和分子模擬算法,結(jié)合新一代分子特征化方法,開(kāi)發(fā)了多種計(jì)算機(jī)模型,可用于藥物開(kāi)發(fā)中的多個(gè)階段,為藥物的快速設(shè)計(jì)開(kāi)發(fā)提供一個(gè)完整的基于人工智能的解決方案。成果:1.藥物毒性預(yù)測(cè)方法:傳統(tǒng)的化合物毒性檢測(cè)技術(shù)一般需要使用生化試驗(yàn)、細(xì)胞實(shí)驗(yàn)、甚至動(dòng)物模型,這些方法不僅耗費(fèi)大量時(shí)間,而且成本很高。使用計(jì)算模型進(jìn)行有機(jī)化合物的毒性預(yù)測(cè),所需投入較少,但產(chǎn)出巨大。特別是基于化合物的物理化學(xué)和結(jié)構(gòu)特性的計(jì)算模型,甚至能夠在化合物合成之前就對(duì)其進(jìn)行預(yù)測(cè),大大提高了效率,使其越來(lái)越受到歡迎。在進(jìn)行體外和體內(nèi)試驗(yàn)之前先使用計(jì)算機(jī)模型對(duì)化合物進(jìn)行大規(guī)模的毒性篩選,能夠更好地解決候選藥物具有毒性的問(wèn)題。我們建立了一套新的基于多種分子指紋和機(jī)器學(xué)習(xí)算法的化合物毒性預(yù)測(cè)集成學(xué)習(xí)算法,運(yùn)用此集成學(xué)習(xí)算法建立了新的有機(jī)化合物致癌性、致突變性和肝毒性預(yù)測(cè)模型。我們分別建立了名為CarcinoPred-EL (http://112.126.70.33/toxicity/CarcinoPred-EL/, 致癌性預(yù)測(cè))、MutagenPred-EL (http://112.126.70.33/toxicity/MutagenPred-EL/, 致突變性預(yù)測(cè))、LiverToxPred-EL (http://112.126.70.33/toxicity/LiverToxPred-EL/, 肝毒性預(yù)測(cè))的預(yù)測(cè)服務(wù)器,這些服務(wù)器能夠?yàn)槭褂谜咛峁└咝Ц憬莸念A(yù)測(cè)技術(shù)服務(wù)。自2017年服務(wù)器發(fā)表起,我們已為國(guó)內(nèi)外藥物分子設(shè)計(jì)研究者提供了5000多次共計(jì)超過(guò)20多萬(wàn)個(gè)化合物的毒性預(yù)測(cè)服務(wù)。在有機(jī)化合物毒性預(yù)測(cè)研究方向,我們主要完成了化合物的細(xì)胞毒性、心臟毒性、生殖毒性、血腦屏障透過(guò)性、水生生物毒性預(yù)測(cè)模型,以及糖尿病早期篩查模型的開(kāi)發(fā),正在進(jìn)行P450酶阻滯劑性預(yù)測(cè)模型、基于圖神經(jīng)網(wǎng)絡(luò)的毒性預(yù)測(cè)算法研究、基于分子對(duì)接的化合物毒性預(yù)測(cè)研究等。相關(guān)研究成果已發(fā)表多篇學(xué)術(shù)論文(Zhang L., et al. Scientific Reports, 2017, 7: 2118. WOS被引次數(shù)80,ESI 1%高被引論文;Ai H., et al. Toxicological Sciences, 2018, 165: 100-107;Yin Z., et al. Journal of Applied Toxicology. 2019, 39(10): 1366-1377;Ai H., et al. Ecotoxicology and Environmental Safety. 2019, 179: 71-78;Liu M., et al. Toxicology Letters. 2020, 332: 88-96;Feng H., et al. Toxicology Letters. 2021, 340: 4-14;Li S. et al. Interdisciplinary Sciences: Computational Life Sciences. 2021, 13: 25-33.)致癌性預(yù)測(cè)服務(wù)器首頁(yè)致癌性預(yù)測(cè)結(jié)果頁(yè)相關(guān)綜述對(duì)本服務(wù)器的介紹RF-hERG-Score預(yù)測(cè)藥物引起的hERG相關(guān)心臟毒性2.藥物設(shè)計(jì)方法:在計(jì)算機(jī)上對(duì)藥物靶點(diǎn)和藥物分子的結(jié)構(gòu)和活性建模,計(jì)算藥物與靶點(diǎn)之間的相互作用關(guān)系,從而設(shè)計(jì)出具有治療作用的藥物。計(jì)算機(jī)輔助藥物設(shè)計(jì)可以為藥物設(shè)計(jì)各階段的實(shí)驗(yàn)方案提供有意義的指導(dǎo),減少需要通過(guò)實(shí)驗(yàn)評(píng)估的候選藥物的數(shù)量,從而加快新藥研發(fā)速度。我們應(yīng)用分子對(duì)接、分子動(dòng)力學(xué)模擬、自由能計(jì)算、機(jī)器學(xué)習(xí)等方法研究流感病毒等重要疾病的計(jì)算機(jī)輔助藥物設(shè)計(jì)、并開(kāi)發(fā)更有效的計(jì)算機(jī)輔助藥物設(shè)計(jì)方法。在計(jì)算機(jī)輔助藥物設(shè)計(jì)研究我們主要完成了流感病毒M2質(zhì)子通道蛋白抑制劑虛擬篩選方法研究,正在進(jìn)行先導(dǎo)化合物生成模型研究、基于機(jī)器學(xué)習(xí)的虛擬篩選打分函數(shù)算法開(kāi)發(fā)、SARS-CoV-2病毒S蛋白與受體相互作用及藥物設(shè)計(jì)研究。特異性重打分函數(shù)顯著虛擬篩選性能顯著較高篩選出兩個(gè)候選抑制劑3.藥物靶點(diǎn)識(shí)別方法:長(zhǎng)非編碼RNA(lncRNA)是一種長(zhǎng)度在200nt至100,000nt之間的非編碼RNA,是轉(zhuǎn)錄物的主要成分。研究表明lncRNA在許多生物學(xué)和病理學(xué)過(guò)程中起著重要作用。lncRNA起作用的重要途徑是與其靶蛋白結(jié)合。lncRNA-蛋白質(zhì)相互作用的實(shí)驗(yàn)研究需要大量資源。累積的實(shí)驗(yàn)數(shù)據(jù)使得通過(guò)計(jì)算方法預(yù)測(cè)lncRNA-蛋白質(zhì)相互作用成為可能。我們使用各種數(shù)學(xué)建模和機(jī)器學(xué)習(xí)方法開(kāi)發(fā)了幾種用于預(yù)測(cè)lncRNA-蛋白質(zhì)相互作用的新模型。這些模型命名為:RWLPAP(隨機(jī)游走),LPI-NRLMF(鄰域正則化邏輯矩陣分解),IRWNRLPI(集成隨機(jī)游走和鄰域規(guī)則化Logistic矩陣分解),LPI-BNPRA(雙向網(wǎng)絡(luò)投影推薦算法),LPI-ETSLP(基于特征值變換的半監(jiān)督鏈路預(yù)測(cè)),HLPI-Ensemble(集成學(xué)習(xí))。在交叉驗(yàn)證中,我們的模型獲得了較好的預(yù)測(cè)性能。lncRNA-蛋白質(zhì)相互作用預(yù)測(cè)模型的性能比較lncRNA-蛋白質(zhì)相互作用預(yù)測(cè)服務(wù)器相關(guān)軟件著作權(quán):
遼寧大學(xué)
2021-04-10