計算機輔助藥物設計(CADD)始于20世紀70年代,當時(shí)科學(xué)家首次使用計算機來(lái)預測藥物分子對生物系統的影響。
如今,CADD已成為藥物發(fā)現的一個(gè)重要工具,使研究人員能夠快速分析大型數據集并識別潛在的藥物靶點(diǎn)。
隨著(zhù)最近ChatGPT、GPT-4等為代表的人工智能技術(shù)的發(fā)展,或再掀AI研發(fā)熱潮!
從CADD到AIDD,藥物「智造」進(jìn)展如何?
CADD的「前世今生」
CADD開(kāi)發(fā)了虛擬篩選方法,可用于尋找有希望的化合物進(jìn)行藥物開(kāi)發(fā):
結合人工智能(AI)、機器學(xué)習(ML)和深度學(xué)習(DL)等技術(shù),可以處理大量的生物數據,從而在藥物開(kāi)發(fā)過(guò)程中減少時(shí)間和成本;根據蛋白質(zhì)或配體的3D結構的可用性使用兩種不同的技術(shù),它們被稱(chēng)為基于結構的藥物設計(SBDD)和基于配體的藥物設計(LBDD)。
在某些情況下,這兩種技術(shù)的結合在尋找先導分子方面表現出不錯的準確性。
圖1 CADD概覽
圖片來(lái)源:綜述論文1
下表列舉了CADD常用的對接軟件。
表1 常用CADD對接工具列表
注:增量構建是一種藥物發(fā)現的方法,即通過(guò)添加與目標蛋白契合度高的片段,一步步構建藥物分子。這種方法可以減少搜索空間,提高尋找最 佳候選藥物的效率。增量構建可以使用不同的算法,如FlexX,它使用一套規則,根據其結合親和力和幾何形狀選擇和放置片段。
資料來(lái)源:參考論文1
目前流行的采樣算法有三種:形狀匹配、系統搜索(窮舉搜索、分段搜索和構象集合)和隨機搜索算法(如蒙特卡洛算法、遺傳算法、禁忌搜索法和群體優(yōu)化法)。而流行的評分函數主要可分為三類(lèi):力場(chǎng)、經(jīng)驗和基于知識的評分函數。
作者發(fā)現商業(yè)對接軟件,可能比學(xué)術(shù)對接軟件有更好的性能。根據對1990年至2013年的所有分子對接文獻的分析,AutoDock12、GOLD12和Glide12是最常用的對接軟件。
然而,這并不意味著(zhù)這三個(gè)軟件比其他軟件更準確。更多關(guān)于分子對接程序的橫向評測可以參考文獻3。在文章里討論了多種分子對接軟件的效果,包括Autodock、Autodock Vina、Ledock、Rdock、UCSF DOCK、LigandFit、Glide、GOLD、MOE Dock、Surflex-dock等。
其次,CADD在藥物發(fā)現過(guò)程中仍存在一些問(wèn)題。
比如使用CADD預測結合親和力的挑戰,在過(guò)去三十年的研究中由于蛋白質(zhì)柔性,水的行為,擁擠效應等影響依然無(wú)法僅僅依靠CADD做出可靠的、普遍的預測。
另外,CADD只是產(chǎn)生想法,而藥物發(fā)現和生物學(xué)仍然需要非常多的實(shí)驗,和同行的交流中普遍感覺(jué)到目前藥物研發(fā)行業(yè)還是趨向保守。
因此,CADD仍然被視為藥物發(fā)現過(guò)程的支持部門(mén),而不是核心部門(mén)。
AI驅動(dòng)藥物設計的現狀
過(guò)去十年來(lái),人工智能(AI)一直在藥物發(fā)現領(lǐng)域取得進(jìn)展:采用人工智能方法的生物技術(shù)公司,有150個(gè)小分子藥物正在研發(fā),超15個(gè)已經(jīng)進(jìn)入臨床試驗階段。
據Exscientia公司報告,第一個(gè)由人工智能設計的候選藥物將在2020年初進(jìn)入臨床試驗。該候選藥物DSP-0038是一種雙靶點(diǎn)5-HT1a受體激動(dòng)劑和5-HT2a受體拮抗劑,是Exscientia和Sumitomo Dainippon Pharma之間合作的一部分。2021年5月宣布在美國啟動(dòng)DSP-0038的1期臨床研究。
近期涉及AI在藥物研發(fā)中應用的公司交易整理如下:
表2 人工智能應用于藥物研發(fā)的部分交易
資料來(lái)源:參考資料4
最近,筆者有幸聆聽(tīng)insilico medicine(英矽智能)團隊介紹他們最新的Pharma AI平臺,特別是引入了類(lèi)似chatgpt的界面大大方便了沒(méi)有深厚計算機基礎的藥物研發(fā)用戶(hù)的使用門(mén)檻。
圖2 英硅智能公司的PHARMA AI藥物研發(fā)平臺
如圖所示,英硅智能公司致力于促進(jìn)新藥發(fā)現和研發(fā)的三個(gè)領(lǐng)域:疾病靶點(diǎn)識別、合成生物學(xué)的生成和新型分子數據的生成、以及臨床試驗結果的預測
與傳統藥物研發(fā)流程相比,引入GPT的AI藥物研發(fā)平臺還可以通過(guò)在研究和開(kāi)發(fā)過(guò)程中減少失敗的嘗試次數來(lái)節省時(shí)間和資源。
此外,可以根據已知的蛋白質(zhì)結構和化學(xué)反應,預測新的化合物和藥物靶點(diǎn)。這意味著(zhù)研究人員可以更快地進(jìn)行藥物篩選和評估,從而縮短藥物研發(fā)周期。然而,這些技術(shù)仍處于早期階段,需要進(jìn)一步的發(fā)展和驗證,以確保其在藥物研發(fā)中的可靠性和安全性。
然而,人工智能在藥物發(fā)現中的方法需要在未來(lái)更好地考慮藥物的體內相關(guān)特性,數據生成和分析需要向更快、更低成本地到達安全和有效的藥物方向發(fā)展。
未來(lái)已來(lái):
GPT打破壁壘
GPT-4和ChatGPT是人工智能技術(shù)發(fā)展的縮影,具有影響藥物發(fā)現和開(kāi)發(fā)的潛力。
GPT-4可以提出新的化合物,從而加快和提高藥物發(fā)現的效率,也可能發(fā)現傳統方法未能發(fā)現的新藥。
ChatGPT是一款會(huì )話(huà)式聊天機器人,可以找到具有類(lèi)似性質(zhì)的化合物并對其進(jìn)行修改,以確保它們沒(méi)有被專(zhuān)利。這些技術(shù)有潛力釋放海量數據的能量,加速藥物發(fā)現和開(kāi)發(fā)的進(jìn)程。
下面,筆者就使用GPT工具來(lái)嘗試新藥研發(fā)初期常見(jiàn)的靶點(diǎn)立項基礎任務(wù)。
筆者以正在研究的靶向河馬通路下游TEAD開(kāi)發(fā)治療癌癥新藥為例,用GPT要求寫(xiě)一份已知化合物抑制劑的清單,并給出一個(gè)郵件模板方便筆者寫(xiě)信給CRO公司咨詢(xún)合成報價(jià)。
圖3 ChatGPT關(guān)于TEAD抑制劑的回答
為了比較,筆者嘗試了谷歌最新的BARD,結果如下:
圖4 BARD關(guān)于相同問(wèn)題的答案
相比ChatGPT找到了CA3(CIL56)化合物,BARD提出了更多候選化合物,包括共價(jià)抑制劑TEAD347等。
圖5 CA3的化學(xué)結構
兩個(gè)GPT都提到了CA3這個(gè)化合物。
通過(guò)Bing瀏覽器Edge dev版內置的Chat繼續提問(wèn)了解到CA3(CIL56)是一種小分子化合物,通過(guò)產(chǎn)生依賴(lài)鐵的活性氧(ROS)誘導細胞鐵死亡12。鐵死亡是近年來(lái)發(fā)現的一種新型細胞死亡方式,通常在細胞死亡過(guò)程中伴隨著(zhù)大量鐵積累和脂質(zhì)過(guò)氧化反應。CA3(CIL56)對YAP1/Tead轉錄活性具有強烈的抑制作用,主要靶向具有CSC特性的YAP1高表達和治療耐藥性的食管腺癌細胞。
圖6 使用bing chat可以通過(guò)互聯(lián)網(wǎng)更快找到可靠的參考來(lái)源
英文郵件格式也很貼心的準備好,稍作修改即可發(fā)給CRO公司,大大提高了效率。
圖7 地道英文生成的咨詢(xún)CRO公司合成目標化合物的商業(yè)郵件模板
除了以上幾款人工智能軟件外,筆者還近距離體驗了一款天然產(chǎn)物與AI相結合的AI研發(fā)平臺——藥智NPAIEngine。
據了解,NPAIEngine是一個(gè)天然產(chǎn)物+AI研發(fā)平臺,由藥智網(wǎng)與英國伯明翰大學(xué)何山教授等團隊合作打造,特別適用于聚焦于天然產(chǎn)物與中藥研發(fā)領(lǐng)域。
據介紹該平臺匯聚了全球約3.5萬(wàn)種植物、生物和礦物質(zhì)的57萬(wàn)個(gè)天然產(chǎn)物,并應用了AIA Insights自主研發(fā)的核心AI算法。
圖8 NPAIEngine天然產(chǎn)物AI研發(fā)平臺
通過(guò)將天然產(chǎn)物中的化合物結構數據庫、化合物生物活性數據庫以及相應的疾病數據庫有機地結合起來(lái),NPAIEngine的強大功能使得用戶(hù)能夠篩選出天然產(chǎn)物中的有效成分,并預測這些成分對于特定靶點(diǎn)或疾病的作用。
另外,基于輸入的天然物化學(xué)結構利用藥物AI從頭設計算法,設計可合成性高、成藥性好、具有新穎專(zhuān)利結構的先導化合物優(yōu)化功能也即將年內上線(xiàn)。
小 結
盡管AI在藥物開(kāi)發(fā)中展現出了巨大的潛力,但也面臨著(zhù)一些挑戰和障礙:基于人工智能的方法通常是數據密集型的,需要大量的數據集以獲得準確的結果。
此外,基于人工智能的方法可能難以解釋?zhuān)沟没谌斯ぶ悄艿乃幬锇l(fā)現的結果難以解釋?;谌斯ぶ悄艿乃幬锇l(fā)現可能是昂貴的,因為它往往需要專(zhuān)門(mén)的硬件和軟件。不過(guò)筆者認為隨著(zhù)GPT技術(shù)的普及,通過(guò)聊天方式就可以高效解決以往需要費時(shí)費力才能搞定的問(wèn)題指日可待。
接下來(lái)傳統藥物研發(fā)團隊,更多要關(guān)注新藥開(kāi)發(fā)過(guò)程中數據質(zhì)量和可用性、算法可解釋性和可靠性、知識產(chǎn)權和監管問(wèn)題等。要充分利用AI在藥物開(kāi)發(fā)中的價(jià)值,需要投資數據、技術(shù)、新技能和行為,并實(shí)現整個(gè)研發(fā)過(guò)程的轉型。傳統制藥公司需要及時(shí)跟上AI帶來(lái)的變革,并與AI先驅公司進(jìn)行合作或競爭。
參考文獻:
1.Vemula,D.,Jayasurya,P.,Sushmitha,V.,Kumar,Y.N.and Bhandari,V.,2022.CADD,AI and ML in Drug Discovery:A Comprehensive Review.European Journal of Pharmaceutical Sciences,p.106324.
2.Ledock介紹:生信云實(shí)證,ledock分子對接,ledock實(shí)證,虛擬篩選-速石科技BLOG(fastonetech.com)
3.十種分子對接程序的綜合評價(jià):基于多種蛋白-配體復合物、采樣能力和評分能力的預測精度-四川魔德科技有限公司(modekeji.cn)
4.Tapping into the drug discovery potential of AI(nature.com)
5.在藥物發(fā)現中采用人工智能https://www.bcg.com/publications/2022/adopting-ai-in-pharmaceutical-discovery
6.How Artificial Intelligence is Changing Drug Discovery and Development?.https://www.delveinsight.com/blog/artificial-intelligence-in-drug-discovery
7.AI in drug discovery and development:A brief commentary.https://www.pharmatutor.org/articles/ai-in-drug-discovery-and-development-a-brief-commentary
8.AI&Machine Learning in Drug Discovery&Development(2022)-Insider Intelligence.https://www.insiderintelligence.com/insights/ai-machine-learning-in-drug-discovery-development/
9.有關(guān)異黃酮Dracaeconolide B發(fā)表在JNP的論文https://pubs.acs.org/doi/10.1021/acs.jnatprod.2c00859
10.NPAIengine平臺網(wǎng)址:https://app.npaiengine.com/login
11.Hermite直播間|精彩回顧:分子對接與打分函數:歷史、現狀與新工具
合作咨詢(xún)
肖女士
021-33392297
Kelly.Xiao@imsinoexpo.com