技術(shù)
導(dǎo)讀:AI+藥物研發(fā),正以肉眼可見的速度崛起。不論是AI技術(shù),還是AI技術(shù)在制藥領(lǐng)域的應(yīng)用,都是全球多個(gè)國(guó)家大力發(fā)展的領(lǐng)域。
新藥研發(fā)現(xiàn)狀與借力AI的期待
新藥研發(fā)具有成本高(10億左右)、研發(fā)周期長(zhǎng)(10-12年)、成功率低(14%左右)三大高風(fēng)險(xiǎn)特性,而且制藥檢測(cè)及生產(chǎn)等環(huán)節(jié)也是如此。
事實(shí)上,藥物開發(fā)的投資回報(bào)率從2010年的10%穩(wěn)步下降至2018年的2%左右。
研發(fā)周期長(zhǎng)、成本高、成功率低已經(jīng)成為新藥研發(fā)的“三座大山”。
因此降低研發(fā)費(fèi)用,提高成功率,縮短周期,開發(fā)有差異性、競(jìng)爭(zhēng)力、技術(shù)門檻高的藥物是各大制藥公司迫切需要解決的問題。
因此近年來,人工智能與生物醫(yī)藥的結(jié)合興起,利用AI技術(shù)的認(rèn)知能力,人工智能技術(shù)很好地解決了生物主要所面臨的痛點(diǎn),在多方面促使生物制藥由勞動(dòng)力密集型向智能技術(shù)型轉(zhuǎn)變。
AI技術(shù)在自然語言處理、圖像識(shí)別、深度學(xué)習(xí)和認(rèn)知計(jì)算等方面的優(yōu)勢(shì)可應(yīng)用到新藥研發(fā)的各個(gè)環(huán)節(jié)。
據(jù)估算,從靶點(diǎn)確定到臨床候選藥物環(huán)節(jié),通過AI輔助計(jì)算的方法,可以把傳統(tǒng)研發(fā)方法需要的時(shí)間從3—6年壓縮到1—2年,從而大幅提升效率并節(jié)省成本。
數(shù)據(jù)海洋中AI被寄予厚望
新藥研發(fā)的成功率本來已經(jīng)很低了,如果AI能把1%,提到2%、3%,就已經(jīng)是發(fā)揮作用了。
根據(jù)藥物研發(fā)過程,AI技術(shù)可用于靶點(diǎn)發(fā)現(xiàn)、早期藥物研發(fā)、臨床前實(shí)驗(yàn)的設(shè)計(jì)與處理、臨床試驗(yàn)、現(xiàn)有藥物再利用、信息整合與新見解輸出等多個(gè)方向。
AI已被一些大型制藥公司視為新的藥物研發(fā)工具。構(gòu)建模型和從非結(jié)構(gòu)化數(shù)據(jù)中挖掘數(shù)據(jù),被認(rèn)為是人工智能在藥物發(fā)現(xiàn)方面最具顛覆性的領(lǐng)域。
而在靶點(diǎn)發(fā)現(xiàn)和早期藥物發(fā)現(xiàn)具體環(huán)節(jié),AI技術(shù)常被用于這些方面:
分析數(shù)據(jù)集,形成假設(shè)并產(chǎn)生新見解;識(shí)別候選新藥;通過對(duì)比分析健康人群和患者樣本的數(shù)據(jù)來尋找新的生物標(biāo)記物和治療靶點(diǎn);預(yù)測(cè)分子的親和力和其他藥理特性;降低蛋白質(zhì)設(shè)計(jì)的復(fù)雜性。
在臨床前實(shí)驗(yàn)的設(shè)計(jì)與處理環(huán)節(jié),AI技術(shù)希望被用來減少實(shí)驗(yàn)階段時(shí)間、降低成本和不確定性。
一般情況下,AI制藥公司會(huì)通過分析已有數(shù)據(jù)來尋找新的研發(fā)角度,自動(dòng)化樣品分析與機(jī)器云實(shí)驗(yàn)室也隨之興起。
在臨床試驗(yàn)階段,AI技術(shù)被期待的用途則更多。例如,優(yōu)化臨床試驗(yàn)研究設(shè)計(jì);將不同的生物醫(yī)學(xué)和醫(yī)療保健數(shù)據(jù)流轉(zhuǎn)換為代表個(gè)體患者的計(jì)算機(jī)模型;通過為個(gè)別患者提供最佳的健康干預(yù)措施,從而提供大規(guī)模個(gè)性化醫(yī)療;通過分析病歷,尋找合適的臨床試驗(yàn)患者;通過個(gè)人病史和基因分析自動(dòng)匹配癌癥患者的臨床試驗(yàn);改善病理分析。
AI+新藥研發(fā)領(lǐng)域投資情況
據(jù)統(tǒng)計(jì),2020年全球AI+新藥研發(fā)領(lǐng)域的投資已經(jīng)超過18.3億美元,是2015年投資額的5.4倍。
有統(tǒng)計(jì)顯示,2020年全球AI+新藥研發(fā)領(lǐng)域的投資已經(jīng)超過18.3億美元,是2015年投資額的5.4倍。
值得一提的是,在2021Q1,就已有超10家國(guó)內(nèi)外AI制藥公司完成了不同輪次的融資。
從整體來看,目前全球共有138家AI+藥物研發(fā)初創(chuàng)企業(yè),美國(guó)擁有86家,數(shù)量較多多,其次為英國(guó)及加拿大,以色列、日本、韓國(guó)也有企業(yè)分布。
相較來說,與國(guó)外相比我國(guó)AI藥物研發(fā)起步較晚,目前尚處在初期階段。
但近年來,隨著國(guó)內(nèi)一系列政策助推,以及醫(yī)藥創(chuàng)新氛圍的日漸濃厚,也已經(jīng)開始涌現(xiàn)出了晶泰科技、深度智耀、云勢(shì)軟件、望石智慧等一批創(chuàng)新企業(yè)。
國(guó)內(nèi)科技巨頭,除了投資相關(guān)公司以外,也做好了自己下場(chǎng)的準(zhǔn)備。百度成立百圖生科、騰訊推出云深智藥;華為官網(wǎng)掛出的招聘藥物研發(fā)算法工程師的操作。
AI與制藥探索磨合
數(shù)據(jù)產(chǎn)生:在生物醫(yī)藥行業(yè),包括數(shù)據(jù)可重復(fù)性在內(nèi)的數(shù)據(jù)質(zhì)量問題一直存在。為此,一些AI藥物發(fā)現(xiàn)初創(chuàng)公司除了使用公開來源、合作伙伴等渠道獲得的數(shù)據(jù)以外,尋求開發(fā)新的數(shù)據(jù)來源,包括自建實(shí)驗(yàn)室獲取數(shù)據(jù)、將“濕實(shí)驗(yàn)”的部分外包給CRO獲得數(shù)據(jù)、借助遠(yuǎn)程機(jī)器人來生產(chǎn)數(shù)據(jù)等。
數(shù)據(jù)共享:對(duì)于機(jī)器學(xué)習(xí)來說,數(shù)據(jù)量越大,預(yù)測(cè)的準(zhǔn)確性可能就越高。為此,制藥公司嘗試組成聯(lián)盟來開展基于AI的藥物研發(fā)。
數(shù)據(jù)治理:以新型冠狀病毒肺炎為例,新冠病毒在全球范圍內(nèi)傳播的同時(shí),眾多國(guó)家和地區(qū)呼吁共享新冠肺炎的研究數(shù)據(jù)集和相關(guān)研究文獻(xiàn),并建議發(fā)布者同時(shí)提供可以直接應(yīng)用人工智能的全文和數(shù)據(jù)格式,便于再次研究和分析。
國(guó)內(nèi)AI藥物研發(fā)困境
①從全球人才流向看,大多數(shù)AI技術(shù)人才仍匯集在美國(guó)。斯坦福大學(xué)人工智能研究所發(fā)布的《人工智能指數(shù)2021年年度報(bào)告》顯示,2019年北美人工智能專業(yè)畢業(yè)的博士中有65%進(jìn)入產(chǎn)業(yè)界,其中有64.3%的人是國(guó)際學(xué)生。而國(guó)際學(xué)生中有81.8%的人選擇了留在美國(guó)工作。
②缺乏可用的高質(zhì)量數(shù)據(jù),這仍是AI技術(shù)需要邁過的一道坎。目前來看,公共數(shù)據(jù)庫內(nèi)的數(shù)據(jù)并不能很好地實(shí)現(xiàn)建模,而高質(zhì)量的數(shù)據(jù)很少且難獲取。
③缺乏倫理共識(shí)和完善的監(jiān)管規(guī)定。目前AI技術(shù)在倫理和監(jiān)管方面仍缺乏基準(zhǔn)和共識(shí),在制藥行業(yè)的應(yīng)用亦是如此。
結(jié)尾
然而,任何技術(shù)的應(yīng)用和推廣很難一蹴而就,螺旋式上升、波浪式前進(jìn)是新事物的發(fā)展規(guī)律。藥物研發(fā)或許還需要更多更深入的探索和實(shí)踐才能真正體現(xiàn)AI的價(jià)值。
作者 | 方文