萬物皆可ChatGPT?
自去年 12 月(美國時(shí)間 11 月 30 日)發(fā)布以來,ChatGPT 火爆全球,不斷刷屏。從寫郵件、做食譜、寫詩歌、精通十以內(nèi)加減法,到寫出較高水平的代碼和論文,通過了商科、法學(xué)和醫(yī)學(xué)院的研究生水平考試,再到 ChatGPT 成功通過了谷歌的面試,并拿到了年薪 18 萬美元的 L3 工程師 offer......
瑞士銀行巨頭瑞銀集團(tuán)的一份報(bào)告指出,推出僅兩個(gè)月后,ChatGPT 月活用戶已經(jīng)突破了 1 億,成為史上用戶增長速度最快的消費(fèi)級應(yīng)用程序,更是成為一款“現(xiàn)象級”的 AI 產(chǎn)品。
ChatGPT 是 OpenAI 推出的一款對話機(jī)器人,也被視為有史以來最好的AI聊天機(jī)器人,本質(zhì)上是一個(gè)大規(guī)模預(yù)訓(xùn)練語言模型。這是在自然語言模型 GPT-3.5(GPT-3 的升級版)的基礎(chǔ)上進(jìn)行調(diào)整、優(yōu)化的產(chǎn)品,也是生成式 AI 工具。有業(yè)內(nèi)人士將 ChatGPT 比喻為“搜索引擎+社交軟件”的結(jié)合體,能夠通過實(shí)時(shí)互動獲得問題的答案。
生成式 AI 近期所取得的一系列新突破有可能徹底改變?nèi)藗儍?nèi)容創(chuàng)作的方式,從編程再到視頻、藝術(shù)、寫作、游戲、數(shù)學(xué)計(jì)算到生物醫(yī)藥等等。
比爾·蓋茨稱,ChatGPT、 Bing 聊天機(jī)器人和谷歌的 AI 聊天機(jī)器人 Bard 等模型在全球范圍內(nèi)開啟了一種新形式的革命。
蒙特利爾高等商學(xué)院計(jì)算機(jī)系的終身副教授唐建在《理解未來》科學(xué)講座上表示,生成式 AI 近年來快速取得突破性發(fā)展,ChatGPT 則是生成式 AI 快速發(fā)展的一個(gè)重要里程碑。與其他領(lǐng)域類似,ChatGPT 在生物醫(yī)藥領(lǐng)域內(nèi)有著同樣的機(jī)會,理論上我們完全可以開發(fā)出生物醫(yī)藥領(lǐng)域的“ChatGPT”。
比如說,生成式 AI 在生物醫(yī)藥領(lǐng)域有許多應(yīng)用,包括尋找病因、發(fā)現(xiàn)新的藥物靶點(diǎn)以及生成全新的小分子和抗體。
Nature Biotechnology 上的一篇社論文章也指出,生成式 AI 正在生物醫(yī)學(xué)領(lǐng)域全速前進(jìn)。
生成式 AI 被視為人工智能皇冠上一顆璀璨的“明珠”,已經(jīng)在多個(gè)領(lǐng)域表現(xiàn)出獨(dú)特的價(jià)值。該技術(shù)始于 2014 年,誕生于 Yoshua Bengio 與 Ian Goodfellow 發(fā)表的開創(chuàng)性論文“生成對抗網(wǎng)絡(luò)(GAN)”。截止目前,這篇論文被引用了超過 5.5 萬次。
這是一類能根據(jù)輸入?yún)?shù)生成新內(nèi)容的算法,包括無監(jiān)督和半監(jiān)督訓(xùn)練技術(shù),能夠使用已創(chuàng)建的文本、圖像、音頻、視頻和代碼等創(chuàng)建新的內(nèi)容。與信息分析和處理的 AI 不同,生成式 AI 的出現(xiàn)可能會對多個(gè)行業(yè)產(chǎn)生更為深遠(yuǎn)的影響。生成即創(chuàng)造,該算法的突破也意味著 AI 開始走向了創(chuàng)造新內(nèi)容的發(fā)展路徑。
生成式 AI 模型通常需要在大型數(shù)據(jù)集上進(jìn)行訓(xùn)練學(xué)習(xí),并使用機(jī)器學(xué)習(xí)算法生成與訓(xùn)練數(shù)據(jù)相似的新內(nèi)容。該算法在各種應(yīng)用程序中很有幫助,比如創(chuàng)建藝術(shù)、音樂和聊天機(jī)器人生成文本等。這種算法模型類型多樣,常見的生成模型包括生成對抗網(wǎng)絡(luò)(GAN)、VAE 和自回歸模型。比較有代表性的生成式 AI 模型包括 DALL-E、DALL-E2、ProGen 以及 ChatGPT 等。
Insilico Medicine 創(chuàng)始人兼聯(lián)合首席執(zhí)行官 Alex Zhavoronkov 指出,“生成式 AI 可根據(jù)生成條件來生成合成數(shù)據(jù),目前已被應(yīng)用于醫(yī)療健康領(lǐng)域的方方面面,從靶點(diǎn)發(fā)現(xiàn)、小分子設(shè)計(jì)、生成合成生物數(shù)據(jù)、醫(yī)療和美容成像等等。任何地方,當(dāng)你需要在醫(yī)療健康領(lǐng)域中使用 ‘AI 想象力’,GANs 就會是忠實(shí)的朋友。”
Forbes 上的一篇文章也這樣寫道,類似于 iPhone 等手機(jī)快速成為我們生活中不可或缺的一部分,ChatGPT 等先進(jìn)的生成式 AI 工具將深刻變革醫(yī)療健康領(lǐng)域。
首先,ChatGPT 等工具會隨著經(jīng)驗(yàn)和計(jì)算能力的提高,相應(yīng)提高敏銳度和準(zhǔn)確性。還可以通過學(xué)習(xí)幫助醫(yī)生或者護(hù)士行醫(yī)就診、預(yù)防醫(yī)藥差錯(cuò)等。比方說,下一代 ChatGPT 可能會具備視頻功能,以此觀察醫(yī)生和護(hù)士,并將其行為和循證指南進(jìn)行比較,在醫(yī)生和護(hù)士做出誤判時(shí)給出指導(dǎo)。同時(shí),根據(jù)監(jiān)測數(shù)據(jù)進(jìn)一步防止用藥錯(cuò)誤等等。
其次,針對一些慢性疾病,下一代生成式 AI 工具將能夠全天候 24/7 監(jiān)測患者并提供持續(xù)的日常護(hù)理。
此外,也可以應(yīng)用于新藥研發(fā)領(lǐng)域,通過學(xué)習(xí)生成和設(shè)計(jì)出全新的蛋白質(zhì)和抗體分子。
生物醫(yī)藥領(lǐng)域經(jīng)歷了多次的變革,基因測序、基因編輯、冷凍電鏡等新技術(shù)的發(fā)展加速了生物醫(yī)藥領(lǐng)域內(nèi)生物數(shù)據(jù)的指數(shù)級增加,這些數(shù)據(jù)包括蛋白質(zhì)數(shù)據(jù)、抗體序列數(shù)據(jù)以及結(jié)構(gòu)數(shù)據(jù)。
上文提到,生成式 AI 模型需要大量的數(shù)據(jù)和代碼數(shù)據(jù)進(jìn)行預(yù)訓(xùn)練。基于大量的生物數(shù)據(jù)和生成式 AI 的天然屬性,理論上人們完全可以預(yù)訓(xùn)練出一個(gè)生物制藥領(lǐng)域的生成式 AI 模型,類似于“ChatGPT”。
唐建在《生命科學(xué)中的生成式人工智能:如何搭建生命科學(xué)的“ChatGPT”》講座中談到,“生成式 AI 非常適用于藥物發(fā)現(xiàn),尤其是蛋白質(zhì)、抗體設(shè)計(jì),此類型模型可以生成全新的蛋白質(zhì)和全新的分子,并幫助科學(xué)家們發(fā)現(xiàn)更好的藥物。以蛋白質(zhì)設(shè)計(jì)領(lǐng)域?yàn)槔徽撌切》肿舆€是蛋白質(zhì)分子,本質(zhì)而言都需要生成一些新的結(jié)構(gòu)。通過融入 ChatGPT,可以提升蛋白質(zhì)設(shè)計(jì)的創(chuàng)新度和多樣性。”
事實(shí)上,科學(xué)家們已經(jīng)嘗試?yán)?ChatGPT 進(jìn)行藥物發(fā)現(xiàn),通過分析科學(xué)論文、專利和臨床試驗(yàn)數(shù)據(jù)識別新的藥物靶點(diǎn)和潛在的藥物相互作用。
阿斯利康在將 ChatGPT 應(yīng)用于藥物發(fā)現(xiàn)的一項(xiàng)研究中表示,ChatGPT 可以識別出傳統(tǒng)方法未發(fā)現(xiàn)的新靶點(diǎn),并展示了生成式 AI 算法在加速藥物發(fā)現(xiàn)過程的潛力。
劍橋大學(xué)的研究人員利用 ChatGPT 分析科學(xué)文獻(xiàn)并確定了一個(gè)治療阿爾茨海默病的新靶點(diǎn);舊金山加利福尼亞大學(xué)的研究人員使用 ChatGPT 分析電子健康記錄并識別現(xiàn)實(shí)環(huán)境中存在的潛在藥物間相互作用關(guān)系。
IT 研究與顧問咨詢公司 Gartner 的分析師指出,幾乎所有大型制藥公司和許多小型制藥初創(chuàng)公司已瞄準(zhǔn)基于類似于 ChatGPT 的生成式 AI 技術(shù)進(jìn)行新藥研發(fā),并利用其設(shè)計(jì)針對疾病蛋白質(zhì)屬性或功能的藥物,一些藥物現(xiàn)在正處于臨床試驗(yàn)階段。
預(yù)計(jì)到 2025 年,生成式 AI 將用于發(fā)現(xiàn) 30% 的新藥和工業(yè)材料。這是制藥業(yè)的一個(gè)重大變化。
其中,成立于 2020 年的 AI 制藥 Generate Biomedicines 使用生成式 AI 來生成并設(shè)計(jì)可用作新型療法的蛋白質(zhì);2015 年成立的 AI 藥物發(fā)現(xiàn)公司 Standigm 也使用生成式 AI 工具通過查詢大型生物醫(yī)學(xué)數(shù)據(jù)庫在短短 2 個(gè)月內(nèi)創(chuàng)建了數(shù)百種新分子。
視線回到國內(nèi),公開資料顯示,Insilico Medicine 是國內(nèi)一家將生成式 AI 應(yīng)用于藥物研發(fā)領(lǐng)域的 AI 制藥公司,旗下生成化學(xué)平臺 Chemistry42 合成多款新型化合物結(jié)構(gòu),大約幾小時(shí)到數(shù)十小時(shí)可以針對特定蛋白生成新分子;晶泰科技聯(lián)合創(chuàng)始人、首席創(chuàng)新官賴力鵬博士也表示,公司目前也有類似的生成算法,主要在 AI 抗體發(fā)現(xiàn)等蛋白質(zhì)生成領(lǐng)域有所應(yīng)用,底層邏輯也與 ChatGPT 這樣的語言模型有類似之處。
根據(jù)相關(guān)數(shù)據(jù), 2022 年,生成式 AI 領(lǐng)域投資超過 13.7 億美元,隨著該模型在生物醫(yī)學(xué)領(lǐng)域獲得更多關(guān)注,該領(lǐng)域的投資金額可能會進(jìn)一步持續(xù)增加。預(yù)計(jì)到 2040 年,生成式 AI 可能會為醫(yī)療健康行業(yè)帶來 1 萬億美元的價(jià)值。
ChatGPT 一定程度上引發(fā)了業(yè)內(nèi)對于 ChatGPT 以及生成式 AI 算法的熱捧,雖然在醫(yī)療健康具有一定的應(yīng)用潛力,但是真正應(yīng)用于醫(yī)療健康尤其是生物制藥領(lǐng)域還存在一些現(xiàn)實(shí)挑戰(zhàn)。
賴力鵬坦言,ChatGPT 是基于大數(shù)據(jù)大模型,相比以前的類似算法,在文本生成和問答上的應(yīng)用獲得了質(zhì)的提升。不過,ChatGPT 在核對事實(shí)的能力上仍有局限,目前可以在人的引導(dǎo)下作為效率工具使用。這類工具更適合比較寬泛的邏輯梳理和信息歸納,然而,生物醫(yī)藥領(lǐng)域?qū)ι伤惴ǖ慕Y(jié)果有更高、更具體的要求,需要更精確的產(chǎn)出(比如同時(shí)具有多個(gè)特定性質(zhì)的小分子或者蛋白質(zhì)片段),現(xiàn)階段醫(yī)藥健康領(lǐng)域還不是 ChatGPT 擅長的方向。
Alex Zhavoronkov 也表示,考慮到 ChatGPT 使用的訓(xùn)練集和訓(xùn)練它的 AI 訓(xùn)練師水平,存在準(zhǔn)確性問題,暫時(shí)不建議將其直接應(yīng)用于任何生物醫(yī)學(xué)領(lǐng)域。我認(rèn)為,需要考慮醫(yī)療領(lǐng)域?qū)?zhǔn)確率和專業(yè)知識的要求,更期待開發(fā)出在醫(yī)療健康領(lǐng)域類似 ChatGPT 的專門系統(tǒng)。
賴力鵬進(jìn)一步從生成式AI算法角度解釋道,當(dāng)前,生成AI在生物醫(yī)藥領(lǐng)域的主要應(yīng)用限制在于高質(zhì)量結(jié)構(gòu)性數(shù)據(jù)的獲取,以及數(shù)據(jù)的平衡性(比如,除了獲得發(fā)表的成功實(shí)驗(yàn)數(shù)據(jù),其實(shí)失敗實(shí)驗(yàn)、項(xiàng)目的數(shù)據(jù)也很重要)。
而生命科學(xué)領(lǐng)域?qū)π畔⒌臏?zhǔn)確、邏輯的嚴(yán)謹(jǐn)都有更高的要求,未來如果想在生命科學(xué)領(lǐng)域用到 ChatGPT 等生成式 AI 算法,可能需要模型中針對性地處理更多的科學(xué)內(nèi)容,公開數(shù)據(jù)源,并且投入人力運(yùn)維,才能讓產(chǎn)出的內(nèi)容不僅通順,而且正確。
“此外,如何開源分享私有數(shù)據(jù)、防止濫用和數(shù)據(jù)偏見也都是類似生成式 AI 工具應(yīng)用在生命科學(xué)領(lǐng)域中需要面對的問題。”賴力鵬說。
Alex Zhavoronkov 認(rèn)為,在生物制藥領(lǐng)域,現(xiàn)在面臨的真正問題是,人們可能知道所有人類生物學(xué)、化學(xué)和物理學(xué)的 0.1%,但是對于如何改變這些缺乏觀點(diǎn),因此即使有生成式 AI 的重大進(jìn)展,也不可能從 0.1% 產(chǎn)生 100% 的知識。
當(dāng)下,我們更需要做很多的研究和探索。生成式 AI 可能在某種程度上幫助發(fā)現(xiàn)靶點(diǎn)、生成分子,甚至從無到有產(chǎn)生一些新穎的想法,但在很長一段時(shí)間內(nèi),它不會取代實(shí)驗(yàn)。
“ChatGPT 讓我們看到了 AI 在各個(gè)領(lǐng)域中幫助人類科學(xué)家跳脫個(gè)人信息處理能力上限、實(shí)現(xiàn)高效創(chuàng)新的潛力。我相信,未來,如果 ChatGPT 等生成式 AI 模型在特定方向的數(shù)據(jù)上加強(qiáng)訓(xùn)練,將有機(jī)會在特定領(lǐng)域,包括生物制藥領(lǐng)域,大放異彩。”賴力鵬總結(jié)道。
本文鏈接:http://www.tebozhan.com/showinfo-62-1196-0.htmlChatGPT是生物醫(yī)藥發(fā)展的新機(jī)遇?
聲明:本網(wǎng)頁內(nèi)容由互聯(lián)網(wǎng)博主自發(fā)貢獻(xiàn),不代表本站觀點(diǎn),本站不承擔(dān)任何法律責(zé)任。天上不會到餡餅,請大家謹(jǐn)防詐騙!若有侵權(quán)等問題請及時(shí)與本網(wǎng)聯(lián)系,我們將在第一時(shí)間刪除處理。
上一篇: 穩(wěn)健醫(yī)療的“馬拉松”:堅(jiān)守產(chǎn)品領(lǐng)先,秉持卓越運(yùn)營