亚洲国产日韩欧美一区二区三区,精品亚洲国产成人av在线,国产99视频精品免视看7,99国产精品久久久久久久成人热,欧美日韩亚洲国产综合乱

首頁(yè) 科技週邊 人工智慧 準(zhǔn)確率達(dá)60.8%,浙大基於Transformer的化學(xué)逆合成預(yù)測(cè)模型,登Nature子刊

準(zhǔn)確率達(dá)60.8%,浙大基於Transformer的化學(xué)逆合成預(yù)測(cè)模型,登Nature子刊

Aug 06, 2024 pm 07:34 PM
理論

準(zhǔn)確率達(dá)60.8%,浙大基於Transformer的化學(xué)逆合成預(yù)測(cè)模型,登Nature子刊

編輯 | KX

逆合成是藥物發(fā)現(xiàn)和有機(jī)合成中的一項(xiàng)關(guān)鍵任務(wù),AI 越來(lái)越多地用於加快這一過(guò)程。

現(xiàn)有 AI 方法性能不盡人意,多樣性有限。在實(shí)踐中,化學(xué)反應(yīng)通常會(huì)引起局部分子變化,反應(yīng)物和產(chǎn)物之間存在很大重疊。

受此啟發(fā),浙江大學(xué)侯廷軍團(tuán)隊(duì)提出將單步逆合成預(yù)測(cè)重新定義為分子串編輯任務(wù),迭代細(xì)化目標(biāo)分子串以產(chǎn)生前體化合物。並提出了基於編輯的逆合成模型 EditRetro,該模型可以實(shí)現(xiàn)高品質(zhì)和多樣化的預(yù)測(cè)。

大量實(shí)驗(yàn)表明,模型在標(biāo)準(zhǔn)基準(zhǔn)數(shù)據(jù)集 USPTO-50?K 上取得了出色的性能,top-1 準(zhǔn)確率達(dá)到 60.8%。

結(jié)果表明,EditRetro 表現(xiàn)出良好的泛化能力和穩(wěn)健性,凸顯了其在 AI 驅(qū)動(dòng)的化學(xué)合成規(guī)劃領(lǐng)域的潛力。

相關(guān)研究以「Retrosynthesis prediction with an iterative string editing model」為題,於 7 月 30 日發(fā)佈在《Nature Communications》上。

準(zhǔn)確率達(dá)60.8%,浙大基於Transformer的化學(xué)逆合成預(yù)測(cè)模型,登Nature子刊

論文連結(jié):https://www.nature.com/articles/s41467-024-50617-1

分子合成路徑設(shè)計(jì)是有機(jī)合成的一項(xiàng)重要任務(wù),對(duì)生物醫(yī)學(xué)、製藥和材料工業(yè)等各領(lǐng)域都具有重要意義。

逆合成分析是開(kāi)發(fā)合成路線最廣泛使用的方法。它包括使用已建立的反應(yīng)將分子迭代分解為更簡(jiǎn)單、更易於合成的前體。

近年來(lái),AI 驅(qū)動(dòng)的逆合成促進(jìn)了對(duì)更複雜分子的探索,大大減少了設(shè)計(jì)合成實(shí)驗(yàn)所需的時(shí)間和精力。單步逆合成預(yù)測(cè)是逆合成規(guī)劃的重要組成部分,目前已有幾種基於深度學(xué)習(xí)的方法,且效果優(yōu)異。這些方法大致可分為三類(lèi):基於模板的方法、無(wú)模板的方法和半基於模板的方法。

在此,研究人員專(zhuān)注於無(wú)模板逆合成預(yù)測(cè)。提出將問(wèn)題重新定義為分子字串編輯任務(wù),並提出基於編輯的逆合成模型 EditRetro,可以實(shí)現(xiàn)高品質(zhì)和多樣化的預(yù)測(cè)。

準(zhǔn)確率達(dá)60.8%,浙大基於Transformer的化學(xué)逆合成預(yù)測(cè)模型,登Nature子刊

圖示:所提出的基於分子串的逆合成的 EditRetro 方法的示意圖。 (資料來(lái)源:論文)

該研究的核心概念是,透過(guò)使用 Levenshtein 操作的迭代編輯過(guò)程來(lái)產(chǎn)生反應(yīng)物字串。該方法從基於編輯的序列生成模型的最新進(jìn)展中汲取靈感。具體來(lái)說(shuō),採(cǎi)用了 EDITOR 中的操作,EDITOR 是一種基於編輯的 Transformer,專(zhuān)為神經(jīng)機(jī)器翻譯而設(shè)計(jì)。

EditRetro 概述

EditRetro 模型包含三種編輯操作,即序列重新定位、佔(zhàn)位符插入和標(biāo)記插入,以產(chǎn)生反應(yīng)物字串。它由一個(gè) Transformer 模型實(shí)現(xiàn),該模型由一個(gè)編碼器和三個(gè)解碼器組成,兩者都由堆疊的 Transformer 區(qū)塊組成。

  • 重新定位解碼器:重新定位操作包括基本的 token 編輯操作,例如保留、刪除和重新排序。它可以與識(shí)別反應(yīng)中心的過(guò)程進(jìn)行比較,包括重新排序和刪除原子或基團(tuán)以獲得合成子。
  • 佔(zhàn)位符解碼器:佔(zhàn)位符插入策略(分類(lèi)器)預(yù)測(cè)要在相鄰 token 之間插入的佔(zhàn)位符數(shù)量。它在確定反應(yīng)物的結(jié)構(gòu)方面起著至關(guān)重要的作用,類(lèi)似於識(shí)別從序列重新定位階段獲得的中間合成子中添加原子或基團(tuán)的位置。
  • Token 解碼器:token 插入策略(分類(lèi)器),負(fù)責(zé)為每個(gè)佔(zhàn)位符產(chǎn)生候選 token。這對(duì)於確定可用於合成目標(biāo)產(chǎn)品的實(shí)際反應(yīng)物至關(guān)重要。該過(guò)程可以看作是合成子完成的類(lèi)似過(guò)程,結(jié)合佔(zhàn)位符插入操作。

EditRetro 模型透過(guò)其非自迴歸解碼器提高了生成效率。儘管結(jié)合了額外的解碼器來(lái)迭代預(yù)測(cè)編輯操作,但 EditRetro 在每個(gè)解碼器內(nèi)並行執(zhí)行編輯操作(即非自回歸生成)。

當(dāng)給定一個(gè)目標(biāo)分子時(shí),編碼器將其字串作為輸入並產(chǎn)生相應(yīng)的隱藏表示,然後將其用作解碼器交叉注意模組的輸入。類(lèi)似地,解碼器也在第一次迭代時(shí)將產(chǎn)品字串作為輸入。在每次解碼迭代期間,三個(gè)解碼器依序執(zhí)行。

優(yōu)於基線、生成準(zhǔn)確反應(yīng)物

研究人員在公共基準(zhǔn)數(shù)據(jù)集 USPTO-50K 和 USPTO-FULL 上評(píng)估了所提方法。大量實(shí)驗(yàn)結(jié)果表明,該方法在預(yù)測(cè)準(zhǔn)確度方面優(yōu)于其他基線,包括最先進(jìn)的基于序列的方法 R-SMILES 和基于圖編輯的方法 Graph2Edits。

準(zhǔn)確率達(dá)60.8%,浙大基於Transformer的化學(xué)逆合成預(yù)測(cè)模型,登Nature子刊

EditRetro 在基準(zhǔn)逆合成數(shù)據(jù)集 USPTO-50K 上進(jìn)行的大量實(shí)驗(yàn)表明,EditRetro 取得了優(yōu)越的性能,top-1 精確匹配準(zhǔn)確率達(dá)到 60.8%。

準(zhǔn)確率達(dá)60.8%,浙大基於Transformer的化學(xué)逆合成預(yù)測(cè)模型,登Nature子刊

此外,在更大的 USPTO-FULL 數(shù)據(jù)集上,其中 top-1 精確匹配準(zhǔn)確率達(dá)到 52.2%,證明了其在更多樣化和更具挑戰(zhàn)性的化學(xué)反應(yīng)中是有效的。

準(zhǔn)確率達(dá)60.8%,浙大基於Transformer的化學(xué)逆合成預(yù)測(cè)模型,登Nature子刊

EditRetro 在 RoundTrip 和 MaxFrag 準(zhǔn)確率方面也表現(xiàn)出優(yōu)于基線方法的性能。這證明了 EditRetro 能夠有效地學(xué)習(xí)化學(xué)規(guī)則。

此外,EditRetro 通過(guò)精心設(shè)計(jì)的推理模塊提供多樣化的預(yù)測(cè)。該模塊結(jié)合了重新定位采樣和序列增強(qiáng),有助于生成多樣化和變化的預(yù)測(cè)。重新定位采樣對(duì)重新定位動(dòng)作的預(yù)測(cè)進(jìn)行采樣,從而能夠識(shí)別不同的反應(yīng)位點(diǎn)。序列增強(qiáng)從不同的產(chǎn)品變體到反應(yīng)物生成不同的編輯途徑,從而提高了預(yù)測(cè)的準(zhǔn)確性和多樣性。這兩種策略共同作用,提高了預(yù)測(cè)的準(zhǔn)確性和多樣性。

進(jìn)一步的實(shí)驗(yàn)驗(yàn)證了 EditRetro 在一些更復(fù)雜的反應(yīng)中的優(yōu)越性,包括手性、開(kāi)環(huán)和成環(huán)反應(yīng)。結(jié)果證實(shí)了 EditRetro 在這些具有挑戰(zhàn)性的場(chǎng)景中的優(yōu)越性,證明了它能夠處理不同類(lèi)型的化學(xué)轉(zhuǎn)化。

在多步合成規(guī)劃中的實(shí)用性

特別是,EditRetro 在四個(gè)多步驟逆合成規(guī)劃場(chǎng)景中的成功應(yīng)用證明了其實(shí)用性。

為了評(píng)估 EditRetro 在合成規(guī)劃中的實(shí)用性,通過(guò)連續(xù)的逆合成預(yù)測(cè)設(shè)計(jì)完整的化學(xué)途徑。研究人員選擇了四種具有重要藥用價(jià)值的目標(biāo)化合物進(jìn)行評(píng)估:非布司他、奧希替尼、GPX4?的變構(gòu)激活劑和 DDR1 激酶抑制劑 INS015_037。

準(zhǔn)確率達(dá)60.8%,浙大基於Transformer的化學(xué)逆合成預(yù)測(cè)模型,登Nature子刊

圖示:EditRetro 的多步逆合成預(yù)測(cè)。(來(lái)源:論文)

所有四個(gè)示例都產(chǎn)生了與文獻(xiàn)中報(bào)道的途徑非常一致的逆合成途徑,大多數(shù)預(yù)測(cè)排名在前兩位。在考慮的 16 個(gè)單獨(dú)步驟中,有 10 個(gè)步驟的預(yù)測(cè)準(zhǔn)確率為 1。這些結(jié)果證明了 EditRetro 在實(shí)際逆合成預(yù)測(cè)中的實(shí)際潛力。

通過(guò)提供有價(jià)值的見(jiàn)解并促進(jìn)高效合成路線的設(shè)計(jì),該方法有望在逆合成規(guī)劃領(lǐng)域得到實(shí)際應(yīng)用。

以上是準(zhǔn)確率達(dá)60.8%,浙大基於Transformer的化學(xué)逆合成預(yù)測(cè)模型,登Nature子刊的詳細(xì)內(nèi)容。更多資訊請(qǐng)關(guān)注PHP中文網(wǎng)其他相關(guān)文章!

本網(wǎng)站聲明
本文內(nèi)容由網(wǎng)友自願(yuàn)投稿,版權(quán)歸原作者所有。本站不承擔(dān)相應(yīng)的法律責(zé)任。如發(fā)現(xiàn)涉嫌抄襲或侵權(quán)的內(nèi)容,請(qǐng)聯(lián)絡(luò)admin@php.cn

熱AI工具

Undress AI Tool

Undress AI Tool

免費(fèi)脫衣圖片

Undresser.AI Undress

Undresser.AI Undress

人工智慧驅(qū)動(dòng)的應(yīng)用程序,用於創(chuàng)建逼真的裸體照片

AI Clothes Remover

AI Clothes Remover

用於從照片中去除衣服的線上人工智慧工具。

Clothoff.io

Clothoff.io

AI脫衣器

Video Face Swap

Video Face Swap

使用我們完全免費(fèi)的人工智慧換臉工具,輕鬆在任何影片中換臉!

熱工具

記事本++7.3.1

記事本++7.3.1

好用且免費(fèi)的程式碼編輯器

SublimeText3漢化版

SublimeText3漢化版

中文版,非常好用

禪工作室 13.0.1

禪工作室 13.0.1

強(qiáng)大的PHP整合開(kāi)發(fā)環(huán)境

Dreamweaver CS6

Dreamweaver CS6

視覺(jué)化網(wǎng)頁(yè)開(kāi)發(fā)工具

SublimeText3 Mac版

SublimeText3 Mac版

神級(jí)程式碼編輯軟體(SublimeText3)

突破傳統(tǒng)缺陷檢測(cè)的界限,\'Defect Spectrum\'首次實(shí)現(xiàn)超高精度豐富語(yǔ)意的工業(yè)缺陷檢測(cè)。 突破傳統(tǒng)缺陷檢測(cè)的界限,\'Defect Spectrum\'首次實(shí)現(xiàn)超高精度豐富語(yǔ)意的工業(yè)缺陷檢測(cè)。 Jul 26, 2024 pm 05:38 PM

在現(xiàn)代製造業(yè)中,精準(zhǔn)的缺陷檢測(cè)不僅是確保產(chǎn)品品質(zhì)的關(guān)鍵,更是提升生產(chǎn)效率的核心。然而,現(xiàn)有的缺陷檢測(cè)資料集常常缺乏實(shí)際應(yīng)用所需的精確度和語(yǔ)意豐富性,導(dǎo)致模型無(wú)法辨識(shí)特定的缺陷類(lèi)別或位置。為了解決這個(gè)難題,由香港科技大學(xué)廣州和思謀科技組成的頂尖研究團(tuán)隊(duì),創(chuàng)新地開(kāi)發(fā)了「DefectSpectrum」資料集,為工業(yè)缺陷提供了詳盡、語(yǔ)義豐富的大規(guī)模標(biāo)註。如表一所示,相較於其他工業(yè)資料集,「DefectSpectrum」資料集提供了最多的缺陷標(biāo)註(5438張缺陷樣本),最細(xì)緻的缺陷分類(lèi)(125個(gè)缺陷類(lèi)別

英偉達(dá)對(duì)話模式ChatQA進(jìn)化到2.0版本,上下文長(zhǎng)度提到128K 英偉達(dá)對(duì)話模式ChatQA進(jìn)化到2.0版本,上下文長(zhǎng)度提到128K Jul 26, 2024 am 08:40 AM

開(kāi)放LLM社群正是百花齊放、競(jìng)相爭(zhēng)鳴的時(shí)代,你能看到Llama-3-70B-Instruct、QWen2-72B-Instruct、Nemotron-4-340B-Instruct、Mixtral-8x22BInstruct-v0.1等許多表現(xiàn)優(yōu)良的模型。但是,相較於以GPT-4-Turbo為代表的專(zhuān)有大模型,開(kāi)放模型在許多領(lǐng)域仍有明顯差距。在通用模型之外,也有一些專(zhuān)精關(guān)鍵領(lǐng)域的開(kāi)放模型已被開(kāi)發(fā)出來(lái),例如用於程式設(shè)計(jì)和數(shù)學(xué)的DeepSeek-Coder-V2、用於視覺(jué)-語(yǔ)言任務(wù)的InternVL

數(shù)百萬(wàn)晶體資料訓(xùn)練,解決晶體學(xué)相位問(wèn)題,深度學(xué)習(xí)方法PhAI登Science 數(shù)百萬(wàn)晶體資料訓(xùn)練,解決晶體學(xué)相位問(wèn)題,深度學(xué)習(xí)方法PhAI登Science Aug 08, 2024 pm 09:22 PM

編輯|KX時(shí)至今日,晶體學(xué)所測(cè)定的結(jié)構(gòu)細(xì)節(jié)和精度,從簡(jiǎn)單的金屬到大型膜蛋白,是任何其他方法都無(wú)法比擬的。然而,最大的挑戰(zhàn)——所謂的相位問(wèn)題,仍然是從實(shí)驗(yàn)確定的振幅中檢索相位資訊。丹麥哥本哈根大學(xué)研究人員,開(kāi)發(fā)了一種解決晶體相問(wèn)題的深度學(xué)習(xí)方法PhAI,利用數(shù)百萬(wàn)人工晶體結(jié)構(gòu)及其相應(yīng)的合成衍射數(shù)據(jù)訓(xùn)練的深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò),可以產(chǎn)生準(zhǔn)確的電子密度圖。研究表明,這種基於深度學(xué)習(xí)的從頭算結(jié)構(gòu)解決方案方法,可以以?xún)H2埃的分辨率解決相位問(wèn)題,該分辨率僅相當(dāng)於原子分辨率可用數(shù)據(jù)的10%到20%,而傳統(tǒng)的從頭算方

GoogleAI拿下IMO奧數(shù)銀牌,數(shù)學(xué)推理模型AlphaProof面世,強(qiáng)化學(xué)習(xí) is so back GoogleAI拿下IMO奧數(shù)銀牌,數(shù)學(xué)推理模型AlphaProof面世,強(qiáng)化學(xué)習(xí) is so back Jul 26, 2024 pm 02:40 PM

對(duì)AI來(lái)說(shuō),奧數(shù)不再是問(wèn)題了。本週四,GoogleDeepMind的人工智慧完成了一項(xiàng)壯舉:用AI做出了今年國(guó)際數(shù)學(xué)奧林匹克競(jìng)賽IMO的真題,並且距拿金牌僅一步之遙。上週剛結(jié)束的IMO競(jìng)賽共有六道賽題,涉及代數(shù)、組合學(xué)、幾何和數(shù)論。谷歌提出的混合AI系統(tǒng)做對(duì)了四道,獲得28分,達(dá)到了銀牌水準(zhǔn)。本月初,UCLA終身教授陶哲軒剛剛宣傳了百萬(wàn)美元獎(jiǎng)金的AI數(shù)學(xué)奧林匹克競(jìng)賽(AIMO進(jìn)步獎(jiǎng)),沒(méi)想到7月還沒(méi)過(guò),AI的做題水平就進(jìn)步到了這種水平。 IMO上同步做題,做對(duì)了最難題IMO是歷史最悠久、規(guī)模最大、最負(fù)

為大模型提供全新科學(xué)複雜問(wèn)答基準(zhǔn)與評(píng)估體系,UNSW、阿貢、芝加哥大學(xué)等多家機(jī)構(gòu)共同推出SciQAG框架 為大模型提供全新科學(xué)複雜問(wèn)答基準(zhǔn)與評(píng)估體系,UNSW、阿貢、芝加哥大學(xué)等多家機(jī)構(gòu)共同推出SciQAG框架 Jul 25, 2024 am 06:42 AM

編輯|ScienceAI問(wèn)答(QA)資料集在推動(dòng)自然語(yǔ)言處理(NLP)研究中發(fā)揮著至關(guān)重要的作用。高品質(zhì)QA資料集不僅可以用於微調(diào)模型,也可以有效評(píng)估大語(yǔ)言模型(LLM)的能力,尤其是針對(duì)科學(xué)知識(shí)的理解和推理能力。儘管目前已有許多科學(xué)QA數(shù)據(jù)集,涵蓋了醫(yī)學(xué)、化學(xué)、生物等領(lǐng)域,但這些數(shù)據(jù)集仍有一些不足之處。其一,資料形式較為單一,大多數(shù)為多項(xiàng)選擇題(multiple-choicequestions),它們易於進(jìn)行評(píng)估,但限制了模型的答案選擇範(fàn)圍,無(wú)法充分測(cè)試模型的科學(xué)問(wèn)題解答能力。相比之下,開(kāi)放式問(wèn)答

PRO | 為什麼基於 MoE 的大模型更值得關(guān)注? PRO | 為什麼基於 MoE 的大模型更值得關(guān)注? Aug 07, 2024 pm 07:08 PM

2023年,幾乎AI的每個(gè)領(lǐng)域都在以前所未有的速度進(jìn)化,同時(shí),AI也不斷地推動(dòng)著具身智慧、自動(dòng)駕駛等關(guān)鍵賽道的技術(shù)邊界。在多模態(tài)趨勢(shì)下,Transformer作為AI大模型主流架構(gòu)的局面是否會(huì)撼動(dòng)?為何探索基於MoE(專(zhuān)家混合)架構(gòu)的大模型成為業(yè)界新趨勢(shì)?大型視覺(jué)模型(LVM)能否成為通用視覺(jué)的新突破? ……我們從過(guò)去的半年發(fā)布的2023年本站PRO會(huì)員通訊中,挑選了10份針對(duì)以上領(lǐng)域技術(shù)趨勢(shì)、產(chǎn)業(yè)變革進(jìn)行深入剖析的專(zhuān)題解讀,助您在新的一年裡為大展宏圖做好準(zhǔn)備。本篇解讀來(lái)自2023年Week50

準(zhǔn)確率達(dá)60.8%,浙大基於Transformer的化學(xué)逆合成預(yù)測(cè)模型,登Nature子刊 準(zhǔn)確率達(dá)60.8%,浙大基於Transformer的化學(xué)逆合成預(yù)測(cè)模型,登Nature子刊 Aug 06, 2024 pm 07:34 PM

編輯|KX逆合成是藥物發(fā)現(xiàn)和有機(jī)合成中的關(guān)鍵任務(wù),AI越來(lái)越多地用於加快這一過(guò)程?,F(xiàn)有AI方法性能不盡人意,多樣性有限。在實(shí)踐中,化學(xué)反應(yīng)通常會(huì)引起局部分子變化,反應(yīng)物和產(chǎn)物之間存在很大重疊。受此啟發(fā),浙江大學(xué)侯廷軍團(tuán)隊(duì)提出將單步逆合成預(yù)測(cè)重新定義為分子串編輯任務(wù),迭代細(xì)化目標(biāo)分子串以產(chǎn)生前驅(qū)化合物。並提出了基於編輯的逆合成模型EditRetro,該模型可以實(shí)現(xiàn)高品質(zhì)和多樣化的預(yù)測(cè)。大量實(shí)驗(yàn)表明,模型在標(biāo)準(zhǔn)基準(zhǔn)資料集USPTO-50?K上取得了出色的性能,top-1準(zhǔn)確率達(dá)到60.8%。

SOTA性能,廈大多模態(tài)蛋白質(zhì)-配體親和力預(yù)測(cè)AI方法,首次結(jié)合分子表面訊息 SOTA性能,廈大多模態(tài)蛋白質(zhì)-配體親和力預(yù)測(cè)AI方法,首次結(jié)合分子表面訊息 Jul 17, 2024 pm 06:37 PM

編輯|KX在藥物研發(fā)領(lǐng)域,準(zhǔn)確有效地預(yù)測(cè)蛋白質(zhì)與配體的結(jié)合親和力對(duì)於藥物篩選和優(yōu)化至關(guān)重要。然而,目前的研究並沒(méi)有考慮到分子表面訊息在蛋白質(zhì)-配體相互作用中的重要作用?;洞?,來(lái)自廈門(mén)大學(xué)的研究人員提出了一種新穎的多模態(tài)特徵提?。∕FE)框架,該框架首次結(jié)合了蛋白質(zhì)表面、3D結(jié)構(gòu)和序列的信息,並使用交叉注意機(jī)制進(jìn)行不同模態(tài)之間的特徵對(duì)齊。實(shí)驗(yàn)結(jié)果表明,該方法在預(yù)測(cè)蛋白質(zhì)-配體結(jié)合親和力方面取得了最先進(jìn)的性能。此外,消融研究證明了該框架內(nèi)蛋白質(zhì)表面資訊和多模態(tài)特徵對(duì)齊的有效性和必要性。相關(guān)研究以「S

See all articles