亚洲国产日韩欧美一区二区三区,精品亚洲国产成人av在线,国产99视频精品免视看7,99国产精品久久久久久久成人热,欧美日韩亚洲国产综合乱

首頁(yè) 科技周邊 人工智能 數(shù)百萬(wàn)晶體數(shù)據(jù)訓(xùn)練,解決晶體學(xué)相位問(wèn)題,深度學(xué)習(xí)方法PhAI登Science

數(shù)百萬(wàn)晶體數(shù)據(jù)訓(xùn)練,解決晶體學(xué)相位問(wèn)題,深度學(xué)習(xí)方法PhAI登Science

Aug 08, 2024 pm 09:22 PM
理論

數(shù)百萬(wàn)晶體數(shù)據(jù)訓(xùn)練,解決晶體學(xué)相位問(wèn)題,深度學(xué)習(xí)方法PhAI登Science

編輯 | KX

時(shí)至今日,晶體學(xué)所測(cè)定的結(jié)構(gòu)細(xì)節(jié)和精度,從簡(jiǎn)單的金屬到大型膜蛋白,是任何其他方法都無(wú)法比擬的。然而,最大的挑戰(zhàn)——所謂的相位問(wèn)題,仍然是從實(shí)驗(yàn)確定的振幅中檢索相位信息。

丹麥哥本哈根大學(xué)研究人員,開(kāi)發(fā)了一種解決晶體相問(wèn)題的深度學(xué)習(xí)方法 PhAI,利用數(shù)百萬(wàn)人工晶體結(jié)構(gòu)及其相應(yīng)的合成衍射數(shù)據(jù)訓(xùn)練的深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò),可以生成準(zhǔn)確的電子密度圖。

研究表明,這種基于深度學(xué)習(xí)的從頭算結(jié)構(gòu)解決方案方法,可以以僅 2 埃的分辨率解決相位問(wèn)題,該分辨率僅相當(dāng)于原子分辨率可用數(shù)據(jù)的 10% 到 20%,而傳統(tǒng)的從頭算方法通常需要原子分辨率。

相關(guān)研究以《PhAI: A deep-learning approach to solve the crystallographic phase problem》為題,于 8 月 1 日發(fā)布在《Science》上。

數(shù)百萬(wàn)晶體數(shù)據(jù)訓(xùn)練,解決晶體學(xué)相位問(wèn)題,深度學(xué)習(xí)方法PhAI登Science

論文鏈接:https://www.science.org/doi/10.1126/science.adn2777

晶體學(xué)是自然科學(xué)中的核心分析技術(shù)之一。X 射線晶體學(xué)為晶體的三維結(jié)構(gòu)提供了獨(dú)特的視角。

為了重建電子密度圖,必須知道足夠多的衍射反射的復(fù)雜結(jié)構(gòu)因子 $F$。在傳統(tǒng)實(shí)驗(yàn)中,只能獲得振幅 $|F|$,而相位 $phi$ 會(huì)丟失。這是晶體學(xué)相位問(wèn)題。

數(shù)百萬(wàn)晶體數(shù)據(jù)訓(xùn)練,解決晶體學(xué)相位問(wèn)題,深度學(xué)習(xí)方法PhAI登Science

圖示:標(biāo)準(zhǔn)晶體結(jié)構(gòu)測(cè)定流程圖。(來(lái)源:論文)

20 世紀(jì) 50 年代和 60 年代取得了重大突破,KarleHauptmann** 開(kāi)發(fā)了用于解決相位問(wèn)題的所謂直接方法。但直接法需要原子分辨率的衍射數(shù)據(jù)。然而,原子分辨率的要求是一種經(jīng)驗(yàn)觀察。

近年來(lái),傳統(tǒng)的直接方法已被對(duì)偶空間方法所補(bǔ)充。目前可用的從頭算方法似乎已達(dá)到極限。相位問(wèn)題的普遍解決方案仍然未知。

從數(shù)學(xué)上講,結(jié)構(gòu)因子振幅與相位的任何組合都可以進(jìn)行逆傅里葉變換。然而,物理和化學(xué)要求(例如具有原子狀電子密度分布)對(duì)與一組振幅一致的相位的可能組合施加了規(guī)則。深度學(xué)習(xí)的進(jìn)步使得人們能夠探索這種關(guān)系,也許比目前的從頭算方法更深入。

在此,哥本哈根大學(xué)的研究人員采用了數(shù)據(jù)驅(qū)動(dòng)的方法,使用數(shù)百萬(wàn)個(gè)人造晶體結(jié)構(gòu)及其相應(yīng)的衍射數(shù)據(jù),旨在解決晶體學(xué)中的相位問(wèn)題。

研究表明,這種基于深度學(xué)習(xí)的從頭算結(jié)構(gòu)解決方案方法,可以在僅最小晶格平面距離(dmin)= 2.0 ? 的分辨率下執(zhí)行,只需要使用直接方法所需數(shù)據(jù)的 10% 到 20%。

神經(jīng)網(wǎng)絡(luò)的設(shè)計(jì)與訓(xùn)練

構(gòu)建的人工神經(jīng)網(wǎng)絡(luò)稱之為 PhAI,接受結(jié)構(gòu)因子振幅 |F| 并輸出相應(yīng)的相位值??PhAI 的架構(gòu)如下圖所示。

數(shù)百萬(wàn)晶體數(shù)據(jù)訓(xùn)練,解決晶體學(xué)相位問(wèn)題,深度學(xué)習(xí)方法PhAI登Science

圖示:PhAI 神經(jīng)網(wǎng)絡(luò)方法解決相位問(wèn)題。(來(lái)源:論文)晶體結(jié)構(gòu)的結(jié)構(gòu)因子數(shù)量取決于晶胞大小。根據(jù)計(jì)算資源,對(duì)輸入數(shù)據(jù)的大小設(shè)置了限制。輸入結(jié)構(gòu)因子振幅是根據(jù) Miller 指數(shù) (h、k、l) 服從

數(shù)百萬(wàn)晶體數(shù)據(jù)訓(xùn)練,解決晶體學(xué)相位問(wèn)題,深度學(xué)習(xí)方法PhAI登Science

1. 反射來(lái)選擇的。
也就是,限制在原子分辨率下晶胞尺寸約為 10 ? 的結(jié)構(gòu)。此外,選擇了最常見(jiàn)的中心對(duì)稱空間群 P21/c。中心對(duì)稱性將可能的相位值限制為零或 π?rad。
  1. 研究使用主要包含有機(jī)分子的人工晶體結(jié)構(gòu)訓(xùn)練神經(jīng)網(wǎng)絡(luò)。創(chuàng)建了大約 49,000,000 個(gè)結(jié)構(gòu),其中有機(jī)晶體結(jié)構(gòu)占 94.29%,金屬有機(jī)晶體結(jié)構(gòu)占 5.66%,無(wú)機(jī)晶體結(jié)構(gòu)占 0.05%。
  2. 神經(jīng)網(wǎng)絡(luò)的輸入由振幅和相位組成,它們由卷積輸入塊處理,添加并輸入到一系列卷積塊(Conv3D)中,然后是一系列多層感知器(MLP)塊。來(lái)自線性分類器(相位分類器)的預(yù)測(cè)相位通過(guò)網(wǎng)絡(luò)循環(huán) Nc 次。訓(xùn)練數(shù)據(jù)是通過(guò)將 GDB-13 數(shù)據(jù)庫(kù)中的金屬原子和有機(jī)分子插入到晶胞中生成的。生成的結(jié)構(gòu)被組織成訓(xùn)練數(shù)據(jù),從中可以計(jì)算出在采樣溫度因子、分辨率和完整性時(shí)的真實(shí)相位和結(jié)構(gòu)因子振幅。
    解決真實(shí)結(jié)構(gòu)問(wèn)題
  3. 經(jīng)過(guò)訓(xùn)練的神經(jīng)網(wǎng)絡(luò)在標(biāo)準(zhǔn)計(jì)算機(jī)上運(yùn)行,計(jì)算需求適中。它接受?hkl 索引列表和相應(yīng)的結(jié)構(gòu)因子振幅作為輸入。不需要其他輸入信息,甚至不需要結(jié)構(gòu)的晶胞參數(shù)。這與所有其他現(xiàn)代從頭算方法有著根本區(qū)別。網(wǎng)絡(luò)可以即時(shí)預(yù)測(cè)并輸出相位值。
  4. 研究人員使用計(jì)算得出的真實(shí)晶體結(jié)構(gòu)的衍射數(shù)據(jù)測(cè)試了神經(jīng)網(wǎng)絡(luò)的性能。共獲得 2387 個(gè)測(cè)試用例。對(duì)于所有收集的結(jié)構(gòu),考慮了多個(gè)數(shù)據(jù)分辨率值,范圍從 1.0 到 2.0 ?。為了進(jìn)行比較,還使用了電荷翻轉(zhuǎn)方法來(lái)檢索相位信息。

    數(shù)百萬(wàn)晶體數(shù)據(jù)訓(xùn)練,解決晶體學(xué)相位問(wèn)題,深度學(xué)習(xí)方法PhAI登Science

    圖示:相位和真實(shí)電子密度圖之間的相關(guān)系數(shù) r 的直方圖。
    (來(lái)源:論文)

經(jīng)過(guò)訓(xùn)練的神經(jīng)網(wǎng)絡(luò)表現(xiàn)出色;如果相應(yīng)的衍射數(shù)據(jù)分辨率良好,它可以解決所有測(cè)試結(jié)構(gòu)(N = 2387),并且在從低分辨率數(shù)據(jù)中解決結(jié)構(gòu)方面表現(xiàn)出色。盡管神經(jīng)網(wǎng)絡(luò)幾乎沒(méi)有針對(duì)無(wú)機(jī)結(jié)構(gòu)進(jìn)行訓(xùn)練,但它可以完美地解決此類結(jié)構(gòu)。

電荷翻轉(zhuǎn)法在處理高分辨率數(shù)據(jù)時(shí)表現(xiàn)優(yōu)異,但隨著數(shù)據(jù)分辨率的降低,其產(chǎn)生合理正確解的能力逐漸下降;然而,它仍然以 1.6? 的分辨率解決了大約 32% 的結(jié)構(gòu)。通過(guò)進(jìn)一步試驗(yàn)和更改輸入?yún)?shù)(例如翻轉(zhuǎn)閾值),可以改善通過(guò)電荷翻轉(zhuǎn)確定的結(jié)構(gòu)數(shù)量。

在 PhAI 方法中,這種元優(yōu)化是在訓(xùn)練期間執(zhí)行的,不需要由用戶執(zhí)行。這些結(jié)果表明,在晶體學(xué)中必須有原子分辨率數(shù)據(jù)才能從頭算相位的普遍觀念可能被打破。PhAI 僅需要 10% 至 20% 的原子分辨率數(shù)據(jù)。

這一結(jié)果清楚地表明,原子分辨率對(duì)于從頭算方法來(lái)說(shuō)不是必需的,并為基于深度學(xué)習(xí)的結(jié)構(gòu)測(cè)定開(kāi)辟了新途徑。

這種深度學(xué)習(xí)方法的挑戰(zhàn)是擴(kuò)展神經(jīng)網(wǎng)絡(luò),也就是說(shuō),較大晶胞的衍射數(shù)據(jù)將需要大量的輸入和輸出數(shù)據(jù)以及訓(xùn)練期間的計(jì)算成本。未來(lái),需要進(jìn)一步研究,將該方法擴(kuò)展到一般情況。

以上是數(shù)百萬(wàn)晶體數(shù)據(jù)訓(xùn)練,解決晶體學(xué)相位問(wèn)題,深度學(xué)習(xí)方法PhAI登Science的詳細(xì)內(nèi)容。更多信息請(qǐng)關(guān)注PHP中文網(wǎng)其他相關(guān)文章!

本站聲明
本文內(nèi)容由網(wǎng)友自發(fā)貢獻(xiàn),版權(quán)歸原作者所有,本站不承擔(dān)相應(yīng)法律責(zé)任。如您發(fā)現(xiàn)有涉嫌抄襲侵權(quán)的內(nèi)容,請(qǐng)聯(lián)系admin@php.cn

熱AI工具

Undress AI Tool

Undress AI Tool

免費(fèi)脫衣服圖片

Undresser.AI Undress

Undresser.AI Undress

人工智能驅(qū)動(dòng)的應(yīng)用程序,用于創(chuàng)建逼真的裸體照片

AI Clothes Remover

AI Clothes Remover

用于從照片中去除衣服的在線人工智能工具。

Clothoff.io

Clothoff.io

AI脫衣機(jī)

Video Face Swap

Video Face Swap

使用我們完全免費(fèi)的人工智能換臉工具輕松在任何視頻中換臉!

熱工具

記事本++7.3.1

記事本++7.3.1

好用且免費(fèi)的代碼編輯器

SublimeText3漢化版

SublimeText3漢化版

中文版,非常好用

禪工作室 13.0.1

禪工作室 13.0.1

功能強(qiáng)大的PHP集成開(kāi)發(fā)環(huán)境

Dreamweaver CS6

Dreamweaver CS6

視覺(jué)化網(wǎng)頁(yè)開(kāi)發(fā)工具

SublimeText3 Mac版

SublimeText3 Mac版

神級(jí)代碼編輯軟件(SublimeText3)

突破傳統(tǒng)缺陷檢測(cè)的界限,\'Defect Spectrum\'首次實(shí)現(xiàn)超高精度豐富語(yǔ)義的工業(yè)缺陷檢測(cè)。 突破傳統(tǒng)缺陷檢測(cè)的界限,\'Defect Spectrum\'首次實(shí)現(xiàn)超高精度豐富語(yǔ)義的工業(yè)缺陷檢測(cè)。 Jul 26, 2024 pm 05:38 PM

在現(xiàn)代制造業(yè)中,精準(zhǔn)的缺陷檢測(cè)不僅是保證產(chǎn)品質(zhì)量的關(guān)鍵,更是提升生產(chǎn)效率的核心。然而,現(xiàn)有的缺陷檢測(cè)數(shù)據(jù)集常常缺乏實(shí)際應(yīng)用所需的精確度和語(yǔ)義豐富性,導(dǎo)致模型無(wú)法識(shí)別具體的缺陷類別或位置。為了解決這一難題,由香港科技大學(xué)廣州和思謀科技組成的頂尖研究團(tuán)隊(duì),創(chuàng)新性地開(kāi)發(fā)出了“DefectSpectrum”數(shù)據(jù)集,為工業(yè)缺陷提供了詳盡、語(yǔ)義豐富的大規(guī)模標(biāo)注。如表一所示,相比其他工業(yè)數(shù)據(jù)集,“DefectSpectrum”數(shù)據(jù)集提供了最多的缺陷標(biāo)注(5438張缺陷樣本),最細(xì)致的缺陷分類(125種缺陷類別

英偉達(dá)對(duì)話模型ChatQA進(jìn)化到2.0版本,上下文長(zhǎng)度提到128K 英偉達(dá)對(duì)話模型ChatQA進(jìn)化到2.0版本,上下文長(zhǎng)度提到128K Jul 26, 2024 am 08:40 AM

開(kāi)放LLM社區(qū)正是百花齊放、競(jìng)相爭(zhēng)鳴的時(shí)代,你能看到Llama-3-70B-Instruct、QWen2-72B-Instruct、Nemotron-4-340B-Instruct、Mixtral-8x22BInstruct-v0.1等許多表現(xiàn)優(yōu)良的模型。但是,相比于以GPT-4-Turbo為代表的專有大模型,開(kāi)放模型在很多領(lǐng)域依然還有明顯差距。在通用模型之外,也有一些專精關(guān)鍵領(lǐng)域的開(kāi)放模型已被開(kāi)發(fā)出來(lái),比如用于編程和數(shù)學(xué)的DeepSeek-Coder-V2、用于視覺(jué)-語(yǔ)言任務(wù)的InternVL

數(shù)百萬(wàn)晶體數(shù)據(jù)訓(xùn)練,解決晶體學(xué)相位問(wèn)題,深度學(xué)習(xí)方法PhAI登Science 數(shù)百萬(wàn)晶體數(shù)據(jù)訓(xùn)練,解決晶體學(xué)相位問(wèn)題,深度學(xué)習(xí)方法PhAI登Science Aug 08, 2024 pm 09:22 PM

編輯|KX時(shí)至今日,晶體學(xué)所測(cè)定的結(jié)構(gòu)細(xì)節(jié)和精度,從簡(jiǎn)單的金屬到大型膜蛋白,是任何其他方法都無(wú)法比擬的。然而,最大的挑戰(zhàn)——所謂的相位問(wèn)題,仍然是從實(shí)驗(yàn)確定的振幅中檢索相位信息。丹麥哥本哈根大學(xué)研究人員,開(kāi)發(fā)了一種解決晶體相問(wèn)題的深度學(xué)習(xí)方法PhAI,利用數(shù)百萬(wàn)人工晶體結(jié)構(gòu)及其相應(yīng)的合成衍射數(shù)據(jù)訓(xùn)練的深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò),可以生成準(zhǔn)確的電子密度圖。研究表明,這種基于深度學(xué)習(xí)的從頭算結(jié)構(gòu)解決方案方法,可以以僅2埃的分辨率解決相位問(wèn)題,該分辨率僅相當(dāng)于原子分辨率可用數(shù)據(jù)的10%到20%,而傳統(tǒng)的從頭算方

谷歌AI拿下IMO奧數(shù)銀牌,數(shù)學(xué)推理模型AlphaProof面世,強(qiáng)化學(xué)習(xí) is so back 谷歌AI拿下IMO奧數(shù)銀牌,數(shù)學(xué)推理模型AlphaProof面世,強(qiáng)化學(xué)習(xí) is so back Jul 26, 2024 pm 02:40 PM

對(duì)于AI來(lái)說(shuō),奧數(shù)不再是問(wèn)題了。本周四,谷歌DeepMind的人工智能完成了一項(xiàng)壯舉:用AI做出了今年國(guó)際數(shù)學(xué)奧林匹克競(jìng)賽IMO的真題,并且距拿金牌僅一步之遙。上周剛剛結(jié)束的IMO競(jìng)賽共有六道賽題,涉及代數(shù)、組合學(xué)、幾何和數(shù)論。谷歌提出的混合AI系統(tǒng)做對(duì)了四道,獲得28分,達(dá)到了銀牌水平。本月初,UCLA終身教授陶哲軒剛剛宣傳了百萬(wàn)美元獎(jiǎng)金的AI數(shù)學(xué)奧林匹克競(jìng)賽(AIMO進(jìn)步獎(jiǎng)),沒(méi)想到7月還沒(méi)過(guò),AI的做題水平就進(jìn)步到了這種水平。IMO上同步做題,做對(duì)了最難題IMO是歷史最悠久、規(guī)模最大、最負(fù)

為大模型提供全新科學(xué)復(fù)雜問(wèn)答基準(zhǔn)與測(cè)評(píng)體系,UNSW、阿貢、芝加哥大學(xué)等多家機(jī)構(gòu)聯(lián)合推出SciQAG框架 為大模型提供全新科學(xué)復(fù)雜問(wèn)答基準(zhǔn)與測(cè)評(píng)體系,UNSW、阿貢、芝加哥大學(xué)等多家機(jī)構(gòu)聯(lián)合推出SciQAG框架 Jul 25, 2024 am 06:42 AM

編輯|ScienceAI問(wèn)答(QA)數(shù)據(jù)集在推動(dòng)自然語(yǔ)言處理(NLP)研究發(fā)揮著至關(guān)重要的作用。高質(zhì)量QA數(shù)據(jù)集不僅可以用于微調(diào)模型,也可以有效評(píng)估大語(yǔ)言模型(LLM)的能力,尤其是針對(duì)科學(xué)知識(shí)的理解和推理能力。盡管當(dāng)前已有許多科學(xué)QA數(shù)據(jù)集,涵蓋了醫(yī)學(xué)、化學(xué)、生物等領(lǐng)域,但這些數(shù)據(jù)集仍存在一些不足。其一,數(shù)據(jù)形式較為單一,大多數(shù)為多項(xiàng)選擇題(multiple-choicequestions),它們易于進(jìn)行評(píng)估,但限制了模型的答案選擇范圍,無(wú)法充分測(cè)試模型的科學(xué)問(wèn)題解答能力。相比之下,開(kāi)放式問(wèn)答

PRO | 為什么基于 MoE 的大模型更值得關(guān)注? PRO | 為什么基于 MoE 的大模型更值得關(guān)注? Aug 07, 2024 pm 07:08 PM

2023年,幾乎AI的每個(gè)領(lǐng)域都在以前所未有的速度進(jìn)化,同時(shí),AI也在不斷地推動(dòng)著具身智能、自動(dòng)駕駛等關(guān)鍵賽道的技術(shù)邊界。多模態(tài)趨勢(shì)下,Transformer作為AI大模型主流架構(gòu)的局面是否會(huì)撼動(dòng)?為何探索基于MoE(專家混合)架構(gòu)的大模型成為業(yè)內(nèi)新趨勢(shì)?大型視覺(jué)模型(LVM)能否成為通用視覺(jué)的新突破?...我們從過(guò)去的半年發(fā)布的2023年本站PRO會(huì)員通訊中,挑選了10份針對(duì)以上領(lǐng)域技術(shù)趨勢(shì)、產(chǎn)業(yè)變革進(jìn)行深入剖析的專題解讀,助您在新的一年里為大展宏圖做好準(zhǔn)備。本篇解讀來(lái)自2023年Week50

準(zhǔn)確率達(dá)60.8%,浙大基于Transformer的化學(xué)逆合成預(yù)測(cè)模型,登Nature子刊 準(zhǔn)確率達(dá)60.8%,浙大基于Transformer的化學(xué)逆合成預(yù)測(cè)模型,登Nature子刊 Aug 06, 2024 pm 07:34 PM

編輯|KX逆合成是藥物發(fā)現(xiàn)和有機(jī)合成中的一項(xiàng)關(guān)鍵任務(wù),AI越來(lái)越多地用于加快這一過(guò)程。現(xiàn)有AI方法性能不盡人意,多樣性有限。在實(shí)踐中,化學(xué)反應(yīng)通常會(huì)引起局部分子變化,反應(yīng)物和產(chǎn)物之間存在很大重疊。受此啟發(fā),浙江大學(xué)侯廷軍團(tuán)隊(duì)提出將單步逆合成預(yù)測(cè)重新定義為分子串編輯任務(wù),迭代細(xì)化目標(biāo)分子串以生成前體化合物。并提出了基于編輯的逆合成模型EditRetro,該模型可以實(shí)現(xiàn)高質(zhì)量和多樣化的預(yù)測(cè)。大量實(shí)驗(yàn)表明,模型在標(biāo)準(zhǔn)基準(zhǔn)數(shù)據(jù)集USPTO-50?K上取得了出色的性能,top-1準(zhǔn)確率達(dá)到60.8%。

SOTA性能,廈大多模態(tài)蛋白質(zhì)-配體親和力預(yù)測(cè)AI方法,首次結(jié)合分子表面信息 SOTA性能,廈大多模態(tài)蛋白質(zhì)-配體親和力預(yù)測(cè)AI方法,首次結(jié)合分子表面信息 Jul 17, 2024 pm 06:37 PM

編輯|KX在藥物研發(fā)領(lǐng)域,準(zhǔn)確有效地預(yù)測(cè)蛋白質(zhì)與配體的結(jié)合親和力對(duì)于藥物篩選和優(yōu)化至關(guān)重要。然而,目前的研究沒(méi)有考慮到分子表面信息在蛋白質(zhì)-配體相互作用中的重要作用?;诖?,來(lái)自廈門(mén)大學(xué)的研究人員提出了一種新穎的多模態(tài)特征提?。∕FE)框架,該框架首次結(jié)合了蛋白質(zhì)表面、3D結(jié)構(gòu)和序列的信息,并使用交叉注意機(jī)制進(jìn)行不同模態(tài)之間的特征對(duì)齊。實(shí)驗(yàn)結(jié)果表明,該方法在預(yù)測(cè)蛋白質(zhì)-配體結(jié)合親和力方面取得了最先進(jìn)的性能。此外,消融研究證明了該框架內(nèi)蛋白質(zhì)表面信息和多模態(tài)特征對(duì)齊的有效性和必要性。相關(guān)研究以「S

See all articles