亚洲国产日韩欧美一区二区三区,精品亚洲国产成人av在线,国产99视频精品免视看7,99国产精品久久久久久久成人热,欧美日韩亚洲国产综合乱

首頁 科技週邊 人工智慧 數(shù)百萬晶體資料訓練,解決晶體學相位問題,深度學習方法PhAI登Science

數(shù)百萬晶體資料訓練,解決晶體學相位問題,深度學習方法PhAI登Science

Aug 08, 2024 pm 09:22 PM
理論

數(shù)百萬晶體資料訓練,解決晶體學相位問題,深度學習方法PhAI登Science

編輯 | KX

時至今日,晶體學所測定的結(jié)構(gòu)細節(jié)和精度,從簡單的金屬到大型膜蛋白,是任何其他方法都無法比擬的。然而,最大的挑戰(zhàn)——所謂的相位問題,仍然是從實驗確定的振幅中檢索相位資訊。

丹麥哥本哈根大學研究人員,開發(fā)了一種解決晶體相問題的深度學習方法PhAI,利用數(shù)百萬人工晶體結(jié)構(gòu)及其相應(yīng)的合成衍射數(shù)據(jù)訓練的深度學習神經(jīng)網(wǎng)絡(luò),可以產(chǎn)生準確的電子密度圖。

研究表明,這種基於深度學習的從頭算結(jié)構(gòu)解決方案方法,可以以僅2 埃的分辨率解決相位問題,該分辨率僅相當於原子分辨率可用數(shù)據(jù)的10% 到20%,而傳統(tǒng)的從頭算方法通常需要原子分辨率。

相關(guān)研究以《PhAI: A deep-learning approach to solve the crystallographic phase problem》為題,於 8 月 1 日發(fā)佈在《Science》上。

數(shù)百萬晶體資料訓練,解決晶體學相位問題,深度學習方法PhAI登Science

論文連結(jié):https://www.science.org/doi/10.1126/science.adn2777

晶體學是自然科學中的核心分析技術(shù)之一。 X 射線晶體學為晶體的三維結(jié)構(gòu)提供了獨特的視角。

為了重建電子密度圖,必須知道足夠的衍射反射的複雜結(jié)構(gòu)因子 $F$。在傳統(tǒng)實驗中,只能得到振幅 $|F|$,相位 $phi$ 會遺失。這是晶體學相位問題。

數(shù)百萬晶體資料訓練,解決晶體學相位問題,深度學習方法PhAI登Science

圖示:標準晶體結(jié)構(gòu)測定流程圖。 (資料來源:論文)

20 世紀 50 年代和 60 年代取得了重大突破,KarleHauptmann** 開發(fā)了用於解決相位問題的所謂直接方法。但直接法需要原子分辨率的繞射數(shù)據(jù)。然而,原子分辨率的要求是一種經(jīng)驗觀察。

近年來,傳統(tǒng)的直接方法已被對偶空間方法所補充。 目前可用的從頭算方法似乎已達到極限。相位問題的普遍解決方案仍然未知。

從數(shù)學上講,結(jié)構(gòu)因子振幅與相位的任何組合都可以進行逆傅立葉變換。 然而,物理和化學要求(例如具有原子狀電子密度分佈)對與一組振幅一致的相位的可能組合施加了規(guī)則。深度學習的進步使得人們能夠探索這種關(guān)係,也許比目前的從頭算方法更深入。

在此,哥本哈根大學的研究人員採用了數(shù)據(jù)驅(qū)動的方法,使用數(shù)百萬個人造晶體結(jié)構(gòu)及其相應(yīng)的衍射數(shù)據(jù),旨在解決晶體學中的相位問題。

研究表明,這種基於深度學習的從頭算結(jié)構(gòu)解決方案方法,可以在僅最小晶格平面距離(dmin)= 2.0 ? 的分辨率下執(zhí)行,只需要使用直接方法所需數(shù)據(jù)的10% 到20%。

神經(jīng)網(wǎng)路的設(shè)計與訓練

所建構(gòu)的人工神經(jīng)網(wǎng)路稱為 PhAI,接受結(jié)構(gòu)因子振幅 |F| 並輸出對應(yīng)的相位值?? ? 。 PhAI

的架構(gòu)如下圖所示。 數(shù)百萬晶體資料訓練,解決晶體學相位問題,深度學習方法PhAI登Science

圖示:PhAI 神經(jīng)網(wǎng)路方法解決相位問題。 (資料來源:論文)晶體結(jié)構(gòu)的結(jié)構(gòu)因子數(shù)量取決於晶胞大小。根據(jù)計算資源,對輸入資料的大小設(shè)定了限制。輸入結(jié)構(gòu)因子振幅是根據(jù) Miller 指數(shù) (h、k、l) 服從數(shù)百萬晶體資料訓練,解決晶體學相位問題,深度學習方法PhAI登Science


1. 反射來選擇的。 也就是,限制在原子解析度下晶胞尺寸約為 10 ? 的結(jié)構(gòu)。此外,選擇了最常見的中心對稱空間群 P21/c。中心對稱性將可能的相位值限制為零或 π?rad。 ??
  1. Research on training neural networks using artificial crystal structures containing mainly organic molecules. Approximately 49,000,000 structures were created, of which 94.29% were organic crystal structures, 5.66% were metal-organic crystal structures, and 0.05% were inorganic crystal structures.
  2. The input to the neural network consists of amplitude and phase, which are processed by a convolutional input block, added and fed into a series of convolutional blocks (Conv3D), followed by a series of multilayer perceptron (MLP) blocks. The predicted phase from the linear classifier (phase classifier) ??is cycled through the network Nc times. Training data were generated by inserting metal atoms and organic molecules from the GDB-13 database into unit cells. The resulting structures are organized into training data from which the true phase and structure factor amplitudes at sampled temperature factors, resolution and integrity can be calculated.
    Solve real structural problems
  3. Trained neural networks run on standard computers with moderate computational requirements. It accepts as input a list of hkl indices and corresponding structure factor amplitudes. No other input information is required, not even the unit cell parameters of the structure. This is fundamentally different from all other modern ab initio methods. The network can predict and output phase values ??on the fly.
  4. The researchers tested the performance of the neural network using calculated diffraction data from real crystal structures. A total of 2387 test cases were obtained. For all collected structures, multiple data resolution values ??ranging from 1.0 to 2.0 ? were considered. For comparison, a charge flip method was also used to retrieve phase information.

    數(shù)百萬晶體資料訓練,解決晶體學相位問題,深度學習方法PhAI登Science

    Illustration: Histogram of the correlation coefficient r between phase and true electron density map.
    (Source: paper)

The trained neural network performs well; It can solve all tested structures (N = 2387) if the corresponding diffraction data are of good resolution, and it is better at solving structures from low-resolution data Excellent performance. Although a neural network is rarely trained on inorganic structures, it can solve such structures perfectly.

The charge flip method performs well when processing high-resolution data, but its ability to produce reasonably correct solutions gradually decreases as the data resolution decreases; however, it still solves approximately 32 pixels at a resolution of 1.6? % Structure. The number of structures identified by charge flipping can be improved by further experimentation and changing input parameters such as flipping thresholds.

In the PhAI approach, This meta-optimization is performed during training and does not need to be performed by the user. These results suggest that the common notion in crystallography that atomic resolution data are necessary to calculate phases ab initio may be broken. PhAI requires only 10% to 20% atomic resolution data.

This result clearly shows that atomic resolution is not necessary for ab initio methods and opens new avenues for deep learning-based structure determination.

The challenge of this deep learning approach is to scale the neural network, that is, diffraction data for larger unit cells will require a large amount of input and output data as well as computational cost during training. In the future, further research is needed to extend this method to the general case.

以上是數(shù)百萬晶體資料訓練,解決晶體學相位問題,深度學習方法PhAI登Science的詳細內(nèi)容。更多資訊請關(guān)注PHP中文網(wǎng)其他相關(guān)文章!

本網(wǎng)站聲明
本文內(nèi)容由網(wǎng)友自願投稿,版權(quán)歸原作者所有。本站不承擔相應(yīng)的法律責任。如發(fā)現(xiàn)涉嫌抄襲或侵權(quán)的內(nèi)容,請聯(lián)絡(luò)admin@php.cn

熱AI工具

Undress AI Tool

Undress AI Tool

免費脫衣圖片

Undresser.AI Undress

Undresser.AI Undress

人工智慧驅(qū)動的應(yīng)用程序,用於創(chuàng)建逼真的裸體照片

AI Clothes Remover

AI Clothes Remover

用於從照片中去除衣服的線上人工智慧工具。

Clothoff.io

Clothoff.io

AI脫衣器

Video Face Swap

Video Face Swap

使用我們完全免費的人工智慧換臉工具,輕鬆在任何影片中換臉!

熱工具

記事本++7.3.1

記事本++7.3.1

好用且免費的程式碼編輯器

SublimeText3漢化版

SublimeText3漢化版

中文版,非常好用

禪工作室 13.0.1

禪工作室 13.0.1

強大的PHP整合開發(fā)環(huán)境

Dreamweaver CS6

Dreamweaver CS6

視覺化網(wǎng)頁開發(fā)工具

SublimeText3 Mac版

SublimeText3 Mac版

神級程式碼編輯軟體(SublimeText3)

熱門話題

Laravel 教程
1597
29
PHP教程
1488
72
突破傳統(tǒng)缺陷檢測的界限,\'Defect Spectrum\'首次實現(xiàn)超高精度豐富語意的工業(yè)缺陷檢測。 突破傳統(tǒng)缺陷檢測的界限,\'Defect Spectrum\'首次實現(xiàn)超高精度豐富語意的工業(yè)缺陷檢測。 Jul 26, 2024 pm 05:38 PM

在現(xiàn)代製造業(yè)中,精準的缺陷檢測不僅是確保產(chǎn)品品質(zhì)的關(guān)鍵,更是提升生產(chǎn)效率的核心。然而,現(xiàn)有的缺陷檢測資料集常常缺乏實際應(yīng)用所需的精確度和語意豐富性,導致模型無法辨識特定的缺陷類別或位置。為了解決這個難題,由香港科技大學廣州和思謀科技組成的頂尖研究團隊,創(chuàng)新地開發(fā)了「DefectSpectrum」資料集,為工業(yè)缺陷提供了詳盡、語義豐富的大規(guī)模標註。如表一所示,相較於其他工業(yè)資料集,「DefectSpectrum」資料集提供了最多的缺陷標註(5438張缺陷樣本),最細緻的缺陷分類(125個缺陷類別

英偉達對話模式ChatQA進化到2.0版本,上下文長度提到128K 英偉達對話模式ChatQA進化到2.0版本,上下文長度提到128K Jul 26, 2024 am 08:40 AM

開放LLM社群正是百花齊放、競相爭鳴的時代,你能看到Llama-3-70B-Instruct、QWen2-72B-Instruct、Nemotron-4-340B-Instruct、Mixtral-8x22BInstruct-v0.1等許多表現(xiàn)優(yōu)良的模型。但是,相較於以GPT-4-Turbo為代表的專有大模型,開放模型在許多領(lǐng)域仍有明顯差距。在通用模型之外,也有一些專精關(guān)鍵領(lǐng)域的開放模型已被開發(fā)出來,例如用於程式設(shè)計和數(shù)學的DeepSeek-Coder-V2、用於視覺-語言任務(wù)的InternVL

數(shù)百萬晶體資料訓練,解決晶體學相位問題,深度學習方法PhAI登Science 數(shù)百萬晶體資料訓練,解決晶體學相位問題,深度學習方法PhAI登Science Aug 08, 2024 pm 09:22 PM

編輯|KX時至今日,晶體學所測定的結(jié)構(gòu)細節(jié)和精度,從簡單的金屬到大型膜蛋白,是任何其他方法都無法比擬的。然而,最大的挑戰(zhàn)——所謂的相位問題,仍然是從實驗確定的振幅中檢索相位資訊。丹麥哥本哈根大學研究人員,開發(fā)了一種解決晶體相問題的深度學習方法PhAI,利用數(shù)百萬人工晶體結(jié)構(gòu)及其相應(yīng)的合成衍射數(shù)據(jù)訓練的深度學習神經(jīng)網(wǎng)絡(luò),可以產(chǎn)生準確的電子密度圖。研究表明,這種基於深度學習的從頭算結(jié)構(gòu)解決方案方法,可以以僅2埃的分辨率解決相位問題,該分辨率僅相當於原子分辨率可用數(shù)據(jù)的10%到20%,而傳統(tǒng)的從頭算方

GoogleAI拿下IMO奧數(shù)銀牌,數(shù)學推理模型AlphaProof面世,強化學習 is so back GoogleAI拿下IMO奧數(shù)銀牌,數(shù)學推理模型AlphaProof面世,強化學習 is so back Jul 26, 2024 pm 02:40 PM

對AI來說,奧數(shù)不再是問題了。本週四,GoogleDeepMind的人工智慧完成了一項壯舉:用AI做出了今年國際數(shù)學奧林匹克競賽IMO的真題,並且距拿金牌僅一步之遙。上週剛結(jié)束的IMO競賽共有六道賽題,涉及代數(shù)、組合學、幾何和數(shù)論。谷歌提出的混合AI系統(tǒng)做對了四道,獲得28分,達到了銀牌水準。本月初,UCLA終身教授陶哲軒剛剛宣傳了百萬美元獎金的AI數(shù)學奧林匹克競賽(AIMO進步獎),沒想到7月還沒過,AI的做題水平就進步到了這種水平。 IMO上同步做題,做對了最難題IMO是歷史最悠久、規(guī)模最大、最負

為大模型提供全新科學複雜問答基準與評估體系,UNSW、阿貢、芝加哥大學等多家機構(gòu)共同推出SciQAG框架 為大模型提供全新科學複雜問答基準與評估體系,UNSW、阿貢、芝加哥大學等多家機構(gòu)共同推出SciQAG框架 Jul 25, 2024 am 06:42 AM

編輯|ScienceAI問答(QA)資料集在推動自然語言處理(NLP)研究中發(fā)揮著至關(guān)重要的作用。高品質(zhì)QA資料集不僅可以用於微調(diào)模型,也可以有效評估大語言模型(LLM)的能力,尤其是針對科學知識的理解和推理能力。儘管目前已有許多科學QA數(shù)據(jù)集,涵蓋了醫(yī)學、化學、生物等領(lǐng)域,但這些數(shù)據(jù)集仍有一些不足之處。其一,資料形式較為單一,大多數(shù)為多項選擇題(multiple-choicequestions),它們易於進行評估,但限制了模型的答案選擇範圍,無法充分測試模型的科學問題解答能力。相比之下,開放式問答

PRO | 為什麼基於 MoE 的大模型更值得關(guān)注? PRO | 為什麼基於 MoE 的大模型更值得關(guān)注? Aug 07, 2024 pm 07:08 PM

2023年,幾乎AI的每個領(lǐng)域都在以前所未有的速度進化,同時,AI也不斷地推動著具身智慧、自動駕駛等關(guān)鍵賽道的技術(shù)邊界。在多模態(tài)趨勢下,Transformer作為AI大模型主流架構(gòu)的局面是否會撼動?為何探索基於MoE(專家混合)架構(gòu)的大模型成為業(yè)界新趨勢?大型視覺模型(LVM)能否成為通用視覺的新突破? ……我們從過去的半年發(fā)布的2023年本站PRO會員通訊中,挑選了10份針對以上領(lǐng)域技術(shù)趨勢、產(chǎn)業(yè)變革進行深入剖析的專題解讀,助您在新的一年裡為大展宏圖做好準備。本篇解讀來自2023年Week50

準確率達60.8%,浙大基於Transformer的化學逆合成預測模型,登Nature子刊 準確率達60.8%,浙大基於Transformer的化學逆合成預測模型,登Nature子刊 Aug 06, 2024 pm 07:34 PM

編輯|KX逆合成是藥物發(fā)現(xiàn)和有機合成中的關(guān)鍵任務(wù),AI越來越多地用於加快這一過程?,F(xiàn)有AI方法性能不盡人意,多樣性有限。在實踐中,化學反應(yīng)通常會引起局部分子變化,反應(yīng)物和產(chǎn)物之間存在很大重疊。受此啟發(fā),浙江大學侯廷軍團隊提出將單步逆合成預測重新定義為分子串編輯任務(wù),迭代細化目標分子串以產(chǎn)生前驅(qū)化合物。並提出了基於編輯的逆合成模型EditRetro,該模型可以實現(xiàn)高品質(zhì)和多樣化的預測。大量實驗表明,模型在標準基準資料集USPTO-50?K上取得了出色的性能,top-1準確率達到60.8%。

SOTA性能,廈大多模態(tài)蛋白質(zhì)-配體親和力預測AI方法,首次結(jié)合分子表面訊息 SOTA性能,廈大多模態(tài)蛋白質(zhì)-配體親和力預測AI方法,首次結(jié)合分子表面訊息 Jul 17, 2024 pm 06:37 PM

編輯|KX在藥物研發(fā)領(lǐng)域,準確有效地預測蛋白質(zhì)與配體的結(jié)合親和力對於藥物篩選和優(yōu)化至關(guān)重要。然而,目前的研究並沒有考慮到分子表面訊息在蛋白質(zhì)-配體相互作用中的重要作用?;洞?,來自廈門大學的研究人員提出了一種新穎的多模態(tài)特徵提取(MFE)框架,該框架首次結(jié)合了蛋白質(zhì)表面、3D結(jié)構(gòu)和序列的信息,並使用交叉注意機制進行不同模態(tài)之間的特徵對齊。實驗結(jié)果表明,該方法在預測蛋白質(zhì)-配體結(jié)合親和力方面取得了最先進的性能。此外,消融研究證明了該框架內(nèi)蛋白質(zhì)表面資訊和多模態(tài)特徵對齊的有效性和必要性。相關(guān)研究以「S

See all articles