


SOTA Performance, eine multimodale KI-Methode zur Vorhersage der Protein-Ligand-Affinit?t in Xiamen, kombiniert erstmals molekulare Oberfl?cheninformationen
Jul 17, 2024 pm 06:37 PM
Herausgeber |. KX
Im Bereich der Arzneimittelforschung und -entwicklung ist die genaue und effektive Vorhersage der Bindungsaffinit?t von Proteinen und Liganden für das Arzneimittelscreening und die Arzneimitteloptimierung von entscheidender Bedeutung. Aktuelle Studien berücksichtigen jedoch nicht die wichtige Rolle molekularer Oberfl?cheninformationen bei Protein-Ligand-Wechselwirkungen.
Auf dieser Grundlage schlugen Forscher der Universit?t Xiamen ein neuartiges MFE-Framework (Multimodal Feature Extraction) vor, das erstmals Informationen über Proteinoberfl?che, 3D-Struktur und -Sequenz kombiniert und einen Kreuzaufmerksamkeitsmechanismus für verschiedene Modi verwendet. Feature-Ausrichtung zwischen Staaten.
Experimentelle Ergebnisse zeigen, dass diese Methode bei der Vorhersage der Protein-Ligand-Bindungsaffinit?t Spitzenleistungen erbringt. Darüber hinaus belegen Ablationsstudien die Wirksamkeit und Notwendigkeit der Proteinoberfl?cheninformation und der multimodalen Merkmalsausrichtung innerhalb dieses Rahmens.
Verwandte Forschung mit dem Titel ?Oberfl?chenbasierte multimodale Protein-Ligand-Bindungsaffinit?tsvorhersage“ wurde am 21. Juni auf ?Bioinformatik“ ver?ffentlicht.
Forschung zur Vorhersage der Protein-Ligand-Bindungsaffinit?t
Als Schlüsselphase der Arzneimittelentwicklung wird die Vorhersage der Protein-Ligand-Bindungsaffinit?t seit langem ausführlich untersucht, was für ein effizientes und genaues Arzneimittelscreening von entscheidender Bedeutung ist.
Herk?mmliche computergestützte Tools zur Arzneimittelentdeckung nutzen Scoring-Funktionen (SF), um die Protein-Ligand-Bindungsaffinit?t grob abzusch?tzen, jedoch mit geringer Genauigkeit. Molekulardynamik-Simulationsmethoden k?nnen genauere Sch?tzungen der Bindungsaffinit?t liefern, sind jedoch oft kostspielig und zeitaufw?ndig.
Mit der Entwicklung der Computertechnologie und der zunehmenden Fülle umfangreicher biologischer Daten haben Deep-Learning-basierte Methoden gro?es Potenzial im Bereich der Vorhersage der Protein-Ligand-Bindungsaffinit?t gezeigt.
Allerdings nutzt die aktuelle Forschung haupts?chlich sequenz- oder strukturbasierte Darstellungen, um die Protein-Ligand-Bindungsaffinit?t vorherzusagen, und es gibt relativ wenige Studien zu Proteinoberfl?cheninformationen, die für Protein-Ligand-Wechselwirkungen entscheidend sind.
Eine molekulare Oberfl?che ist eine hochrangige Darstellung der Struktur eines Proteins, die charakteristische chemische und geometrische Muster aufweist, die als Fingerabdrücke der Interaktionsmuster des Proteins mit anderen Biomolekülen dienen. Daher begannen einige Studien, Proteinoberfl?cheninformationen zu nutzen, um die Protein-Ligand-Bindungsaffinit?t vorherzusagen.
Aber bestehende Methoden konzentrieren sich haupts?chlich auf monomodale Daten und ignorieren die multimodalen Informationen von Proteinen. Darüber hinaus verbinden herk?mmliche Methoden bei der Verarbeitung multimodaler Informationen von Proteinen normalerweise Merkmale verschiedener Modalit?ten direkt, ohne die Heterogenit?t zwischen ihnen zu berücksichtigen, was dazu führt, dass die Komplementarit?t zwischen Modalit?ten nicht effektiv genutzt werden kann.
Neuartiges Framework zur multimodalen Merkmalsextraktion
Hier schlagen Forscher ein neuartiges Framework zur multimodalen Merkmalsextraktion (MFE) vor, das zum ersten Mal Informationen aus Proteinoberfl?che, 3D-Struktur und Sequenz kombiniert.
Konkret wurden in der Studie zwei Hauptkomponenten entworfen: das Protein-Merkmalsextraktionsmodul und das multimodale Merkmalsvergleichsmodul.
Das Protein-Feature-Extraktionsmodul wird verwendet, um anf?ngliche Einbettungen aus Proteinoberfl?chen-, Struktur- und Sequenzinformationen zu extrahieren.
Im multimodalen Merkmalsvergleichsmodul wird der Kreuzaufmerksamkeitsmechanismus verwendet, um einen Merkmalsvergleich zwischen Proteinstruktur, Sequenzeinbettung und Oberfl?cheneinbettung zu erreichen und so eine einheitliche und informationsreiche Merkmalseinbettung zu erhalten.
Im Vergleich zu aktuellen Methoden auf dem neuesten Stand der Technik erzielt das vorgeschlagene Framework die besten Ergebnisse bei der Aufgabe der Vorhersage der Protein-Ligand-Bindungsaffinit?t.
SOTA-Leistung
Tabelle 1 zeigt die Ergebnisse von MFE und anderen Basismodellen zur Vorhersage der Protein-Ligand-Bindungsaffinit?t. Alle Modelle verwendeten die gleiche Partitionierungsmethode für Trainings- und Validierungss?tze und wurden auf dem PDBbind-Kernsatz (Version 2016) getestet. Es kann festgestellt werden, dass die MFE-Methode im Vergleich zu allen Basislinien eine SOTA-Leistung erzielt.
Ablationsstudie
Um die Wirksamkeit und Notwendigkeit verschiedener modaler Merkmale und Merkmalsvergleiche weiter zu beweisen, führten die Forscher die folgenden Ablationsstudien durch: Informationen zur W/O-Proteinoberfl?che, Informationen zur W/O-Proteinstruktur, w/ o Proteinsequenzinformationen und merkmalslose Alignments. Die Ergebnisse sind in Tabelle 2 und Abbildung 2 dargestellt.
Abbildung 2: Ergebnisse der Ablationsstudie. (Quelle: Papier)
Die Ergebnisse zeigen, dass die Leistung erheblich abnimmt, wenn Oberfl?cheninformationen entfernt werden, was darauf hindeutet, dass Oberfl?cheninformationen eine entscheidende Rolle im Modell spielen. Ebenso führt der Ausschluss von Struktur- oder Sequenzinformationen zu einer Leistungsverschlechterung, w?hrend die Eliminierung von Sequenzinformationen zu einer st?rkeren Verschlechterung führt. Dies liegt daran, dass Sequenzinformationen globale Informationen über das Protein enthalten, die für das vollst?ndige Verst?ndnis des Proteins durch das Modell von entscheidender Bedeutung sind.
Darüber hinaus nimmt ohne Funktionsvergleich die Leistung des Modells ab. Dies unterstreicht die Bedeutung des Merkmalsvergleichs bei der Verarbeitung multimodaler Daten, da er dazu beitr?gt, die Heterogenit?t zwischen verschiedenen Modalmerkmalen zu verringern und dadurch die F?higkeit des Modells zur effektiven Integration verschiedener Modalmerkmale zu verbessern.
Hyperparameteranalyse
Um den Einfluss verschiedener Hyperparameter auf die Modellleistung zu untersuchen, führten die Forscher die folgenden drei Experimente durch: (i) MFE-A-6: Verwenden Sie nur 6 grundlegende Atomtypen zur Darstellung von Chemikalien Eigenschaften der Oberfl?che, einschlie?lich Wasserstoff, Kohlenstoff, Stickstoff, Sauerstoff, Phosphor und Schwefel; (ii) MFE-P-256: Nur die 256 Oberfl?chenpunkte, die dem Ligandenzentrum am n?chsten liegen, werden als Proteintaschenoberfl?che ausgew?hlt; -P -1024: W?hlen Sie die 1024 Oberfl?chenpunkte, die dem Ligandenzentrum am n?chsten liegen, als Proteintaschenoberfl?che aus.
Abbildung 3 zeigt die Ergebnisse von drei verschiedenen Hyperparameter-Auswahlmethoden für die Aufgabe zur Vorhersage der Protein-Ligand-Bindungsaffinit?t.
Merkmalsausrichtungsanalyse und -visualisierung
Um den Einfluss der Merkmalsausrichtung auf die Modellleistung eingehend zu untersuchen, verwendeten die Forscher die Hauptkomponentenanalyse (PCA), um eine Dimensionsreduktion und Summierung der Proteinoberfl?che und -struktur durchzuführen und Sequenzmerkmale im Testsatz Visuelle Analyse. Mit diesem Ansatz soll ermittelt werden, ob die Merkmalsausrichtung die Heterogenit?t zwischen multimodalen Einbettungen verringern kann.
Untersuchungen haben ergeben, dass die Merkmalsausrichtung die Konsistenz zwischen Proteinoberfl?che, Struktur und Sequenzeinbettung deutlich verbessert. Dies ist auf die Optimierung multimodaler Feature-Interaktionen in Transformer durch den Aufmerksamkeitsmechanismus zurückzuführen, der Aufmerksamkeitsgewichte zwischen verschiedenen Features berechnet. Dies verbessert die F?higkeit des Modells, wichtige Informationen zu erfassen, wodurch Daten aus verschiedenen Modalit?ten enger im Merkmalsraum geclustert werden k?nnen, wodurch Rauschen und Fehler bei der Identifizierung von Protein-Ligand-Wechselwirkungen durch das Modell reduziert werden.
Abschlie?end kamen die Forscher zu dem Schluss: ?Zusammenfassend k?nnen wir durch die Untersuchung der Oberfl?che von Proteinen ein tieferes Verst?ndnis dafür erlangen, wie Proteine ??mit anderen Biomolekülen interagieren. In zukünftigen Arbeiten werden wir Proteinoberfl?chen gründlicher untersuchen, um ihre breitere Anwendung aufzudecken.“ Bioinformatik“
Hinweis: Das Cover stammt aus dem Internet
.Das obige ist der detaillierte Inhalt vonSOTA Performance, eine multimodale KI-Methode zur Vorhersage der Protein-Ligand-Affinit?t in Xiamen, kombiniert erstmals molekulare Oberfl?cheninformationen. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Hei?e KI -Werkzeuge

Undress AI Tool
Ausziehbilder kostenlos

Undresser.AI Undress
KI-gestützte App zum Erstellen realistischer Aktfotos

AI Clothes Remover
Online-KI-Tool zum Entfernen von Kleidung aus Fotos.

Clothoff.io
KI-Kleiderentferner

Video Face Swap
Tauschen Sie Gesichter in jedem Video mühelos mit unserem v?llig kostenlosen KI-Gesichtstausch-Tool aus!

Hei?er Artikel

Hei?e Werkzeuge

Notepad++7.3.1
Einfach zu bedienender und kostenloser Code-Editor

SublimeText3 chinesische Version
Chinesische Version, sehr einfach zu bedienen

Senden Sie Studio 13.0.1
Leistungsstarke integrierte PHP-Entwicklungsumgebung

Dreamweaver CS6
Visuelle Webentwicklungstools

SublimeText3 Mac-Version
Codebearbeitungssoftware auf Gottesniveau (SublimeText3)

Hei?e Themen





Diese Seite berichtete am 27. Juni, dass Jianying eine von FaceMeng Technology, einer Tochtergesellschaft von ByteDance, entwickelte Videobearbeitungssoftware ist, die auf der Douyin-Plattform basiert und grunds?tzlich kurze Videoinhalte für Benutzer der Plattform produziert Windows, MacOS und andere Betriebssysteme. Jianying kündigte offiziell die Aktualisierung seines Mitgliedschaftssystems an und führte ein neues SVIP ein, das eine Vielzahl von KI-Schwarztechnologien umfasst, wie z. B. intelligente übersetzung, intelligente Hervorhebung, intelligente Verpackung, digitale menschliche Synthese usw. Preislich betr?gt die monatliche Gebühr für das Clipping von SVIP 79 Yuan, die Jahresgebühr 599 Yuan (Hinweis auf dieser Website: entspricht 49,9 Yuan pro Monat), das fortlaufende Monatsabonnement betr?gt 59 Yuan pro Monat und das fortlaufende Jahresabonnement betr?gt 499 Yuan pro Jahr (entspricht 41,6 Yuan pro Monat). Darüber hinaus erkl?rte der Cut-Beamte auch, dass diejenigen, die den ursprünglichen VIP abonniert haben, das Benutzererlebnis verbessern sollen

In der modernen Fertigung ist die genaue Fehlererkennung nicht nur der Schlüssel zur Sicherstellung der Produktqualit?t, sondern auch der Kern für die Verbesserung der Produktionseffizienz. Allerdings mangelt es vorhandenen Datens?tzen zur Fehlererkennung h?ufig an der Genauigkeit und dem semantischen Reichtum, die für praktische Anwendungen erforderlich sind, was dazu führt, dass Modelle bestimmte Fehlerkategorien oder -orte nicht identifizieren k?nnen. Um dieses Problem zu l?sen, hat ein Spitzenforschungsteam bestehend aus der Hong Kong University of Science and Technology Guangzhou und Simou Technology innovativ den ?DefectSpectrum“-Datensatz entwickelt, der eine detaillierte und semantisch reichhaltige gro? angelegte Annotation von Industriedefekten erm?glicht. Wie in Tabelle 1 gezeigt, bietet der Datensatz ?DefectSpectrum“ im Vergleich zu anderen Industriedatens?tzen die meisten Fehleranmerkungen (5438 Fehlerproben) und die detaillierteste Fehlerklassifizierung (125 Fehlerkategorien).

Die offene LLM-Community ist eine ?ra, in der hundert Blumen blühen und konkurrieren. Sie k?nnen Llama-3-70B-Instruct, QWen2-72B-Instruct, Nemotron-4-340B-Instruct, Mixtral-8x22BInstruct-v0.1 und viele andere sehen hervorragende Darsteller. Allerdings weisen offene Modelle im Vergleich zu den propriet?ren Gro?modellen GPT-4-Turbo in vielen Bereichen noch erhebliche Lücken auf. Zus?tzlich zu allgemeinen Modellen wurden einige offene Modelle entwickelt, die sich auf Schlüsselbereiche spezialisieren, wie etwa DeepSeek-Coder-V2 für Programmierung und Mathematik und InternVL für visuelle Sprachaufgaben.

Herausgeber |KX Bis heute sind die durch die Kristallographie ermittelten Strukturdetails und Pr?zision, von einfachen Metallen bis hin zu gro?en Membranproteinen, mit keiner anderen Methode zu erreichen. Die gr??te Herausforderung, das sogenannte Phasenproblem, bleibt jedoch die Gewinnung von Phaseninformationen aus experimentell bestimmten Amplituden. Forscher der Universit?t Kopenhagen in D?nemark haben eine Deep-Learning-Methode namens PhAI entwickelt, um Kristallphasenprobleme zu l?sen. Ein Deep-Learning-Neuronales Netzwerk, das mithilfe von Millionen künstlicher Kristallstrukturen und den entsprechenden synthetischen Beugungsdaten trainiert wird, kann genaue Elektronendichtekarten erstellen. Die Studie zeigt, dass diese Deep-Learning-basierte Ab-initio-Strukturl?sungsmethode das Phasenproblem mit einer Aufl?sung von nur 2 Angstr?m l?sen kann, was nur 10 bis 20 % der bei atomarer Aufl?sung verfügbaren Daten im Vergleich zur herk?mmlichen Ab-initio-Berechnung entspricht

Für KI ist die Mathematikolympiade kein Problem mehr. Am Donnerstag hat die künstliche Intelligenz von Google DeepMind eine Meisterleistung vollbracht: Sie nutzte KI, um meiner Meinung nach die eigentliche Frage der diesj?hrigen Internationalen Mathematikolympiade zu l?sen, und war nur einen Schritt davon entfernt, die Goldmedaille zu gewinnen. Der IMO-Wettbewerb, der gerade letzte Woche zu Ende ging, hatte sechs Fragen zu Algebra, Kombinatorik, Geometrie und Zahlentheorie. Das von Google vorgeschlagene hybride KI-System beantwortete vier Fragen richtig und erzielte 28 Punkte und erreichte damit die Silbermedaillenstufe. Anfang dieses Monats hatte der UCLA-Professor Terence Tao gerade die KI-Mathematische Olympiade (AIMO Progress Award) mit einem Millionenpreis gef?rdert. Unerwarteterweise hatte sich das Niveau der KI-Probleml?sung vor Juli auf dieses Niveau verbessert. Beantworten Sie die Fragen meiner Meinung nach gleichzeitig. Am schwierigsten ist es meiner Meinung nach, da sie die l?ngste Geschichte, den gr??ten Umfang und die negativsten Fragen haben

Herausgeber | Der Frage-Antwort-Datensatz (QA) von ScienceAI spielt eine entscheidende Rolle bei der F?rderung der Forschung zur Verarbeitung natürlicher Sprache (NLP). Hochwertige QS-Datens?tze k?nnen nicht nur zur Feinabstimmung von Modellen verwendet werden, sondern auch effektiv die F?higkeiten gro?er Sprachmodelle (LLMs) bewerten, insbesondere die F?higkeit, wissenschaftliche Erkenntnisse zu verstehen und zu begründen. Obwohl es derzeit viele wissenschaftliche QS-Datens?tze aus den Bereichen Medizin, Chemie, Biologie und anderen Bereichen gibt, weisen diese Datens?tze immer noch einige M?ngel auf. Erstens ist das Datenformular relativ einfach, die meisten davon sind Multiple-Choice-Fragen. Sie sind leicht auszuwerten, schr?nken jedoch den Antwortauswahlbereich des Modells ein und k?nnen die F?higkeit des Modells zur Beantwortung wissenschaftlicher Fragen nicht vollst?ndig testen. Im Gegensatz dazu offene Fragen und Antworten

Laut Nachrichten dieser Website vom 1. August hat SK Hynix heute (1. August) einen Blogbeitrag ver?ffentlicht, in dem es ankündigt, dass es am Global Semiconductor Memory Summit FMS2024 teilnehmen wird, der vom 6. bis 8. August in Santa Clara, Kalifornien, USA, stattfindet viele neue Technologien Generation Produkt. Einführung des Future Memory and Storage Summit (FutureMemoryandStorage), früher Flash Memory Summit (FlashMemorySummit), haupts?chlich für NAND-Anbieter, im Zusammenhang mit der zunehmenden Aufmerksamkeit für die Technologie der künstlichen Intelligenz wurde dieses Jahr in Future Memory and Storage Summit (FutureMemoryandStorage) umbenannt Laden Sie DRAM- und Speicheranbieter und viele weitere Akteure ein. Neues Produkt SK Hynix wurde letztes Jahr auf den Markt gebracht

Im Jahr 2023 entwickeln sich fast alle Bereiche der KI in beispielloser Geschwindigkeit weiter. Gleichzeitig verschiebt die KI st?ndig die technologischen Grenzen wichtiger Bereiche wie der verk?rperten Intelligenz und des autonomen Fahrens. Wird der Status von Transformer als Mainstream-Architektur gro?er KI-Modelle durch den multimodalen Trend erschüttert? Warum ist die Erforschung gro?er Modelle auf Basis der MoE-Architektur (Mixture of Experts) zu einem neuen Trend in der Branche geworden? K?nnen Large Vision Models (LVM) ein neuer Durchbruch im allgemeinen Sehverm?gen sein? ...Aus dem PRO-Mitglieder-Newsletter 2023 dieser Website, der in den letzten sechs Monaten ver?ffentlicht wurde, haben wir 10 spezielle Interpretationen ausgew?hlt, die eine detaillierte Analyse der technologischen Trends und industriellen Ver?nderungen in den oben genannten Bereichen bieten, um Ihnen dabei zu helfen, Ihre Ziele in der Zukunft zu erreichen Jahr vorbereitet sein. Diese Interpretation stammt aus Week50 2023
