


Was macht PHI 3.5 SLMS zu einem Game-Changer für generative KI?
Apr 14, 2025 am 09:13 AMMicrosoft enthüllt Phi-3.5: eine Familie effizienter und leistungsstarker kleiner Sprachmodelle
Die neueste Generation von SLMs (SLMS) von Microsoft, die Phi-3,5-Familie, bietet über verschiedene Benchmarks, die Sprache, Argumentation, Codierung und Mathematik umfassen, überlegene Leistung. Diese Modelle wurden sowohl für Leistung als auch für Effizienz entwickelt und erweitern die Angebote von Azure und bieten Entwicklern erweiterte Tools für generative KI -Anwendungen. Aufbauend auf dem Feedback des Benutzers seit dem Start von Phi-3 April 2024 führt Phi-3,5 drei Schlüsselmodelle ein: Phi-3,5-Mini, Phi-3,5-Vision und Phi-3,5-MOE (ein Modell der Expertenmischung).
Schlüsselmodellmerkmale:
- PHI-3,5-MINI: verfügt über eine erweiterte Kontextl?nge von 128.000 und verbesserte mehrsprachige Funktionen.
- PHI-3,5-Vision: bietet ein verbessertes Multi-Rahmen-Bildverst?ndnis und Argumentation, was zu verbesserten Ein-Image-Benchmark-Ergebnissen führt.
- PHI-3,5-MOE: Ein Modell der Expertenmischung mit 16 Experten und 6,6B-aktiven Parametern, die gr??ere Modelle übertreffen und gleichzeitig Effizienz, mehrsprachige Unterstützung und robuste Sicherheitsmerkmale beibehalten. Es unterstützt auch eine Kontextl?nge von 128.000.
Phi-3,5-MOE: ein tiefer Tauchgang
Das Flaggschiff phi-3,5-MOE-Modell umfasst 16 Experten mit jeweils 3,8B-Parametern und insgesamt 42B-Parameter. Zu einem bestimmten Zeitpunkt sind jedoch nur 6,6B -Parameter aktiv. Diese Architektur übertrifft vergleichbare dichte Modelle in Bezug auf Leistung und Qualit?t und unterstützt über 20 Sprachen. Strenge Sicherheitstraining, die sowohl propriet?re als auch Open-Source-Daten einbezieht, verwendet direkte Pr?ferenzoptimierung (DPO) und beaufsichtigte Feinabstimmung (SFT), um Harmlosigkeit und Hilfsbereitschaft zu gew?hrleisten.
PHI-3.5-MOE-Trainingsdaten:
Das Training des Modells verwendete 4,9 Billionen Token (10% mehrsprachig) aus verschiedenen Quellen:
- Hochwertige, streng gefilterte ?ffentliche Dokumente und Bildungsdaten.
- Synthetische "Lehrbuch-?hnliche" Daten für Mathematik-, Codierungs- und Argumentationsf?higkeiten.
- Hochwertige Chat-Daten, die menschliche Vorlieben für Anweisungen, Wahrhaftigkeit und Hilfsbereitschaft widerspiegeln.
In der obigen Tabelle werden die überlegene Leistung von Phi-3,5-MOE im Vergleich zu gr??eren Modellen über verschiedene Benchmarks hinweg hervorgehoben.
Diese Tabelle zeigt die starken mehrsprachigen F?higkeiten von Phi-3,5-MOE und übertreffen gr??ere Modelle für mehrsprachige Aufgaben.
Phi-3,5-mini: kleine Gr??e, gro?e Auswirkungen
Phi-3,5-Mini profitiert von zus?tzlichen Voraussetzungen und Nachtraining (DPO, PPO, SFT) unter Verwendung mehrsprachiger und qualitativ hochwertiger Daten.
Phi-3,5-Mini-Trainingsdaten:
?hnlich wie bei Phi-3,5-MOE enth?lt die Trainingsdaten von Phi-3,5-Mini (3,4 Billionen Token) gefilterte ?ffentliche Dokumente, synthetische Daten und qualitativ hochwertige Chat-Daten.
Diese Tabelle zeigt die Wettbewerbsleistung von Phi-3,5-Mini gegen gr??ere Modelle.
Diese Tabelle zeigt die verbesserte mehrsprachige Leistung von Phi-3,5-mini, insbesondere in Sprachen wie Arabisch, Niederl?ndisch und Finnisch.
Die 128K-Kontextl?nge von Phi-3,5-Mini macht es für Langdokumentverarbeitungsaufgaben geeignet.
Phi-3.5-Vision: Bildverst?ndnis neu definiert
PHI-3.5-Vision nutzt einen vielf?ltigen Schulungsdatensatz, einschlie?lich gefilterter ?ffentlicher Dokumente, Bildtextdaten, synthetischen Daten und qualitativ hochwertigen Chat-Daten. Es zeichnet sich im Multi-Frame-Bildverst?ndnis aus und erm?glicht Aufgaben wie Bildvergleich und Zusammenfassung der Mehrfach image. Es zeigt auch eine verbesserte Leistung bei Einzel-Image-Benchmarks.
Diese Tabellen veranschaulichen die Leistungsverbesserungen der PHI-3.5-Vision gegenüber Multi-Image-Benchmarks.
Die Modelle ausprobieren:
Anweisungen und Beispiele werden zur Verwendung von Phi-3,5-Mini und Phi-3,5-Vision über Umarmung und Azure-AI-Studio vorgesehen. Beachten Sie, dass für die PHI-3,5-Vision aufgrund seiner GPU-Anforderungen umarme Gesichtsr?ume verwendet wurden.
Abschluss:
Die Phi-3,5-Familie bietet eine überzeugende Auswahl an kostengünstigen, leistungsstarken SLMs für Open-Source-Entwickler und Azure-Benutzer. Jedes Modell richtet sich an bestimmte Bedürfnisse, von kompakten und mehrsprachigen pHi-3,5-mini bis zum leistungsstarken und vielseitigen Phi-3,5-MOE und der bildorientierten pHi-3,5-Vision.
H?ufig gestellte Fragen: (im Originaltext enthalten)
Das obige ist der detaillierte Inhalt vonWas macht PHI 3.5 SLMS zu einem Game-Changer für generative KI?. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Hei?e KI -Werkzeuge

Undress AI Tool
Ausziehbilder kostenlos

Undresser.AI Undress
KI-gestützte App zum Erstellen realistischer Aktfotos

AI Clothes Remover
Online-KI-Tool zum Entfernen von Kleidung aus Fotos.

Clothoff.io
KI-Kleiderentferner

Video Face Swap
Tauschen Sie Gesichter in jedem Video mühelos mit unserem v?llig kostenlosen KI-Gesichtstausch-Tool aus!

Hei?er Artikel

Hei?e Werkzeuge

Notepad++7.3.1
Einfach zu bedienender und kostenloser Code-Editor

SublimeText3 chinesische Version
Chinesische Version, sehr einfach zu bedienen

Senden Sie Studio 13.0.1
Leistungsstarke integrierte PHP-Entwicklungsumgebung

Dreamweaver CS6
Visuelle Webentwicklungstools

SublimeText3 Mac-Version
Codebearbeitungssoftware auf Gottesniveau (SublimeText3)

Hei?e Themen





Das Investieren boomt, aber Kapital allein reicht nicht aus. Mit zunehmender Bewertungen und Verblassen der Unterscheidungskraft müssen Investoren in AI-fokussierten Risikokonstrumentfonds eine wichtige Entscheidung treffen: Kaufen, Bau oder Partner, um einen Vorteil zu erlangen? Hier erfahren Sie, wie Sie jede Option bewerten - und PR

Reden wir darüber. Diese Analyse eines innovativen KI -Durchbruchs ist Teil meiner laufenden Forbes -S?ulenberichterstattung über die neueste in der KI, einschlie?lich der Identifizierung und Erkl?rung verschiedener wirksamer KI -Komplexit?ten (siehe Link hier). Auf dem Weg zu Agi und

Erinnern Sie sich an die Flut chinesischer Open-Source-Modelle, die die Genai-Industrie Anfang dieses Jahres gest?rt haben? W?hrend Deepseek die meisten Schlagzeilen machte, war Kimi K1.5 einer der herausragenden Namen in der Liste. Und das Modell war ziemlich cool.

Reden wir darüber. Diese Analyse eines innovativen KI -Durchbruchs ist Teil meiner laufenden Forbes -S?ulenberichterstattung über die neueste in der KI, einschlie?lich der Identifizierung und Erkl?rung verschiedener wirksamer KI -Komplexit?ten (siehe Link hier). Für diejenigen Leser, die h

Bis Mitte 2025 heizt sich das KI ?Wettret“ auf, und Xai und Anthropic haben beide ihre Flaggschiff-Modelle GROK 4 und Claude 4 ver?ffentlicht. Diese beiden Modelle befinden

Wenn Sie beispielsweise einem Modell eine Frage wie: "Was macht (x) Person bei (x) Firma?" M?glicherweise sehen Sie eine Argumentationskette, die ungef?hr so ??aussieht, vorausgesetzt, das System wei?, wie man die erforderlichen Informationen abgerufen: Details zum CO finden

Der Senat stimmte am Dienstagmorgen mit 99: 1 für die T?tung des Moratoriums nach einem Aufruhr in letzter Minute von Interessenvertretungsgruppen, Gesetzgebern und Zehntausenden von Amerikanern, die es als gef?hrliche überreichung ansah. Sie blieben nicht ruhig. Der Senat h?rte zu.

Klinische Studien sind ein enormer Engpass in der Arzneimittelentwicklung, und Kim und Reddy glaubten, dass die AI-f?hige Software, die sie bei PI Health gebaut hatten, dazu beitragen k?nnte, sie schneller und billiger zu machen, indem sie den Pool potenziell berechtigter Patienten erweitert. Aber die
