亚洲国产日韩欧美一区二区三区,精品亚洲国产成人av在线,国产99视频精品免视看7,99国产精品久久久久久久成人热,欧美日韩亚洲国产综合乱

Table des matières
Aper?u
Table des matières
Quel est le gros problème?
Cas d'utilisation d'Openai O1
Résultats de test impressionnants
Concours de mathématiques avancées
Expertise scientifique
Codage
Autres repères et compréhension visuelle
Comprendre les informations visuelles (perception de la vision)
Test d'imagerie médicale (référence MMMU)
Large éventail de connaissances (référence MMLU)
Rencontrez O1-MinI
Mathématiques avec O1 Mini
Qui peut utiliser O1-Preview?
Comment accéder à O1-Preview?
La sécurité est également importante
Quelle est la prochaine étape?
Réflexions finales
Maison Périphériques technologiques IA Openai O1: un nouveau modèle qui ?pense? avant de répondre aux problèmes

Openai O1: un nouveau modèle qui ?pense? avant de répondre aux problèmes

Apr 13, 2025 am 09:26 AM

Avez-vous entendu la grande nouvelle? Openai vient de déployer un aper?u d'une nouvelle série de modèles d'IA - Openai O1 (également connu sous le nom de Project Strawberry / Q *). Ces modèles sont spéciaux car ils passent plus de temps à ?penser? avant de vous donner une réponse. Cela signifie qu'ils sont meilleurs pour résoudre des problèmes vraiment difficiles dans des domaines comme la science, le codage et les mathématiques par rapport aux modèles antérieurs, en grande partie grace aux paramètres avancés OpenAI O1 .

Openai prend la devise ?Pensez avant de parler? à c?ur avec la série O1!

Aper?u

  • La nouvelle série de modèles O1 d'Openai excelle dans le raisonnement à travers des problèmes difficiles en mathématiques, en sciences et en codage, surpassant les versions précédentes.
  • Le modèle O1-Preview s'attaque aux taches avancées, en résolvant 93% des problèmes mathématiques de l'AIME et en dépassant les experts humains dans des références scientifiques. Une grande partie de ce succès se résume à l'efficacité des paramètres OpenAi O1 pour gérer les taches complexes.
  • O1-Mini d'OpenAI offre des capacités de codage puissantes à 80% du co?t, ce qui en fait un outil accessible pour les développeurs.
  • Avec des mesures de sécurité améliorées, les modèles O1 garantissent une utilisation responsable de l'IA tout en fournissant une résolution de problèmes améliorée aux chercheurs, aux développeurs et aux éducateurs.

Table des matières

  • Quel est le gros problème?
  • Cas d'utilisation d'Openai O1
  • Résultats de test impressionnants
    • Concours de mathématiques avancées
    • Expertise scientifique
    • Codage
    • Autres repères et compréhension visuelle
  • Rencontrez O1-MinI
  • Mathématiques avec O1 Mini
  • Qui peut utiliser O1-Preview?
  • Comment accéder à O1-Preview?
  • La sécurité est également importante
  • Quelle est la prochaine étape?
  • Réflexions finales

Quel est le gros problème?

Les modèles O1-Preview sont formés pour prendre du recul et réfléchir vraiment, tout comme un humain face à un problème difficile. Ils considèrent différentes approches, affinent leurs pensées et ont même attrapé leurs propres erreurs en cours de route. Ce niveau de réflexion plus profond leur permet de résoudre des problèmes que les modèles plus anciens ne pouvaient pas gérer.

Cas d'utilisation d'Openai O1

Codage avec openai o1

écrire des puzzles avec Openai O1

HTML Snake avec Openai O1

Résultats de test impressionnants

Pour voir à quel point l'O1 est meilleur par rapport au modèle GPT-4O précédent, OpenAI les a fait passer une série de tests difficiles, y compris les examens humains et les références d'apprentissage automatique. Et devinez quoi? O1 a surpassé le GPT-4O sur la plupart de ces taches de raisonnement!

Décomposons certains des résultats:

Concours de mathématiques avancées

Ils ont testé les modèles sur l' AIME (American Invitational Mathematics Examination) , qui est un examen de mathématiques super difficile pour les meilleurs lycéens aux états-Unis

  • GPT-4O : a résolu environ 12% des problèmes (environ 1,8 sur 15 questions).
  • Openai O1 : résolu 74% avec une seule tentative par problème (environ 11,1 sur 15). Lorsqu'ils ont laissé le modèle essayer plusieurs fois et ont pris la réponse la plus courante, il a obtenu un score de 83% . En utilisant des méthodes encore plus avancées, il a atteint 93% , résolvant environ 13,9 sur 15 problèmes!

Pour mettre cela en perspective, un score de 13,9 placerait l'O1 parmi les 500 meilleurs étudiants à l'échelle nationale et au-dessus du seuil pour l' Olympiade mathématique des états-Unis . C'est un cerveau sérieux!

Expertise scientifique

Ils ont également évalué l'O1 sur GPQA-Diamond , une référence difficile qui teste les connaissances en chimie, en physique et en biologie. Openai a même fait venir des experts avec des doctorants pour répondre à ces questions.

  • Résultat : O1 a surpassé ces experts humains, devenant le premier modèle d'IA à le faire sur cette référence! Cela montre que l'O1 peut résoudre des problèmes scientifiques complexes à un niveau très élevé.

Codage

Dans le codage de concours comme Codeforces, les nouveaux modèles ont atteint le 89e centile , montrant qu'ils peuvent générer et déboguer le code complexe avec facilité.

Openai O1: un nouveau modèle qui ?pense? avant de répondre aux problèmes

Autres repères et compréhension visuelle

Mais ce n'est pas tout! Le modèle O1 a également montré des améliorations significatives dans d'autres domaines:

Comprendre les informations visuelles (perception de la vision)

Le modèle O1 peut désormais interpréter et comprendre les images - une capacité connue sous le nom de perception de la vision . Cela signifie qu'il peut analyser les données visuelles et répondre aux questions à ce sujet, ce qui est un grand pas en avant pour l'IA.

Test d'imagerie médicale (référence MMMU)

OpenAI a testé O1 sur une référence difficile appelée MMMU (qui signifie Multimodal Medical Machine Comprendre ). Ce test évalue la fa?on dont une IA peut comprendre les images médicales et faire des évaluations précises, similaires aux taches effectuées par des professionnels de la santé.

Résultat : O1 a marqué 78,2% sur ce test, ce qui en fait le premier modèle d'IA à fonctionner à un niveau comparable aux experts humains en imagerie médicale. Ceci est énorme parce que la compréhension et l'interprétation des images médicales nécessite des connaissances approfondies et une précision.

Large éventail de connaissances (référence MMLU)

Le modèle O1 a également été testé sur la référence MMLU (Multi-Multitasc Language Comprendre) , qui couvre 57 sujets différents allant de l'histoire et de la littérature aux mathématiques et à l'informatique.

Résultat : O1 a surpassé le GPT-4O dans 54 des 57 sujets! Cela montre que l'O1 n'est pas seulement spécialisé dans un domaine - il démontre une meilleure compréhension à travers un large éventail de sujets.

Openai O1: un nouveau modèle qui ?pense? avant de répondre aux problèmes

En termes plus simples, la capacité d'O1 à comprendre à la fois le texte et les images signifie qu'elle devient plus polyvalente et capable. Qu'il s'agisse d'analyser des images médicales complexes, de résoudre des problèmes mathématiques avancés ou de répondre à des questions sur diverses matières, O1 établit de nouvelles normes pour ce que l'IA peut faire.

Rencontrez O1-MinI

OpenAI a également introduit O1-Mini , une version plus petite, plus rapide et plus abordable du modèle O1-Preview qui est particulièrement bon dans les taches de codage. Il est 80% moins cher , ce qui en fait une excellente option pour les développeurs qui ont besoin de capacités de raisonnement puissantes sans se ruiner.

Nous publions également Openai O1-MinI, un modèle de raisonnement rentable qui excelle à STEM, en particulier les mathématiques et le codage.https: //t.co/wfvvczifev

- Openai (@openai) 12 septembre 2024

Mathématiques avec O1 Mini

Lire aussi: O1-Mini d'Openai: un modèle qui change la donne pour la tige avec un raisonnement rentable

Qui peut utiliser O1-Preview?

Ces nouveaux modèles changent la donne pour quiconque traitait des problèmes complexes:

  • Chercheurs et scientifiques : Ils peuvent aider à annoter les données de séquen?age des cellules ou générer des formules complexes nécessaires dans des domaines comme la physique quantique.
  • Développeurs : la construction et l'exécution de workflows en plusieurs étapes devient plus facile et plus efficace.
  • étudiants et éducateurs : Ils offrent une nouvelle fa?on d'explorer des concepts difficiles en mathématiques et en sciences.

Comment accéder à O1-Preview?

Chatgpt Plus et utilisateurs de l'équipe : vous pouvez accéder aux modèles O1-Preview et O1-MinI dans Chatgpt à partir d'aujourd'hui. Sélectionnez-les simplement dans le cueilleur de modèle. Il y a des limites de messages hebdomadaires pour l'instant (30 messages pour O1-Preview et 50 pour O1-MinI), mais OpenAI travaille bient?t à augmenter ces limites.

Openai O1: un nouveau modèle qui ?pense? avant de répondre aux problèmes

  • ChatGPT Enterprise et Utilisateurs d'Edu : vous aurez accès aux deux modèles à partir de la semaine prochaine.
  • Développeurs : Si vous êtes dans le niveau 5 de l'API, vous pouvez commencer à expérimenter ces modèles via l'API aujourd'hui. Certaines fonctionnalités telles que l'appel de fonction et le streaming ne sont pas encore disponibles, mais elles sont en route.
  • Utilisateurs gratuits de Chatgpt : Excellentes nouvelles! OpenAI prévoit de mettre O1-MinI à la disposition de tous les utilisateurs gratuits bient?t.

La sécurité est également importante

OpenAI a également intensifié les caractéristiques de sécurité avec ces modèles. Ils ont été formés pour mieux comprendre et suivre les directives de sécurité en raisonnant les règles lors des conversations. Cela signifie qu'ils sont moins susceptibles d'être trompés pour faire quelque chose qu'ils ne devraient pas (vous pourriez avoir entendu parler de modèles d'IA ?jailbreakés?).

Dans les tests de sécurité difficiles, le modèle O1-Preview a marqué 84 sur 100 , par rapport au score de GPT-4O de 22 . C'est une amélioration significative, montrant qu'ils sont bien meilleurs pour rester dans des limites s?res et appropriées.

OpenAI travaille en étroite collaboration avec des organisations de sécurité aux états-Unis et au Royaume-Uni, ils ont même donné à ces instituts un accès précoce aux modèles pour aider à la recherche et s'assurer que tout est à la hauteur.

Quelle est la prochaine étape?

Ce n'est que le début. OpenAI prévoit des mises à jour et des améliorations régulières de ces modèles. Ils cherchent à ajouter des fonctionnalités comme la navigation sur le Web, le téléchargement de fichiers et d'images, et plus encore pour les rendre encore plus utiles.

Ils continuent également de développer des modèles dans la série GPT aux c?tés de cette nouvelle série O1, donc il y a beaucoup à espérer.

Réflexions finales

Le lancement des modèles O1-Preview et O1-Mini est un gros problème dans le monde de l'IA. Ils représentent une étape importante dans la fa?on dont l'IA peut raisonner à travers des problèmes complexes. Avec de meilleures performances et des mesures de sécurité améliorées, ces modèles sont prêts à changer la donne pour de nombreuses personnes travaillant sur des taches difficiles.

Restez à l'écoute sur Analytics Vidhya Blog pour en savoir plus sur les utilisations de O1 et O1 Mini!

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Déclaration de ce site Web
Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefa?on, veuillez contacter admin@php.cn

Outils d'IA chauds

Undress AI Tool

Undress AI Tool

Images de déshabillage gratuites

Undresser.AI Undress

Undresser.AI Undress

Application basée sur l'IA pour créer des photos de nu réalistes

AI Clothes Remover

AI Clothes Remover

Outil d'IA en ligne pour supprimer les vêtements des photos.

Clothoff.io

Clothoff.io

Dissolvant de vêtements AI

Video Face Swap

Video Face Swap

échangez les visages dans n'importe quelle vidéo sans effort grace à notre outil d'échange de visage AI entièrement gratuit?!

Outils chauds

Bloc-notes++7.3.1

Bloc-notes++7.3.1

éditeur de code facile à utiliser et gratuit

SublimeText3 version chinoise

SublimeText3 version chinoise

Version chinoise, très simple à utiliser

Envoyer Studio 13.0.1

Envoyer Studio 13.0.1

Puissant environnement de développement intégré PHP

Dreamweaver CS6

Dreamweaver CS6

Outils de développement Web visuel

SublimeText3 version Mac

SublimeText3 version Mac

Logiciel d'édition de code au niveau de Dieu (SublimeText3)

L'investisseur de l'IA est resté à l'arrêt? 3 chemins stratégiques pour acheter, construire ou s'associer avec les fournisseurs d'IA L'investisseur de l'IA est resté à l'arrêt? 3 chemins stratégiques pour acheter, construire ou s'associer avec les fournisseurs d'IA Jul 02, 2025 am 11:13 AM

L'investissement est en plein essor, mais le capital seul ne suffit pas. Avec la montée et la décoloration des évaluations, les investisseurs dans les fonds de capital-risque axés sur l'IA doivent prendre une décision clé: acheter, construire ou partenaire pour gagner un avantage? Voici comment évaluer chaque option et PR

AGI et AI Superintelligence vont fortement frapper la barrière d'hypothèse du plafond humain AGI et AI Superintelligence vont fortement frapper la barrière d'hypothèse du plafond humain Jul 04, 2025 am 11:10 AM

Parlons-en. Cette analyse d'une percée innovante de l'IA fait partie de ma couverture de colonne Forbes en cours sur les dernières personnes en IA, notamment en identifiant et en expliquant diverses complexités d'IA percutantes (voir le lien ici). Se dirigeant vers Agi et

Kimi K2: le modèle agentique open source le plus puissant Kimi K2: le modèle agentique open source le plus puissant Jul 12, 2025 am 09:16 AM

Rappelez-vous le flot de modèles chinois open source qui a perturbé l'industrie du Genai plus t?t cette année? Alors que Deepseek a fait la majeure partie des titres, Kimi K1.5 était l'un des noms importants de la liste. Et le modèle était assez cool.

Prévision future d'une explosion de renseignement massive sur la voie de l'IA à AGI Prévision future d'une explosion de renseignement massive sur la voie de l'IA à AGI Jul 02, 2025 am 11:19 AM

Parlons-en. Cette analyse d'une percée innovante de l'IA fait partie de ma couverture de colonne Forbes en cours sur les dernières personnes en IA, notamment en identifiant et en expliquant diverses complexités d'IA percutantes (voir le lien ici). Pour ces lecteurs qui h

Grok 4 vs Claude 4: Quel est le meilleur? Grok 4 vs Claude 4: Quel est le meilleur? Jul 12, 2025 am 09:37 AM

à la mi-2025, l'AI ?Arme Race? se réchauffe, et Xai et Anthropic ont tous deux publié leurs modèles phares, Grok 4 et Claude 4.

Cha?ne de pensée pour le raisonnement Les modèles peuvent ne pas fonctionner à long terme Cha?ne de pensée pour le raisonnement Les modèles peuvent ne pas fonctionner à long terme Jul 02, 2025 am 11:18 AM

Par exemple, si vous posez une question à un modèle comme: "Que fait (x) personne à (x) l'entreprise?" Vous pouvez voir une cha?ne de raisonnement qui ressemble à quelque chose comme ceci, en supposant que le système sait comment récupérer les informations nécessaires: localiser les détails sur le CO

Le Sénat tue l'interdiction de l'IA au niveau de l'état à 10 ans niché dans le projet de loi budgétaire de Trump Le Sénat tue l'interdiction de l'IA au niveau de l'état à 10 ans niché dans le projet de loi budgétaire de Trump Jul 02, 2025 am 11:16 AM

Le Sénat a voté le 99-1 mardi matin pour tuer le moratoire après un tumulte de dernière minute de groupes de défense des groupes de défense, des législateurs et des dizaines de milliers d'Américains qui l'ont vu comme une dangereuse dépassement. Ils ne sont pas restés silencieux. Le Sénat écouté.

Cette startup a construit un h?pital en Inde pour tester son logiciel AI Cette startup a construit un h?pital en Inde pour tester son logiciel AI Jul 02, 2025 am 11:14 AM

Les essais cliniques sont un énorme goulot d'étranglement du développement de médicaments, et Kim et Reddy pensaient que le logiciel compatible AI qu'ils avait construit chez PI Health pourrait les aider à les faire plus rapidement et moins cher en élargissant le bassin de patients potentiellement éligibles. Mais le

See all articles