


Guide de Rohan Rao pour choisir les bons LLM pour les entreprises
Apr 12, 2025 am 11:40 AMDans cet épisode de Leading with Data, nous plongeons dans le monde fascinant de la science des données avec Rohan Rao, un grand ma?tre de Kaggle quadruple et expert en solutions d'apprentissage automatique. Rohan partage des informations sur les partenariats stratégiques, l'évolution des outils de données et l'avenir des modèles de gros langues, mettant en lumière les défis et les innovations qui fa?onnent l'industrie.
Vous pouvez écouter cet épisode de Leading avec des données sur les plateformes populaires comme Spotify, Google Podcasts et Apple. Choisissez votre favori pour profiter du contenu perspicace!
Informations clés de notre conversation avec Rohan Rao
- Les partenariats stratégiques dans les compétitions peuvent conduire à des victoires mémorables et à des expériences d'apprentissage.
- L'évolution des outils de science des données nécessite l'apprentissage et l'adaptation continus des praticiens.
- L'avenir des LLM peut dépendre de nouvelles sources de données et de la génération de données synthétiques.
- Les entreprises souhaitent intégrer les LLM, mais sont confrontées à des défis pour les appliquer à des ensembles de données uniques.
- Un cadre complet pour la sélection des LLM peut guider les entreprises dans la prise de décisions éclairées.
- L'expérimentation est essentielle dans le choix entre les algorithmes traditionnels et l'IA générative pour les problèmes commerciaux.
- Les LLM propriétaires avec API offrent souvent une solution plus pratique pour les entreprises malgré des co?ts plus élevés.
- L'IA responsable implique une approche multiforme, notamment la technologie, la politique et la réglementation.
- Les agents d'IA spécialisés sont prometteurs pour la résolution de problèmes ciblée et efficace au sein des entreprises.
Rejoignez notre prochain menant avec des séances de données pour des discussions perspicaces avec l'IA et les leaders de la science des données!
Examinons les détails de notre conversation avec Rohan Rao!
Comment avez-vous commencé votre parcours en science des données et quelle compétition vous démarque?
Merci, Kunal, de m'avoir fait diriger avec des données. Mon voyage en science des données a commencé il y a près d'une décennie, rempli de codage, de hackathons et de compétitions. Il est difficile de choisir une compétition hors concours, mais un moment mémorable a été de réaliser un tour de victoires sur les hackathons de l'analyse Vidhya en s'assocant intelligemment à un fort concurrent. Ce fut une décision stratégique qui a porté ses fruits et est une mémoire affectueuse de mes jours compétitifs.
Observant les tendances, comment la science des données a-t-elle évolué récemment?
Le domaine de la science des données a connu des phases de progrès progressif et des sauts soudains. Des outils comme XGBOost ont révolutionné la modélisation prédictive, tandis que Bert a transformé la NLP. Récemment, la sortie de Chatgpt a marqué une étape importante, présentant les capacités des LLM. Ces progrès ont obligé les scientifiques des données à adapter et à moderniser en permanence leurs compétences.
Quelles sont vos prédictions pour l'avenir de l'IA générative?
La trajectoire des LLMS a tendance à montrer une forte amélioration initiale suivie d'un plateau. L'amélioration des performances devient progressivement plus difficile au fil du temps. Bien que les LLM aient appris de grandes quantités de données Internet, les améliorations futures peuvent dépendre de nouveaux ensembles de données ou innovations importants dans la génération de données synthétiques. Les ressources informatiques disponibles aujourd'hui sont sans précédent, ce qui rend l'innovation plus accessible que jamais.
Comment les entreprises adoptent-elles l'IA et les LLM génératives?
Les entreprises de diverses industries sont désireuses d'intégrer les LLM dans leurs opérations. Le défi consiste à épouser ces modèles aux données commerciales propriétaires, qui n'est souvent pas aussi étendue que les données sur les données sur lesquelles sont formées. Chez H2O.AI, nous constatons une partie importante de nos travaux axés sur l'activation des entreprises de tirer parti de la puissance des LLM avec leurs ensembles de données uniques.
Quels sont les cas d'utilisation les plus courants que vous avez vus dans différents secteurs?
La question la plus courante des entreprises est de savoir comment faire apprendre un LLM de leurs données spécifiques. L'objectif est d'appliquer les capacités générales des LLM pour relever des défis commerciaux uniques. Cela implique de comprendre les forces et les limites des modèles et les intégrer aux systèmes et formats de données existants.
Pouvez-vous partager votre framework pour sélectionner le bon LLM pour les besoins de l'entreprise?
Certainement. Le cadre que j'ai présenté au Data Hack Summit comprend 12 points à considérer lors de la sélection d'un LLM pour votre entreprise. Ceux-ci vont des capacités et de la précision du modèle à l'évolutivité, au co?t et aux considérations juridiques comme la conformité et la confidentialité. Il est crucial d'évaluer ces facteurs pour déterminer quel LLM s'aligne le mieux avec vos objectifs et contraintes commerciaux.
Comment naviguer dans le choix entre les algorithmes traditionnels et l'IA générative?
La clé est d'expérimenter et d'itérer. Bien que les algorithmes traditionnels comme XGBOost aient été les incontournables pour de nombreux problèmes, les LLM offrent de nouvelles possibilités. En comparant leurs performances sur des taches spécifiques, les entreprises peuvent déterminer quelle approche donne de meilleurs résultats et est plus possible pour déployer et gérer.
Quelles sont les considérations lors de la construction de solutions d'ingénierie autour de LLMS?
Le choix entre les LLMS propriétaires avec des API et l'hébergement de LLMS open-source sur site est une décision importante. Bien que les modèles open source puissent sembler rentables, ils sont livrés avec des complexités cachées comme la gestion et l'évolutivité des infrastructures. Souvent, les entreprises gravitent vers les services API pour leur commodité, malgré des co?ts plus élevés.
Comment relevez-vous les défis de l'IA responsable?
L'IA responsable est un problème complexe qui s'étend au-delà des solutions technologiques. Alors que les garde-corps et les cadres sont en place pour éviter une mauvaise utilisation, la nature imprévisible des LLMs rend difficile le contr?le complètement. La solution peut impliquer une combinaison de garanties technologiques, de politiques gouvernementales et de réglementations de l'IA pour équilibrer l'innovation avec une utilisation éthique.
Quelle est votre opinion sur l'utilisation des agents de l'IA dans les affaires?
Je suis extrêmement optimiste sur le potentiel des agents de l'IA. Les agents spécialisés peuvent effectuer des taches spécifiques avec une grande précision, et le défi consiste à intégrer ces microtasses dans des solutions plus larges. Bien que certains produits puissent simplement envelopper les LLM existantes avec des invites personnalisées, les agents vraiment spécialisés ont le potentiel de révolutionner la fa?on dont nous abordons la résolution de problèmes dans divers domaines.
Note finale
Comme le souligne Rohan, naviguer dans le paysage de la science des données et de l'IA générative nécessite un apprentissage et une expérimentation continus. En adoptant des cadres innovants et des pratiques d'IA responsables, les entreprises peuvent exploiter la puissance des données pour stimuler des solutions significatives, transformant finalement la fa?on dont elles fonctionnent et rivalisent sur un marché en évolution rapide.
Pour des séances plus engageantes sur l'IA, la science des données et le Genai, restez à l'écoute avec nous en menant avec les données.
Vérifiez nos séances à venir ici.
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Outils d'IA chauds

Undress AI Tool
Images de déshabillage gratuites

Undresser.AI Undress
Application basée sur l'IA pour créer des photos de nu réalistes

AI Clothes Remover
Outil d'IA en ligne pour supprimer les vêtements des photos.

Clothoff.io
Dissolvant de vêtements AI

Video Face Swap
échangez les visages dans n'importe quelle vidéo sans effort grace à notre outil d'échange de visage AI entièrement gratuit?!

Article chaud

Outils chauds

Bloc-notes++7.3.1
éditeur de code facile à utiliser et gratuit

SublimeText3 version chinoise
Version chinoise, très simple à utiliser

Envoyer Studio 13.0.1
Puissant environnement de développement intégré PHP

Dreamweaver CS6
Outils de développement Web visuel

SublimeText3 version Mac
Logiciel d'édition de code au niveau de Dieu (SublimeText3)

Sujets chauds

L'investissement est en plein essor, mais le capital seul ne suffit pas. Avec la montée et la décoloration des évaluations, les investisseurs dans les fonds de capital-risque axés sur l'IA doivent prendre une décision clé: acheter, construire ou partenaire pour gagner un avantage? Voici comment évaluer chaque option et PR

Parlons-en. Cette analyse d'une percée innovante de l'IA fait partie de ma couverture de colonne Forbes en cours sur les dernières personnes en IA, notamment en identifiant et en expliquant diverses complexités d'IA percutantes (voir le lien ici). Se dirigeant vers Agi et

Rappelez-vous le flot de modèles chinois open source qui a perturbé l'industrie du Genai plus t?t cette année? Alors que Deepseek a fait la majeure partie des titres, Kimi K1.5 était l'un des noms importants de la liste. Et le modèle était assez cool.

Parlons-en. Cette analyse d'une percée innovante de l'IA fait partie de ma couverture de colonne Forbes en cours sur les dernières personnes en IA, notamment en identifiant et en expliquant diverses complexités d'IA percutantes (voir le lien ici). Pour ces lecteurs qui h

à la mi-2025, l'AI ?Arme Race? se réchauffe, et Xai et Anthropic ont tous deux publié leurs modèles phares, Grok 4 et Claude 4.

Par exemple, si vous posez une question à un modèle comme: "Que fait (x) personne à (x) l'entreprise?" Vous pouvez voir une cha?ne de raisonnement qui ressemble à quelque chose comme ceci, en supposant que le système sait comment récupérer les informations nécessaires: localiser les détails sur le CO

Le Sénat a voté le 99-1 mardi matin pour tuer le moratoire après un tumulte de dernière minute de groupes de défense des groupes de défense, des législateurs et des dizaines de milliers d'Américains qui l'ont vu comme une dangereuse dépassement. Ils ne sont pas restés silencieux. Le Sénat écouté.

Les essais cliniques sont un énorme goulot d'étranglement du développement de médicaments, et Kim et Reddy pensaient que le logiciel compatible AI qu'ils avait construit chez PI Health pourrait les aider à les faire plus rapidement et moins cher en élargissant le bassin de patients potentiellement éligibles. Mais le
