Publié le: 13/09/2024 @ 16:37:39: Par Nic007 Dans "Programmation"
OpenAI a annoncé OpenAI o1 , nom de code « Strawberry », une nouvelle série de grands modèles de langage (LLM ) capables de « raisonner » et donc de résoudre des problèmes très complexes. Attention à ne pas prendre cette définition avec des pincettes ! Pour le moment, OpenAI o1 est en première version et intégré à ChatGPT (et à l'API de l'entreprise) sous la forme de o1-preview et o1-mini , deux modèles qui, tout comme GPT-4o et GPT-4o mini , se distinguent par la rapidité et la complexité de leurs réponses. Ces modèles ont été entraînés pour prendre plus de temps à traiter le problème avant de formuler une réponse, tout comme le ferait une personne. En faisant cela, le GPT essaie différentes approches, il devrait donc fournir de meilleures réponses et éventuellement éviter les erreurs. Oui, OpenAI o1 est plus lent que GPT-4o . Selon les tests menés par OpenAI , ces modèles peuvent surpasser les humains compétents, titulaires d'un doctorat, dans la résolution de questions complexes en physique, chimie et biologie . En outre, les performances en mathématiques et en codage se sont également améliorées . Il y a un dernier aspect sur lequel OpenAI a insisté, sans entrer dans les détails : la sécurité . « Le processus d'apprentissage de ces modèles permet de s'aligner plus efficacement sur les normes et directives de sécurité attendues. » Cela peut paraître un détail, mais compte tenu des capacités toujours croissantes de ces modèles, ce n'est pas du tout le cas. En effet, la sécurité de l’IA est l’une des questions cruciales avec laquelle nous devrons inévitablement nous confronter, à mesure que ces systèmes deviennent de plus en plus du domaine public.
Outre la vitesse inférieure, qui peut être considérée comme un mal nécessaire en vue du meilleur résultat, les modèles OpenAI o1 présentent plusieurs autres limitations.
- Ils ne prennent en charge le téléchargement d'aucun type de fichier, l'option n'est pas vraiment disponible de toute façon
- Impossible de parcourir le Web pour obtenir des informations
- Il existe diverses lacunes dans l'API , telles que la prise en charge de l'utilisation des outils, de la fonction d'appel, du streaming et de la personnalisation des messages.
- Il ne surpasse pas nécessairement les modèles précédents dans des domaines tels que l'écriture créative ou stylistique, les dates, les biographies et les anecdotes.
- Continue de faire des erreurs et peut générer des informations inexactes ou des hallucinations .
- Il est plus sensible au contexte qu’auparavant. Nous avons ajouté ce dernier point suite aux tests que nous avons effectués. Le sentiment est que o1-preview a tendance à mieux se comporter si le dialogue se poursuit de manière linéaire et logique. Si vous sautez d'un point à l'autre, il essaiera d'abord de comprendre s'il y a un lien avec ce qui a été dit précédemment, et cela prendra du temps. - ---- OpenAI devrait apprendre à donner de meilleurs noms à ses modèles. Peut-être pourriez-vous leur demander conseil.
Autrement dit, GPT-4o reste le modèle préférable pour des usages plus généraux , et où il est nécessaire de traiter des fichiers ou de naviguer sur internet. Nous nous attendons à ce que ces fonctionnalités arrivent sur OpenAI o1 au fil du temps. Lors d'un test pratique , o1-preview a été invité à développer un simulateur pédagogique utilisant plusieurs agents et une IA générative, inspiré d'un article fourni et prenant en compte les points de vue des enseignants et des étudiants. Le modèle a produit des lignes de code détaillées et une approche structurée, démontrant une capacité remarquable à traduire des instructions complexes en solutions opérationnelles . C'est peut-être la plus grande différence pratique par rapport à ses prédécesseurs : o1-preview est plus autonome . Toute cette partie de correction et d'affinement qui aurait été auparavant le résultat de (nombreuses) interactions avec l'opérateur humain est désormais effectuée automatiquement (pour la plupart).
Un autre test consistait à résoudre des mots croisés très difficiles . Alors que les modèles d'IA traditionnels, comme Claude, n'ont pas réussi à résoudre ce problème en raison d'un manque de capacités itératives, o1-preview a mis plus de 100 secondes pour « réfléchir » au problème. Il a démontré un processus de raisonnement itératif , générant et rejetant des idées jusqu'à ce qu'une solution presque correcte soit trouvée. Bien qu'il ait d'abord été trompé par un indice ambigu (faisant référence aux smartphones Samsung Galaxy), avec un petit indice, il a réussi à se corriger et à compléter les mots croisés (même si cela a ensuite généré une hallucination).
Dans ChatGPT, les utilisateurs Plus et Team peuvent accéder dès maintenant à la version préliminaire de o1-preview et o1-mini. Les utilisateurs de ChatGPT Enterprise et Edu auront accès aux deux modèles à partir de la semaine prochaine. Les modèles OpenAI o1 seront disponibles pour les développeurs , mais uniquement pour le "Tier 5" pour le moment. Il n'y a aucune nouvelle pour la version gratuite de ChatGPT, qui reste actuellement limitée à GPT-4o et versions antérieures. L'accès aux nouveaux modèles est réservé aux abonnés, pour l'instant.
Outre la vitesse inférieure, qui peut être considérée comme un mal nécessaire en vue du meilleur résultat, les modèles OpenAI o1 présentent plusieurs autres limitations.
- Ils ne prennent en charge le téléchargement d'aucun type de fichier, l'option n'est pas vraiment disponible de toute façon
- Impossible de parcourir le Web pour obtenir des informations
- Il existe diverses lacunes dans l'API , telles que la prise en charge de l'utilisation des outils, de la fonction d'appel, du streaming et de la personnalisation des messages.
- Il ne surpasse pas nécessairement les modèles précédents dans des domaines tels que l'écriture créative ou stylistique, les dates, les biographies et les anecdotes.
- Continue de faire des erreurs et peut générer des informations inexactes ou des hallucinations .
- Il est plus sensible au contexte qu’auparavant. Nous avons ajouté ce dernier point suite aux tests que nous avons effectués. Le sentiment est que o1-preview a tendance à mieux se comporter si le dialogue se poursuit de manière linéaire et logique. Si vous sautez d'un point à l'autre, il essaiera d'abord de comprendre s'il y a un lien avec ce qui a été dit précédemment, et cela prendra du temps. - ---- OpenAI devrait apprendre à donner de meilleurs noms à ses modèles. Peut-être pourriez-vous leur demander conseil.
Autrement dit, GPT-4o reste le modèle préférable pour des usages plus généraux , et où il est nécessaire de traiter des fichiers ou de naviguer sur internet. Nous nous attendons à ce que ces fonctionnalités arrivent sur OpenAI o1 au fil du temps. Lors d'un test pratique , o1-preview a été invité à développer un simulateur pédagogique utilisant plusieurs agents et une IA générative, inspiré d'un article fourni et prenant en compte les points de vue des enseignants et des étudiants. Le modèle a produit des lignes de code détaillées et une approche structurée, démontrant une capacité remarquable à traduire des instructions complexes en solutions opérationnelles . C'est peut-être la plus grande différence pratique par rapport à ses prédécesseurs : o1-preview est plus autonome . Toute cette partie de correction et d'affinement qui aurait été auparavant le résultat de (nombreuses) interactions avec l'opérateur humain est désormais effectuée automatiquement (pour la plupart).
Un autre test consistait à résoudre des mots croisés très difficiles . Alors que les modèles d'IA traditionnels, comme Claude, n'ont pas réussi à résoudre ce problème en raison d'un manque de capacités itératives, o1-preview a mis plus de 100 secondes pour « réfléchir » au problème. Il a démontré un processus de raisonnement itératif , générant et rejetant des idées jusqu'à ce qu'une solution presque correcte soit trouvée. Bien qu'il ait d'abord été trompé par un indice ambigu (faisant référence aux smartphones Samsung Galaxy), avec un petit indice, il a réussi à se corriger et à compléter les mots croisés (même si cela a ensuite généré une hallucination).
Dans ChatGPT, les utilisateurs Plus et Team peuvent accéder dès maintenant à la version préliminaire de o1-preview et o1-mini. Les utilisateurs de ChatGPT Enterprise et Edu auront accès aux deux modèles à partir de la semaine prochaine. Les modèles OpenAI o1 seront disponibles pour les développeurs , mais uniquement pour le "Tier 5" pour le moment. Il n'y a aucune nouvelle pour la version gratuite de ChatGPT, qui reste actuellement limitée à GPT-4o et versions antérieures. L'accès aux nouveaux modèles est réservé aux abonnés, pour l'instant.
Envoyer une nouvelle à un ami