En septembre 2024, la compétition dans le domaine des intelligences artificielles génératives connaît de nouveaux bouleversements. OpenAI, avec ses derniers modèles, regagne la tête du classement après une courte perte de leadership en août face à Google et ses modèles Gemini.
Après avoir été brièvement dépassée en août par Google et ses modèles Gemini, OpenAI renforce sa domination avec le lancement de ses nouveaux modèles o1-preview et o1-mini. Ces IA, conçues pour exécuter des tâches complexes, permettent à l’entreprise de San Francisco d’occuper à nouveau les trois premières places de la Chatbot Arena. Cette dernière est une plateforme qui classe les modèles d’IA selon leurs performances, grâce à des évaluations impartiales d’utilisateurs.
La Chatbot Arena, développée par des chercheurs de l’Université de Berkeley, utilise un système où les utilisateurs comparent les réponses de deux IA, sans savoir à quel modèle elles appartiennent. Cela permet un classement transparent et représentatif, contrairement aux méthodes internes des entreprises, souvent jugées biaisées. Ce mois-ci, OpenAI s’impose avec ses modèles o1-preview, o1-mini, et les itérations récentes de GPT-4o.
Malgré la prédominance d’OpenAI, d’autres acteurs de l’IA continuent de marquer leur présence. Google se classe en 4e et 9e position avec ses modèles Gemini 1.5 Pro 0827 et Gemini 1.5 Flash 0827. Anthropic place son modèle Claude 3.5 Sonnet en 8e place, tandis que xAI, la société fondée par Elon Musk, fait une entrée remarquée dans le classement avec Grok-2, en 5e et 10e positions. Ces modèles Grok, intégrés à la plateforme X (anciennement Twitter), permettent à xAI de rivaliser avec les poids lourds du secteur.
Le classement des 10 meilleurs modèles d’IA en septembre 2024 :
o1-preview : 1 355 (Score Elo)
ChatGPT 4o Latest : 1 335
o1-mini : 1 324
Gemini 1.5 Pro 0827 : 1 299
Grok-2 0813 : 1 294
GPT-4o 0512 : 1 285
GPT-4o mini 0718 : 1 273
Claude 3.5 Sonnet : 1 269
Gemini 1.5 Flash 0827 : 1 269
Grok-2 Mini 0813 : 1 267
Source : Blogdumoderateur.com