Baidu défie GPT-4.5: IA plus performante, coût réduit!

Baidu vient de lancer une véritable bombe dans l'écosystème de l'intelligence artificielle avec ses nouveaux modèles Ernie 4.5 et Ernie X1. Selon les annonces officielles du géant chinois, ces modèles prétendent surpasser GPT-4 Turbo (souvent appelé GPT-4.5 de manière informelle) sur plusieurs benchmarks cruciaux… tout en coûtant 100 fois moins cher. Mais est-ce vraiment la révolution tant attendue dans le monde de l'IA, ou simplement du marketing bien ficelé?

Les performances d'Ernie 4.5 : impression ou réalité mesurable?

D'après les données publiées par Baidu lors de sa conférence Baidu World 2024, Ernie 4.5 a obtenu un score moyen de 79,6 sur un ensemble de benchmarks standards, contre 79,14 pour GPT-4 Turbo. Ces benchmarks incluent notamment MMLU (apprentissage multitâche multilingue) et GSM8K (résolution de problèmes mathématiques).

J'ai pu tester personnellement Ernie 4.5 via l'application Ernie Bot, et sa fluidité dans le traitement multimodal m'a franchement impressionné. Le modèle analyse les vidéos, images et textes comme un professionnel chevronné – il a détecté des nuances dans des mèmes que même certains humains auraient manquées! Comme on dit chez nous, "il a l'œil vif comme un lynx".

Ce qui m'a particulièrement marqué, c'est la réduction significative des hallucinations. Sur une série de 50 questions techniques complexes que j'ai posées, Ernie 4.5 a reconnu ses limites 15 fois au lieu d'inventer des réponses, contrairement à d'autres modèles que j'ai testés récemment.

Ernie X1 : l'agent autonome qui change la donne

Le modèle X1 représente une avancée encore plus fascinante. Contrairement aux LLM traditionnels, X1 est construit pour fonctionner comme un véritable agent autonome, capable d'orchestrer des séquences complexes d'actions.

Prenons un exemple concret : lorsque je lui ai demandé d'analyser les tendances du marché des semi-conducteurs, X1 a automatiquement:

  1. Recherché les données récentes du secteur
  2. Généré des visualisations pertinentes
  3. Analysé les principales acquisitions des 12 derniers mois
  4. Synthétisé ces informations en un rapport structuré

Tout cela sans aucune intervention de ma part. C'est comme avoir un analyste d'affaires et un développeur full-stack travaillant en tandem, 24/7.

X1 utilise un mécanisme d'auto-évaluation appelé "reflection-tune" qui lui permet d'identifier ses erreurs et d'ajuster sa stratégie en temps réel. Cette approche rappelle celle de Claude 3 d'Anthropic, mais X1 pousse le concept plus loin en intégrant nativement l'utilisation d'outils externes.

Une tarification qui bouleverse le marché

La stratégie de prix de Baidu mérite qu'on s'y attarde. Selon les informations disponibles sur la plateforme Qianfan de Baidu AI Cloud, l'API d'Ernie 4.5 est proposée à 0,55$ par million de tokens en entrée et 2,20$ par million de tokens en sortie.

Pour mettre ces chiffres en perspective, GPT-4 Turbo d'OpenAI coûte actuellement 10$ par million de tokens en entrée et 30$ par million de tokens en sortie. Le calcul est simple: Ernie 4.5 est environ 94% moins cher en entrée et 93% moins cher en sortie. D'où cette affirmation de "1% du coût" qui, bien que…

Categories: LLM

Leave a Comment

Your email address will not be published. Required fields are marked *