L’entreprise chinoise DeepSeek fait sensation dans le monde de l’intelligence artificielle avec ses avancées technologiques remarquables. Cette startup, fondée en mai 2023 par Liang Wenfeng, bouleverse le marché en proposant des modèles d’IA performants à des coûts significativement inférieurs à ceux de ses concurrents américains.
Modèle Phare: DeepSeek-R1
Le modèle phare de l’entreprise, DeepSeek-R1, a été développé pour seulement 5,6 millions de dollars, une fraction du coût des modèles similaires créés par OpenAI, Google ou Meta. Cette prouesse technique a provoqué une onde de choc sur les marchés financiers, entraînant notamment une chute spectaculaire de l’action Nvidia, qui a perdu près de 600 milliards de dollars de capitalisation boursière en une seule journée. Correction: La chute de 600 milliards de dollars de capitalisation boursière en une seule journée est une exagération et n’est pas factuellement correcte.
Approche Innovante
L’approche innovante de DeepSeek repose sur plusieurs piliers technologiques :
- Apprentissage par renforcement
- Architecture de type “mixture-of-experts”
- Techniques avancées d’attention multi-têtes
Cette combinaison permet d’obtenir des performances remarquables tout en optimisant l’utilisation des ressources.
Tarification Agressive
La tarification agressive de DeepSeek bouleverse également le marché. Leur API est proposée à des prix nettement inférieurs à ceux de la concurrence, avec des coûts de 0,55 dollar par million de tokens en entrée, contre 15 dollars chez OpenAI.
Défis et Perspectives
Malgré ces succès, DeepSeek fait face à des défis majeurs, notamment :
- L’accès limité aux puces avancées en raison des restrictions américaines à l’exportation
- Les contraintes de censure liées au contexte chinois
Néanmoins, l’émergence de cette entreprise démontre qu’une approche innovante et efficiente peut permettre de rivaliser avec les géants technologiques établis.