Julien Dupont | Savoir AI

L’Innovation du Test-Time Scaling dans les Modèles de Langage

February 18, 2025

Les chercheurs de Stanford ont développé une approche innovante de test-time scaling pour les modèles de langage, démontrant des performances exceptionnelles avec seulement 1000 échantillons d’entraînement et une technique de “budget forcing” pour optimiser la réflexion.

O3-mini : L’IA Experte en Sciences et Raisonnement Avancé

February 18, 2025

Le modèle o3-mini marque une avancée majeure en IA, excellant en sciences, maths et programmation. Accessible aux utilisateurs Pro, Plus et Team, il offre des performances supérieures et une meilleure gestion des limites de taux pour un traitement optimisé.

Mistral Small 3 : La Révolution des LLM Compacts

February 18, 2025

Mistral Small 3, modèle de 24B paramètres, redéfinit les standards des LLM compacts avec une latence optimisée et des performances remarquables. Compatible sur MacBook 32GB RAM, il excelle en détection de fraude, triage médical et analyse des sentiments.

Tülu 3 : Une révolution open-source de 405 milliards de paramètres

February 18, 2025

L’Institut Allen dévoile Tülu 3, un LLM de 405 milliards de paramètres en open-source. Ce modèle implémente le RVLR et la DPO, atteignant un score de 80,7 sur les tests standards. Le code et les données sont entièrement accessibles sur Hugging Face et Ai2 Playground.

DeepResearch d’OpenAI : Une Révolution dans l’Analyse Automatisée

February 18, 2025

Deep Research d’OpenAI, propulsé par le modèle o3, marque une avancée majeure dans l’analyse automatisée. Ce système peut analyser des centaines de sources en minutes, mais nécessite une supervision humaine et d’importantes ressources computationnelles.

Daisy: La Grand-Mère Virtuelle qui Piège les Arnaqueurs

February 18, 2025

Daisy, une grand-mère virtuelle IA, lutte contre les arnaqueurs en les piégeant dans de longues conversations sur le tricot et ses petits-enfants. Cette innovation technologique a déjà mené plus de 1000 conversations, protégeant efficacement les citoyens vulnérables.

Claude 3.5 : Une révolution dans la sécurité des IA

February 18, 2025

Anthropic améliore la sécurité de Claude 3.5 avec des classificateurs constitutionnels bloquant 95% des contournements. Le système, entraîné sur 10 000 prompts, maintient son efficacité tout en préservant les requêtes légitimes.

SoftBank et OpenAI : L’Alliance Stratégique qui Révolutionne l’IA

February 18, 2025

L’alliance stratégique entre SoftBank et OpenAI marque un tournant majeur avec un investissement de 3 milliards $ par an. La création de Cristal Intelligence et le projet Stargate avec Oracle renforcent la position d’OpenAI face à la concurrence chinoise.

O3-mini : La révolution des LLM accessible à tous

February 18, 2025

OpenAI lance o3-mini, un modèle de langage innovant offrant 24% de vitesse en plus et 63% de réduction des coûts. Accessible gratuitement via ChatGPT, il excelle en mathématiques et programmation, tout en intégrant une analyse séquentielle avancée.

UC Berkeley’s TinyZero AI Model

February 18, 2025

L’UC Berkeley développe TinyZero, reproduisant les capacités du modèle DeepSeek R1 Zero pour seulement 30$. Ce projet open source démontre la possibilité de créer des IA avancées à faible coût, ouvrant la voie à une démocratisation de la recherche en IA.

Articles by Julien Dupont