Загрузка...

Comment un modèle de 7M a battu DeepSeek-R1 😳

Un modèle de 7 millions de paramètres qui bat DeepSeek-R1, Gemini 2.5 Pro et o3-mini sur l’ARC-AGI… sérieusement?! 🤯
Lors de la présentation d’Alexia Jolicoeur-Martineau à Mila, personne ne s’attendait à voir un minuscule réseau dépasser des modèles 10 000 fois plus grands.

Les Tiny Recursive Models (TRM) changent complètement les règles: ils apprennent à raisonner en améliorant leurs propres réponses étape par étape, sans métaphores biologiques, sans maths complexes, juste du raisonnement récursif propre et efficace.

Résultat: un modèle minuscule qui dépasse des géants sur ARC-AGI, Sudoku, Maze-Hard. Parfois, moins, c’est vraiment plus.

Et tout ça parce qu’il fallait #SaveTheCurve 😂

Je suis Louis-François, PhD dropout, maintenant CTO et cofondateur de Towards AI. Suivez-moi pour le débrief AI sans bullshit de demain 🚀

#IA #RechercheIA #DeepLearning #short

Видео Comment un modèle de 7M a battu DeepSeek-R1 😳 канала Parlons IA avec Louis-François Bouchard
Яндекс.Метрика
Все заметки Новая заметка Страницу в заметки
Страницу в закладки Мои закладки
На информационно-развлекательном портале SALDA.WS применяются cookie-файлы. Нажимая кнопку Принять, вы подтверждаете свое согласие на их использование.
О CookiesНапомнить позжеПринять