Загрузка...

Comment un modèle de 7M a battu DeepSeek-R1 😳

Un modèle de 7 millions de paramètres qui bat DeepSeek-R1, Gemini 2.5 Pro et o3-mini sur l’ARC-AGI… sérieusement?! 🤯
Lors de la présentation d’Alexia Jolicoeur-Martineau à Mila, personne ne s’attendait à voir un minuscule réseau dépasser des modèles 10 000 fois plus grands.

Les Tiny Recursive Models (TRM) changent complètement les règles: ils apprennent à raisonner en améliorant leurs propres réponses étape par étape, sans métaphores biologiques, sans maths complexes, juste du raisonnement récursif propre et efficace.

Résultat: un modèle minuscule qui dépasse des géants sur ARC-AGI, Sudoku, Maze-Hard. Parfois, moins, c’est vraiment plus.

Et tout ça parce qu’il fallait #SaveTheCurve 😂

Je suis Louis-François, PhD dropout, maintenant CTO et cofondateur de Towards AI. Suivez-moi pour le débrief AI sans bullshit de demain 🚀

#IA #RechercheIA #DeepLearning #short

Видео Comment un modèle de 7M a battu DeepSeek-R1 😳 канала Parlons IA avec Louis-François Bouchard

Комментарии отсутствуют

Информация о видео

17 ноября 2025 г. 18:28:48

00:01:48

Parlons IA avec Louis-François Bouchard

Правообладателям

Жалоба на материал Недопустимый материал Нарушение авторских прав

Комментарии

Поделиться

Другие видео канала

OpenAI o1 : Plus Intelligent, mais...

Améliorez Vos Systèmes RAG avec Ces Métriques de Performance

Pourquoi vous n’avez probablement PAS besoin d’un système multi-agents

L’IA a-t-elle appris à penser ? Voici ce qui change vraiment

Quand l’IA entraîne l’IA

Quelle est la vraie différence entre RAG et Fine-Tuning ?

Ce que les LLMs stockent réellement

Les agents d’IA vont-ils aggraver les biais ?

Contrôler la créativité de GPT-4, c’est possible ?!

Comment l’IA apprend la justesse

Comment fonctionnent réellement les agents d’IA : ReAct vs Plan-and-Execute

L'IA va Vous Remplacer ?!

Comment DeepSeek divise par 15 la mémoire des modèles de langage (FlashMLA Expliqué)

Haiku 4.5 égale Sonnet 4… à 2x la vitesse !

Adieu prompts géants : voici les Agent Skills d’Anthropic

Comment compresser l’intelligence

Comment Netflix et Spotify devinent vos goûts grâce aux bases vectorielles

Pourquoi est-ce que le RAG est si puissant? #ia #rag #llm

Jour 17/42 : Pourquoi l’IA paraît lente

Kimi K2 : l’IA open-source la plus puissante du monde

Pourquoi l’IA a besoin de limites

Все заметки Новая заметка Страницу в заметки

Страницу в закладки Мои закладки

На информационно-развлекательном портале SALDA.WS применяются cookie-файлы. Нажимая кнопку Принять, вы подтверждаете свое согласие на их использование.

О Cookies Напомнить позже Принять