- Популярные видео
- Авто
- Видео-блоги
- ДТП, аварии
- Для маленьких
- Еда, напитки
- Животные
- Закон и право
- Знаменитости
- Игры
- Искусство
- Комедии
- Красота, мода
- Кулинария, рецепты
- Люди
- Мото
- Музыка
- Мультфильмы
- Наука, технологии
- Новости
- Образование
- Политика
- Праздники
- Приколы
- Природа
- Происшествия
- Путешествия
- Развлечения
- Ржач
- Семья
- Сериалы
- Спорт
- Стиль жизни
- ТВ передачи
- Танцы
- Технологии
- Товары
- Ужасы
- Фильмы
- Шоу-бизнес
- Юмор
Tutuca Bench Round 3: "Mini models" Gemini Flash, Haiku & GPT 5.4 Mini
Ask coding agents to use a new framework not in the training set to implement Todo-MVC.
Gemini Flash, Haiku & GPT 5.4 Mini in their native code harness (Gemini CLI, Codex and Claude Code) and all again in OpenCode to see if it makes a difference.
1. Gemini 3 flash (one shot)
2. GPT-5.4-mini
3. Haiku
- Using the "native" harness for a model makes a small positive difference, except for haiku
- Haiku hallucinated syntax the most
- Hallucinations where the same across harnesses for the same model
- GPT-mini in opencode got stuck and then in a thinking spiral
- When errors are pointed out the models tend to fix them quickly
Видео Tutuca Bench Round 3: "Mini models" Gemini Flash, Haiku & GPT 5.4 Mini канала Mariano Guerra
Gemini Flash, Haiku & GPT 5.4 Mini in their native code harness (Gemini CLI, Codex and Claude Code) and all again in OpenCode to see if it makes a difference.
1. Gemini 3 flash (one shot)
2. GPT-5.4-mini
3. Haiku
- Using the "native" harness for a model makes a small positive difference, except for haiku
- Haiku hallucinated syntax the most
- Hallucinations where the same across harnesses for the same model
- GPT-mini in opencode got stuck and then in a thinking spiral
- When errors are pointed out the models tend to fix them quickly
Видео Tutuca Bench Round 3: "Mini models" Gemini Flash, Haiku & GPT 5.4 Mini канала Mariano Guerra
Комментарии отсутствуют
Информация о видео
8 мая 2026 г. 20:02:31
00:17:47
Другие видео канала





















