Загрузка...

Unsloth сделал Qwen3.6 в 2 раза быстрее. Теперь бизнес может экономить миллионы на ИИ

Unsloth творят что-то нереальное 🤯 Сначала они выпустили Unsloth Studio софт, который упростил дообучение моделей на обычном домашнем железе. Раньше эт была сплошная боль🤦🏻 постоянные утечки памяти, сложная подготовка данных и бесконечные танцы с Hugging Face.
Сейчас LoRA дообучение стало вполне комфортным
даже на одной 3090/4090/5090
Просто ставишь Studio и работаешь.
А теперь они ещё и MTP Multi Token Prediction добавили 🙄🤦🏻модель предсказывает сразу несколько токенов вперёд, благодаря чему скорость генерации выросла в 1.4 - 2 раза почти без потери качества. Плюс их умная Dynamic 2.0 квантизация вообще выглядит как магия 🤯
Обычно приходится выбирать: либо скорость, либо качество, либо контекст.
Чем-то почти всегда жертвуешь. Но они сделали систему, которая умно решает, что можно сильнее сжимать, а что лучше оставить максимально точным.
В итоге на обычном домашнем железе благодаря Unsloth можно запустить большую модель с контекстом 256k+ получить реально хорошую скорость, достойную точность и при этом не чувствовать, что модель {зарезали} ради экономии памяти 😏

#искусственныйинтеллект #ai #россия #бизнес #отечественный #ии #автоматизация #документооборот
#llm #локальныйии #qwen #автоматизациядокументооборота

Видео Unsloth сделал Qwen3.6 в 2 раза быстрее. Теперь бизнес может экономить миллионы на ИИ канала Yura Pashkov
Яндекс.Метрика
Все заметки Новая заметка Страницу в заметки
Страницу в закладки Мои закладки
На информационно-развлекательном портале SALDA.WS применяются cookie-файлы. Нажимая кнопку Принять, вы подтверждаете свое согласие на их использование.
О CookiesНапомнить позжеПринять