- Популярные видео
- Авто
- Видео-блоги
- ДТП, аварии
- Для маленьких
- Еда, напитки
- Животные
- Закон и право
- Знаменитости
- Игры
- Искусство
- Комедии
- Красота, мода
- Кулинария, рецепты
- Люди
- Мото
- Музыка
- Мультфильмы
- Наука, технологии
- Новости
- Образование
- Политика
- Праздники
- Приколы
- Природа
- Происшествия
- Путешествия
- Развлечения
- Ржач
- Семья
- Сериалы
- Спорт
- Стиль жизни
- ТВ передачи
- Танцы
- Технологии
- Товары
- Ужасы
- Фильмы
- Шоу-бизнес
- Юмор
LLM Inside: выжимаем максимум из decoder attention на GPU / Андрей Шукшов
На конференции «Я про бэкенд» Андрей Шукшов, старший разработчик в команде оптимизаций инференса Яндекс R&D, рассказал, как выжать максимум из decoder attention на GPU. Он разобрал архитектуру современных графических процессоров и объяснил, как добиться максимальной производительности при реализации ключевого примитива LLM: механизма внимания в декодере.
Доклад будет особенно полезен разработчикам, которые уже работали с CUDA и хотят глубже понять устройство GPU и внутренние процессы больших языковых моделей.
Больше полезных материалов про бэкенд: https://t.me/+aN8Rc-4YJtVlZWZi
#япробэкенд #яндекс #backend #бэкенд #архитектура #highload #инфраструктура #ml #ai #llm #yandextech #разработка #инженерия #devops #ydb #автотранспорт #алиса #рекомендации
Видео LLM Inside: выжимаем максимум из decoder attention на GPU / Андрей Шукшов канала Yandex for Backend
Доклад будет особенно полезен разработчикам, которые уже работали с CUDA и хотят глубже понять устройство GPU и внутренние процессы больших языковых моделей.
Больше полезных материалов про бэкенд: https://t.me/+aN8Rc-4YJtVlZWZi
#япробэкенд #яндекс #backend #бэкенд #архитектура #highload #инфраструктура #ml #ai #llm #yandextech #разработка #инженерия #devops #ydb #автотранспорт #алиса #рекомендации
Видео LLM Inside: выжимаем максимум из decoder attention на GPU / Андрей Шукшов канала Yandex for Backend
я про бэкенд конференция я про бэкенд yandex for developers яндекс backend бэкенд highload инфраструктура системный дизайн масштабирование производительность отказоустойчивость архитектура микросервисы devops cloud machine learning mlops ai llm разработка инженеры технологии yandextech рекомендации поиск ydb автономный транспорт алиса avito vk
Комментарии отсутствуют
Информация о видео
18 октября 2025 г. 16:01:08
00:31:32
Другие видео канала




















