Обучение LLM для бизнеса: практическое руководство с примерами и советами
В этом видео мы погружаемся в мир обучения больших языковых моделей на примере задачи генерации кода. Вместе с экспертами разбираем, как научить нейросеть писать код, начиная с простых методов и заканчивая продвинутыми техниками. Услышьте из первых рук, как создавалась модель, помогающая бизнесу автоматически формировать отчёты по текстовым запросам, и какие уроки были извлечены о важности качества и разнообразия данных. А в "пасхалке" – разбор проблем извлечения информации из сложных PDF-документов и таблиц.
Это видео будет полезно всем, кто интересуется искусственным интеллектом и хочет использовать его для автоматизации работы с кодом и данными. В видео даются практические советы по подготовке данных, выбору методов обучения и оценке результатов. Вы узнаете о реальных примерах использования, необходимом времени обучения и полезных инструментах. Присоединяйтесь, чтобы узнать, как эффективно обучать нейросети и решать сложные задачи, даже если вы новичок в этой области!
Участники
Ковальский Валерий - Full Stack CEO в Neural Deep Tech https://t.me/neuraldeep
Глеб Альшанский - Руководитель компании Actor.ai, специалист по машинному обучения, RAG и LLM https://t.me/GlebAlshanskii
Коренев Александр - Основатель клуба ии-экспертов "Акулы", эксперт по внедрению ИИ в банки
Тайминги:
0:00 Введение: задача обучения модели новому языку программирования (PL/SQL) для генерации кода. Знакомство с экспертами.
3:00 Обзор подходов: In-Context Learning, RAG, LORA, SFT. Когда и почему переходить от простых методов (RAG) к обучению (файнтюнингу).
13:58 Практический опыт Глеба: обучение модели для генерации SQL-запросов по текстовому описанию. Важность разнообразия и чистоты датасета. Небольшой, но чистый датасет лучше огромного, но с ошибками!
33:03 Размеры датасетов для LORA и SFT. Методы сбора данных: синтетические, краудсорсинг, реальные данные.
47:12 Reinforcement Learning (RL) для обучения: подходы DeepSeek (RLAIF) и Kimi. Как обойтись без второй модели-критика.
53:59 Проблема валидации сгенерированного кода. Как понять, что код работает правильно? Тест-кейсы, интерпретатор, оценка с помощью большой LLM.
72:39 "Пасхалка" (после официального окончания): проблемы парсинга PDF и таблиц. Библиотека Marker. Мультимодальный подход (VLM).
Видео Обучение LLM для бизнеса: практическое руководство с примерами и советами автора Korenev_AI
Видео Обучение LLM для бизнеса: практическое руководство с примерами и советами автора Korenev_AI
Информация
19 марта 2025 г. 14:03:43
01:34:13
Похожие видео



















