За Кулисами RAG-Систем: Размышления и Практические Подходы
🌟 Диалог о RAG: Инсайты от Победителя Конкурса. Профессиональный диалог о современных подходах к созданию retrieval-augmented generation систем и их компонентах. Материал охватывает практические кейсы использования RAG в бизнесе, анализ работы с PDF-документами и рассуждения о перспективах развития технологии в ближайшие годы.
Пишу полезное в блоге Telegram: https://t.me/blog_hanzo
Ссылки на статью гостя в первом комментарии
👇👇👇
⏱ *TIMECODES*
00:00 - Начало
01:20 - Что такое RAG для тебя?
03:30 - Новые практики для RAG
05:30 - Архитектура и компоненты
09:20 - Модели LLM Gemini от Google
22:00 - RAG для бизнеса
34:00 - Как будут развиваться RAG системы
38:20 - Embedding модели
👨🏻💻 *Кто я?*
Создаю автоматизацию через чат-боты с нейросетями.
Мой путь это 10 лет инженерного опыта, диплом MBA, управление проектами, оптимизация процессов на заводе IKEA и 3 года бизнес-анализа в 15 компаниях.
*Ключевые моменты*
RAG (Retrieval-Augmented Generation) - это концепция обогащения контекста языковых моделей дополнительной информацией для более точных ответов на вопросы.
- Обработка PDF-документов занимает значительную часть работы (30-50%) при создании RAG-систем, особенно когда документы содержат сложные элементы (таблицы, графики).
- Современные модели, такие как Google Gemini и их линейка 2s Pro, предлагают готовые решения для работы с PDF без необходимости создания сложных пайплайнов предобработки.
- Structured output (структурированный вывод) в формате JSON и "chain of thought" (цепочка рассуждений) являются критически важными элементами при работе с языковыми моделями в RAG-системах.
- Типичный RAG-пайплайн включает: входящий пайплайн для обработки данных, векторизацию (по чанкам или через саммаризацию), гибридный поиск, и финальную LLM для формирования ответа.
- Бизнес-логика и понимание предметной области остаются самыми сложными аспектами создания эффективных RAG-систем, которые не решаются только технологиями.
- Существует различие между статическими (архивными) данными и динамическим контекстом компании, что требует разных подходов к организации RAG-систем.
- Сложные вопросы часто требуют декомпозиции на подвопросы и специальных workflow, что выходит за рамки простого векторного поиска.
- Будущее RAG-систем, вероятно, связано с агентскими системами, которые могут динамически выбирать подходящие инструменты и строить workflow под конкретные вопросы.
- Выбор embedding-моделей для векторизации менее критичен по сравнению с правильной организацией workflow и пониманием бизнес-логики; современные модели достаточно хороши и недороги в использовании.
#llm #rag #aiagents
Видео За Кулисами RAG-Систем: Размышления и Практические Подходы канала Peter Hanzo
Пишу полезное в блоге Telegram: https://t.me/blog_hanzo
Ссылки на статью гостя в первом комментарии
👇👇👇
⏱ *TIMECODES*
00:00 - Начало
01:20 - Что такое RAG для тебя?
03:30 - Новые практики для RAG
05:30 - Архитектура и компоненты
09:20 - Модели LLM Gemini от Google
22:00 - RAG для бизнеса
34:00 - Как будут развиваться RAG системы
38:20 - Embedding модели
👨🏻💻 *Кто я?*
Создаю автоматизацию через чат-боты с нейросетями.
Мой путь это 10 лет инженерного опыта, диплом MBA, управление проектами, оптимизация процессов на заводе IKEA и 3 года бизнес-анализа в 15 компаниях.
*Ключевые моменты*
RAG (Retrieval-Augmented Generation) - это концепция обогащения контекста языковых моделей дополнительной информацией для более точных ответов на вопросы.
- Обработка PDF-документов занимает значительную часть работы (30-50%) при создании RAG-систем, особенно когда документы содержат сложные элементы (таблицы, графики).
- Современные модели, такие как Google Gemini и их линейка 2s Pro, предлагают готовые решения для работы с PDF без необходимости создания сложных пайплайнов предобработки.
- Structured output (структурированный вывод) в формате JSON и "chain of thought" (цепочка рассуждений) являются критически важными элементами при работе с языковыми моделями в RAG-системах.
- Типичный RAG-пайплайн включает: входящий пайплайн для обработки данных, векторизацию (по чанкам или через саммаризацию), гибридный поиск, и финальную LLM для формирования ответа.
- Бизнес-логика и понимание предметной области остаются самыми сложными аспектами создания эффективных RAG-систем, которые не решаются только технологиями.
- Существует различие между статическими (архивными) данными и динамическим контекстом компании, что требует разных подходов к организации RAG-систем.
- Сложные вопросы часто требуют декомпозиции на подвопросы и специальных workflow, что выходит за рамки простого векторного поиска.
- Будущее RAG-систем, вероятно, связано с агентскими системами, которые могут динамически выбирать подходящие инструменты и строить workflow под конкретные вопросы.
- Выбор embedding-моделей для векторизации менее критичен по сравнению с правильной организацией workflow и пониманием бизнес-логики; современные модели достаточно хороши и недороги в использовании.
#llm #rag #aiagents
Видео За Кулисами RAG-Систем: Размышления и Практические Подходы канала Peter Hanzo
Комментарии отсутствуют
Информация о видео
20 мая 2025 г. 22:16:20
00:42:03
Другие видео канала