Авто	Видео-блоги	ДТП, аварии	Для маленьких	Еда, напитки
Животные	Закон и право	Знаменитости	Игры	Искусство
Комедии	Красота, мода	Кулинария, рецепты	Люди	Мото
Музыка	Мультфильмы	Наука, технологии	Новости	Образование
Политика	Праздники	Приколы	Природа	Происшествия
Путешествия	Развлечения	Ржач	Семья	Сериалы
Спорт	Стиль жизни	ТВ передачи	Танцы	Технологии
Товары	Ужасы	Фильмы	Шоу-бизнес	Юмор

За Кулисами RAG-Систем: Размышления и Практические Подходы

🌟 Диалог о RAG: Инсайты от Победителя Конкурса. Профессиональный диалог о современных подходах к созданию retrieval-augmented generation систем и их компонентах. Материал охватывает практические кейсы использования RAG в бизнесе, анализ работы с PDF-документами и рассуждения о перспективах развития технологии в ближайшие годы.

Пишу полезное в блоге Telegram: https://t.me/blog_hanzo
Ссылки на статью гостя в первом комментарии
👇👇👇

⏱ *TIMECODES*
00:00 - Начало
01:20 - Что такое RAG для тебя?
03:30 - Новые практики для RAG
05:30 - Архитектура и компоненты
09:20 - Модели LLM Gemini от Google
22:00 - RAG для бизнеса
34:00 - Как будут развиваться RAG системы
38:20 - Embedding модели
👨🏻‍💻 *Кто я?*
Создаю автоматизацию через чат-боты с нейросетями.
Мой путь это 10 лет инженерного опыта, диплом MBA, управление проектами, оптимизация процессов на заводе IKEA и 3 года бизнес-анализа в 15 компаниях.

*Ключевые моменты*
RAG (Retrieval-Augmented Generation) - это концепция обогащения контекста языковых моделей дополнительной информацией для более точных ответов на вопросы.

- Обработка PDF-документов занимает значительную часть работы (30-50%) при создании RAG-систем, особенно когда документы содержат сложные элементы (таблицы, графики).

- Современные модели, такие как Google Gemini и их линейка 2s Pro, предлагают готовые решения для работы с PDF без необходимости создания сложных пайплайнов предобработки.

- Structured output (структурированный вывод) в формате JSON и "chain of thought" (цепочка рассуждений) являются критически важными элементами при работе с языковыми моделями в RAG-системах.

- Типичный RAG-пайплайн включает: входящий пайплайн для обработки данных, векторизацию (по чанкам или через саммаризацию), гибридный поиск, и финальную LLM для формирования ответа.

- Бизнес-логика и понимание предметной области остаются самыми сложными аспектами создания эффективных RAG-систем, которые не решаются только технологиями.

- Существует различие между статическими (архивными) данными и динамическим контекстом компании, что требует разных подходов к организации RAG-систем.

- Сложные вопросы часто требуют декомпозиции на подвопросы и специальных workflow, что выходит за рамки простого векторного поиска.

- Будущее RAG-систем, вероятно, связано с агентскими системами, которые могут динамически выбирать подходящие инструменты и строить workflow под конкретные вопросы.

- Выбор embedding-моделей для векторизации менее критичен по сравнению с правильной организацией workflow и пониманием бизнес-логики; современные модели достаточно хороши и недороги в использовании.

#llm #rag #aiagents

Видео За Кулисами RAG-Систем: Размышления и Практические Подходы канала Peter Hanzo

RAG LLM Retrieval-Augmented Generation

Комментарии отсутствуют