- Популярные видео
- Авто
- Видео-блоги
- ДТП, аварии
- Для маленьких
- Еда, напитки
- Животные
- Закон и право
- Знаменитости
- Игры
- Искусство
- Комедии
- Красота, мода
- Кулинария, рецепты
- Люди
- Мото
- Музыка
- Мультфильмы
- Наука, технологии
- Новости
- Образование
- Политика
- Праздники
- Приколы
- Природа
- Происшествия
- Путешествия
- Развлечения
- Ржач
- Семья
- Сериалы
- Спорт
- Стиль жизни
- ТВ передачи
- Танцы
- Технологии
- Товары
- Ужасы
- Фильмы
- Шоу-бизнес
- Юмор
Zephyr 7B beta - How much does DPO really help?
Colab Full model with DPO: https://drp.li/QYAnu
Colab with SFT Only: https://drp.li/HAvSc
For more tutorials on using LLMs and building Agents, check out my Patreon:
Patreon: https://www.patreon.com/SamWitteveen
Twitter: https://twitter.com/Sam_Witteveen
My Links:
Linkedin: https://www.linkedin.com/in/samwitteveen/
Github:
https://github.com/samwit/langchain-tutorials (updated)
https://github.com/samwit/llm-tutorials
Timestamps
00:00 Intro
00:15 Zephyr 7B - Model on HF
01:04 Zephyr 7B -Beta Technical Paper
01:49 MT Bench
02:07 AlpacaEval
02:28 UltraChat Dataset
02:48 Zephyr 7B-Beta Flaws
03:21 UltraFeedback Dataset
05:26 Code Time
05:35 Full Model with DPO
08:44 Model with SFT Only
12:11 Alignment Notebook
Видео Zephyr 7B beta - How much does DPO really help? канала Sam Witteveen
Colab with SFT Only: https://drp.li/HAvSc
For more tutorials on using LLMs and building Agents, check out my Patreon:
Patreon: https://www.patreon.com/SamWitteveen
Twitter: https://twitter.com/Sam_Witteveen
My Links:
Linkedin: https://www.linkedin.com/in/samwitteveen/
Github:
https://github.com/samwit/langchain-tutorials (updated)
https://github.com/samwit/llm-tutorials
Timestamps
00:00 Intro
00:15 Zephyr 7B - Model on HF
01:04 Zephyr 7B -Beta Technical Paper
01:49 MT Bench
02:07 AlpacaEval
02:28 UltraChat Dataset
02:48 Zephyr 7B-Beta Flaws
03:21 UltraFeedback Dataset
05:26 Code Time
05:35 Full Model with DPO
08:44 Model with SFT Only
12:11 Alignment Notebook
Видео Zephyr 7B beta - How much does DPO really help? канала Sam Witteveen
GPT-4 langchain openai long chain tutorial zephyr-7B Zephyr 7B Beta Mistral-7B zephyr 7b alpha zephyr 7b beta Zephyr 7B β Direct Preference Optimization MT-Bench chatbot openai gpt 3.5 gpt 4 AlpacaEval Llama2-Chat-70B UltraFeedback GPT3.5 distilled supervised fine-tuning supervsed fine tuning llm large language model Mistral 7B SFT β Mistral 7B SFT Beta mt-bench
Комментарии отсутствуют
Информация о видео
30 октября 2023 г. 19:51:26
00:12:51
Другие видео канала




















