Загрузка...

Zephyr 7B beta - How much does DPO really help?

Colab Full model with DPO: https://drp.li/QYAnu
Colab with SFT Only: https://drp.li/HAvSc

For more tutorials on using LLMs and building Agents, check out my Patreon:
Patreon: https://www.patreon.com/SamWitteveen
Twitter: https://twitter.com/Sam_Witteveen

My Links:
Linkedin: https://www.linkedin.com/in/samwitteveen/

Github:
https://github.com/samwit/langchain-tutorials (updated)
https://github.com/samwit/llm-tutorials

Timestamps
00:00 Intro
00:15 Zephyr 7B - Model on HF
01:04 Zephyr 7B -Beta Technical Paper
01:49 MT Bench
02:07 AlpacaEval
02:28 UltraChat Dataset
02:48 Zephyr 7B-Beta Flaws
03:21 UltraFeedback Dataset
05:26 Code Time
05:35 Full Model with DPO
08:44 Model with SFT Only
12:11 Alignment Notebook

Видео Zephyr 7B beta - How much does DPO really help? канала Sam Witteveen

Комментарии отсутствуют

Информация о видео

30 октября 2023 г. 19:51:26

00:12:51

Правообладателям

Жалоба на материал Недопустимый материал Нарушение авторских прав

Комментарии

Поделиться

Другие видео канала

Finding the Best Free ChatGPT

Google I/O for Devs - TPUs, Gemma & GenKit

Advanced RAG 04 - Contextual Compressors & Filters

How Google is Expanding the Gemini Era

Building a Summarization System with LangChain - Part 3 Using ChatGPT Turbo

Is Meta killing FAIR?

WizardLM: Evolving Instruction Datasets to Create a Better Model

Google I/O 25 - Models vs Products

XGen 7B: Salesforce's 8k LLM for long sequence modeling

Converting a LangChain App from OpenAI to OpenSource

Building a Summarization System with LangChain and GPT-3 - Part 1

Google's RAG Experiment - NotebookLM

Building Custom Tools and Agents with LangChain (gpt-3.5-turbo)

AgentWrite with LangGraph

Colab 101: Your Ultimate Beginner's Guide!

NEW - Anthropic Updated Claude Models & Computer Use Agents!!

What can you do with 16K tokens in LangChain? | OpenAI | LangChain Tutorial Series

Microsoft's Visual ChatGPT using LangChain

LangChain Chat with Flan20B

The New Wizards - Unfiltered & Unaligned

Все заметки Новая заметка Страницу в заметки

Страницу в закладки Мои закладки

На информационно-развлекательном портале SALDA.WS применяются cookie-файлы. Нажимая кнопку Принять, вы подтверждаете свое согласие на их использование.

О Cookies Напомнить позже Принять