Загрузка...

MarkItDown: ahorra tokens en Claude y ChatGPT

Aprende a reducir drásticamente el consumo de tokens al pasar PDFs, Excel, Word, HTML, CSV y JSON a Claude, ChatGPT o Gemini usando MarkItDown, la herramienta open-source de Microsoft (+150K estrellas en GitHub).

En este tutorial te enseño a usar MarkItDown de dos formas: por línea de comandos con uv (sin instalar nada de forma permanente) e integrándolo en tus propios scripts de Python. Verás cómo un PDF de 2 MB lleno de imágenes, iconos y estilos se convierte en un archivo Markdown de apenas 6 KB que tu LLM entiende mejor, más rápido y con salida más confiable.

Qué vas a aprender:
- Por qué los estilos y tags de un PDF/Excel desperdician tokens de input en tu LLM
- Instalar Python y el gestor de paquetes uv de Astral desde cero
- Convertir cualquier archivo a Markdown con un solo comando (uvx)
- Integrar MarkItDown en un script Python paso a paso
- Pasar el resultado a tu LLM vía API para ahorrar cuota y acelerar respuestas

Recursos:
- MarkItDown (GitHub): https://github.com/microsoft/markitdown
- uv (Astral): https://docs.astral.sh/uv/
- Python: https://www.python.org/downloads/

Timestamps:
00:00 Qué es MarkItDown y por qué te ahorra tokens
01:12 El problema: limpieza de archivos consume tokens
02:13 Prerequisitos: instalar Python y uv
03:33 Uso por línea de comandos (uvx markitdown)
05:39 Resultado: de 2 MB a 6 KB
06:54 Probando el Markdown en un LLM
07:24 Integrando MarkItDown en un script Python
09:05 Importar, instalar dependencias con uv add
10:03 Crear el objeto y usar .convert()
11:14 Depurando el error de atributo convert
11:55 Resultado final y cierre

🔗 Sígueme también en:

ACADEMIA: https://pildorasdeprogramacion.com
💬 Discord 👉 https://discord.gg/NESrnqfNWF
📸 Instagram 👉 https://www.instagram.com/pildoras_de_programacion/
🎵 TikTok 👉 https://www.tiktok.com/@pil_programacion
📘 Facebook 👉 https://www.facebook.com/pilprogramacion
📺 YouTube 👉 https://www.youtube.com/@pildorasdeprogramacion

#python #markitdown #claude #ia #tokens #programacion #microsoft #llm #tutorial #python2026

Видео MarkItDown: ahorra tokens en Claude y ChatGPT канала Pildoras de programación
Яндекс.Метрика
Все заметки Новая заметка Страницу в заметки
Страницу в закладки Мои закладки
На информационно-развлекательном портале SALDA.WS применяются cookie-файлы. Нажимая кнопку Принять, вы подтверждаете свое согласие на их использование.
О CookiesНапомнить позжеПринять