- Популярные видео
- Авто
- Видео-блоги
- ДТП, аварии
- Для маленьких
- Еда, напитки
- Животные
- Закон и право
- Знаменитости
- Игры
- Искусство
- Комедии
- Красота, мода
- Кулинария, рецепты
- Люди
- Мото
- Музыка
- Мультфильмы
- Наука, технологии
- Новости
- Образование
- Политика
- Праздники
- Приколы
- Природа
- Происшествия
- Путешествия
- Развлечения
- Ржач
- Семья
- Сериалы
- Спорт
- Стиль жизни
- ТВ передачи
- Танцы
- Технологии
- Товары
- Ужасы
- Фильмы
- Шоу-бизнес
- Юмор
6.1.1: Transformación y Calidad del Dato en Python: Acualizacion de codigo base
Continuamos con la Fase 2 de nuestro pipeline de DataOps. Ya logramos extraer el clima crudo de la API de Open-Meteo, pero esos datos aún no están listos para viajar por nuestra arquitectura. ¡Es hora de aplicar la Calidad del Dato!
En este video, programamos la función de transformación (format_data). Aquí tomaremos el JSON original, crearemos un diccionario limpio, traduciremos los campos y, lo más importante, aseguraremos que cada registro tenga una identidad única y el tipo de dato correcto antes de enviarlo al orquestador.
.
.
.
📌 ¿Qué aprenderás en este video?
Creación de Estructuras (Diccionarios): Cómo inicializar un diccionario vacío en Python para usarlo como "molde" de nuestros datos limpios.
Generación de UUIDs: Uso de la librería uuid para asignar un identificador único e irrepetible a cada bloque de datos, fundamental para evitar duplicados en bases de datos.
Type Casting (Conversión de Tipos): La importancia de forzar los datos numéricos usando float() para garantizar la integridad de las temperaturas y velocidades del viento.
Mapeo y Estandarización: Cómo extraer las llaves en inglés del JSON de la API y guardarlas con una nomenclatura estandarizada en español para nuestro proyecto.
.
.
.
CAPÍTULOS:
00:00 Introducción: La importancia de la Transformación (La "T" en ETL)
00:55 Creando la función format_data y el diccionario vacío
02:30 Generando un ID único con uuid4()
03:30 Extrayendo datos fijos y mapeando el JSON
04:30 Aplicando Calidad del Dato con float() para números
07:45 Retornando el payload limpio al pipeline
.
.
.
#DataOps #Python #ETL #DataQuality #JSON #DataEngineering #Programacion #Airflow #UTTT #backend
Видео 6.1.1: Transformación y Calidad del Dato en Python: Acualizacion de codigo base канала Dataops HEDM
En este video, programamos la función de transformación (format_data). Aquí tomaremos el JSON original, crearemos un diccionario limpio, traduciremos los campos y, lo más importante, aseguraremos que cada registro tenga una identidad única y el tipo de dato correcto antes de enviarlo al orquestador.
.
.
.
📌 ¿Qué aprenderás en este video?
Creación de Estructuras (Diccionarios): Cómo inicializar un diccionario vacío en Python para usarlo como "molde" de nuestros datos limpios.
Generación de UUIDs: Uso de la librería uuid para asignar un identificador único e irrepetible a cada bloque de datos, fundamental para evitar duplicados en bases de datos.
Type Casting (Conversión de Tipos): La importancia de forzar los datos numéricos usando float() para garantizar la integridad de las temperaturas y velocidades del viento.
Mapeo y Estandarización: Cómo extraer las llaves en inglés del JSON de la API y guardarlas con una nomenclatura estandarizada en español para nuestro proyecto.
.
.
.
CAPÍTULOS:
00:00 Introducción: La importancia de la Transformación (La "T" en ETL)
00:55 Creando la función format_data y el diccionario vacío
02:30 Generando un ID único con uuid4()
03:30 Extrayendo datos fijos y mapeando el JSON
04:30 Aplicando Calidad del Dato con float() para números
07:45 Retornando el payload limpio al pipeline
.
.
.
#DataOps #Python #ETL #DataQuality #JSON #DataEngineering #Programacion #Airflow #UTTT #backend
Видео 6.1.1: Transformación y Calidad del Dato en Python: Acualizacion de codigo base канала Dataops HEDM
Комментарии отсутствуют
Информация о видео
22 апреля 2026 г. 12:05:45
00:08:13
Другие видео канала
