Загрузка страницы

Саттар Гюльмамедов, Максим Мартынов — Эволюция ETL-инструментов на примере отдельно взятой Big Data

Ближайшая конференция — SmartData 2024, 4 сентября (online), 8–9 сентября, (Москва + трансляция).
Подробности и билеты: https://jrg.su/KFFBS7
— —
Спикеры расскажут, как менялись пользовательские подходы к организации и реализации ETL-процессов, и как вслед за ними менялись инструменты для лучшего ответа на изменившиеся требования и условия работы. Один из интересных моментов доклада — рассказ о том, как в команде стали отказываться от использования нестандартных собственных инструментов Hadoop в пользу более стандартного Spark, что к этому подвигло и к каким результатам привело.

Доклад будет интересен дата-инженерам, специалистам по ETL, дата-сайентистам и всем, кому важно расширить свой кругозор или узнать об опыте других.

Видео Саттар Гюльмамедов, Максим Мартынов — Эволюция ETL-инструментов на примере отдельно взятой Big Data канала SmartData
Показать
Комментарии отсутствуют
Введите заголовок:

Введите адрес ссылки:

Введите адрес видео с YouTube:

Зарегистрируйтесь или войдите с
Информация о видео
29 июня 2023 г. 14:32:27
00:42:56
Другие видео канала
Andy Pavlo — Lessons learned from using machine learning to optimize database configurationsAndy Pavlo — Lessons learned from using machine learning to optimize database configurationsВиктор Кесслер — Dremio SQL Lakehouse: Быстрые данные для всехВиктор Кесслер — Dremio SQL Lakehouse: Быстрые данные для всехНиколай Марков — Низкий уровень работы с даннымиНиколай Марков — Низкий уровень работы с даннымиЮлия Волкова — Любовь и ненависть к Prefect 2.0 после Apache AirflowЮлия Волкова — Любовь и ненависть к Prefect 2.0 после Apache AirflowСергей Стороженко (SM Lab) — Нетипичное использование KafkaСергей Стороженко (SM Lab) — Нетипичное использование KafkaJeff Zhang — Flink + Zeppelin: Streaming data analytics platformJeff Zhang — Flink + Zeppelin: Streaming data analytics platformАлександр Крашенинников — Hadoop high availability: опыт BadooАлександр Крашенинников — Hadoop high availability: опыт BadooДенис Ефаров — Hadoop 3: Erasure coding catastropheДенис Ефаров — Hadoop 3: Erasure coding catastropheДмитрий Бугайченко — Stateful streaming: Кейсы, паттерны, реализацииДмитрий Бугайченко — Stateful streaming: Кейсы, паттерны, реализацииБронислав Житников — NiFi-скрипты как элемент Less Code ETLБронислав Житников — NiFi-скрипты как элемент Less Code ETLSmartDataCoffeeSmartDataCoffeeКсения Томак, Максим Стаценко, Андрей Терехов — Разговор в телевизореКсения Томак, Максим Стаценко, Андрей Терехов — Разговор в телевизореВиталий Худобахшов — Имя — это фичаВиталий Худобахшов — Имя — это фичаОльга Татаринова, Алексей Махоткин — Как моделирование данных повышает качество работы аналитиковОльга Татаринова, Алексей Махоткин — Как моделирование данных повышает качество работы аналитиковВикторина «Наша игра»Викторина «Наша игра»Павел Якунин — Безопасные интерактивные большие данные в банке: Business intelligence на ClickhouseПавел Якунин — Безопасные интерактивные большие данные в банке: Business intelligence на ClickhouseАлексей Потапов — Глубокое обучение, вероятностное программирование и метавычисленияАлексей Потапов — Глубокое обучение, вероятностное программирование и метавычисленияJacek Laskowski — Apache Spark as an in-memory-only data processing engine?Jacek Laskowski — Apache Spark as an in-memory-only data processing engine?Артур Хачуян — Построение кросс-ID для веб-аналитикиАртур Хачуян — Построение кросс-ID для веб-аналитикиВладимир Озеров — Как устроено выполнение SQL-запросов в Presto/TrinoВладимир Озеров — Как устроено выполнение SQL-запросов в Presto/Trino
Яндекс.Метрика