Загрузка страницы

Виктор Кесслер — Dremio SQL Lakehouse: Быстрые данные для всех

Ближайшая конференция — SmartData 2024, 4 сентября (online), 8–9 сентября, (Москва + трансляция).
Подробности и билеты: https://jrg.su/KFFBS7
— —
Сегодня каждая компания — это софтверная компания и завтра каждый сотрудник может стать дата-аналитиком!

В докладе вы узнаете, что такое Data Lake, какие преимущества и недостатки появляются при использовании этой технологии. Почему важно выстраивать открытую архитектуру для аналитики данных и избегать проприетарный lock-in. Зачем нужны колоночно-ориентированные файловые форматы на диски и в памяти. Как происходит эволюция Data Lake для доработки таких недостающих компонентов, как транзакции и версионирование.

Также на живой демонстрации продукта Dremio вы сможете увидеть, как быстро построить SQL Lakehouse и позволить вашим пользователям самостоятельно анализировать все имеющиеся данные.

Скачать презентацию: https://assets.ctfassets.net/oxjq45e8ilak/6IrgNRsHpfGPy2KzxmmK0B/f88da8a751c76917ab8b58ab748d71d0/The_SQL_Lakehouse_Platform____________________________________________.pdf

Видео Виктор Кесслер — Dremio SQL Lakehouse: Быстрые данные для всех канала SmartData
Показать
Комментарии отсутствуют
Введите заголовок:

Введите адрес ссылки:

Введите адрес видео с YouTube:

Зарегистрируйтесь или войдите с
Информация о видео
27 июня 2022 г. 17:34:42
01:00:06
Другие видео канала
Andy Pavlo — Lessons learned from using machine learning to optimize database configurationsAndy Pavlo — Lessons learned from using machine learning to optimize database configurationsНиколай Марков — Низкий уровень работы с даннымиНиколай Марков — Низкий уровень работы с даннымиЮлия Волкова — Любовь и ненависть к Prefect 2.0 после Apache AirflowЮлия Волкова — Любовь и ненависть к Prefect 2.0 после Apache AirflowJeff Zhang — Flink + Zeppelin: Streaming data analytics platformJeff Zhang — Flink + Zeppelin: Streaming data analytics platformАлександр Крашенинников — Hadoop high availability: опыт BadooАлександр Крашенинников — Hadoop high availability: опыт BadooСаттар Гюльмамедов, Максим Мартынов — Эволюция ETL-инструментов на примере отдельно взятой Big DataСаттар Гюльмамедов, Максим Мартынов — Эволюция ETL-инструментов на примере отдельно взятой Big DataДенис Ефаров — Hadoop 3: Erasure coding catastropheДенис Ефаров — Hadoop 3: Erasure coding catastropheДмитрий Бугайченко — Stateful streaming: Кейсы, паттерны, реализацииДмитрий Бугайченко — Stateful streaming: Кейсы, паттерны, реализацииБронислав Житников — NiFi-скрипты как элемент Less Code ETLБронислав Житников — NiFi-скрипты как элемент Less Code ETLКсения Томак, Максим Стаценко, Андрей Терехов — Разговор в телевизореКсения Томак, Максим Стаценко, Андрей Терехов — Разговор в телевизореВиталий Худобахшов — Имя — это фичаВиталий Худобахшов — Имя — это фичаОльга Татаринова, Алексей Махоткин — Как моделирование данных повышает качество работы аналитиковОльга Татаринова, Алексей Махоткин — Как моделирование данных повышает качество работы аналитиковВикторина «Наша игра»Викторина «Наша игра»Павел Якунин — Безопасные интерактивные большие данные в банке: Business intelligence на ClickhouseПавел Якунин — Безопасные интерактивные большие данные в банке: Business intelligence на ClickhouseАлексей Потапов — Глубокое обучение, вероятностное программирование и метавычисленияАлексей Потапов — Глубокое обучение, вероятностное программирование и метавычисленияJacek Laskowski — Apache Spark as an in-memory-only data processing engine?Jacek Laskowski — Apache Spark as an in-memory-only data processing engine?Артур Хачуян — Построение кросс-ID для веб-аналитикиАртур Хачуян — Построение кросс-ID для веб-аналитикиМихаил Марюфич — Надежные и масштабируемые пайплайны в OKМихаил Марюфич — Надежные и масштабируемые пайплайны в OKЕвгений Ненахов (MTC Digital) — Организация потоковой обработки данных для Big DataЕвгений Ненахов (MTC Digital) — Организация потоковой обработки данных для Big DataАлександр Волочнев — Создание модели данных для высоконагруженных приложений с Apache Cassandra (1)Александр Волочнев — Создание модели данных для высоконагруженных приложений с Apache Cassandra (1)
Яндекс.Метрика