Загрузка страницы

Павел Якунин — Безопасные интерактивные большие данные в банке: Business intelligence на Clickhouse

Ближайшая конференция — SmartData 2024, 4 сентября (online), 8–9 сентября, (Москва + трансляция).
Подробности и билеты: https://jrg.su/KFFBS7
— —
В банке есть множество систем: генерирующих, хранящих и иногда анализирующих различные клиентские и внутренние данные. Часто эти системы слабо связаны между собой и образуют Data Silo. Во многих случаях это происходит из-за сложности правил доступа к данным, определенных регуляторами.

Существование Data Silo мешает использовать данные для поиска новых возможностей бизнеса. В Дойче нашли эффективный путь преодоления этой проблемы и построили безопасный и любимый аналитиками DWH на основе Clickhouse, Kafka и Spark.

В докладе Павел объяснит, чем вызвана фрагментация данных в его организации и какие типичные сценарии аналитики из-за этого страдают. Он расскажет, каким образом удалось построить безопасный DWH на Clickhouse, способный объединить в себе данные из разных источников, предоставить интерактивный инструмент для исследований и не нарушить существующих регуляций и правил. Слушатель сможет узнать о принятых архитектурных решениях и их причинах, собранных граблях, а также решить для себя подходит ли Clickhouse в качестве DWH в его организации.

Видео Павел Якунин — Безопасные интерактивные большие данные в банке: Business intelligence на Clickhouse канала SmartData
Показать
Комментарии отсутствуют
Введите заголовок:

Введите адрес ссылки:

Введите адрес видео с YouTube:

Зарегистрируйтесь или войдите с
Информация о видео
17 февраля 2021 г. 15:48:35
01:14:12
Другие видео канала
Andy Pavlo — Lessons learned from using machine learning to optimize database configurationsAndy Pavlo — Lessons learned from using machine learning to optimize database configurationsВиктор Кесслер — Dremio SQL Lakehouse: Быстрые данные для всехВиктор Кесслер — Dremio SQL Lakehouse: Быстрые данные для всехНиколай Марков — Низкий уровень работы с даннымиНиколай Марков — Низкий уровень работы с даннымиJeff Zhang — Flink + Zeppelin: Streaming data analytics platformJeff Zhang — Flink + Zeppelin: Streaming data analytics platformАлександр Крашенинников — Hadoop high availability: опыт BadooАлександр Крашенинников — Hadoop high availability: опыт BadooСаттар Гюльмамедов, Максим Мартынов — Эволюция ETL-инструментов на примере отдельно взятой Big DataСаттар Гюльмамедов, Максим Мартынов — Эволюция ETL-инструментов на примере отдельно взятой Big DataДенис Ефаров — Hadoop 3: Erasure coding catastropheДенис Ефаров — Hadoop 3: Erasure coding catastropheДмитрий Бугайченко — Stateful streaming: Кейсы, паттерны, реализацииДмитрий Бугайченко — Stateful streaming: Кейсы, паттерны, реализацииБронислав Житников — NiFi-скрипты как элемент Less Code ETLБронислав Житников — NiFi-скрипты как элемент Less Code ETLSmartDataCoffeeSmartDataCoffeeКсения Томак, Максим Стаценко, Андрей Терехов — Разговор в телевизореКсения Томак, Максим Стаценко, Андрей Терехов — Разговор в телевизореВиталий Худобахшов — Имя — это фичаВиталий Худобахшов — Имя — это фичаОльга Татаринова, Алексей Махоткин — Как моделирование данных повышает качество работы аналитиковОльга Татаринова, Алексей Махоткин — Как моделирование данных повышает качество работы аналитиковВикторина «Наша игра»Викторина «Наша игра»Алексей Потапов — Глубокое обучение, вероятностное программирование и метавычисленияАлексей Потапов — Глубокое обучение, вероятностное программирование и метавычисленияJacek Laskowski — Apache Spark as an in-memory-only data processing engine?Jacek Laskowski — Apache Spark as an in-memory-only data processing engine?Артур Хачуян — Построение кросс-ID для веб-аналитикиАртур Хачуян — Построение кросс-ID для веб-аналитикиВладимир Озеров — Как устроено выполнение SQL-запросов в Presto/TrinoВладимир Озеров — Как устроено выполнение SQL-запросов в Presto/TrinoМихаил Марюфич — Надежные и масштабируемые пайплайны в OKМихаил Марюфич — Надежные и масштабируемые пайплайны в OKЕвгений Ненахов (MTC Digital) — Организация потоковой обработки данных для Big DataЕвгений Ненахов (MTC Digital) — Организация потоковой обработки данных для Big Data
Яндекс.Метрика