Загрузка страницы

Николай Голов, Николай Марков, Филлип Уваров: Big Data is Dead

#bigdata #dataengineers #dataanalytics #duckdb #postgresql

Встретились обсудить недавно нашумевшую статью от ребят из Mother Duck - Big Data is Dead. Обсудили, как правильно использовать данные, чтобы получать действенные результаты, и ребята поделились своим реальным опытом. Также мы рассмотрели, какие проблемы возникают при работе с большими данными и как их можно решить. Мы ответили на вопрос, существует ли еще "big data", и зачем сейчас нужны дата-аналитики. Еще разобрались в 3х V - Volume (объем данных), компрессия DuckDB, кластерные облачные базы; в Velocity (скорость поступления данных), стриминг, шины, in-memory databases (DuckDB); в Variety (изменчивость данных).

Ламповый чат https://t.me/backend_megdu_skobkah
Канал с анонсами https://t.me/megdu_skobok
Apple Podcast https://podcasts.apple.com/us/podcast/{-между-скобок-}/id1654695424
Yandex Music https://music.yandex.ru/album/24060063

Полезные ссылки
📖 Hannes Mühleisen - DuckDB, an in-process analytical DBMS https://youtu.be/Z-6SnP6yzgo
📖 WHY USE DUCKDB FOR ANALYTICS? https://motherduck.com/blog/six-reasons-duckdb-slaps/
📖 Big Data is Dead https://motherduck.com/blog/big-data-is-dead/
📖 RTB (Real Time Bidding) https://rtb-media.ru/wiki/
📖 ClickBench — a Benchmark For Analytical DBMS https://benchmark.clickhouse.com
00:00 Приветствие
02:20 Что такое Big Data, volume, value, variety, velocity, and veracity
03:30 Объемы данных в Spotify
05:14 История появления понятия Big Data
06:12 Big Data explosion
12:33 Что такое BigQuery
14:12 Аналитика данных, дата сеты для обучения моделей
17:35 Эксперимент с инвертирование данных для дата сетов
20:17 Актуально ли сейчас учиться аналитике данных
22:03 OLAP vs OLTP
24:19 Резюме по Volume
25:30 Определение Velocity
27:34 RTB (Real Time Bidding)
29:53 Резюме по Velocity
31:42 Пример систем, где нужна real time аналитика
33:27 Определение Velocity
36:22 Пример использования DuckDB
38:30 Почему коллоночные базы такие быстрые, векторные операции
42:20 Война бэнчмарков, почему компании привирают, public relations
44:04 Определение Variety
56:23 Будущее работы с данными
58:00 Какая судьба у Vertica в мире дешевых и хороших инструментов
59:09 Что быстрее Spark или DuckDB

Видео Николай Голов, Николай Марков, Филлип Уваров: Big Data is Dead канала { между скобок }
Показать
Комментарии отсутствуют
Введите заголовок:

Введите адрес ссылки:

Введите адрес видео с YouTube:

Зарегистрируйтесь или войдите с
Информация о видео
15 мая 2023 г. 17:41:03
01:02:28
Другие видео канала
Максим Суркиз: Как успешно запустить свой StartupМаксим Суркиз: Как успешно запустить свой StartupГриша Скобелев, Саша Бармин: Публичное собеседование Senior Software EngineerГриша Скобелев, Саша Бармин: Публичное собеседование Senior Software EngineerПодстава от микросервисной архитектуры 🤯 #softwareengineer #distributedsystems #microserviceПодстава от микросервисной архитектуры 🤯 #softwareengineer #distributedsystems #microserviceDistributed Systems Глава 2 Архитектура распределенных систем | Фрол Крючков, Иван БогатырёвDistributed Systems Глава 2 Архитектура распределенных систем | Фрол Крючков, Иван БогатырёвЗачем нужны абстракции в распределённых системах #distributedsystems #softwarearchitectureЗачем нужны абстракции в распределённых системах #distributedsystems #softwarearchitectureDistributed Systems Глава 1 Введение в распределенные системы | Юрий Бабак, Алексей ГончарукDistributed Systems Глава 1 Введение в распределенные системы | Юрий Бабак, Алексей ГончарукВопрос для оценки руководителя - «а есть ли сильные люди в команде?» #teamlead #leadershipВопрос для оценки руководителя - «а есть ли сильные люди в команде?» #teamlead #leadershipНе злите датасаентистов 😅 #dataanalytics #datascience #softwareengineer #abtesting #dataengineersНе злите датасаентистов 😅 #dataanalytics #datascience #softwareengineer #abtesting #dataengineersВладимир Абазов, Александр Сальников: АБ-тесты, ограничения и альтернативыВладимир Абазов, Александр Сальников: АБ-тесты, ограничения и альтернативыЯрик Астафьев, Аксель Ткачев: публичное собеседование тимлидаЯрик Астафьев, Аксель Ткачев: публичное собеседование тимлидаВалерий Бабушкин, Арсений Кравченко: Интервью с авторами Machine Learning System DesignВалерий Бабушкин, Арсений Кравченко: Интервью с авторами Machine Learning System DesignОльга Елисеева: Как стать лучшим teamlead-омОльга Елисеева: Как стать лучшим teamlead-омВалерий Бабушкин: Почему Data Scientist-oв не существуетВалерий Бабушкин: Почему Data Scientist-oв не существуетМихаил Дружинин: Observability и MonitoringМихаил Дружинин: Observability и MonitoringChatGPT в помощь архитектору / Николай Голов, Иван ШумовChatGPT в помощь архитектору / Николай Голов, Иван ШумовСаша Пшеборовская - Успех через менторствоСаша Пшеборовская - Успех через менторствоВладимир Иванов, Антон Сорокин: публичное собеседование по System DesignВладимир Иванов, Антон Сорокин: публичное собеседование по System DesignОсновы архитектуры ПО. Глава 18 Выбор подходящего стиля архитектуры / Сергей БарановОсновы архитектуры ПО. Глава 18 Выбор подходящего стиля архитектуры / Сергей БарановОсновы архитектуры ПО. Глава 17 Микросервисная архитектура / Филипп Дельгядо, Кирилл ВетчинкинОсновы архитектуры ПО. Глава 17 Микросервисная архитектура / Филипп Дельгядо, Кирилл ВетчинкинАлександр Точин: Описываем сервисы в C4 и StructurizrАлександр Точин: Описываем сервисы в C4 и Structurizr
Яндекс.Метрика