Загрузка страницы

Jacek Laskowski — Apache Spark as an in-memory-only data processing engine?

Ближайшая конференция — SmartData 2024, 4 сентября (online), 8–9 сентября, (Москва + трансляция).
Подробности и билеты: https://jrg.su/KFFBS7
— —
Unlike how people usually think about Apache Spark it keeps blocks of data in memory and (that could be that surprising fact) on disk. The disk is usually for spilling data when running low on memory. That begs the question if it's ever possible to set up Spark so it never touches hard drives and hence be memory-fast? That's the question that Jacek is going to answer during the talk. You'll know a bit about the internals of Apache Spark and what parts are or could be memory-only and what challenges it poses.

Видео Jacek Laskowski — Apache Spark as an in-memory-only data processing engine? канала SmartData
Показать
Комментарии отсутствуют
Введите заголовок:

Введите адрес ссылки:

Введите адрес видео с YouTube:

Зарегистрируйтесь или войдите с
Информация о видео
27 июня 2022 г. 17:34:42
01:03:37
Другие видео канала
Andy Pavlo — Lessons learned from using machine learning to optimize database configurationsAndy Pavlo — Lessons learned from using machine learning to optimize database configurationsВиктор Кесслер — Dremio SQL Lakehouse: Быстрые данные для всехВиктор Кесслер — Dremio SQL Lakehouse: Быстрые данные для всехНиколай Марков — Низкий уровень работы с даннымиНиколай Марков — Низкий уровень работы с даннымиЮлия Волкова — Любовь и ненависть к Prefect 2.0 после Apache AirflowЮлия Волкова — Любовь и ненависть к Prefect 2.0 после Apache AirflowСергей Стороженко (SM Lab) — Нетипичное использование KafkaСергей Стороженко (SM Lab) — Нетипичное использование KafkaJeff Zhang — Flink + Zeppelin: Streaming data analytics platformJeff Zhang — Flink + Zeppelin: Streaming data analytics platformАлександр Крашенинников — Hadoop high availability: опыт BadooАлександр Крашенинников — Hadoop high availability: опыт BadooСаттар Гюльмамедов, Максим Мартынов — Эволюция ETL-инструментов на примере отдельно взятой Big DataСаттар Гюльмамедов, Максим Мартынов — Эволюция ETL-инструментов на примере отдельно взятой Big DataДенис Ефаров — Hadoop 3: Erasure coding catastropheДенис Ефаров — Hadoop 3: Erasure coding catastropheДмитрий Бугайченко — Stateful streaming: Кейсы, паттерны, реализацииДмитрий Бугайченко — Stateful streaming: Кейсы, паттерны, реализацииБронислав Житников — NiFi-скрипты как элемент Less Code ETLБронислав Житников — NiFi-скрипты как элемент Less Code ETLКсения Томак, Максим Стаценко, Андрей Терехов — Разговор в телевизореКсения Томак, Максим Стаценко, Андрей Терехов — Разговор в телевизореВиталий Худобахшов — Имя — это фичаВиталий Худобахшов — Имя — это фичаОльга Татаринова, Алексей Махоткин — Как моделирование данных повышает качество работы аналитиковОльга Татаринова, Алексей Махоткин — Как моделирование данных повышает качество работы аналитиковВикторина «Наша игра»Викторина «Наша игра»Павел Якунин — Безопасные интерактивные большие данные в банке: Business intelligence на ClickhouseПавел Якунин — Безопасные интерактивные большие данные в банке: Business intelligence на ClickhouseАлексей Потапов — Глубокое обучение, вероятностное программирование и метавычисленияАлексей Потапов — Глубокое обучение, вероятностное программирование и метавычисленияАртур Хачуян — Построение кросс-ID для веб-аналитикиАртур Хачуян — Построение кросс-ID для веб-аналитикиВладимир Озеров — Как устроено выполнение SQL-запросов в Presto/TrinoВладимир Озеров — Как устроено выполнение SQL-запросов в Presto/TrinoМихаил Марюфич — Надежные и масштабируемые пайплайны в OKМихаил Марюфич — Надежные и масштабируемые пайплайны в OK
Яндекс.Метрика