Jacek Laskowski — Apache Spark as an in-memory-only data processing engine?
Ближайшая конференция — SmartData 2024, 4 сентября (online), 8–9 сентября, (Москва + трансляция).
Подробности и билеты: https://jrg.su/KFFBS7
— —
Unlike how people usually think about Apache Spark it keeps blocks of data in memory and (that could be that surprising fact) on disk. The disk is usually for spilling data when running low on memory. That begs the question if it's ever possible to set up Spark so it never touches hard drives and hence be memory-fast? That's the question that Jacek is going to answer during the talk. You'll know a bit about the internals of Apache Spark and what parts are or could be memory-only and what challenges it poses.
Видео Jacek Laskowski — Apache Spark as an in-memory-only data processing engine? канала SmartData
Подробности и билеты: https://jrg.su/KFFBS7
— —
Unlike how people usually think about Apache Spark it keeps blocks of data in memory and (that could be that surprising fact) on disk. The disk is usually for spilling data when running low on memory. That begs the question if it's ever possible to set up Spark so it never touches hard drives and hence be memory-fast? That's the question that Jacek is going to answer during the talk. You'll know a bit about the internals of Apache Spark and what parts are or could be memory-only and what challenges it poses.
Видео Jacek Laskowski — Apache Spark as an in-memory-only data processing engine? канала SmartData
Показать
Комментарии отсутствуют
Информация о видео
Другие видео канала
Andy Pavlo — Lessons learned from using machine learning to optimize database configurationsВиктор Кесслер — Dremio SQL Lakehouse: Быстрые данные для всехНиколай Марков — Низкий уровень работы с даннымиЮлия Волкова — Любовь и ненависть к Prefect 2.0 после Apache AirflowСергей Стороженко (SM Lab) — Нетипичное использование KafkaJeff Zhang — Flink + Zeppelin: Streaming data analytics platformАлександр Крашенинников — Hadoop high availability: опыт BadooСаттар Гюльмамедов, Максим Мартынов — Эволюция ETL-инструментов на примере отдельно взятой Big DataДенис Ефаров — Hadoop 3: Erasure coding catastropheДмитрий Бугайченко — Stateful streaming: Кейсы, паттерны, реализацииБронислав Житников — NiFi-скрипты как элемент Less Code ETLКсения Томак, Максим Стаценко, Андрей Терехов — Разговор в телевизореВиталий Худобахшов — Имя — это фичаОльга Татаринова, Алексей Махоткин — Как моделирование данных повышает качество работы аналитиковВикторина «Наша игра»Павел Якунин — Безопасные интерактивные большие данные в банке: Business intelligence на ClickhouseАлексей Потапов — Глубокое обучение, вероятностное программирование и метавычисленияАртур Хачуян — Построение кросс-ID для веб-аналитикиВладимир Озеров — Как устроено выполнение SQL-запросов в Presto/TrinoМихаил Марюфич — Надежные и масштабируемые пайплайны в OK