Загрузка...

[6일차] Apache Iceberg는 왜 차세대 테이블 포맷이 되었을까? | Iceberg 기초 완전 이해

🏗️ 데이터 레이크하우스 엔지니어링 20일 집중 과정
DAY 6 — Apache Iceberg 기초: 왜 Iceberg인가

이번 영상에서는
차세대 데이터 레이크 테이블 포맷인
“Apache Iceberg”의 핵심 구조를 이해합니다.

✔ Hive 테이블 방식의 한계
✔ Partition Metadata 병목 문제
✔ ACID 미지원 문제
✔ Snapshot 기반 테이블 구조
✔ Iceberg Metadata 계층 구조
✔ Manifest / Snapshot / Metadata 동작 원리
✔ Iceberg Catalog 종류
✔ Spark + Iceberg 연동
✔ Optimistic Concurrency Control

기존 Hadoop/Hive 기반 데이터 레이크는
대규모 환경에서 여러 구조적 한계를 가집니다.

Apache Iceberg는
이 문제를 해결하기 위해 등장한
차세대 Open Table Format 입니다.

이번 강의에서는
Iceberg가 왜 중요한지,
그리고 내부 메타데이터 구조가 어떻게 동작하는지를
아키텍처 중심으로 설명합니다.

📌 이런 분들에게 추천합니다
- 데이터 엔지니어
- Spark 개발자
- 플랫폼 엔지니어
- MLOps 엔지니어
- Lakehouse 구축 담당자
- Hadoop/Hive 운영 경험자

🔥 이번 영상 핵심 내용
- Hive Metastore 병목 구조
- Snapshot Isolation 이해
- ACID 기반 데이터 레이크
- Iceberg Metadata Layer
- REST Catalog & Nessie 구조
- Spark SQL 기반 Iceberg 실습

🧪 실습 내용
- Spark + Iceberg REST Catalog 구성
- MinIO 기반 Lakehouse 환경 구축
- Bronze → Silver Iceberg 마이그레이션
- Iceberg 테이블 생성 및 데이터 삽입

#ApacheIceberg
#Iceberg
#Spark
#DataEngineering
#Lakehouse
#BigData
#Hadoop
#Hive
#MLOps
#데이터엔지니어
#AI인프라
#클라우드

Видео [6일차] Apache Iceberg는 왜 차세대 테이블 포맷이 되었을까? | Iceberg 기초 완전 이해 канала AI-Trendy

Комментарии отсутствуют

Информация о видео

Вчера, 3:23:02

00:16:52

Правообладателям

Жалоба на материал Недопустимый материал Нарушение авторских прав

Комментарии

Поделиться

Другие видео канала

음식 주문 시스템으로 배우는 마이크로서비스 | DAY 01: 강의 소개 & 현대 개발의 변화 [MSA 20일 완성]

[MSA 완전정복 Day08] Apache Kafka 기초 — 이벤트 스트리밍과 메시지 브로커 | 토픽·파티션·컨슈머 그룹

[MSA 완전정복 Day09] Kafka 심화 — 파티션 전략, 컨슈머 그룹 리밸런싱, Exactly-Once 처리

[MSA 실전] 14강. Spring Data JPA — 도메인과 영속성 분리 완전 정복 | DataMapper · food-ordering-system

[MSA 실전] 16강. 결제 서비스 구현 — Payment Service와 SAGA | CreditEntry · Outbox · food-ordering-system

[MSA 강의 10강] CQRS 패턴 완전 정복 — Command와 Query를 분리하면 성능이 달라진다

kube-proxy가 느린 이유와 Cilium이 해결하는 방법 | eBPF · Cilium 아키텍처 · Identity 보안 완전 정복

[MSA 완전정복 19일차] MSA 테스트 전략 완전 분석 — 도메인 단위 테스트부터 Embedded Kafka E2E까지

모놀리식 아키텍처란? - 넷플릭스도 여기서 시작했다 | 마이크로서비스 입문 Day 02

[3일차] Ceph는 어떻게 AWS S3를 대체할까? | 분산 스토리지 아키텍처 완전 이해

[MSA 실전] 13강. Outbox 패턴 완전 정복 — 이벤트 유실 없는 메시지 발행 | food-ordering-system 적용

[1일차] 데이터 레이크는 왜 망했을까? | Lakehouse 아키텍처 완전 이해

[4일차] MinIO로 S3 스토리지 직접 구축하기 | 실무형 오브젝트 스토리지 입문

[5일차] HashiCorp Vault 완전 이해 | 데이터 플랫폼 보안 아키텍처 구축

[MSA 강의 11강] SAGA 패턴 완전 정복 — 분산 트랜잭션을 로컬 트랜잭션으로 분해하는 법

Cilium 완전 정복 2강 | Hubble 네트워크 관측성 · 트러블슈팅 · 프로덕션 설치

[MSA 실전] 15강. 주문 서비스 구현 — Order Service 전체 흐름 | CreateOrderCommandHandler · SAGA 연동

[MSA 완전정복 18일차] 서비스 간 이벤트 흐름 완전 분석 — 주문부터 완료까지 Kafka SAGA 전체 시나리오

DDD란 무엇인가? - 엔티티, 밸류 오브젝트, Aggregate를 코드로 이해한다 | MSA 입문 Day 04

[MSA 완전정복 Day07] 클린 아키텍처 — 레이어 분리와 의존성 역전 | Entities, Use Cases, DIP 실습

[2일차] S3는 왜 데이터 플랫폼의 표준이 되었을까? | S3 프로토콜 완전 이해

Все заметки Новая заметка Страницу в заметки

Страницу в закладки Мои закладки

На информационно-развлекательном портале SALDA.WS применяются cookie-файлы. Нажимая кнопку Принять, вы подтверждаете свое согласие на их использование.

О Cookies Напомнить позже Принять