"Apache Iceberg. Полное руководство" — это исчерпывающее руководство по Apache Iceberg, современному формату таблиц для обработки больших данных. Авторы Табо Ширан, Джек Хьюз и Райан Мерсед глубоко раскры...
Опис Apache Iceberg. Полное руководство. Ширан Т., Хьюз Дж., Мерсед А.
"Apache Iceberg. Полное руководство" — это исчерпывающее руководство по Apache Iceberg, современному формату таблиц для обработки больших данных. Авторы Табо Ширан, Джек Хьюз и Райан Мерсед глубоко раскрывают архитектуру, возможности и применение Iceberg в аналитике, обработке данных и интеграции с популярными инструментами.
Что внутри?
Основы Apache Iceberg – понятие о форматах таблиц, отличие от Parquet, ORC и других решений.
Архитектура и внутреннее устройство – разбор метаданных, структуры данных, механизмов снапшотов и управления изменениями.
Интеграция с экосистемой – использование с Apache Spark, Flink, Trino, Hive и Presto.
Транзакции и ACID – поддержка атомарных операций, безопасные изменения данных.
Производительность и оптимизация – как эффективно обрабатывать петабайты данных, управлять партиционированием и индексами.
Практические кейсы – примеры реального применения Apache Iceberg в аналитике, data lake, stream processing.
Почему эта книга?
Написана экспертами, участвующими в разработке Apache Iceberg.
Дает практические советы и примеры кода для реальных проектов.
Полностью охватывает все возможности Iceberg, от установки до продвинутых сценариев использования.
Подходит как для инженеров данных, так и для аналитиков, DevOps-специалистов и архитекторов Big Data.
Это обязательное руководство для всех, кто работает с хранилищами данных и хочет перейти на современный, гибкий и мощный формат таблиц для обработки больших данных.
Основні характеристики Apache Iceberg. Полное руководство. Ширан Т., Хьюз Дж., Мерсед А.