Kail
Организатор
Организатор
- Регистрация
- 09.04.2020
- Сообщения
- 438 392
- Реакции
- 43 519
- Монеты
- 1 191
- Оплачено
- 0
- Баллы
- 0
- #SkladchinaVip
- #1
[Devhands] Lakehouse для аналитиков и инженеров данных [Алексей Белозерский]
- Ссылка на картинку
-
Lakehouse для аналитиков и инженеров данных
Научитесь эффективно использовать Data Lakehouse c разделенным Compute и Storage на основе Iceberg и Trino.
Встречи: 6 недель (1 встреча в неделю)
Занятие 1. Lakehouse, Iceberg, разделение Compute и Storage
Занятие 2. Структура формата Iceberg. Формат Parquet
Занятие 3. Практика
Занятие 4. Метрики запросов в Trino
Занятие 5. Еще раз о формате Iceberg
Занятие 6. Пайплайны и финальная Q&A-сессия
Middle/Senior - Старт 20-го ноября - 6 недель
Живые онлайн-сессии, обсуждения, демо и практика
Научитесь эффективно использовать Data Lakehouse c разделенным Compute и Storage на основе Iceberg и Trino.
- Познакомиться с архитектурой LakeHouse, последним поколением аналитических систем
с разделенными слоями хранения (Iceberg/S3) и вычисления (Trino/k8s). - На практике научиться использовать кластер Trino over k8s, который будет обращаться к данным на S3 в формате Iceberg.
- Научиться строить гибридные пайплайны обработки данных с использованием SQL, Python, Spark.
- Освоить масштабирование до х100 раз без смены парадигм и технологий.
Встречи: 6 недель (1 встреча в неделю)
Занятие 1. Lakehouse, Iceberg, разделение Compute и Storage
Занятие 2. Структура формата Iceberg. Формат Parquet
Занятие 3. Практика
Занятие 4. Метрики запросов в Trino
Занятие 5. Еще раз о формате Iceberg
Занятие 6. Пайплайны и финальная Q&A-сессия
Middle/Senior - Старт 20-го ноября - 6 недель
Живые онлайн-сессии, обсуждения, демо и практика
Показать больше
Зарегистрируйтесь
, чтобы посмотреть контент.
Последнее редактирование:
Скачать