Курс «Lakehouse для аналитиков и инженеров данных» представляет собой интенсивную образовательную программу, сфокусированную на изучении современной архитектуры аналитических систем. В эпоху стремительного роста объемов данных традиционные подходы к хранению и обработке информации перестают справляться с нагрузками, требуя новых решений. Данный курс предлагает глубокое погружение в концепцию Data Lakehouse — передового стандарта, объединяющего гибкость озер данных с надежностью и производительностью корпоративных хранилищ (DWH). Основная идея архитектуры Lakehouse заключается в разделении слоев вычислений (Compute) и хранения (Storage), что позволяет масштабировать систему до 100 раз без необходимости смены технологического стека или фундаментальных парадигм разработки.
В ходе обучения слушатели освоят работу с ключевыми технологиями современного стека: Iceberg, Trino, S3 и Kubernetes. Вы научитесь эффективно использовать формат Apache Iceberg для управления большими данными, обеспечивая транзакционность и атомарность операций поверх объектного хранилища S3. Особое внимание уделяется настройке и эксплуатации кластера Trino, развернутого в среде Kubernetes, что позволяет выполнять сложные аналитические запросы с высокой скоростью. Программа курса построена таким образом, чтобы дать студентам не только теоретическую базу, но и прикладные навыки: от настройки каталогов метаданных до создания гибридных пайплайнов обработки данных с использованием SQL, Python, Spark, DBT и Airflow.
Курс идеально подходит для аналитиков данных, инженеров данных и ML-инженеров, стремящихся повысить свою квалификацию и внедрить современные подходы к построению аналитических платформ. Обучение проходит в формате живых лекций с экспертом Алексеем Белозерским, что обеспечивает возможность задавать вопросы и разбирать реальные кейсы в режиме реального времени. Каждое занятие сопровождается практической работой, позволяющей закрепить знания: от выгрузки таблиц и настройки коннекторов до автоматизации пайплайнов и мониторинга состояния датасетов. По завершении курса участники будут обладать полным пониманием того, как проектировать, разворачивать и поддерживать масштабируемые системы класса Lakehouse, а также как оптимизировать их работу для решения бизнес-задач любой сложности. Вы научитесь работать с метаданными, управлять жизненным циклом данных, реализовывать ACID-транзакции и эффективно использовать инструменты оркестрации для построения надежных конвейеров данных.
Отзывов пока нет. Будьте первым!