634 ₽ 24 000 ₽ −97%
Вам больше не придется ограничиваться локальными объемами данных: этот курс учит переносить задачи анализа на распределенные системы Hadoop и Spark. Здесь разбирают, как эффективно обрабатывать терабайты информации, настраивать ETL-процессы и строить архитектуру хранилищ, когда возможностей стандартного Pandas становится недостаточно. Внутри — работа с NoSQL-базами (HBase, Cassandra, ClickHouse), управление задачами через Apache Airflow и внедрение машинного обучения в инфраструктуру Big Data с помощью Spark ML. В результате вы научитесь готовить данные для DS-моделей в масштабах больших компаний и визуализировать результаты в Apache Superset.
Отзывов пока нет. Будьте первым!