SQLLab

ETL-пайплайны

Pro

Полный курс по построению ETL/ELT-пайплайнов для аналитики данных. Вы научитесь проектировать Extract-паттерны (full load, incremental, CDC), трансформировать данные (SCD Type 2, дедупликация, нормализация), строить DQ-проверки и мониторинг качества данных, оркестрировать пайплайны через Airflow-паттерны, обеспечивать идемпотентность и SLA-мониторинг, работать с потоковой обработкой (Kafka, Flink, Spark Streaming). 55 практических уроков на датасете реальной ETL-платформы.

Что вы научитесь

  • Проектировать Full Load и Incremental Load пайплайны
  • Реализовывать Watermark-паттерн и CDC
  • Строить SCD Type 2 через LEAD и UPSERT
  • Проверять качество данных: completeness, uniqueness, validity
  • Реализовывать Data Contracts и threshold-алерты
  • Строить идемпотентные пайплайны (DELETE+INSERT, UPSERT)
  • Обнаруживать аномалии объёма через Z-score
  • Мониторить SLA и freshness данных
  • Понимать архитектуры Lambda, Kappa, Medallion
  • Строить комплексные ETL-дашборды для всей платформы

Получите полный доступ к курсу

Все уроки, практические задания и проверка запросов — навсегда.