Полный стек аналитика данных: от pandas до dbt. Вы научитесь читать pandas-код и понимать его SQL-эквивалент, строить dbt-модели в стиле staging → mart, писать переносимые Spark SQL запросы, понимать SQLAlchemy Core и ORM, избегать N+1 проблему и писать оптимальные аналитические запросы. 48 практических уроков на датасете SaaS-платформы.
Каждая pandas операция имеет SQL-эквивалент. groupby → GROUP BY, merge → JOIN, query → WHERE, pivot_table → CASE WHEN, cumsum → SUM OVER.
Ещё не начат
dbt (data build tool) организует SQL в иерархию моделей: staging → mart. Staging очищает сырые данные. Mart агрегирует бизнес-метрики. Все модели — это SELECT-запросы.
Ещё не начат
Spark SQL — стандартный SQL в кластерной среде. Синтаксис практически идентичен PostgreSQL. Основные отличия: типы данных, LATERAL VIEW EXPLODE, функции для работы со строками и датами.
Ещё не начат
SQLAlchemy Core и ORM — Python-интерфейс к SQL. Alembic для миграций. Итоговый проект объединяет pandas-паттерны, dbt-стиль и аналитику.
Ещё не начат
Все уроки, практические задания и проверка запросов — навсегда.