SELECT * FROM movies WHERE rating > 8.5 docker-compose up -d python extract.py --source tmdb CREATE TABLE dim_movies (
id SERIAL PRIMARY KEY, title VARCHAR(255), release_date DATE ); 0 */6 * * * /scripts/run_pipeline.sh
Projet réel • Docker • PostgreSQL • Python • SQL

Construis ta première
data pipeline.

Les technologies changeront. Les fondations resteront.

Apprends à construire une vraie infrastructure data de production avec Docker, PostgreSQL, Python, SQL, Metabase et une orchestration.

Projet portfolio réel
Stack utilisée dans l'industrie
100% pratique
Open source & local
30leçons
6modules
~9hde contenu
pipeline-en-fonctionnement
LIVE
LIVE INFRASTRUCTURE

Le système que tu vas construire

Une architecture data production-ready avec Docker, orchestration et monitoring.

GitHub
VS Code
SSH
pgAdmin
Docker Desktop
movie_pipeline
running
containers
TMDB APIexternal

api.themoviedb.org

extract
Python ETL
$ python main_pipeline.py
$ config.py
$ extraction.py
$ load_data.py
$ cleaning.py
✓ 847 rows
load
PostgreSQL
:5432
titleROI
Inception4.3
Interstellar2.7
Vice-Versa2.5
2 tables1 mat_view
select
Metabase
:3000
ROI par Genre
Action
Sci-Fi
Drama
total847
volume: /var/lib/postgresql/data
orchestration layer
Scheduler & Monitoring
active
Bash
$ ./run_pipeline.sh
$ ./health_check.sh
Cron
0 */6 * * *
next: 6h
Refresh
REFRESH mat_view
CONCURRENTLY

À la fin du cours, tu seras capable de

Construire une infrastructure data complète sur ta machine
Présenter un vrai projet data engineering en portfolio
Comprendre comment les entreprises manipulent leurs données
Automatiser des pipelines de manière professionnelle
Explorer de nouvelles technologies sans dépendre de tutoriels
Penser comme un data engineer, pas seulement utiliser des outils

La plupart des tutoriels t'apprennent à utiliser des outils.
Ce cours t'apprend à construire des systèmes.

ConstruireSuivre des tutos
Comprendre les systèmes
Copier des commandes
Penser en pipeline
Scripts isolés
Architecture complète
Exercices déconnectés
Orchestration
Lancement manuel
Autonomie Créative
Dépendance aux tutos

Un vrai environnement de travail data engineering

Pas des slides. Pas des exemples simplifiés. Un vrai système complet.

Dashboard Metabase
Dashboard Metabase
VS Code Python
Pipeline Python - VS Code
zsh — orchestration
Terminal - Pipeline Live
docker-compose.yml
# Infrastructure complète
services:
postgres:
image: postgres:16
ports: ["5432:5432"]
metabase:
image: metabase/metabase
depends_on: [postgres]
python-etl:
build: ./pipeline
Docker Compose

Le parcours complet

Une progression pensée pour te faire construire étape par étape une vraie architecture data.

8h30 de contenu
  • WSL2 pour Windows
  • Terminal & Bash : les commandes essentielles
  • Clés SSH : connexion sécurisée
  • Git & GitHub : versionner ton code
  • VS Code, environnement Python & structure projet

Qui suis-je ?

Photo Thomas

KottioDev

Data Engineer & Créateur de contenu

Je suis Thomas, Data Engineer passionné par la pédagogie et le partage de connaissances. Après des années à construire des pipelines data en entreprise, j'ai décidé de créer les cours que j'aurais aimé avoir quand j'ai commencé. Pas de théorie abstraite, que du concret et des vrais projets.

Head of Data & Software Engineer
Msc in Business Analytics & Data Science
Projets open source & formations
Passionné par la pédagogie technique

Investis dans tes compétences

Un projet complet pour maîtriser le data engineering moderne.

Plateforme dédiéeAccès à vieSupport Discord
35

Paiement unique

30 leçons vidéo HD
6 modules complets
~9h de contenu
Accès à vie
Support Discord
Code source complet
Mises à jour incluses
Projet portfolio GitHub
Commencer maintenant

Questions fréquentes

Arrête les tutoriels isolés.
Construis enfin un vrai système data.

Apprends le data engineering en construisant une stack complète utilisée dans le monde réel.

Commencer le projet

Accès à vie • Mises à jour incluses • Projet portfolio complet