Construire un workflow reproductible de pattern
Construire un workflow reproductible de pattern
Objectif
À la fin, vous aurez reproduit cette étape de bout en bout sur un cas test.
Avant de commencer
- Annotations d’entraînement déjà préparées.
- Classes cibles définies sans ambiguïté.
- Jeu de validation séparé.
Pas à pas
- Versionner données, scripts et paramètres ensemble.
- Utiliser un fichier de configuration unique (
config.yaml). - Séparer entraînement, validation et inférence.
- Conserver un journal d’exécution avec hash git.
- Produire un rapport automatique par run.
À copier-coller
project: pattern_workflow
train_csv: data/train.csv
valid_csv: data/valid.csv
model_out: models/model_v1.pkl
seed: 42
Vérifier que ça marche
- Les métriques du modèle sont calculées.
- Les erreurs majeures sont identifiées.
- Le modèle final est sauvegardé et traçable.
En cas de problème
- Rééquilibrer les classes d’entraînement.
- Vérifier la qualité des annotations de vérité terrain.