Données testset¶
Deux niveaux de données de démonstration sont disponibles.
Le sample historique léger sert à vérifier rapidement que le package fonctionne :
Ce fichier reste local et n'est pas versionné. Le code actif ne dépend pas du
dossier archive/.
Chargement du sample léger :
import xyt_gps as xyt
testset_config = xyt.ProjectConfig(
experiment_name="testset-demo",
motiontag_project_name="sample-motiontag",
period="testset",
raw_data_dir=".",
)
raw = xyt.load_sample_gps(max_rows=800)
dataset = xyt.prepare_mobility_dataset(raw, testset_config)
Sample léger¶
load_sample_gps() :
- charge une
storylineGPS réelle fournie pour la démonstration ; - pseudonymise
user_idensample_userpar défaut ; - ajoute des
trip_idsynthétiques aux lignesTrack; - dérive des tables
Trips,JourneysetUserStatisticsminimales ; - valide le schéma produit.
Limite¶
Ces données servent à apprendre le package et à inspecter les états de transformation. Les tables dérivées ne sont pas des exports fournisseur originaux.
Test set générique avec phases¶
Pour tester un flux plus réaliste, utiliser le générateur local :
Il écrit :
Ce test set contient :
| Élément | Valeur |
|---|---|
| expérimentation | test_set |
| utilisateurs | 15 |
| phases | Phase1, Phase2, Phase3 |
| période | printemps 2026 |
| tables | storyline, trips, journeys, user_statistics, user_presence, public_transport_legs si disponible |
Le générateur part de Data/Output/0-landed-data/anonymized. Il applique une seconde pseudonymisation des user_id, remplace les identifiants de lignes, recale les dates au printemps 2026 et applique une translation spatiale déterministe supplémentaire aux géométries.
Le notebook recommandé est :
Les fichiers générés restent locaux et ignorés par git.
Dataset synthétique multi-expérimentations¶
Pour tester un workflow proche de Déclic avec plusieurs expérimentations, plusieurs phases et des trackings incomplets, utiliser la génération synthétique :
import xyt_gps as xyt
synthetic = xyt.generate_synthetic_declic_gps(
users_per_experiment=50,
random_state=42,
)
raw = synthetic.raw
user_presence = synthetic.user_presence
Voir Données synthétiques Déclic.
Licence des données testset¶
Le testset est fourni uniquement pour la démonstration, les tests et l’apprentissage du package. Tout usage commercial, toute tentative de réidentification et toute redistribution hors du dépôt ou d’un fork conservant les mêmes conditions sont interdits sans accord écrit préalable de Bureau Action Située.
Voir LICENSE.sample-data.md et Licence et citation.