2024-03-29
Je n'ai pas beaucoup de temps aujourd'hui, mais j'aimerais bien en finir avec cette migration vers GTFS, au moins avoir toutes les données exportées.
Hier, je me suis arrêté sur les stations adjacentes.
Récapitulons, je peux extraire :
- les lignes /
routes
- les arrêts /
stops
- les stations adjacentes
Ce qu'il manque :
- récupérer les chemins des lignes pour les ajouter dans les stations adjacentes.
- récupérer les stations uniques dans l'autre fichier fourni par IDFM
- insérer l'id unique dans les stations
Je pense qu'avec ça je suis plutôt tranquille.
Ajouter le chemin entre les deux stations
Il me faut les stations pour avoir leur position, les chemins des lignes, et les stations adjacentes.
Les coordonnées des lignes sont du type :
MultiLineString
, je suppose que c'est pour l'aller-retour, mais à vérifier.
En vérifiant, je vois que ce n'est pas le cas, on est plutôt sur une moyenne de 4 Lines.
En regardant en prenant juste
from
et
to
et en regardant dans chaque
Line
, j'arrive à avoir ces stats :
❯ node scripts/extract-data.js
Adjacent stations with paths: 1572
Adjacent stations without path: 2018
Ce qui me parait beaucoup trop comme écart. Est-ce que je n'aurai pas trop de stations adjacentes ? Je vais vérifier en regardant dans les données actuelles, j'ai écrit un test, j'en ai 1560, ça parait cohérent du coup.
Donc finalement, on n'est pas si mal, si j'ai bien compris.
En analysant les données, je me rends compte que j'ai des
adjacentStations
(est-ce que j'aime ce nom ?), qui sont en
des chemins entre plusieurs stations adjacentes, mais plutôt extérieur (je crois), comme
Quatre Septembre - Opéra
.
Ce que je pense de ça, c'est que certains changements sont plus simples à faire à pied, qu'en transport.
Si par exemple, un utilisateur insère
Opéra
, puis
Quatre Septembre
, je vais les lier avec la 3, donc peu importe que
le chemin à pied existe, je crois ?
Par contre, je me demande si pour l'algo d'affichage, il ne faudrait pas que j'ai le from et to stop_unique_id.
C'est le moment de s'y mettre, j'ai l'impression.
Je télécharge les données généralisées, le csv est pas mal contrairement à celui des tracés des lignes.