-
Notifications
You must be signed in to change notification settings - Fork 18
New issue
Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.
By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.
Already on GitHub? Sign in to your account
Adresses avec codes postaux multiples dans les exports #222
Comments
Bonsoir @amatissart , et merci du signalement. |
Je me permets de relancer ce sujet. Je serais preneur de quelques précisions pour comprendre l'origine du problème, et éventuellement proposer une correction. Si je comprends bien, le contenu de l'export .csv est déterminé par ce fichier: Et dans cette requête SQL, c'est le code postal tiré des polygones d'Openstreetmap qui est utilisé en priorité, en correspondance avec le code INSEE de l'adresse considérée, via le tag bano/bano/sql/export_csv_dept.sql Line 39 in 2a295f5
bano/bano/sql/export_csv_dept.sql Lines 83 to 84 in 2a295f5
D'où l'utilisation des relations suivantes qui portent les tags Ce qui expliquerait pourquoi les relations avec Plus dommage encore, le code postal provenant directement de la source d'adresses (a priori le plus fiable ?), ne semble donc jamais être utilisé. Est-ce qu'il y a une motivation particulière pour l'implémentation existante ? Ne serait-il pas pertinent au moins d'utiliser la valeur diff --git a/bano/sql/export_csv_dept.sql b/bano/sql/export_csv_dept.sql
index 408327b..d330267 100644
--- a/bano/sql/export_csv_dept.sql
+++ b/bano/sql/export_csv_dept.sql
@@ -36,7 +36,7 @@ AS
'"',CHR(39)),
', ',' '),
',',' ') AS voie,
- COALESCE(cp.postal_code, lp.cp, ca.code_postal) AS code_post,
+ COALESCE(o.code_postal, od.code_postal, c.code_postal, cp.postal_code, lp.cp, ca.code_postal) AS code_post,
COALESCE(cn.libelle,initcap(ca.nom_com)) AS ville,
CASE
WHEN u.num=o.num THEN 'OSM' |
J'ai totalement laissé le sujet de côté suite à votre message de décembre, désolé
Oui je suis d'accord, et c'est bien dans la logique de privilégier la donnée attachée directement aux adresses. Le code actuel ne le fait pas, et en fait ne l'a jamais fait. Je viens d'ouvrir #237 pour tracer l'évolution. Ca devrait assécher le souci de valeurs multiples dans le sens où la BAN propose pour chaque adresse un CP. Le CP OSM, associé à l'adresse OSM, sera toujours prioritaire dans le CSV. Pour les endroits où le CP BAN est erroné (comme typiquement dans le XVI où ne figure pour la BAN que le CP 75016) il s'agira donc de correctement renseigner les adresses OSM avec le CP 75116 sur environ la moitié de l'arrondissement. |
@amatissart |
@vdct Pour moi, la seule question en suspens reste l'utilisation ou non des polygones Quant aux codes 75016 et 75116 dans la BAN, savez-vous si le problème a déjà été signalé pour être résolu à la source ? |
Merci pour votre retour Le souci est qu'on dispose d'au moins 2 sources de CP qui couvrent intégralement le territoire : les polygones postaux d'OSM et les CPs placés sur chaque adresse de la BAN. On considère que les CPs placés à l'adresse sur OSM sont prioritaires, via en effet le tag addr:postcode. Mais il est peu présent, environ 1 million d'occurrences. Si en seconde priorité on choisit le CP des polygones postaux, par croisement spatial, alors c'est cette source qui va remplir la quasi intégralité des valeurs de CPs. A l'inverse si on priorise la source de CPs BAN, alors on n'utilisera pas du tout les polygones postaux.
|
Bonjour,
Merci pour votre aide. |
Bonsoir, |
Bonjour @vdct , j'ai remarqué la même chose dans le format JSON : {"id":"674824020","citycode":"67482","type":"street","name":"Rue Livio","postcode":"67000;67100;67200","lat":48.552213,"lon":7.740345,...}
{"id":"060884805","citycode":"06088","type":"street","name":"Rue Parmentier","postcode":"06000;06100;06200;06300","lat":43.713811,"lon":7.259219...}
{"id":"060882370","citycode":"06088","type":"street","name":"Avenue de Fabron","postcode":"06000;06100;06200;06300","lat":43.689717,"lon":7.220905,...} Je ne sais pas si cela a un rapport, mais ces rues sont présentes deux fois avec le même {"id":"060884805","housenumbers":{"10":{"lat":43.713939,"lon":7.260622},"11":{"lat":43.713805,"lon":7.26026},"13":{"lat":43.713727,"lon":7.260071},"14":{"lat":43.714072,"lon":7.260385},"15":{"lat":43.713715,"lon":7.259868},"16":{"lat":43.714068,"lon":7.260087},"17":{"lat":43.713713,"lon":7.259658},"18":{"lat":43.713957,"lon":7.259879},"2":{"lat":43.713969,"lon":7.261298},"20":{"lat":43.714006,"lon":7.259772},"22":{"lat":43.714083,"lon":7.259521},"24":{"lat":43.713884,"lon":7.259405},"25":{"lat":43.713721,"lon":7.258279},"25 A":{"lat":43.713469,"lon":7.258273},"26":{"lat":43.713845,"lon":7.258142},"27":{"lat":43.713708,"lon":7.257952},"28":{"lat":43.713843,"lon":7.257883},"29":{"lat":43.713419,"lon":7.257861},"3":{"lat":43.713648,"lon":7.261191},"30":{"lat":43.713836,"lon":7.257725},"31":{"lat":43.713695,"lon":7.257674},"32":{"lat":43.713798,"lon":7.257596},"33":{"lat":43.713683,"lon":7.257452},"35":{"lat":43.713676,"lon":7.257296},"4":{"lat":43.713968,"lon":7.261162},"6":{"lat":43.713937,"lon":7.260912},"8":{"lat":43.71413,"lon":7.260881},"8 bis":{"lat":43.71394,"lon":7.260761},"9":{"lat":43.713816,"lon":7.260551}}}
{"id":"060884805","housenumbers":{"12":{"lat":43.713904,"lon":7.2605}}} |
Merci pour le signalement, c'était une regression que je viens de corriger, ça devrait profiter aux exports de cette nuit.
Il n'y a pas de rapport non. Le doublon vient du fait que le paradigme ici rattache les CPs à la rue et non au numero, or dans OSM et dans la BAN les CPs sont rattachés potentiellement au numéro. En l'occurence ici, tous les numeros sauf le 12 proviennent d'OSM, où ils héritent de la liste de CPs trouvés dans OSM aussi. Le 12 provient de la BAN qui lui associe uniquement le CP 06100. Ce CP est conservé jusqu'au bout, d'où une entrée distincte. dans le JSON. Si le 12 existe sur le terrain, alors il aurait sa place dans OSM où ce serait l'occasion d'harmoniser les CPs de cette rue |
Certaines adresses contiennent plusieurs codes postaux, séparées par un
;
dans l'export .csv. Cela semble être un changement assez récent dans le format des exports.Ainsi pour toutes les adresses situées à Nice:
ou dans Paris 16e:
Est-ce une limitation connue dans les sources de données ou le processus d'export ? Il me semblait pourtant que la distinction 75016 / 75116 (par exemple) était réalisée par le passé.
Ce format avec le séparateur
;
dans les fichiers .csv est-il attendu ? D'après ce que j'ai pu voir ce point n'est pas documenté, et le fichierlisezmoi-bano.txt
précise même:bano/out/lisezmoi-bano.txt
Line 77 in d21bf84
The text was updated successfully, but these errors were encountered: