gugik2osm

ENG: Tool that prepares packages for JOSM (OpenStreetMap data editor) for easy imports of data from Polish government registries.

Narzędzie do porównywania i przygotowywania importów uwolnionych danych państwowych do OpenStreetMap (OSM).

Pełny opis w dziale FAQ/Pomocy. Zachęcamy do korzystania i zgłaszania uwag oraz pomysłów.

Mamy nadzieję uczynić z tego pomocne narzędzie dla edytorów, które ułatwi import danych z otwartych danych urzędowych do OSM.

https://budynki.openstreetmap.org.pl

Lista rzeczy do zrobienia:

Integracja danych budynków Bdot10k
Integracja danych adresowych w tym algorytm wyszukiwania adresów zdublowanych i błednych

Narzędzia pomocnicze

Przy okazji tworzenia tej aplikacji napisałem kilka skryptów pomocniczych do importu danych z plików XML (GML) z adresami z PRG czy łączenia się z do API GUS w celu pobrania plików z nazwami gmin, miejscowości, ulic (TERYT).

Poniżej krótki opis, może komuś przydadzą się te skrypty w innym celu.

Plik:

processing/scripts/prg_dl.py

Pobiera spakowane pliki XML (GML) z danymi adresowymi (PRG) z geoportalu.

Użycie (windows):

python prg_dl.py --output_dir "D:/temp/"

Dostępny parametry:

--output_dir - ścieżka gdzie chcesz zapisać pliki.
--only - pobierz tylko plik dla wybranego województwa. Podaj dwucyfrowy kod TERYT.

processing/parsers/prg.py

Parsuje pliki XML (GML) z danymi adresowymi (PRG). Może zapisać dane wynikowe do bazy PostgreSQL, SQLite, plików CSV lub wydrukuje w konsoli (stdout). Parsowanie metodą SAX dzięki czemu zużycie pamięci RAM jest bardzo niewielkie (50-100mb).

Użycie (windows):

python prg.py --input "D:/ścieżka/do/pliku/02_PunktyAdresowe.zip --writer stdout --limit 5

Dostępne parametry:

--input - ścieżka do pliku do przetworzenia
--writer - której metody zapisu danych wyjściowych chcemy użyć (postgresql, sqlite, csv, stdout)
--csv_directory - w przypadku wybrania writer csv ten parametr ustawia ścieżkę (folder) gdzie pliki wyjściowe będą zapisane
--sqlite_file - w przypadku wybrania writer sqlite ten parametr ustawia ścieżkę do bazy sqlite gdzie będą zapisywane dane
--dsn - w przypadku wybrania writer postgresql
--prep_tables - jeżeli zapisujemy do bazy danych (postgresql lub sqlite) to ten parametr (wystarczy że sam jest obecny nie trzeba mu nic dodatkowo podawać typu true, 1 etc.) powoduje że najpierw tabele w bazie będą usunięte i odtworzone, przydatne przy ładowaniu pierwszego z serii plików
--limit - przetwórz tylko tyle wierszy. Przydatne do testowania.

processing/scripts/teryt_dl.py

Pobiera spakowane pliki z nazwami gmin, miejscowości, ulic z API rejestru TERYT prowadzonego przez GUS i ładuje je do bazy PostgreSQL.

API GUS dla rejestru TERYT: https://api.stat.gov.pl/Home/TerytApi

Użycie (windows):

python teryt_dl.py --api_env test --api_user UzytkownikTestowy --api_password demo1234 --dsn "host=localhost port=5432 dbname=test user=test password=test"

Dostępne parametry:

--api_env - środowisko API (prod, test)
--api_user - użytkownik do API, którego zakłada nam GUS
--api_password - hasło do użytkownika API
--dsn - dane do połączenia się z bazą PostgreSQL (parametr przekazywany do metody connect biblioteki psycopg2, szczegóły: https://www.psycopg.org/docs/module.html#psycopg2.connect )

Lokalne środowisko

Lokalne środowisko deweloperskie można uruchomić w kontenerach Docker. Kontener nie jest w pełni funkcjonalny w porównaniu do środowiska produkcyjnego, ale podstawowe rzeczy poza aktualizacją danych powinny działać.

Bazę danych można odtworzyć z backupu. Można użyć PostgreSQL+PostGIS zainstalowanego bezpośrednio na maszynie lub utworzyć kontener Docker z bazą (co pewnie jest rozwiązaniem prostszym skoro i tak mamy zainstalowanego Dockera żeby odpalić aplikację).

Uruchomienie kontenera z Postgisem:

docker run --name "postgis" --shm-size=4g -e MAINTAINANCE_WORK_MEM=512MB -p 25432:5432 -e POSTGRES_USER=postgres -e POSTGRES_PASS=1234 -e POSTGRES_DBNAME=gis -d -t kartoza/postgis

--name - nadaje nazwę dla kontenera, można wybrać dowolną
--shm-size=4g - dodatkowy parametr zwiększający ilość miejsca tymczasowego, raczej nie jest niezbędny, ale nie zaszkodzi
-e MAINTAINANCE_WORK_MEM=512MB - zwiększamy dostępną pamięć dla procesów budujących indeksy itp, nie jest niezbędne, ale może się przydać
-p 25432:5432 - mapujemy porty, numer po lewej to ten którym się będziemy mogli połączyć do bazy z naszego systemu
-e POSTGRES_USER=postgres - nazwa domyślnego użytkownika dla bazy PostgreSQL
-e POSTGRES_PASS=1234 - hasło dla powyższego
-e POSTGRES_DBNAME=gis - tworzy od razu nową bazę (z odblokowanym rozszerzenim PostGIS)
-d - uruchamia kontener w tle dzięki czemu będzie można zamknąć okno konsoli bez zatrzymywania bazy
-t kartoza/postgis - nazwa obrazu do uruchomienia, korzystamy z obrazu od razu skonfigurowanego z bazą PostgreSQL i dodatkiem PostGIS

Przywrócenie niezbędnych tabel:

Najpierw tworzymy schematy "prg" i "teryt:

psql -d gis -h localhost -p 25432 -U postgres -c "create schema prg;"

psql -d gis -h localhost -p 25432 -U postgres -c "create schema teryt;"

Następnie przywracamy kilka wybranych tabel i indeksów do schematów public i prg:

pg_restore --jobs 2 --no-owner -n public -d gis -h localhost -p 25432 -U postgres db.bak

pg_restore --jobs 2 --no-owner -n prg -t delta -t lod1_buildings -I delta_gis -I delta_lokalnyid -I delta_simc -I lod1_buildings_geom_idx -I lod1_buildings_pkey -d gis -h localhost -p 25432 -U postgres db.bak

pg_restore --jobs 2 --no-owner -n teryt -d gis -h localhost -p 25432 -U postgres db.bak

Na końcu trzeba podać ścieżkę do pliku jeżeli nie znajduje się w tym folderze w którym mamy otworzoną konsole.

Budowa i uruchomienie kontenera

Przechodzimy w konsoli do folderu gdzie mamy sklonowane repozytorium (do folderu gdzie jest Dockerfile) i uruchamiamy:

docker build -t gugik2osm .

-t gugik2osm - oznacza nazwę dla naszego obrazu, można zmienić
. - oznacza obecną lokalizację

Następnie uruchamiamy kontener:

docker run --rm -p 45000:80 --mount type=bind,source=C:/Users/Tomasz/PycharmProjects/gugik2osm/app,target=/opt/gugik2osm/app --mount type=bind,source=C:/Users/Tomasz/PycharmProjects/gugik2osm/web,target=/opt/gugik2osm/web -e dsn="host=172.17.0.2 port=5432 user=postgres password=1234 dbname=gis" -e reCaptchaSecretToken="twojTokenPrywatnyCaptcha" -it gugik2osm

--rm - powoduje że po wyłączeniu kontenera jest on automatycznie usuwany
-p 45000:80 - mapowanie portów, numer po lewej oznacza pod jakim portem będziemy mogli się połączyć do kontenera z "zewnątrz" czyli naszej maszyny
--mount type=bind,source=C:/Users/Tomasz/PycharmProjects/gugik2osm/app,target=/opt/gugik2osm/app - montuje katalog z naszej maszyny w określonym miejscu w kontenerze, trzeba podawać ścieżki absolutne, zmień lewą część na swoją ścieżkę tak by prowadziła do folderów app i web w sklonowanym repozytorium
--mount type=bind,source=C:/Users/Tomasz/PycharmProjects/gugik2osm/web,target=/opt/gugik2osm/web - j.w.
-e dsn="host=172.17.0.2 port=5432 user=postgres password=1234 dbname=gis" - dodaj parametr z danymi do połączenia do bazy danych, ip podajemy dla kontenera od bazy danych (jeżeli baza była uruchamiana instrukcjami powyżej). Można to sprawdzić komendą: docker inspect -f '{{range .NetworkSettings.Networks}}{{.IPAddress}}{{end}}' postgis (gdzie postgis to nazwa kontenera z bazą danych). Zwróć uwagę że podajemy port pod którym postgres jest uruchomiony w kontenerze, ponieważ kontenery rozmawiają ze sobą w jednej sieci wirtualnej, trochę inaczej niż kontener z hostem.
-e reCaptchaSecretToken="twojTokenPrywatnyCaptcha" - jeżeli chcesz używać funkcji zgłaszania adresów/budynków wstaw tutaj swój token captcha v2 utworzony dla domeny localhost
-it - przeciwieństwo -d, uruchamia kontener "na pierwszym planie", dzięki czemu będziemy mogli wykonywać w nim komendy w razie potrzeby
gugik2osm - nazwa obrazu który zbudowaliśmy w poprzednim kroku

Po uruchomieniu kontenera odpali się terminal bash.

Zmiana plików strony/aplikacji

Ostatnią rzeczą jaką powinniśmy zmienić jest url dla serwera z kafelkami MVT. W pliku web/map.js znajdujemy fragment:

"mvt-tiles": {
    "type": "vector",
    "tiles": [
        "https://budynki.openstreetmap.org.pl/tiles/{z}/{x}/{y}.pbf"
    ]
}

i zamieniamy url na:

"http://localhost:45000/tiles/{z}/{x}/{y}.pbf"

(port podajemy taki jaki ustawiliśmy w parametrze -p dla kontenera aplikacji).

Jeżeli używasz swojego tokenu captcha to zmień też token publiczny w pliku map.js

Wszystkie zmiany dla plików HTML/JS i Python powinny być automatycznie widoczne po odświeżeniu strony (rzeczy typu pliki js mogą wymagać odświeżenia wraz z usunięciem cache: ctrl+f5).

W przeglądarce przejdź do http://localhost:45000 (lub pod innym portem zależnie od tego co zostało ustawione w komendzie docker run).

Name		Name	Last commit message	Last commit date
Latest commit History 302 Commits
app		app
conf		conf
db_scripts		db_scripts
imposm3		imposm3
processing		processing
web		web
.gitignore		.gitignore
Dockerfile		Dockerfile
LICENSE		LICENSE
README.md		README.md
requirements.txt		requirements.txt

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

gugik2osm

Lista rzeczy do zrobienia:

Narzędzia pomocnicze

Plik:

processing/scripts/prg_dl.py

processing/parsers/prg.py

processing/scripts/teryt_dl.py

Lokalne środowisko

Uruchomienie kontenera z Postgisem:

Przywrócenie niezbędnych tabel:

Budowa i uruchomienie kontenera

Zmiana plików strony/aplikacji

About

Releases

Packages

Languages

License

mskakuj/gugik2osm

Folders and files

Latest commit

History

Repository files navigation

gugik2osm

Lista rzeczy do zrobienia:

Narzędzia pomocnicze

Plik:

processing/scripts/prg_dl.py

processing/parsers/prg.py

processing/scripts/teryt_dl.py

Lokalne środowisko

Uruchomienie kontenera z Postgisem:

Przywrócenie niezbędnych tabel:

Budowa i uruchomienie kontenera

Zmiana plików strony/aplikacji

About

Resources

License

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages