Skip to content

Набір різноманітних колекцій даних українською мовою зібраний протягом роботи над антикорупційними проектами. CSV–формат, до деяких датасетів також наявний переклад англійською або російською.

Notifications You must be signed in to change notification settings

lang-uk/ua-gazetteers

Repository files navigation

ua-gazetteers

Набір різноманітних колекцій даних українською мовою, зібраний протягом роботи над антикорупційними проектами. CSV–формат, UTF-8, до деяких датасетів також наявний переклад англійською або російською.

ISO-3166-1 (iso3166-1.csv)

Назви країн та юрисдикцій за стандартом ISO-3166-1. Кожен запис складається з числового коду, Alpha 2 коду (UA, GB, US), Alpha 3 коду (UKR, GBR, USA), та назви українською, російською та англійською.

Джерела даних: UA wiki, EN wiki, RU wiki

Столиці та країни світу (capitals.csv)

Кожен запис складається з назви країни, назви столиці, та регіону (Африка, Азія, Європа, Південна Америка, Північна Америка, Австралія і Океанія). Для деяких країн наприкінці списку вказано декілька столиць.

Джерела даних: UA wiki 1, UA wiki 2

Валюти (currencies.csv)

Кожен запис складається з назви країни, назви офіційної валюти, та її літерного та цифрового кода. Для деяких країн вказано декілька валют.

Джерела даних: UA wiki.

Автівки (cars.csv)

Марка та модель найпоширеніших автівок. На жаль, джерело даних не має нормальної української версії, тож назви деінде російські.

Джерело даних: AUTO.RIA

Мотоцикли (motos.csv)

Марка та модель найпоширеніших мотоциклів. На жаль, джерело даних не має нормальної української версії, тож назви деінде російські.

Джерело даних: AUTO.RIA

Вантажівки (trucks.csv)

Марка та модель найпоширеніших вантажівок та тягачів. На жаль, джерело даних не має нормальної української версії, тож назви деінде російські.

Джерело даних: AUTO.RIA

Човни (boats.csv)

Марка та модель найпоширеніших човнів та яхт. На жаль, джерело даних не має нормальної української версії, тож назви деінде російські.

Джерело даних: AUTO.RIA

Літаки (aircrafts.csv)

Марка та модель найпоширеніших приватних літаків. На жаль, джерело даних не має нормальної української версії, тож назви деінде російські.

Джерело даних: AUTO.RIA

Абревіатури (abbreviations.csv)

Стандартні скорочення слів (наприклад, `"проф." -> "професор")

Джерело даних: ДСТУ 3582-97

About

Набір різноманітних колекцій даних українською мовою зібраний протягом роботи над антикорупційними проектами. CSV–формат, до деяких датасетів також наявний переклад англійською або російською.

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published