Набір різноманітних колекцій даних українською мовою, зібраний протягом роботи над антикорупційними проектами. CSV–формат, UTF-8, до деяких датасетів також наявний переклад англійською або російською.
Назви країн та юрисдикцій за стандартом ISO-3166-1. Кожен запис складається з числового коду, Alpha 2 коду (UA, GB, US), Alpha 3 коду (UKR, GBR, USA), та назви українською, російською та англійською.
Джерела даних: UA wiki, EN wiki, RU wiki
Кожен запис складається з назви країни, назви столиці, та регіону (Африка, Азія, Європа, Південна Америка, Північна Америка, Австралія і Океанія). Для деяких країн наприкінці списку вказано декілька столиць.
Джерела даних: UA wiki 1, UA wiki 2
Кожен запис складається з назви країни, назви офіційної валюти, та її літерного та цифрового кода. Для деяких країн вказано декілька валют.
Джерела даних: UA wiki.
Марка та модель найпоширеніших автівок. На жаль, джерело даних не має нормальної української версії, тож назви деінде російські.
Джерело даних: AUTO.RIA
Марка та модель найпоширеніших мотоциклів. На жаль, джерело даних не має нормальної української версії, тож назви деінде російські.
Джерело даних: AUTO.RIA
Марка та модель найпоширеніших вантажівок та тягачів. На жаль, джерело даних не має нормальної української версії, тож назви деінде російські.
Джерело даних: AUTO.RIA
Марка та модель найпоширеніших човнів та яхт. На жаль, джерело даних не має нормальної української версії, тож назви деінде російські.
Джерело даних: AUTO.RIA
Марка та модель найпоширеніших приватних літаків. На жаль, джерело даних не має нормальної української версії, тож назви деінде російські.
Джерело даних: AUTO.RIA
Стандартні скорочення слів (наприклад, `"проф." -> "професор")
Джерело даних: ДСТУ 3582-97