DeepSpeech on 751 hours of Ukrainian
This model was trained on data available here
Parameters used for training:
train_cudnn
train_batch_size
128dev_batch_size
128test_batch_size
128n_hidden
2048learning_rate
0.0001dropout_rate
0.40- alphabet.txt attached below
epochs
10test dataset
Common Voice 6.1 Ukrainiantest.tsv
dev dataset
Common Voice 6.1 Ukrainiandev.tsv
Test on /mnt/data/CV/uk/clips/test.csv - WER: 0.603569, CER: 0.167068, loss: 32.373993
Best WER:
WER: 0.000000, CER: 0.000000, loss: 7.037546
- wav: file:///mnt/data/CV/uk/clips/common_voice_uk_23551664_prep.wav
- src: "настав час висповідатися"
- res: "настав час висповідатися"
WER: 0.000000, CER: 0.043478, loss: 6.745183
- wav: file:///mnt/data/CV/uk/clips/common_voice_uk_21568868_prep.wav
- src: "ніч віджене ніч прижене"
- res: "ніч віджене ніч прижене "
WER: 0.000000, CER: 0.000000, loss: 6.093888
- wav: file:///mnt/data/CV/uk/clips/common_voice_uk_20900160_prep.wav
- src: "тому я би просив єдине слово виключити"
- res: "тому я би просив єдине слово виключити"
WER: 0.000000, CER: 0.000000, loss: 6.064182
- wav: file:///mnt/data/CV/uk/clips/common_voice_uk_21572586_prep.wav
- src: "той горя не знає"
- res: "той горя не знає"
WER: 0.000000, CER: 0.000000, loss: 4.580412
- wav: file:///mnt/data/CV/uk/clips/common_voice_uk_21377791_prep.wav
- src: "тут це важливо підкреслити"
- res: "тут це важливо підкреслити"
Median WER:
WER: 0.625000, CER: 0.200000, loss: 47.603748
- wav: file:///mnt/data/CV/uk/clips/common_voice_uk_21552603_prep.wav
- src: "далі кладемо інгредієнти шарами — вівсянка сирок горіхи"
- res: "далі кладемо грідієнти шарами бівсянко сирог виріхи "
WER: 0.625000, CER: 0.191489, loss: 47.506721
- wav: file:///mnt/data/CV/uk/clips/common_voice_uk_23553793_prep.wav
- src: "втеча від суспільного життя — це зменшення себе"
- res: "хпечові суспільно о життя це зменшення всебе"
WER: 0.625000, CER: 0.288462, loss: 40.911366
- wav: file:///mnt/data/CV/uk/clips/common_voice_uk_23642647_prep.wav
- src: "малко вже давно навчився розуміти княжича й відповів"
- res: "малко вже навноночися розуміти кляжий черіних повів"
WER: 0.625000, CER: 0.139241, loss: 39.645527
- wav: file:///mnt/data/CV/uk/clips/common_voice_uk_21499704_prep.wav
- src: "волонтери навіть організовували декілька масштабних виставок військових товарів"
- res: "волонтери навіь рглізвали декілька мисштабних вистувик військових тиварів"
WER: 0.625000, CER: 0.098039, loss: 39.339531
- wav: file:///mnt/data/CV/uk/clips/common_voice_uk_23699440_prep.wav
- src: "якщо вона запущена – отже щось повинна обґрунтувати"
- res: "зякщо в на запущена отже щось повинна обкрунтувати"
Worst WER:
WER: 1.500000, CER: 0.142857, loss: 2.103775
- wav: file:///mnt/data/CV/uk/clips/common_voice_uk_20894352_prep.wav
- src: "це неправильно"
- res: "се не правильно"
WER: 2.000000, CER: 0.733333, loss: 37.599571
- wav: file:///mnt/data/CV/uk/clips/common_voice_uk_20982337_prep.wav
- src: "пане володимире"
- res: "ана було му нара"
WER: 2.000000, CER: 0.235294, loss: 13.988269
- wav: file:///mnt/data/CV/uk/clips/common_voice_uk_23552766_prep.wav
- src: "брехня безкінечна"
- res: "брехтя бе з цінечна"
WER: 2.000000, CER: 0.285714, loss: 7.106981
- wav: file:///mnt/data/CV/uk/clips/common_voice_uk_23549772_prep.wav
- src: "чергове"
- res: "черго уве"
WER: 2.000000, CER: 0.222222, loss: 5.891386
- wav: file:///mnt/data/CV/uk/clips/common_voice_uk_23551784_prep.wav
- src: "прирівняв"
- res: "порирів няв"