Skip to content

DeepSpeech on 751 hours of Ukrainian

Compare
Choose a tag to compare
@robinhad robinhad released this 17 Feb 13:41
66e801b

This model was trained on data available here
Parameters used for training:

  • train_cudnn
  • train_batch_size 128
  • dev_batch_size 128
  • test_batch_size 128
  • n_hidden 2048
  • learning_rate 0.0001
  • dropout_rate 0.40
  • alphabet.txt attached below
  • epochs 10
  • test dataset Common Voice 6.1 Ukrainian test.tsv
  • dev dataset Common Voice 6.1 Ukrainian dev.tsv

Test on /mnt/data/CV/uk/clips/test.csv - WER: 0.603569, CER: 0.167068, loss: 32.373993
Best WER:

WER: 0.000000, CER: 0.000000, loss: 7.037546

  • wav: file:///mnt/data/CV/uk/clips/common_voice_uk_23551664_prep.wav
  • src: "настав час висповідатися"
  • res: "настав час висповідатися"

WER: 0.000000, CER: 0.043478, loss: 6.745183

  • wav: file:///mnt/data/CV/uk/clips/common_voice_uk_21568868_prep.wav
  • src: "ніч віджене ніч прижене"
  • res: "ніч віджене ніч прижене "

WER: 0.000000, CER: 0.000000, loss: 6.093888

  • wav: file:///mnt/data/CV/uk/clips/common_voice_uk_20900160_prep.wav
  • src: "тому я би просив єдине слово виключити"
  • res: "тому я би просив єдине слово виключити"

WER: 0.000000, CER: 0.000000, loss: 6.064182

  • wav: file:///mnt/data/CV/uk/clips/common_voice_uk_21572586_prep.wav
  • src: "той горя не знає"
  • res: "той горя не знає"

WER: 0.000000, CER: 0.000000, loss: 4.580412

  • wav: file:///mnt/data/CV/uk/clips/common_voice_uk_21377791_prep.wav
  • src: "тут це важливо підкреслити"
  • res: "тут це важливо підкреслити"

Median WER:

WER: 0.625000, CER: 0.200000, loss: 47.603748

  • wav: file:///mnt/data/CV/uk/clips/common_voice_uk_21552603_prep.wav
  • src: "далі кладемо інгредієнти шарами — вівсянка сирок горіхи"
  • res: "далі кладемо грідієнти шарами бівсянко сирог виріхи "

WER: 0.625000, CER: 0.191489, loss: 47.506721

  • wav: file:///mnt/data/CV/uk/clips/common_voice_uk_23553793_prep.wav
  • src: "втеча від суспільного життя — це зменшення себе"
  • res: "хпечові суспільно о життя це зменшення всебе"

WER: 0.625000, CER: 0.288462, loss: 40.911366

  • wav: file:///mnt/data/CV/uk/clips/common_voice_uk_23642647_prep.wav
  • src: "малко вже давно навчився розуміти княжича й відповів"
  • res: "малко вже навноночися розуміти кляжий черіних повів"

WER: 0.625000, CER: 0.139241, loss: 39.645527

  • wav: file:///mnt/data/CV/uk/clips/common_voice_uk_21499704_prep.wav
  • src: "волонтери навіть організовували декілька масштабних виставок військових товарів"
  • res: "волонтери навіь рглізвали декілька мисштабних вистувик військових тиварів"

WER: 0.625000, CER: 0.098039, loss: 39.339531

  • wav: file:///mnt/data/CV/uk/clips/common_voice_uk_23699440_prep.wav
  • src: "якщо вона запущена – отже щось повинна обґрунтувати"
  • res: "зякщо в на запущена отже щось повинна обкрунтувати"

Worst WER:

WER: 1.500000, CER: 0.142857, loss: 2.103775

  • wav: file:///mnt/data/CV/uk/clips/common_voice_uk_20894352_prep.wav
  • src: "це неправильно"
  • res: "се не правильно"

WER: 2.000000, CER: 0.733333, loss: 37.599571

  • wav: file:///mnt/data/CV/uk/clips/common_voice_uk_20982337_prep.wav
  • src: "пане володимире"
  • res: "ана було му нара"

WER: 2.000000, CER: 0.235294, loss: 13.988269

  • wav: file:///mnt/data/CV/uk/clips/common_voice_uk_23552766_prep.wav
  • src: "брехня безкінечна"
  • res: "брехтя бе з цінечна"

WER: 2.000000, CER: 0.285714, loss: 7.106981

  • wav: file:///mnt/data/CV/uk/clips/common_voice_uk_23549772_prep.wav
  • src: "чергове"
  • res: "черго уве"

WER: 2.000000, CER: 0.222222, loss: 5.891386

  • wav: file:///mnt/data/CV/uk/clips/common_voice_uk_23551784_prep.wav
  • src: "прирівняв"
  • res: "порирів няв"