GMAK is for MAking Kaptions.
beta site in operation is here.
(Works only in Google Chrome for Desktop.)
- Speech recognition with time code
- Downloading captions file in JSON format
- Downloading the audio file
- audio recording
- download in .wav format
- select input source
- video recording
- downloading
- select input source
- i18n
- select language for recognition
- translating into any language afterwards
- then edit them independently
- UI/layout
- not tab. but side menu.
- Audio preview
- with highlighting current caption
- editing captions
- display in seconds or time code, frame
- "shift this and the latter" functionality
- adding/deleting row
- adding/deleting/copying tab
- downloading in vtt format
- using downloaded data
- import into AfterEffects to generate this
below are memo for me in Japanese.
almost same as the future feature above but a bit detailed.
- wavでDLできるようにする
- マイク選択できるようにする
- ビデオのオンオフ
- カメラ選択できるようにする
- 音声と一緒にDLできる
- 後から音声だけDLも可能?要調査
- 認識言語を変更できる
- テーブルごと翻訳して別タブ(takeタブ内に言語タブをつくる)にコピー
- その後は全く別々に編集する。タイムコードの編集も個別に可能。再反映はしない。
- 翻訳APIに文章をどの単位で投げるかは要検討
- まとめて投げないと前後の文脈汲めなそうとか、
- そもそも文の途中で途切れてたりとかするし
- しかしどうしたら一番良いかは言語によって違いそうだし
- 一旦安直に行毎に投げる仕様にするか?
- それとも全文を投げて、各行に分割するためのUIを別で作るか?
- タブじゃなくサイドメニュー的なやつの方が良いかも?
- 音声プレビュー
- タイムラインに応じて行をハイライト表示したい
- 秒・タイムコード・フレームでの表記切替
- 「ここ以降の開始時刻をシフト」する機能
- 行の追加、削除
- 時刻の編集がしにくい。React Hooksの理解が足りない。
- タブの名前変更
- タブの削除
- タブのコピー
- JSON、VTT
- 翻訳がある場合は統合または別ファイルのJSON、または別ファイルのVTTでDL可能
- JSONかVTTからこれを生成するスクリプトを書く
- VTTだとパース面倒そうだしスタイルの反映(もしくは無視)とか考えなきゃいけないのでJSONのみ対応する予定