简介

听到了! (Heard) 是一个字幕生成器，原理：

使用 Whisper 生成字幕，支持 GPU 模式
GUI 部分则是使用 Ave React 开发的

使用它可以生成 srt 格式字幕：

演示视频见:

听到了！Whisper & GPU 离线字幕提取

使用说明

软件首页：https://rerender2021.github.io/products/heard/

开发者向

本地开发

> npm install
> npm run dev

开发过程中需要确保本机启动了 Whisper 服务器: https://github.com/rerender2021/Whisper-API/releases/tag/1.0.0

下载它，并解压到项目下，确保项目目录结构如下：

- whisper-gpu-server
    - Whisper-API.exe
    - ...
- src
- ...
- package.json

此外，还需要安装 cuda 环境，注意版本：11.7：https://developer.nvidia.com/cuda-11-7-0-download-archive?target_os=Windows&target_arch=x86_64

验证 cuda 安装成功：命令行输入 nvcc -V，看输出：

  Copyright (c) 2005-2022 NVIDIA Corporation
  Built on Tue_May__3_19:00:59_Pacific_Daylight_Time_2022
  Cuda compilation tools, release 11.7, V11.7.64
  Build cuda_11.7.r11.7/compiler.31294372_0

运行 Whisper 还需要安装 ffmpeg，验证是否安装成功：ffmpeg -v

ffmpeg version 2022-02-10-git-b6bb6b9f22-full_build-www.gyan.dev Copyright (c) 2000-2022 the FFmpeg developers
  built with gcc 11.2.0 (Rev7, Built by MSYS2 project)
  ...

功能扩展

默认支持 Whisper 类型为 base 的模型（英语 & 多语言），如果需要使用其它模型，可自行下载，并放在 whisper-gpu-server\model 下。

模型下载地址：openai/whisper#63 (comment)

打包发布

生成 exe

> npm run release

开源协议

MIT

赞赏

:) 如果此软件值得赞赏，可以请作者看小说，一元足足可看八章呢。

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

README.md

README.md

简介

使用说明

开发者向

本地开发

功能扩展

打包发布

开源协议

赞赏

Files

README.md

Latest commit

History

README.md

File metadata and controls

简介

使用说明

开发者向

本地开发

功能扩展

打包发布

开源协议

赞赏