Skip to content

Latest commit

 

History

History
97 lines (62 loc) · 2.63 KB

README.md

File metadata and controls

97 lines (62 loc) · 2.63 KB

build pack

简介

听到了! (Heard) 是一个字幕生成器,原理:

  • 使用 Whisper 生成字幕,支持 GPU 模式
  • GUI 部分则是使用 Ave React 开发的

heard-usage

使用它可以生成 srt 格式字幕:

srt-demo

演示视频见:

使用说明

开发者向

本地开发

> npm install
> npm run dev

开发过程中需要确保本机启动了 Whisper 服务器: https://github.com/rerender2021/Whisper-API/releases/tag/1.0.0

下载它,并解压到项目下,确保项目目录结构如下:

- whisper-gpu-server
    - Whisper-API.exe
    - ...
- src
- ...
- package.json

验证 cuda 安装成功:命令行输入 nvcc -V,看输出:

  Copyright (c) 2005-2022 NVIDIA Corporation
  Built on Tue_May__3_19:00:59_Pacific_Daylight_Time_2022
  Cuda compilation tools, release 11.7, V11.7.64
  Build cuda_11.7.r11.7/compiler.31294372_0
  • 运行 Whisper 还需要安装 ffmpeg,验证是否安装成功:ffmpeg -v
ffmpeg version 2022-02-10-git-b6bb6b9f22-full_build-www.gyan.dev Copyright (c) 2000-2022 the FFmpeg developers
  built with gcc 11.2.0 (Rev7, Built by MSYS2 project)
  ...

功能扩展

默认支持 Whisper 类型为 base 的模型(英语 & 多语言),如果需要使用其它模型,可自行下载,并放在 whisper-gpu-server\model 下。

打包发布

  • 生成 exe
> npm run release

开源协议

MIT

赞赏

:) 如果此软件值得赞赏,可以请作者看小说,一元足足可看八章呢。