谷歌Colab:Whisper生成字幕和FFmpeg压制

雨云 RainYun.com 服务器,存储桶,游戏云,域名注册 积分换钱 持证

本文章的发布是为了我个人使用方便,所以只是概括性地写了出来并发布到博客。若按照步骤操作不能成功,请留言。

在正文之前,你需要在Google Colab打开或新建一个笔记本。

Whisper部分

先设置硬件加速器。我实际用的是GPU,能正常运行。TPU可能也可以。

顶栏-修改-笔记本设置

Whisper安装和运行,实测时没写输出为文件的参数,所以请直接复制结果:

1
2
!pip install -U openai-whisper
!whisper --language English --model large-v2 --device cuda 视频或音频文件名

FFmpeg部分

要用GPU的话,先安装CUDA。实测时GPU似乎没有运行,因此这个步骤可能无效,存疑

1
2
3
4
!wget https://developer.download.nvidia.com/compute/cuda/repos/ubuntu2204/x86_64/cuda-keyring_1.1-1_all.deb
!sudo dpkg -i cuda-keyring_1.1-1_all.deb
!sudo apt-get update
!sudo apt-get -y install cuda-toolkit-12-4

字幕压制(output.mp4就是生成文件,名字可以自定义):

1
!ffmpeg -hwaccel cuda -i '原视频' -vf "subtitles=字幕文件" -c:v h264_nvenc output.mp4

谷歌Colab:Whisper生成字幕和FFmpeg压制
https://www.yuanzj.top/posts/1468b00f.html
作者
yzl3014
发布于
2025年2月14日
许可协议