whisper离线安装教程 | 存内网环境下部署whisper
openai开源了whisper,这是一个支持多语言的自动语音识别项目,其中对普通话的支持虽说不是最好的,但是在众多开源的语音识别中,对中文的识别还是蛮不错的。在联网的机器上部署whisper很简单,但是在一些对安全性要求很高的企业内部想要在离线的状态下安装部署whisper,那么将会遇到很多问题,所以这次记录一下我如何在离线状态下安装成功的。最后希望这篇文章能够帮助到你。
热爱生活,热爱程序
openai开源了whisper,这是一个支持多语言的自动语音识别项目,其中对普通话的支持虽说不是最好的,但是在众多开源的语音识别中,对中文的识别还是蛮不错的。在联网的机器上部署whisper很简单,但是在一些对安全性要求很高的企业内部想要在离线的状态下安装部署whisper,那么将会遇到很多问题,所以这次记录一下我如何在离线状态下安装成功的。最后希望这篇文章能够帮助到你。
在本篇文章中,我会告诉你如何使用whisper提供的参数对音频进行转录操作,包括不限于指定音频的语音,指定使用CPU还是GPU进行转录,指定输出位置,指定输出文档的格式等等,这些内容都会在文档中说明。
基于开源的whispercpp搭建的语音识别项目,支持实时语音识别,可在多个平台中安装部署,whispercpp项目是使用C++对whisper项目的重构,理论上来说C++运行的速度要比Python快,具体的速度还取决于服务器的性能。
whisper开源之后,很多相关的衍生产品也开源了,比如faster-whisper,它是一个比whisper转录更快的技术实现,转录速度是whisper的4倍,并且占用的显存更少,占用显存是whisper的1/2。而我们这次要讲的是faster-whisper-webui是内置了VAD的支持,可以很精准的定位到每一句话的开始和结束,对于转录长音视频很有意义,可以防止转录长音视频出现幻听的情况。
本篇文章主要讲述如何安装whisper-jax。本篇涉及到jax的安装,cuDNN的安装,whisper-jar的安装以及whisper-jar的使用。
这篇文章主要讲如何在CentOS7.9系统中安装OpenAI开源的语音识别项目Whisper。主要涉及到Python版本的升级,Anaconda的安装,CUDA的安装,cuDNN的安装,PyTorch的安装,FFmpeg源码编译安装,Whisper的安装。
本篇文章将会讲述如何在Ubuntu Server 22.04中安装OpenAI开源的语音识别项目Whisper。你能从这篇文章中了解到详细的安装过程,包括Anaconda的安装以及使用,FFmpeg的安装,PyTorch的安装,最重要的是显卡驱动和CUDA的安装。很多人都不会在Linux中安装显卡驱动,那么这篇文章将会讲两种方式安装显卡驱动。