faster-whisper部署教程

本文章主要讲述faster-whisper和whisper的对比,以及如何在Windows中部署faster-whisper,faster-whisper号称比whisper更快,大约快4倍,并且占用的资源更少。


解决国内下载torch慢的问题

国内下载torch的速度很慢,那么我们可以先去到官方网站手动下载whl,下载的时候可以使用多线程下载器IDM下载,这样的大大提升下载速度,基本上就几分钟就可以下载完成,然后可以使用pip install命令安装whl安装包。


docker安装funasr

本篇文章主要讲述如何在无网络的机器上部署语音识别服务端,本项目利用开源的 FunASR作为语音识别的服务端,并且使用C++版本,支持多路并发的实时语音识别。


Linux安装jupyter notebook

本篇文章主要讲述如何在CentOS7中部署jupyter notebook的应用,notebook是为了方便python开发者使用,能够记录运行的过程。特别是在运行一些科学计算的python程序时,这个jupyter notebook是很流行,是必备的开发工具之一。


whisper离线安装教程 | 存内网环境下部署whisper

openai开源了whisper,这是一个支持多语言的自动语音识别项目,其中对普通话的支持虽说不是最好的,但是在众多开源的语音识别中,对中文的识别还是蛮不错的。在联网的机器上部署whisper很简单,但是在一些对安全性要求很高的企业内部想要在离线的状态下安装部署whisper,那么将会遇到很多问题,所以这次记录一下我如何在离线状态下安装成功的。最后希望这篇文章能够帮助到你。


whisper使用说明书

在本篇文章中,我会告诉你如何使用whisper提供的参数对音频进行转录操作,包括不限于指定音频的语音,指定使用CPU还是GPU进行转录,指定输出位置,指定输出文档的格式等等,这些内容都会在文档中说明。


FunASR部署

本篇文章主要讲述如何在Liunx中安装开源的语音识别项目FunASR,以及如何导出为ONNX模型。


Python绘制音谱图

在这篇文章中,我将会讲述我是如何通过python来绘制音频的音谱图的。


whispercpp安装教程

基于开源的whispercpp搭建的语音识别项目,支持实时语音识别,可在多个平台中安装部署,whispercpp项目是使用C++对whisper项目的重构,理论上来说C++运行的速度要比Python快,具体的速度还取决于服务器的性能。


faster-whisper-webui

whisper开源之后,很多相关的衍生产品也开源了,比如faster-whisper,它是一个比whisper转录更快的技术实现,转录速度是whisper的4倍,并且占用的显存更少,占用显存是whisper的1/2。而我们这次要讲的是faster-whisper-webui是内置了VAD的支持,可以很精准的定位到每一句话的开始和结束,对于转录长音视频很有意义,可以防止转录长音视频出现幻听的情况。