Hi,Friend

热爱生活,热爱程序

docker安装funasr

本篇文章主要讲述如何在无网络的机器上部署语音识别服务端,本项目利用开源的 FunASR作为语音识别的服务端,并且使用C++版本,支持多路并发的实时语音识别。

Linux安装jupyter notebook

本篇文章主要讲述如何在CentOS7中部署jupyter notebook的应用,notebook是为了方便python开发者使用,能够记录运行的过程。特别是在运行一些科学计算的python程序时,这个jupyter notebook是很流行,是必备的开发工具之一。

whisper离线安装教程 | 存内网环境下部署whisper

openai开源了whisper,这是一个支持多语言的自动语音识别项目,其中对普通话的支持虽说不是最好的,但是在众多开源的语音识别中,对中文的识别还是蛮不错的。在联网的机器上部署whisper很简单,但是在一些对安全性要求很高的企业内部想要在离线的状态下安装部署whisper,那么将会遇到很多问题,所以这次记录一下我如何在离线状态下安装成功的。最后希望这篇文章能够帮助到你。

whisper使用说明书

在本篇文章中,我会告诉你如何使用whisper提供的参数对音频进行转录操作,包括不限于指定音频的语音,指定使用CPU还是GPU进行转录,指定输出位置,指定输出文档的格式等等,这些内容都会在文档中说明。

源码编译安装gcc

在编译开源的FunASR项目的C++代码时,可能要求的gcc版本不符合,需要升级gcc版本,但是从网上搜索升级gcc方式,大部分都是通过简单的yum命令方式升级,我也尝试了这个方式,这种方式并不能升级到最新的版本,想要升级到最新版本需要自行下载源码,通过源码编译方式升级。

FunASR部署

本篇文章主要讲述如何在Liunx中安装开源的语音识别项目FunASR,以及如何导出为ONNX模型。

apt install报错解决方案

最近在一台Ubuntu 22.04系统中部署语音识别项目,不知道怎么,我使用apt install安装软件时报错,无论安装什么软件都是报同一个错误E: Unmet dependencies. Try 'apt --fix-broken install' with no packages

whispercpp安装教程

基于开源的whispercpp搭建的语音识别项目,支持实时语音识别,可在多个平台中安装部署,whispercpp项目是使用C++对whisper项目的重构,理论上来说C++运行的速度要比Python快,具体的速度还取决于服务器的性能。

faster-whisper-webui

whisper开源之后,很多相关的衍生产品也开源了,比如faster-whisper,它是一个比whisper转录更快的技术实现,转录速度是whisper的4倍,并且占用的显存更少,占用显存是whisper的1/2。而我们这次要讲的是faster-whisper-webui是内置了VAD的支持,可以很精准的定位到每一句话的开始和结束,对于转录长音视频很有意义,可以防止转录长音视频出现幻听的情况。

Hi,Friend

切换主题 | SCHEME TOOL