Hi,Friend

热爱生活,热爱程序

从零部署Fun-ASR-Nano实时语音识别并区分说话人教程

这篇文章主要讲述如何在Linux服务器中部署阿里开源的Fun-ASR项目,可以进行实时语音识别和区分说话人。主要记录了我是如何解决安装这些依赖以及其它系统环境的。使用了阿里开源的Fun-ASR-Nano-2512这个模型,进行流式实时语音转写同时可以输出单词级别的时间戳和区分说话人,可以应用到会议实时转写中,也可以应用到智能客户通话实时转写中。

河南方言ASR模型训练最详细文章

河南方言ASR模型训练,基于阿里开源的SenseVoiceSmall训练可以准确识别河南方言的ASR模型,支持返回字级别时间戳,可以识别普通话和河南话,工业级水平的模型,适合应用在生产环境中,识别准确率是目前开源方言模型中识别河南方言最准确的模型之一。

部署Qwen3-ASR

这篇文章主要讲述我是如何在Ubuntu服务器中本地化部署阿里最新开源的ASR大模型的,主要讲述如何部署Qwen3-ASR大模型,在服务器中本地化部署Qwen3-ASR大模型,以及解决vLLM部署Qwen3-ASR的问题。

训练温州方言ASR模型

这篇文章主要记录了我是如何基于这个阿里开源的FunASR来训练方言模型,训练温州方言ASR,基于SenseVoiceSmall训练国内方言模型。

ASR数据集采集系统

这篇文章详细记录我如何在Linux中部署ASR数据集采集系统的,这个ASR数据集采集系统主要讲解采集ASR方言数据集的难题,可以支持多人在线同时录制采集。

部署DeepSeek-OCR-2

这篇文章主要讲述了我在服务器中部署DeepSeek最新开源的OCR项目遇到的问题的解决方法。

Hi,Friend

切换主题 | SCHEME TOOL