SenseVoiceSmall区分说话人语音识别在通话录音转写中的优化 | FunASR区分说话人优化

这篇文章主要解决FunASR中使用SenseVoiceSmall模型在外呼系统中对通话录音转写识别区分说话人准确率的问题。文章讲述了如何提升FunASR区分说话人准确率，如何提高企业部署并发性问题。

部署kotoba_whisper文档

本地化部署开源的日语语音识别项目kotoba_whisper，可以区分说话人，可以返回时间戳，能精准识别日语，是基于whisper做的二次开发优化，专门针对日语进行语音转写的模型。这篇文档主要记录我当时部署中遇到的问题以及我是如何解决的，希望这篇文章对你有一定的帮助。

从零部署Fun-ASR-Nano实时语音识别并区分说话人教程

这篇文章主要讲述如何在Linux服务器中部署阿里开源的Fun-ASR项目，可以进行实时语音识别和区分说话人。主要记录了我是如何解决安装这些依赖以及其它系统环境的。使用了阿里开源的Fun-ASR-Nano-2512这个模型，进行流式实时语音转写同时可以输出单词级别的时间戳和区分说话人，可以应用到会议实时转写中，也可以应用到智能客户通话实时转写中。

河南方言ASR模型训练最详细文章

河南方言ASR模型训练，基于阿里开源的SenseVoiceSmall训练可以准确识别河南方言的ASR模型，支持返回字级别时间戳，可以识别普通话和河南话，工业级水平的模型，适合应用在生产环境中，识别准确率是目前开源方言模型中识别河南方言最准确的模型之一。

部署Qwen3-ASR

这篇文章主要讲述我是如何在Ubuntu服务器中本地化部署阿里最新开源的ASR大模型的，主要讲述如何部署Qwen3-ASR大模型，在服务器中本地化部署Qwen3-ASR大模型，以及解决vLLM部署Qwen3-ASR的问题。

训练温州方言ASR模型

这篇文章主要记录了我是如何基于这个阿里开源的FunASR来训练方言模型，训练温州方言ASR，基于SenseVoiceSmall训练国内方言模型。

ASR数据集采集系统

这篇文章详细记录我如何在Linux中部署ASR数据集采集系统的，这个ASR数据集采集系统主要讲解采集ASR方言数据集的难题，可以支持多人在线同时录制采集。

GPU版本FunASR推理速度测试

这篇文章主要测试了源码编译GPU版本的FunASR在单卡和多卡中的转写速度和资源占用情况。

源码编译GPU版本FunASR

这篇文章主要详细记录了我是如何在Linux系统中通过源码编译GPU版本的FunASR的过程，包括model.torchscript模型的转换。虽然可以直接拉取官方的docker镜像，但是镜像拉取速度很慢，并且有些公司不让使用docker在生产环境中。这里就记录了自己的实操过程，希望对你们有帮助。

Fun-ASR-Nano深度评测

Fun-ASR-Nano-2512 是由阿里巴巴旗下的通义实验室开源的语音识别模型，通义实验室之前还开源了 SenseVoiceSmall 和 Paraformer 模型，这篇文章使用三种模型对多种方言，以及真实电话录音进行对比测试，在开源的数据集中评估的结果官方已经给出，这里使用自己的数据测试。

Hi,Friend