Linux中部署GPT-OSS-20B大模型 | 服务器中部署OpenAI开源的大模型 | 私有化部署GPT-OSS-20B大模型 Linux 这篇文章主要讲述了我如何在Linux服务器中部署openai公司开源的生成式大模型gpt-oss-20b,以及这个部署过程中遇到的问题的解决方案。文章还讲述了如何在内网的环境中部署,并且解决了报错openai_harmony.HarmonyError的问题。
Linux中部署Qwen3.5大模型 | 本地私有化部署阿里最新开源Qwen3.5大模型 | 私有化部署本地大模型需要什么配置 Linux 这篇文章详细分享了如何在本地部署阿里最新开源的多模态大模型,支持图片识别,视频识别和文字生成。这篇文章记录我真实的部署过,在Linux服务器中部署开源的Qwen最新大模型。
ClearerVoice部署教程 | 基于AI的重叠语音分离 AI 这篇文章记录我如何在Linux中部署这个阿里开源的ClearerVoice的项目,这个ClearerVoice主要用于分离重叠说话人,目标说话人提取和降噪与人声增强。
源码编译GPU版本FunASR ASR 这篇文章主要详细记录了我是如何在Linux系统中通过源码编译GPU版本的FunASR的过程,包括model.torchscript模型的转换。虽然可以直接拉取官方的docker镜像,但是镜像拉取速度很慢,并且有些公司不让使用docker在生产环境中。这里就记录了自己的实操过程,希望对你们有帮助。
Fun-ASR-Nano深度评测 ASR Fun-ASR-Nano-2512 是由阿里巴巴旗下的通义实验室开源的语音识别模型,通义实验室之前还开源了 SenseVoiceSmall 和 Paraformer 模型,这篇文章使用三种模型对多种方言,以及真实电话录音进行对比测试,在开源的数据集中评估的结果官方已经给出,这里使用自己的数据测试。
基于FunASR开发的FunASR_API接口项目 ASR 这是基于FunASR开发的一套语音识别接口,可私有化部署语音识别接口,可以准确识别通话录音,会议录音,可区分说话人,部署简单,支持在Linux服务器中部署。
记录基于FunASR训练的通话录音转写ASR模型 ASR 这篇博文详细记录了我给一家公司训练外呼用的ASR模型,开源的ASR模型通常在外呼中识别的准确率偏低,这里使用了16万多条真实通话录音进行训练,真实的通话噪音,基于优秀的SenseVoiceSmall模型训练,训练后的准确率高于原始模型。