小红书开源语音识别模型FireRedASR登场,中文识别准确率出类拔萃

小红书开源语音识别模型FireRedASR登场,中文识别准确率出类拔萃

作者: 发表时间:2025-12-15 4:40:40
玉溪市学校app 郴州市学校app 惠州市第四小学app 金华市第四高中app 眉山市征地服务app 抚州市公共法律服务app 张家口市招标信息app 齐齐哈尔市第二高中app 辽阳市出口管理app 哈尔滨市新闻中心app 亳州市专题专栏app 九江市第二中学app 固原市第二小学app 曲靖市专题专栏app 贵港市公益app 平顶山市论坛app 三亚市未成年保护协会app 桂林市安全生产app 南宁市政务监督app 镇江市台风监控中心app 许昌市安全生产app 南昌市防火app 盘锦市历史记录app 宝清县工程造价app 桃源县重大建设公开app 罗田县税务局app 饶平县第三高中app 沅陵县安全生产app 赫章县建设局信息app 巫山县电台广播中心app 宝清县防火app 伊通满族自治县铁路管理app 汉源县政务服务app 彭水苗族土家族自治县审计公开app 台江县通讯协会app 永兴县人社管理app 通道侗族自治县风力发电app 革吉县第四小学app 霍城县桥梁管理app 赞皇县灾害救助app 夏津县数据管理局app 砀山县市场监督app 隆德县工程造价app 新邵县第四小学app 元谋县妇联app 宁陵县劳动局app 永宁县灾害救助app

近日,小红书旗下的 FireRed 团队推出了全新的开源语音识别模型——FireRedASR。该模型作为基于大模型构建的语音识别系统,在多个标准测试集中都斩获了极为优异的成绩,无疑为中文语音识别技术带来了重大突破。

小红书开源语音识别模型FireRedASR登场,中文识别准确率出类拔萃

FireRedASR 的核心指标是字错误率(CER),该指标越低,表示模型的识别效果越好。在最近的公开测试中,FireRedASR 的 CER 达到了3.05%,较之前的最佳模型 Seed-ASR 降低了8.4%。这一结果显示出 FireRed 团队在语音识别技术上的创新能力。

FireRedASR 模型分为两种核心结构:FireRedASR-LLM 和 FireRedASR-AED。前者专注于极致的语音识别精度,后者则在准确率与推理效率之间实现了良好的平衡。团队提供了不同规模的模型和推理代码,以满足各种应用场景的需求。

在多个日常应用场景中,FireRedASR 同样展现了强大的性能。在由短视频、直播和语音输入等多种来源组成的测试集中,FireRedASR-LLM 的 CER 相较于业内领先的服务提供商降低了23.7% 至40%。特别是在需要歌词识别的场景中,该模型的表现尤为突出,CER 实现了50.2% 至66.7% 的相对降低。

此外,FireRedASR 还在中文方言和英语场景中表现优异,其 CER 在 KeSpeech 和 LibriSpeech 测试集上显著优于之前的开源模型,证明其在多种语言环境中的鲁棒性和适应性。

FireRed 团队希望通过开源这一新模型,推动语音识别技术的发展和应用,为语音交互的未来贡献力量。所有模型和代码已在 GitHub 上公开,鼓励更多开发者和研究者参与其中。

相关文章