广场
最新
热门
资讯
我的主页
发布
HappyMinerUncle
2026-04-22 12:21:03
关注
注意到在语音识别领域出现了有趣的动向。Sierra 将 μ-Bench 多语言数据集公开,作为评估 ASR 系统的工具,这看起来是一个相当重要的举措。
核心内容是:该数据集包含 250 条来自客户服务的真实录音和 4270 个带注释的音频片段。与现有基准不同的是,这里不仅仅支持英语。支持五种语言——英语、西班牙语、土耳其语、越南语和普通话。
特别有趣的是新的指标 UER (Utterance Error Rate)。它区分会改变语义的错误和不影响语义的错误。这比传统的 WER 指标要细腻得多,后者将所有错误一视同仁。
测试结果显示:Google Chirp-3 在准确率方面领先,Deepgram Nova-3 速度最快,但在多语言方面略有落后。未来的发展令人期待。
数据集和结果表已在 Hugging Face 上开放,其他开发者也可以加入评测。看来 μ-Bench 正在成为客户服务环境中评估 ASR 的新标准。
查看原文
此页面可能包含第三方内容,仅供参考(非陈述/保证),不应被视为 Gate 认可其观点表述,也不得被视为财务或专业建议。详见
声明
。
赞赏
点赞
评论
转发
分享
评论
请输入评论内容
请输入评论内容
评论
暂无评论
热门话题
查看更多
#
WCTC交易王PK
70.08万 热度
#
美国寻求战略比特币储备
5886.25万 热度
#
比特币ETF期权持仓限额增4倍
108.94万 热度
#
美联储利率不变但内部分歧加剧
6.56万 热度
#
DeFi4月安全事件损失超6亿美元
1022.41万 热度
置顶
网站地图
注意到在语音识别领域出现了有趣的动向。Sierra 将 μ-Bench 多语言数据集公开,作为评估 ASR 系统的工具,这看起来是一个相当重要的举措。
核心内容是:该数据集包含 250 条来自客户服务的真实录音和 4270 个带注释的音频片段。与现有基准不同的是,这里不仅仅支持英语。支持五种语言——英语、西班牙语、土耳其语、越南语和普通话。
特别有趣的是新的指标 UER (Utterance Error Rate)。它区分会改变语义的错误和不影响语义的错误。这比传统的 WER 指标要细腻得多,后者将所有错误一视同仁。
测试结果显示:Google Chirp-3 在准确率方面领先,Deepgram Nova-3 速度最快,但在多语言方面略有落后。未来的发展令人期待。
数据集和结果表已在 Hugging Face 上开放,其他开发者也可以加入评测。看来 μ-Bench 正在成为客户服务环境中评估 ASR 的新标准。