首页 > 其他资讯 > 阿里通义推出语音识别大模型Fun-ASR1.5:覆盖30种语言 支持汉语七大方言体系

阿里通义推出语音识别大模型Fun-ASR1.5:覆盖30种语言 支持汉语七大方言体系

时间:26-04-20

阿里通义发布Fun-ASR1.5语音识别大模型:30种语言与汉语七大方言全覆盖

阿里通义实验室正式推出新一代语音识别大模型Fun-ASR1.5。该模型凭借其卓越的多语言与方言处理能力,为语音识别技术设定了新的行业基准。

免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈

阿里通义推出语音识别大模型Fun-ASR1.5:覆盖30种语言 支持汉语七大方言体系

Fun-ASR1.5的核心突破在于其统一的模型架构实现了前所未有的泛化能力。单一模型即可精准处理全球30种主流语言,并深度支持汉语的七大方言体系及二十余种地方口音。其技术边界甚至延伸至古诗词吟诵的韵律识别与转写,展现了强大的上下文理解与声学建模能力。

阿里通义推出语音识别大模型Fun-ASR1.5:覆盖30种语言 支持汉语七大方言体系

在关键的性能指标上,Fun-ASR1.5表现突出。针对复杂方言场景,其字错误率(CER)实现了56.2%的相对下降。目前,模型对5种方言的识别准确率已超过90%,另有15种方言的准确率稳定在80%以上,为跨地域商业应用提供了可靠的技术基础。

除了高精度识别,Fun-ASR1.5集成了智能后处理功能。它能自动为口语转录添加标点,并将数字、日期、金额、电话号码等实体信息转换为标准书面格式。这一特性直接提升了转录内容的可读性与可用性。

对于会议纪要、访谈整理、司法笔录等专业场景,这一功能显著减少了人工后期校对的时间成本,使从业者能够将资源集中于内容分析与策略制定,从而优化工作流程并提升效率。

阿里通义推出语音识别大模型Fun-ASR1.5:覆盖30种语言 支持汉语七大方言体系

开发者与企业可便捷地集成该模型。用户可通过阿里云百炼平台直接调用Fun-ASR1.5的API服务,快速部署至自有产品。同时,也可在魔搭社区进行免费在线体验,直观测试其多语言与方言识别效果。

相关体验地址如下:

阿里云百炼:https://bailian.console.aliyun.com/cn-beijing?tab=model#/efm/model_experience_center/voice?modelId=fun-asr

魔搭社区:https://modelscope.cn/studios/iic/FunAudio-ASR


这就是阿里通义推出语音识别大模型Fun-ASR1.5:覆盖30种语言 支持汉语七大方言体系的全部内容了,希望以上内容对小伙伴们有所帮助,更多详情可以关注我们的菜鸟游戏和软件相关专区,更多攻略和教程等你发现!

热搜     |     排行     |     热点     |     话题     |     标签

手机版 | 电脑版 | 客户端

湘ICP备2022003375号-1

本站所有软件,来自于互联网或网友上传,版权属原著所有,如有需要请购买正版。如有侵权,敬请来信联系我们,cn486com@outlook.com 我们立刻删除。