两江要闻
两江新区官网> 两江要闻 > 正文
全球最新语音识别世界纪录在两江新区诞生

云从科技以97.03%正确率打破语音识别世界纪录

    依托全市最大数字经济产业园,两江新区人工智能产业正迅速发展。记者从两江新区获悉, 10月 29日,入驻两江新区数字经济产业园的AI独角兽重庆中科云丛科技有限公司在语音识别技术上取得重大突破,该企业融合图像识别与语音识别的优势,推出了全新Pyramidal-FSMN语音识别模型,超过微软、IBM、阿里、百度、约翰霍普金斯大学等企业及高校,大幅刷新语音识别世界纪录。

    超越人类专业速记员水平

    云从科技领跑人工智能行业

    据悉,语音识别技术是智能感知的重要部分,通过语音识别,机器就可以像人类一样听懂说话,进而能够理解、思考与反馈。近年来,在深度学习技术的帮助下,语音识别取得了极大的进展,从实验室开始走向市场,走向实用化。基于语音识别技术的输入法、搜索和翻译等人机交互场景都有了广泛的应用。2018年6月,阿里巴巴达摩院推出了新一代语音识别模型DFSMN,将全球语音识别准确率纪录提高至96.04%,错词率降低至3.96%。

    由云从科技自主研发的全新Pyramidal-FSMN语音识别模型在全球最大的开源语音识别数据集Librispeech上刷新了世界纪录,准确率提升到97.03%,将Librispeech的错词率(Worderrorrate,WER)降低至2.97%,较之前提升了25%,已超越人类专业速记员水平。

    同时,该模型融合图像识别与语音识别的优势,将残差卷积网络和金字塔记忆模块的序列记忆网络相结合, 能够同时有效的提取空间和时间上不同粒度的信息,对比目前业界使用最为广泛的LSTM模型,训练速度更快、识别准确率更高。

    “该突破将推动语音识别技术的大幅进步,也使得语音识别离更良好的智慧交互体验越来越近。”相关负责人告诉记者,此次突破标志着云从科技在今年4月刷新跨镜追踪技术(ReID)三项世界纪录后在新领域再次取得重大成果,也是云从科技打造核心技术闭环路径中的关键一步。

    记者了解到,云从科技核心技术闭环包括人脸识别、智能感知与智能分析三个阶段,此次语音识别突破属于智能感知中的一环。在10月12日的国家发改委“人工智能基础资源公共服务平台”项目发布会上,云从科技创始人周曦提出了人工智能发展的五个阶段,而核心技术闭环正是五个阶段的重要基础。云从科技在今年先后首发3D结构光人脸识别技术及刷新跨镜追踪技术三项世界纪录,并在金融、安防、机场等优势行业建设基于智能分析的“行业大脑”,正稳步推进从核心技术到智能生态的五步走战略。

    营商环境持续优化

    两江新区打造数字经济发展高地

    作为国家级开发开放新区,依托已建成的重庆市最大数字经济产业园,两江新区正不断优化营商环境,加速数字经济与实体经济融合发展,已集聚了一批数字经济优质企业。云从科技正是其中的代表之一。

    “无论是在办公场地、政策扶持还是人才培养上,两江新区都给予了我们很多帮助。” 云从科技创始人周曦告诉记者,随着规模扩大,云从科技更是即将迁入重庆两江数字经济产业园二期办公,依托两江新区优势资源,云从科技正在致力整合算力、智力、数据等资源及其成果,打造人工智能平台,进一步促进人工智能在金融、安防、交通、零售、教育等重要行业的落地。

    不只营商环境,人工智能作为将大数据、云计算资源整合、深化的纽带,在两江新区同样有着很好的产业发展环境。据周曦介绍,云从科技将通过和联通、浪潮等企业合作,把应用做活,形成场景化的解决方案,而中国联通大数据有限公司、浪潮集团等在两江新区已是早有布局。

    依托良好的产业、人才、基础设施等各方面的发展优势,两江新区正在数字经济建设方面持续发力,使其成为经济高质量发展的有力支撑。依托已建成的重庆最大数字经济产业园,两江新区下一步将全面升级打造“智慧两江”,形成全市大数据智能化经济发展的领头羊、主力军、展示窗口及高技术人才与数字经济企业聚集高地。

    (记者 王丹)

编辑:刘春雪
中国 ● 重庆两江新区党工委管委会 地址:重庆渝北区金渝大道金山大厦招商电话:8623-67573888 8623-67573997
渝ICP备15010887  |   渝公网安备 50019002501334号  |  网上传播视听节目许可证(0104065)  |  主办:重庆两江新区党工委管委会
主办:重庆两江新区党工委管委会
执行:两江新区宣传部(文明办)