SlideShare ist ein Scribd-Unternehmen logo
1 von 18
Downloaden Sie, um offline zu lesen
语音识别的新纪元
                 “讯飞语音云”


   科大讯飞副总裁        江涛
   2011.11. 24   北京
科大讯飞简介
• 中国语音产业唯一的国家规划布局内重点软件企业和唯一的语
 音上市公司,08年在深圳证券交易所挂牌上市

• 核心技术国际领先,牵头制定国家标准并拥有主流市场80%以
 上的市场份额,讯飞目前市值100亿,员工1600多人
 语音产业唯一国家科技进步奖     语音产业唯一信息产业重大技术发明
语音产业国家队




福布斯中国潜力企业   中国软件企业最具创新实力奖   CCTV“十佳创新公司”

  科大讯飞现已发展为业界公认的“中文语音产业国家队”
移动互联网时代人机交互需求
• 移动互联网终端键盘与屏幕的天然限制,语音作
 为信息交互最自然、便捷的手段,在小尺寸终端
 和移动状态下更是具有明确需求




   语音交互将成为移动互联网应用
    用户体验的关键要素之一
回顾-讯飞语音云发布
• 2010年10月28日,科大讯飞在业界率先发布全球首个同时提供高
 质量语音合成、语音搜索、语音听写等智能语音交互能力的移动
 互联网智能交互平台——“讯飞语音云”




   周光召致辞      柳传志致辞     语音云启动仪式
语音云服务能力快速进步
     当前语音用户超过800万,平均每日新增用户超过3万
      其中:  语音云服务容量已经达到3000万,可随
            应用规模快速扩张

 每天在线用户数量超过20万,总使用量超过200万次
  得益       语音输入法和口讯等业务已经成为用户
  于:        日常生活中必不可少的助手
           当用户感受到语音的魅力后,语音逐渐
            形成习惯
服务整体可用性达到94%
得益      服务器可用性的提高和稳定性改善
于:      客户端流程的优化,提高恶劣网络环境下
         的容错能力
     服务平均响应时间降低至2.0秒
     得益     服务器和客户端交互流程的优化
     于      客户端负载均衡策略的启用
讯飞输入法国际移动互联网大会获奖




•   国际移动互联网大会
•   移动互联网领域的年度盛会




•   开发者星球应用开发大赛



                   输入法专业评委奖第一名
讯飞口讯荣登App Store排行榜首位
丰富多彩的语音云应用产品

           语音聊天

 语音                      互联网
 导航                      电视




       讯飞语音云
语音                         语音

搜索                         微博



      语音          更多合作
                  业务…
      短信
讯飞语音云总体架构
•   基于云计算的讯飞语音平台封装了各类智能语音模块,可向开发伙伴提供便捷
    的开发环境、向各行业及个人用户提供高效的语音服务
语音合成技术的不断进步

• 语音合成系统最关键的是自然度综合指标:

  年份    1995年 1998年 1999年 2001年 2010年

  自然度    <3.0   3.0   3.5   3.8   4.5

                                        STOP


   原文:9,这是乔丹参加1984年奥运会和1992年奥运会时的球
衣号码。在1984年洛杉矶奥运会上,由于前苏联以及东欧诸国……
国际英文语音合成大赛六联冠
评测时间:2006~2011                                                评测对象:英文语音合成技术
评测单位:“Blizzard Challenge”国际英文语音合成大赛
参赛单位:IBM、微软、MIT、CMU、英国爱丁堡大学、日本ATR等
评测结果:
                        英文合成系统连续六年蝉联自然度评测指标第一名

      自然语音    Blizzard                          Challenge 测试结果(自然度指标)
        科大讯飞参测系统
        5
            4.8                                            迄今唯一自然度
      4.5         4.2
                                                          大于4分的参测系统                                                  参
                                                                                                                     测
                        3.8   3.7
        4
                                    3.3   3.3
                                                                                                                     系
      3.5                                       3.1   3   3
                                                               2.7   2.7
MOS




        3                                                                  2.6   2.6   2.6   2.5
      2.5                                                                                          2.1
                                                                                                         1.9
                                                                                                                     统
        2                                                                                                      1.6
                                                                                                                     编
      1.5
        1                                                                                                            号
      0.5                                                                                                            匿
        0
            A     M     J     T     F     V     S     B   P    R     U     G     H     N     C     L     O     Q
                                                                                                                     名
语音合成技术最新进展
NIST说话人语音识别评测
    由NIST(美国国家标准技术研究院)举办,是国际上规模与影响力最大的说
     话人识别评测

    1996年第一次评测,之后每两年评测一次,说话人识别任务难度接近大规模
     实际应用环境(不同信道、不同环境干扰)

    科大讯飞在2008,2010年连续两届评测中均处于国际领先地位
                       三大核心测试指标            在参测系统中排名
       测试时间        Min                     Min   EE
                           EER     DCF                    DCF
                   DCF                     DCF        R
        2008       0.107   2.625   0.187    1    1         3

        2010       0.33    5.872   0.405    2    2         2

确立了科大讯飞在国际语音技术领域的全面领先地位
 参赛单位有:CMU、MIT、Stanford、清华大学、中科院自动化所、中科院声学所、
  Motorola研究中心、IBM 研究院等国内外50家著名语音研究机构
持续提升的语音识别准确率
面向移动互联实际应用环境的中文连续语音识别技术性能
                                    83.2%
                                           2011年10月
                                         复杂DT及TANDEM
     2011年4月                                  技术
  超大规模语言模型技                                第四次更新
    术第二次更新        78.8%
                                         2011年8月

  2011年1月                       81.2%   基于上线数据
                                        第三次更新
 基于上线数据
   首次更新
                                    – 通过对海量数据的训练,可以更好的
          75.3%                         处理困扰语音识别的技术难点

                                    – 用户在实际使用中形成的数据可以反
2010年8月
                                        馈到平台中,形成不断迭代优化的正
  语音云         60.2%   2010年10月28日
内测版上线                                   反馈机制,持续提高效果
                      语音云正式发布
   55.8%
MSC开发两类接口
•   C风格的API接口

    – 实现最广泛的平台覆盖性

•   可视化控件接口

    – 为了提高智能终端开发效率、降低开发难度,为Android、iPhone、
      Symbian平台提供了内置语音交互UI、录音放音封装的可视化语音控件
      接口
不断扩展的语音云服务
                       语音识别服务 关键
  语音合成服务              命令   短信  词检
       个性化            词识   听写   索
 传统语   语音合             别      转写
                         搜索   字幕
 音合成    成
     变声

               网站服务
              用户
                 论坛
              管理

  声纹识别服务                其他服务
                                文本
声音相                   唱歌   文字   分析
    声纹                     客服 语言
似度       声纹           评分
    验证
   语种    鉴别              手写识 学习
   识别                     别
结束语:致谢


期待与更多合作伙伴共同探讨
移动互联网时代语音技术的应用

Weitere ähnliche Inhalte

Ähnlich wie 第19期极客活动-讯飞语音云

20100629 中山大学交流
20100629 中山大学交流20100629 中山大学交流
20100629 中山大学交流leonsandy888
 
物联网操作系统漫谈-GIAC大会.pdf
物联网操作系统漫谈-GIAC大会.pdf物联网操作系统漫谈-GIAC大会.pdf
物联网操作系统漫谈-GIAC大会.pdfOpenCity Community
 
Web logic platform 8.1
Web logic platform 8.1Web logic platform 8.1
Web logic platform 8.1williams2014
 
中国移动2010年物联网发展战略规划
中国移动2010年物联网发展战略规划中国移动2010年物联网发展战略规划
中国移动2010年物联网发展战略规划top idea
 
打造面向服务的敏捷团队 Q con-beijing2012
打造面向服务的敏捷团队 Q con-beijing2012打造面向服务的敏捷团队 Q con-beijing2012
打造面向服务的敏捷团队 Q con-beijing2012Qiao Liang
 
service-oriented agile team-Q con-beijing2012
service-oriented agile team-Q con-beijing2012service-oriented agile team-Q con-beijing2012
service-oriented agile team-Q con-beijing2012Qiao Liang
 
雲端行動商務發展趨勢 V1.2
雲端行動商務發展趨勢 V1.2雲端行動商務發展趨勢 V1.2
雲端行動商務發展趨勢 V1.2yaohung
 
快播科技简介V8
快播科技简介V8快播科技简介V8
快播科技简介V8liuyang0703
 
2010 year_Win 7 Multi-touch 應用趨勢下的觸控驗證_ITRI
2010 year_Win 7 Multi-touch 應用趨勢下的觸控驗證_ITRI2010 year_Win 7 Multi-touch 應用趨勢下的觸控驗證_ITRI
2010 year_Win 7 Multi-touch 應用趨勢下的觸控驗證_ITRICHENHuiMei
 
同济优秀课程设计 - 软件测试报告
同济优秀课程设计 - 软件测试报告同济优秀课程设计 - 软件测试报告
同济优秀课程设计 - 软件测试报告Kerry Zhu
 
敏捷测试中的工具实现
敏捷测试中的工具实现敏捷测试中的工具实现
敏捷测试中的工具实现drewz lin
 
从运维系统的开发谈安全架构设计
从运维系统的开发谈安全架构设计从运维系统的开发谈安全架构设计
从运维系统的开发谈安全架构设计mysqlops
 
什么是云计算
什么是云计算什么是云计算
什么是云计算Liyang Tang
 
Appscomm Product Catalog
Appscomm Product CatalogAppscomm Product Catalog
Appscomm Product CatalogAviva Lau
 
Nodejs & NAE
Nodejs & NAENodejs & NAE
Nodejs & NAEq3boy
 
数据采集中间件技术交流
数据采集中间件技术交流数据采集中间件技术交流
数据采集中间件技术交流jerry tom
 
Top100summit前端的云时代支付宝前端平台架构 王保平
Top100summit前端的云时代支付宝前端平台架构  王保平Top100summit前端的云时代支付宝前端平台架构  王保平
Top100summit前端的云时代支付宝前端平台架构 王保平drewz lin
 
移动互联网的机遇与挑战
移动互联网的机遇与挑战移动互联网的机遇与挑战
移动互联网的机遇与挑战Courtney Chow
 
ITI - Marketing Project - Telecom Cooperation Proposal
ITI - Marketing Project - Telecom Cooperation ProposalITI - Marketing Project - Telecom Cooperation Proposal
ITI - Marketing Project - Telecom Cooperation ProposalJames Chen-En Cheng
 

Ähnlich wie 第19期极客活动-讯飞语音云 (20)

20100629 中山大学交流
20100629 中山大学交流20100629 中山大学交流
20100629 中山大学交流
 
物联网操作系统漫谈-GIAC大会.pdf
物联网操作系统漫谈-GIAC大会.pdf物联网操作系统漫谈-GIAC大会.pdf
物联网操作系统漫谈-GIAC大会.pdf
 
Web logic platform 8.1
Web logic platform 8.1Web logic platform 8.1
Web logic platform 8.1
 
中国移动2010年物联网发展战略规划
中国移动2010年物联网发展战略规划中国移动2010年物联网发展战略规划
中国移动2010年物联网发展战略规划
 
打造面向服务的敏捷团队 Q con-beijing2012
打造面向服务的敏捷团队 Q con-beijing2012打造面向服务的敏捷团队 Q con-beijing2012
打造面向服务的敏捷团队 Q con-beijing2012
 
service-oriented agile team-Q con-beijing2012
service-oriented agile team-Q con-beijing2012service-oriented agile team-Q con-beijing2012
service-oriented agile team-Q con-beijing2012
 
雲端行動商務發展趨勢 V1.2
雲端行動商務發展趨勢 V1.2雲端行動商務發展趨勢 V1.2
雲端行動商務發展趨勢 V1.2
 
快播科技简介V8
快播科技简介V8快播科技简介V8
快播科技简介V8
 
2010 year_Win 7 Multi-touch 應用趨勢下的觸控驗證_ITRI
2010 year_Win 7 Multi-touch 應用趨勢下的觸控驗證_ITRI2010 year_Win 7 Multi-touch 應用趨勢下的觸控驗證_ITRI
2010 year_Win 7 Multi-touch 應用趨勢下的觸控驗證_ITRI
 
Chengdu Embedded Stagy
Chengdu Embedded StagyChengdu Embedded Stagy
Chengdu Embedded Stagy
 
同济优秀课程设计 - 软件测试报告
同济优秀课程设计 - 软件测试报告同济优秀课程设计 - 软件测试报告
同济优秀课程设计 - 软件测试报告
 
敏捷测试中的工具实现
敏捷测试中的工具实现敏捷测试中的工具实现
敏捷测试中的工具实现
 
从运维系统的开发谈安全架构设计
从运维系统的开发谈安全架构设计从运维系统的开发谈安全架构设计
从运维系统的开发谈安全架构设计
 
什么是云计算
什么是云计算什么是云计算
什么是云计算
 
Appscomm Product Catalog
Appscomm Product CatalogAppscomm Product Catalog
Appscomm Product Catalog
 
Nodejs & NAE
Nodejs & NAENodejs & NAE
Nodejs & NAE
 
数据采集中间件技术交流
数据采集中间件技术交流数据采集中间件技术交流
数据采集中间件技术交流
 
Top100summit前端的云时代支付宝前端平台架构 王保平
Top100summit前端的云时代支付宝前端平台架构  王保平Top100summit前端的云时代支付宝前端平台架构  王保平
Top100summit前端的云时代支付宝前端平台架构 王保平
 
移动互联网的机遇与挑战
移动互联网的机遇与挑战移动互联网的机遇与挑战
移动互联网的机遇与挑战
 
ITI - Marketing Project - Telecom Cooperation Proposal
ITI - Marketing Project - Telecom Cooperation ProposalITI - Marketing Project - Telecom Cooperation Proposal
ITI - Marketing Project - Telecom Cooperation Proposal
 

Mehr von geekparknet

极客活动28期 嘉宾分享 - 我查查
极客活动28期   嘉宾分享 - 我查查极客活动28期   嘉宾分享 - 我查查
极客活动28期 嘉宾分享 - 我查查geekparknet
 
极客活动28期 嘉宾分享 - 拖拉网
极客活动28期   嘉宾分享 - 拖拉网极客活动28期   嘉宾分享 - 拖拉网
极客活动28期 嘉宾分享 - 拖拉网geekparknet
 
极客活动28期 嘉宾分享 - 淘宝天猫
极客活动28期   嘉宾分享 - 淘宝天猫极客活动28期   嘉宾分享 - 淘宝天猫
极客活动28期 嘉宾分享 - 淘宝天猫geekparknet
 
极客活动28期 嘉宾分享 - 立体时代
极客活动28期   嘉宾分享 - 立体时代极客活动28期   嘉宾分享 - 立体时代
极客活动28期 嘉宾分享 - 立体时代geekparknet
 
极客活动28期 嘉宾分享 - 新浪微博
极客活动28期   嘉宾分享 - 新浪微博极客活动28期   嘉宾分享 - 新浪微博
极客活动28期 嘉宾分享 - 新浪微博geekparknet
 
下厨房:蚍蜉撼大树
下厨房:蚍蜉撼大树 下厨房:蚍蜉撼大树
下厨房:蚍蜉撼大树 geekparknet
 
网易新闻眼中的应用营销矩阵
网易新闻眼中的应用营销矩阵 网易新闻眼中的应用营销矩阵
网易新闻眼中的应用营销矩阵 geekparknet
 
应用分发: 和你的用户谈恋爱
应用分发: 和你的用户谈恋爱 应用分发: 和你的用户谈恋爱
应用分发: 和你的用户谈恋爱 geekparknet
 
随手记做口碑
随手记做口碑 随手记做口碑
随手记做口碑 geekparknet
 
海豚浏览器谈移动应用海外掘金
海豚浏览器谈移动应用海外掘金海豚浏览器谈移动应用海外掘金
海豚浏览器谈移动应用海外掘金geekparknet
 
UC如何做海外市场拓展
UC如何做海外市场拓展 UC如何做海外市场拓展
UC如何做海外市场拓展 geekparknet
 
时尚互动杂志 Windows Phone 开发分享
时尚互动杂志 Windows Phone 开发分享时尚互动杂志 Windows Phone 开发分享
时尚互动杂志 Windows Phone 开发分享geekparknet
 
新浪微博WP客户端的开发经验分享
新浪微博WP客户端的开发经验分享 新浪微博WP客户端的开发经验分享
新浪微博WP客户端的开发经验分享 geekparknet
 
数据和算法驱动的本地生活推荐
数据和算法驱动的本地生活推荐数据和算法驱动的本地生活推荐
数据和算法驱动的本地生活推荐geekparknet
 

Mehr von geekparknet (20)

极客活动28期 嘉宾分享 - 我查查
极客活动28期   嘉宾分享 - 我查查极客活动28期   嘉宾分享 - 我查查
极客活动28期 嘉宾分享 - 我查查
 
极客活动28期 嘉宾分享 - 拖拉网
极客活动28期   嘉宾分享 - 拖拉网极客活动28期   嘉宾分享 - 拖拉网
极客活动28期 嘉宾分享 - 拖拉网
 
极客活动28期 嘉宾分享 - 淘宝天猫
极客活动28期   嘉宾分享 - 淘宝天猫极客活动28期   嘉宾分享 - 淘宝天猫
极客活动28期 嘉宾分享 - 淘宝天猫
 
极客活动28期 嘉宾分享 - 立体时代
极客活动28期   嘉宾分享 - 立体时代极客活动28期   嘉宾分享 - 立体时代
极客活动28期 嘉宾分享 - 立体时代
 
极客活动28期 嘉宾分享 - 新浪微博
极客活动28期   嘉宾分享 - 新浪微博极客活动28期   嘉宾分享 - 新浪微博
极客活动28期 嘉宾分享 - 新浪微博
 
下厨房:蚍蜉撼大树
下厨房:蚍蜉撼大树 下厨房:蚍蜉撼大树
下厨房:蚍蜉撼大树
 
网易新闻眼中的应用营销矩阵
网易新闻眼中的应用营销矩阵 网易新闻眼中的应用营销矩阵
网易新闻眼中的应用营销矩阵
 
应用分发: 和你的用户谈恋爱
应用分发: 和你的用户谈恋爱 应用分发: 和你的用户谈恋爱
应用分发: 和你的用户谈恋爱
 
随手记做口碑
随手记做口碑 随手记做口碑
随手记做口碑
 
海豚浏览器谈移动应用海外掘金
海豚浏览器谈移动应用海外掘金海豚浏览器谈移动应用海外掘金
海豚浏览器谈移动应用海外掘金
 
UC如何做海外市场拓展
UC如何做海外市场拓展 UC如何做海外市场拓展
UC如何做海外市场拓展
 
时尚互动杂志 Windows Phone 开发分享
时尚互动杂志 Windows Phone 开发分享时尚互动杂志 Windows Phone 开发分享
时尚互动杂志 Windows Phone 开发分享
 
新浪微博WP客户端的开发经验分享
新浪微博WP客户端的开发经验分享 新浪微博WP客户端的开发经验分享
新浪微博WP客户端的开发经验分享
 
海豚声纳
海豚声纳海豚声纳
海豚声纳
 
智能360
智能360智能360
智能360
 
开心集品
开心集品开心集品
开心集品
 
LC 风格网
LC 风格网LC 风格网
LC 风格网
 
蘑菇街
蘑菇街蘑菇街
蘑菇街
 
花瓣网
花瓣网花瓣网
花瓣网
 
数据和算法驱动的本地生活推荐
数据和算法驱动的本地生活推荐数据和算法驱动的本地生活推荐
数据和算法驱动的本地生活推荐
 

第19期极客活动-讯飞语音云