2017年 科大讯飞专利报告

2017年 科大讯飞专利报告
附件:
2017科大讯飞专利报告.pdf
下载完整版报告

2015年全球人工智能市场规模为1270亿美元,而到了明年这一市场有可能较2015年翻番。许多国家已将发展人工智能上升到国家战略高度。长期看,人工智能的发展趋势早已不可逆转。近年来,谷歌、微软、亚马逊、特斯拉等国外科技巨头纷纷发力,而国内企业也不甘示弱,纷纷和顶尖技术团队合作,积极布局。

在这其中,百度的百度大脑计划和科大讯飞的超脑计划已经领跑国内人工智能的发展前线了。



“讯飞超脑”计划是讯飞自己的研究计划,重点是要突破认知智能,同时结合感知智能。 讯飞超脑计划是要实现基于类人神经网络的认知智能引擎,预期成果是实现世界上第一个中文认知智能计算引擎。目前,讯飞已经集结了在认知智能领域最强研究团队,将在知识图谱构建与推理、人工神经网络模拟、人脑原理分析模拟几个方向展开研究。


构建超脑的技术有哪些?


(1)语音识别技术


语音识别技术 所要解决的问题是让计算机能够“听懂”人类的语音,将语音中包含的文字信息“提取”出来。该技术在“能听会说”的智能计算机系统中扮演着重要角色,相当于给计算机系统安装上“耳朵”,使其具备“能听”的功能,进而实现信息时代利用“语音”这一最自然、最便捷的手段进行人机通信和交互。


(2)语音合成技术


语音合成技术 又称文语转换(Text to Speech)技术,它涉及声学、语言学、数字信号处理、计算机科学等多个学科技术。语音合成技术解决的主要问题是将文字信息转化为声音信息,即让机器像人一样开口说话。


(3)自然语言处理技术


自然语言处理技术 该技术所涵盖的研究内容非常广泛,从研究成果的表现形式来说,基本可以分为基础研究和应用研究两大类。

基础研究:主要指对自然语言内在规律的研究,从研究深度和难度上大致可以划分为词典编撰、分词断句、词性分析、语言模型、语法分析、语义分析、语用分析等。

应用研究:主要指基于基础研究的成果,面向不同的应用,研发相关的自然语言处理技术,大的方向包括但不限于:拼音输入法、信息检索、信息抽取、自动摘要、机器翻译、语音合成、语音识别、文本匹配、文本分类、对话系统等。


(4)语音评测技术


语音评测技术 又称计算机辅助语言学习(Computer Assisted Language Learning),是机器自动对用户发音进行评分、检错并给出矫正指导的技术。语音评测技术是智能语音处理领域的研究前沿,同时又因为能显著提高受众对口语学习的兴趣、效率和效果,而有着广阔的应用前景。


(5)声纹识别技术


声纹识别技术 是一种通过语音信号提取代表说话人身份的相关特征(如反映声门开合频率的基频特征、反映口腔大小形状及声道长度的频谱特征等),进而识别出说话人身份等方面的技术。它可以广泛应用于信息安全、电话银行、智能门禁以及娱乐增值等领域。


(6)手写识别技术


手写识别技术 是一种让计算机能够“认识”用户在手写设备上书写的文字信息,将有序的笔迹轨迹转换为用户所书写的字符的技术。手写识别技术在智能手机、平板电脑等移动终端设备上为用户提供了一种较传统输入方式更为便利的交互方式。它使得不熟悉或不方便键盘操作的用户也能轻松上手使用各类电子设备。


拿什么来支撑这些技术?


整体3D专利地图分析


我们先利用智慧芽3D专利地图从整体角度查看科大讯飞的技术。3D专利地图是技术空间中专利的3D呈现。其基于专利文件中语言相似性和IPC共同性进行分析归类。因此,3D专利地图使科大讯飞的科技布局可视化,高峰代表了技术聚焦的领域,低谷则意味着技术盲点(潜在的机会或者待开拓的领域)。



在上方的3D专利地图中,科大讯飞的优势技术分别分布在自然语言处理,语音识别技术的识别方式、模型构建、参数及测试,教育领域、手写输入以及能使用语音识别及人工智能技术的终端产品等多个方向。这与前文中我们讨论科大讯飞核心技术相对应,看来科大讯飞确实有“很多刷子”!


专利申请趋势分析



科大讯飞如何积累这些技术的?


从其发展历程来看,2000年被认定为国家863计划成果产业化基地,与中国科大、社科院共建实验室,但在02年之前科大讯飞并没有申请相关专利,此时科大讯飞仍然处在“闷声搞研发”的阶段。

随着2002年开始科大讯飞逐渐开始申请布局专利,整体趋势上年专利申请量也在提升。特别是在2013年,科大讯飞专利申请量达到了顶峰。2013年井喷式的专利布局发展为科大讯飞成为中国人工智能产业中一颗冉冉升起的“新星”奠定了基础,也促成了相关研究向应用性技术方向发展。


专利IPC技术布局分析



对科大讯飞所申请专利的IPC分类进行分析,可以得出其近400项发明专利归属数量最多的10个IPC小类的饼图。由上表可以看出,语音分析或合成、语音识别、音频分析或处理(G10L)是科大讯飞最为核心的专利技术,该技术领域专利占发明专利总量的43.97%。排名靠前的电数字数据处理(G06F),数据识别、数据表示、记录载体(G06K),教育或演示用具(G09B),数字信息的传输(H04L)等技术也对科大讯飞的发展起到至关重要的作用。


科大讯飞的专利已经被其他大企业所肯定



单靠我们“吹”并不能体现科大讯飞专利的关键性和技术水平,因此我们要去看其专利是否被其他企业所认可。科大讯飞专利被谁引用过,值得参考。在上表中,我们发现诸如腾讯、百度、中兴这样的国内计算机与互联网企业都在技术研发与专利申请中参考了科大讯飞的技术专利,这足以说明科大讯飞的技术确有真才实学。


面对强敌Nuance,科大讯飞能否制胜


狼来了!科大讯飞能否成功狙击?

所以,科大讯飞已经在国内“独孤求败”了?当然不是,在国内思必驰等语音识别企业也占据了一定市场,更何况狼也想要进入中国市场。



2017年3月15日,语音和语言解决方案提供商Nuance在上海举办了第4届“Nuance中国汽车论坛”,探讨语音助手在或将是继智能手机后下一个重要移动端—“汽车”上的应用现状与前景,并展示了其车载语音助手产品:Dragon Drive(声龙驾驶)。

期间,Nuance高层,包括集团副总裁及大中华区总裁蒯文瑞先生、车载业务部高级副总裁Arnd Weil以及研究部副总裁吴建雄博士等重要人士纷纷出席。可见,这家国际语音巨头已经将目标瞄上了中国大陆……

 

不在一个数量级的专利数:



单从企业专利的申请量来看的,科大讯飞相交与Nuance仍然存在着巨大的差距。经历多年积累的Nuance在专利数量上有着绝对的优势。尽管,这些年来科大讯飞的专利申请一直在增速,但是要追上像Nuance这样的对手?仅靠量是很难的,唯有以“质”取胜,才能让科大讯飞反转数量上的绝对劣势。


从技术上看,相近的布局



如果抛去数量上的差异来看两家企业专利的技术布局的话,其实双方的侧重点与研发方向都是相似的。毕竟都是在语音识别及人工智能领域深耕的企业,他们很明白这一领域内应当发展的技术方向,从而在竞争中,不落于人后。


科大讯飞也有自己的优势



然而Nuance真的处处领先毫无破绽?假如是这样的话,Nuance在近些年里又怎么会被投资者看低呢?

最直观的一点,就是Nuance忽视了新兴市场,特别是中国地区的布局。从专利的地理布局对比上来看,科大讯飞早已明白专利技术全球化的意义。而反观Nuance在中国大陆的专利布局,近乎为0。要知道中国大陆已经是全球最大的智能语音市场之一,同时也是潜力最大的地区,完全没有布局的Nuance匆忙进入中国市场,必将遭到以科大讯飞为首的中国本土企业的狙击


对了,在专利角度上有些科大讯飞的专利值得我们关注


专利被引用情况


上表中的这些科大讯飞专利已广泛应用并且有很多人借鉴这些技术,这些专利相较于科大讯飞的其他专利更具影响力并代表着公司的核心创新技术。


专利家族规模



上表中的专利拥有科大讯飞在全球范围内布局规模最大的专利家族。这些专利可能是科大讯飞在众多地区中最为成功的发明专利,也因此必须在全球范围内采取最严密的专利保护措施。


专利权利要求数量



大量的权利要求项是为了保护多项技术,相应起草交底书的工作量也会很大,这代表了一种全新的技术(在申请时)。因此,上表中这些科大讯飞权利要求数量较多的专利一方面可能是科大讯飞想要扩大保护范围的核心专利,另一方面也可能是其未来发展的重点。


科大讯飞发展中有何独到之处?


始终坚持与科研院校合作


在1999年获得第一笔融资后,科大讯飞就立即用这笔资金作为基础建立利益共享机制,整合国内在语音技术不同领域优势互补的研发资源。

来看看这些年,科大讯飞找了多少科研院校合作:

2000年年初,科大讯飞相继与中国科大、中科院声学所、中国社科院语言所这三个在语音领域有着丰富积累的机构相继成立语音技术联合实验室;2006年,与清华大学建立校企联合科研机构。2010年相继与新疆大学、内蒙古大学成立语音及语言联合实验室;2011年,与西藏大学、云南大学成立语音及语言联合实验室;2012年,与兰州大学建立语音及语言云计算联合实验室。


发现机遇,果断并购——以教育领域为例 


在先前科大讯飞专利的技术布局中,我们发现科大讯飞在语音识别及人工智能在教育领域的运用中投入了不小的资源。与此同时,科大讯飞不断加大投入布局认知智能,抢占技术高点,“讯飞超脑”项目已经取得阶段成果,开始支撑公司在教育、政府等领域的应用。

除了在自主研发上重视教育市场,在资本投资上也同步行动:

2013年,科大讯飞以自有资金4.8亿元收购广东启明科技发展有限公公司:



讯飞收购启明科技的直接原因在于:启明在英语口语考场的机考领域提供解决方案并拥有相关专利,技术核心为由机器进行语音识别并打分的系统。我们也能在智慧芽数据库中发现这写信息直接反映在启明科技的专利申请中。



而科大讯飞也存在这类业务,如果对于科大讯飞专利更细化的进行筛选,我们能够发现在2009至2015年间,科大讯飞快速且大量的申请相关中英文培训、考试等教育领域的相关专利。而在此期间收购启明科技,目的是为了产生明显的协同效应:降低竞争成本,并且讯飞在这个领域的市场地位也得到巩固和提高。


无独有偶,在2016年5 月 9 日,科大讯飞又以4.96 亿人民币收购北京乐知行软件有限公司 100% 股权。乐知行是一家专注于中小学教育信息化领域的企业,以数字校园、教育物联网和区域教育云建设为核心,根植于北京,覆盖至全国。科大讯飞在教育领域的布局正在向更广的市场推进,我们有理由相信接下来科大讯飞还将在教育领域有更多更大的“动作”。


“研究—工程—产品—用户”的闭环



虽然人工智能现在已经大红大紫,但是如果不能“接地气”与实际运用结合,那么在人工智能中的巨大投入,如何产生效益呢?

因此,科大讯飞更为关心的是人工智能的突破与运用问题。目前,深度神经网络与大数据两个关键要素的结合是当前人工智能研究的一条主流路径,这条路径中还有一个非常重要的内容,就是基于互联网和移动互联网的“研究- 工程- 产品- 用户”大闭环优化,用简单的四个字概括就是“大、智、移、云”,它推动了工业界人工智能技术直接迈过了可用性门槛。



而讯飞开发平台,正是这一闭环发展壮大的成功。用户可通过互联网、移动互联网,使用任何设备、在任何时间、任何地点,随时随地享受讯飞开放平台提供的“听、说、读、写……”等全方位的人工智能服务。目前,开放平台以“云+端”的形式向开发者提供语音合成、语音识别、语音唤醒、语义理解、人脸识别、个性化彩铃、移动应用分析等多项服务。


坚持下去等待爆发


任何技术从概念的导入到最终的大规模使用都要经历一个漫长的积累过程,也许是10年、20年甚至更长的时间。尤其是那些对于人类社会起到重大影响的技术,比如蒸汽机、比如电气,比如现在的人工智能。

作为一家人工智能企业,科大讯飞真正意义上体现了“厚积薄发”一词的概念。技术上潜心研发,专利技术从无到有再到布局全球,企业规模由小至大A股上市,一步步的迈向中国人工智能领域的第一梯队。

这为很多后来者,特别是广大中小人工智能创业企业提供了可以参考的模板。

 



作者:陈子豪


设计:糖米小朋友


数据说明:所有专利数据截至发文日时各官方知识产权局已公开的专利文献(考虑到 18 个月的公开期限,已申请未公开的不做统计)并经过同族去重


智慧牙学院微信