智能语音未来趋势:垂直细分

发布时间:2016-11-28 阅读量:529 来源: 发布人:

随着人工智能技术的不断进步,智能语音技术也日趋成熟,在这里不得不提谷歌、微软、科大讯飞等科技公司在智能语音方面的带动作用,使得我们在日常生活中已经不乏看到语音技术的应用。

当前触摸屏和键盘仍然是今天人机交互主要媒介,但未来语音交互或可与之平分天下。智能语音的发展将推动人工智能的发展,使我们的生活变得更轻松更美好。

英语口语考试,你的考官不是人,而是一台计算机,它直接给你打分;一边开车一边对你的车说话下命令,“帮我打电话给妈妈”、“帮我买明天去北京的机票”、“带我去最近的面馆”;躺在病床上,不用动身体,直接开口对空调说“把温度调到26度”。

语音直接说话下命令,代替按键、触摸屏,是人更自然的体验。语音技术正让机器像人一样用语音交流。

谷歌美国公司语音技术人员向记者透露,谷歌正在各项服务中全面融入语音技术。微软的开发者大会提出“对话即平台”(Conversation as Platform)计划,简单说就是“想让你对机器说句话就把事给办了”。微软CEO纳德拉表示,语音指令正成为键盘、触摸屏之后的新一代人机对话方式。

当下正是转型关键期,各大企业的竞争也从单纯技术水平转变到应用场景的用户,“语音+各个应用场景”成为这百亿市场的制胜关键。

科大讯飞:从幕后到台前

科大讯飞自称占中文语音市场70%份额,以其为案例,或许可对这个行业略窥一二。

科大讯飞董秘江涛透露,目前科大讯飞在企业端和终端消费者端的业务占比分别是80%和20%,公司的目标是今后使这两块比重倒置,此次收购教育软件公司也是其“语音+教育”的重要一步。

科大讯飞要让终端消费者成为自己主要的用户?而科大讯飞目前的客户还是以政府、国企为主,这家具有国企背景的公司,如何能抓住互联网时代终端消费者的心?

面对记者的这一提问,科大讯飞并没有给出明确的回答,或许科大讯飞看到了市场未来的大势,但具体怎么落地实施,仍需时日来摸索。

于是记者试图从其目前技术中,梳理出科大讯飞可能的方向。要具体应用于终端消费者,首先需要确定在什么场景下、谁来用这项服务、用户有哪些需要,因此,服务的场景、用户特征需要首先锁定。换句话说,需要锁定垂直细分领域,再根据这一领域的具体场景配置技术。

比如,机器自动翻译应用在手机端。科大讯飞称,“随声译”功能达到了大学英语六级水平,一秒钟内能实现中英语音互译。

据科大讯飞公司介绍,在广东、江苏、上海、重庆、山东等10余省市的中高考英语听说考试中,开始试点用机器当考官,全年累计测试考生数近1000万。此外,用机器来改作文,也已经在安庆、合肥、湖南等地试点应用。

目前打客服电话需要通过一层层语音提示、按键,能否一次性直接得到想要的答案?“智能客服未来会替换掉50%以上的人工。”科大讯飞公司向《国际金融报》记者表示。安徽(科大讯飞起家的地方)省移动公司目前用科大讯飞的技术,可以基本实现语音直接搜索答案。科大讯飞为中国联通建设的智能语音客服——语音导航系统的试点建设,为其节省了20%以上的人工成本。另外,政府背景的金融机构、国家电网、航空公司、政府机关、医疗机构、广电行业,以及速运行业等主要呼叫中心,正在使用科大讯飞的机器语音应答。

目前已有31款车在出厂前搭载了科大讯飞的智能语音系统。同时,在政府基础设施建设上,科大讯飞也与江西、广西、吉林等省展开合作。

未来趋势:垂直细分

智能语音产业并不是以大取胜,并非范围铺的越大、叫得越响、效果就越好。一些小型创业公司反而在某些单点技术上成为最优。

例如,在真实场景中,噪音、被打断、离太远听不清,非常常见,因此不是简单一个识别率的问题而已。思必驰是一家只针对智能硬件厂商提供语音解决方案的公司,“在去年7月推出‘打断纠正’的智能交互技术,科大讯飞比它晚5个月,思必驰的语音输入板比科大讯飞早一年,但在严重噪声干扰中,准确率明显高于科大讯飞、百度语音。2015年发现了机器人对远场交互、声源定位的刚需,在去年12月推出环形‘6+1’远场麦克风阵列,讯飞是今年3月推出的。”思必驰公司市场负责人龙梦竹介绍。

但创业公司既要避开互联网大公司,又要开辟科大讯飞已经抢占市场之外的其他领域。

“我们专注的是交互,而不是识别。语音交互好不好,重点不在于识别准确率,而是垂直场景下的语义理解,以及后端服务。举个例子,如果你对机器说‘帮我放一首许巍的《生活不止眼前的苟且》’,如果机器回答你‘抱歉,找不到您要的服务’。用户只会觉得是交互不好,不智能。其实核心问题是,后端的内容不够。”龙梦竹告诉记者。

因此,“阿里年初投了思必驰,重点不是资金,而是我们看中阿里能带来的资源,比如高德、虾米音乐、神马搜索、云os等。”龙梦竹告诉记者。

这些创业公司需要非常专注在某一垂直细分领域,针对具体场景来为客户量身定制开发技术。“我们不做客服、不做教育、不做智慧城市,专注在车载、家居、机器人三个垂直领域的解决方案。车载后市场中,思必驰大约占45%市场。我们也没做方言,没做英语。但2014年以来的订单快速增加,证明了在专业领域的技术水平。”思必驰公司市场负责人告诉记者。

另一家to B的基础技术公司云知声的CEO黄伟向《国际金融报》记者表示,“在应用层面,公司提供AI芯(智能芯片)、AIUI(智能界面)、AI Service(智能服务)三大解决方案。”

人工智能芯片,即把智能程序植入芯片,例如针对空调的程序植入芯片后就可以装入各家公司的产品中,目前云知声芯片已经在美的、格力、华帝、海信植入芯片。“与讯飞、百度相比,云知声的技术定位是重点解决基于物联网设备的智能服务,尤其是从芯片级的紧密配合,直到打通云端服务。”黄伟表示。

智能界面,即人机交互界面,包括车载后市场(即出厂后车主自己配置的工具)、智能家居(在家具中植入智能语音程序)、智能机器人等。

而智能服务,是基于开放平台的SDK(软件开发工具包)。在这一方面,医院或许是个大市场。例如,医生不用再手写病历,直接说话即可自动录入。不仅如此,黄伟介绍,“云知声希望实现智能语音交互的知识问答、病历查询,进行健康风险预测和患者分群分析。目前合作伙伴包括北大医信、飞利浦医疗、北京协和医院、北京大学人民医院、江苏省肿瘤医院等。”

除了to B市场,“出门问问”是一家做2C(面向消费者)方向软硬结合的公司,谷歌公司占其一成股份。公司推出了智能手表Ticwatch,以及针对安卓穿戴、谷歌眼镜的智能语音操控应用、中文智能手表操作系统Ticwear。

总体而言,智能语音产业将呈现“多点开花、群星闪耀”的市场格局,但前提是能理解用户真实需求,否则不理解用户的语音将难以作为人工智能的切入口,而停留在语音只是语音的阶段。当下,正是该领域决胜负的关键战略期。

目前,科大讯飞语音大赛正在如火如荼报名当中,想与大咖之间合作,赶紧报名吧!

智能语音大赛:http://www.52solution.com/index.php/Home/Special/kdxfform.html


相关资讯
YXC可编程振荡器,频点100MHz,工作电压3.3V,应用于笔记本电脑

在笔记本电脑中,晶振通常用于控制中央处理器(CPU)和其他重要组件的时钟频率

YXC可编程晶振,频点10.48576MHz,封装5032,应用于光端机

在光端机中,晶振主要用于控制和同步数据传输、处理和调度

YXC可编程振荡器,频点22.578MHz,工作电压3.3V,应用于游戏机

晶振在游戏机中扮演着的角色是为CPU、GPU、音频处理器等各个组件提供稳定的时钟信号

永磁同步电机的工作原理及优势解析

永磁同步电动机具有结构简单,体积小、效率高、功率因数高等优点。永磁同步电动机已经在冶金行业(炼铁厂和烧结厂等)、陶瓷行业(球磨机)、橡胶行业(密炼机)、石油行业(抽油机)、纺织行业(倍捻机、细纱机)等行业的中、低压电动机中获得业绩,并逐步积累设计和运行经验。

超声波流量计设计要点及应用案例

超声波技术探测流速,测量点在机体前方,不破坏流场;测量精度高,测流线性,可测瞬时流速,也可测平均流速