都说文无第一武无第二,但是针对语音助手这个问题来说,我们讨论“最好”的时候,各家其实还真的都有各自能拿出来一较高下的亮点。传统的移动端研发公司,几乎都在说自个有什么“黑科技”,尽管不论是2B或是2C端用户,“黑科技”这个词都是最能触及到大众认知层面到词汇。
但是从现实层面来说,还真的没有那个的黑科技能突然投入到广泛的实际应用层面,至少针对语音助手来说,最重要的不是功能,而是其整合能力和综合素质的体现,以及其能力的衍生范围,是作为一款语音app,或是作为一台真的能切实改变我们生活的“助手”。
所以对此,我们可以稍微分析一下当前市场环境下语音助手的不同优势作为评判——
先拿百度比较引以为傲的小度来说,百度在自然语言处理(NLP)领域,确实积累非常深厚,目前来说它们最大的亮点在于对话式语音操作系统,并且拿到了专利金奖,而且在此基础上,小度在2021百度大会上,将小度的场景进阶到除了家庭之外的更多场景中,随身设备和音质的提升,主打沉浸体验,而且方向上基本也从”语音“转型到”视听体验“上。
小米的小爱同学,去年完成了升级,在开发者大会上5.0版本的发布从语音助手升级为智能生活助手,还升级了五大场景,但是这次升级对我来说,形式意义远大于实际意义,确实能让很多消费者感受到语音模式的进化,比如全景智能协同和对话主动智能,但是在小米生态之下,它单独的存在或是和从前几乎没有任何拓展。
至于你和我说华为的小艺和荣耀的yoyo……有用过的朋友可以在评论区留言,我就不过多吐槽了……
同样是作为语音助手,天猫精灵,最近几年被达摩院打磨的是越来越好了,上文中大家吹过的牛,天猫精灵几乎都能实现,不仅如此,天猫精灵还在IoT生态的移动端用户交互入口位置做的更优秀,在“双端一体”的层级表现上更成熟。而且在此之外,还将语音助手完全拓展到了传统场景外的汽车行业,真的把使用场景做到大跨步“出圈”,而这些也离不开斑马智行的巨大助力。
同样来自达摩院的技术,斑马智行加持下的语音助手系统,已经几乎占据了车载语音助手的头把交椅。可以这么说,作为行业内首个将语音定义为车内第一交互方式的头部玩家,斑马智行从指令交互到自然对话交互升级,再到斑马洛神智能座舱系统实现的AI语音学习能力,尽管从16年才开始引入车载智能语音助手,但是短短5年,已经完成了车载智能操控语音方面的超级蜕变。
小鹏的语音优势集中在车控方面的诸多细节,比如打开车窗可以说百分比,也可以进行简单的对话闲聊,但自主学习的能力和潜力在实用型场景中远远不够,对于人声命令的触达机制也停留在“语音”阶段,而不是精益求精的“语义”层面,而语音和语义有着天壤之别的巨大差异;
理想one的语音助手,主打形象牌,虽然近两年才在ota过程中强化了语音的能力,例如“所见即所说”,但是它最大的弊端,仍在于或是只能一句指令一句回答,单次的唤醒。
打个比方说,你每一次都需要重新问一台问题,它既不会记得你之前的话,也不会猜测你后面想问什么,纯粹的语音指令交互。严格来讲,它所做的所谓创新性努力都还停留在平台型的需求补给层面,而我看到有人说Siri,不好意思,你的Siri实际上也只停留在这一层。
但是斑马智行的语音,很早就完成了“所见即所说”目前甚至可以支持90s连续自然语对话,也就是上文所说的“语音不同于语义”。
这里的90s的背后,其实是AI在理解语义的复杂过程,打个比方说,当你问到“今天天气如何?”时,语音助手一般都会给出完整的回答,但是当你继续问到“那明天呢?”一般的语音助手就会从基础应答开始,陷入迷茫:“对不起,我好像听不懂您在说什么”,而这样割裂的对话,显然不适合我们的沟通习惯,但是理解语义的关联后,就好像学语文时常说的上下文的理解,可以更顺畅的完成信息交互过程。
语音和语义的区别就在于,一台是通过你的直接指令给出反馈,另一台则是通过你说的话,猜测你的意图,而这两个从能力上有着天壤之别:纯粹的语音指令不会添加任何的AI导向,服从命令就够了,而语义则更切合日常中我们和朋友一样的交谈方式,它会思考,会构建完整的对话体系,从而完成更严格的工作任务。
从这一点上来说,斑马智行这波又是站在第五层。
而且斑马智行目前的洛神系统,可以通过达摩院AI语音平台的学习能力,将一些原本不会的指令通过用户的教学引导,学习掌握新技能。
打个比方说,你的一些口语习惯可能一开始它没法理解,但是当你稍微换种方式让它理解后,它也会马上将指令记录下来,学习新的指令说法。而遇到非常难以理解的问题时,它则会转到后台学习平台进行“学习”,通过人工/自动标注的方式掌握,并在后续使用中提醒你学会了新知识。
这就非常“贾维斯”了!想想看,不同于统一的系统AI识别应答,每个人都可以通过洛神系统得到自个的专属管家助手,而且时间越久,你们的配合就越默契。能够沟通交流自个学习成长的AI语音,才是未来人工智能的正确方向。
就像我开头所提及的那样,语音助手的终极到底是指什么?是一款语音app或是一台真能切实改变人们生活方式的“助手”呢?这个问题的最终答案到目前来说,仍然没有揭晓,但是我们几乎也能遇见到未来将会有一场白热化的“语音大战”,而这场大战我显然更看好天猫精灵和斑马智行的强强联合,因为正是有他们拓宽赛道的一系列操作,才让这个起跑线和竞争门槛拉高,不再将技术禁锢于语音本身,开拓出了更多的场景与功能,而这些技能树的疯狂点亮,无疑就是斑马智行一直在做的事——
依靠科技改变的不仅仅是科技本身,而是改变你原本以为熟悉的各个行业。在AI的想象空间没有到达突破人类极限之前,我们对此可以抱有无限的期待,因为它确实值得这份期待。 |