开启辅助访问
 找回密码
 立即注册

车载智能语音控制系统目前做得比较好的有哪些牌子?

market5 回答数5 浏览数853
车载智能语音控制系统目前做得比较好的有哪些牌子?
使用道具 举报
| 来自北京
notask | 来自北京
从18年开始,陆陆续续也算是开过了量产的不少新能源汽车品牌,车载语音做的比较好的,大致应该是下面的情况:
小鹏起步比较早,整体体验比较好。
蔚来稍晚一点,体验稍弱,但是整体上差距不大。
搭载华为智能座舱的问界,感觉后面量产交付以后,语音会是一个亮点~
为什么说这些品牌的语音控制系统做的比较好?我觉得主要是实现了以下几个方面的功能:
一、连续对话

相信现在家里有智能音箱的小伙伴应该比较多了,或者手机上的语音助手也大多都是标配了,我们在和这些语音助手对话的时候,往往需要不停的去唤醒他,比如我要放个音乐,然后声音低一点,再关个窗帘,那我一般要说:
XX同学,放一首百战成诗
好的
XX同学,声音小一点
好的
XX同学,关窗帘
窗帘已关闭
在这样的对话过程中,大家都会觉得这个对话有点傻,因为我需要不停的去唤醒语音设备,在车机上也是一样,明明一次讲话能搞定的事情,要反复喊三遍,大多数人应该都是会嫌烦的。
但是20年的时候,小鹏P7上首发的全场景语音就给出了解决方案,实现了所谓连续对话的能力,在这种能力下,实际上你一次唤醒后可以持续的给车机下命令,车机会持续监听你的声音,并持续执行命令,还是上面的那个场景,现在的场景就变成了
XX同学,放一首百战成诗
好的
声音小一点
好的
关窗帘
窗帘已关闭
怎么样?是不是觉得好多了?是不是感觉和平时的对话已经很像了~下面的视频是我录的一段连续对话的语音,大概一分多钟,感兴趣的小伙伴可以感受一下这个连续对话的能力和使用场景:


https://www.zhihu.com/video/1490452013939372032
当然,现在不仅仅是小鹏,包括蔚来,理想,零跑等很多品牌的车机语音都支持了连续对话能力,虽然连续的能力有差异,但是整体来说比那种需要一次次唤醒的要好多了。
二、多音区锁定

多音区锁定比较简单,就是主驾说话的时候,语音助手会锁定主驾的声音,只听主驾的命令,无论车上其他人说话,都不会听进去。同样如果是副驾在说话,那语音助手就会锁定副驾的声音,并不会听其他的人的声音。
这其实也是解决了日常驾驶中很大的痛点,因为在开车的时候,很多时候车上都有人,别人可能在说话,我要关个空调,可能还要先喊一声:
“你们不要说话啦!”
是不是感觉很离谱?有了多音区锁定功能,这个就很好应对了,比如下面的视频中,在问界的语音操作过程中,我在语音操作相机拍照的时候,旁边的小伙伴说了一声“这个可以!”但是丝毫没有对语音助手产生任何影响。

https://www.zhihu.com/video/1490454961061933056
三、语义识别

在我们开车的时候,我们经常会被各种情况所打断,比如刚打开空调,老婆说我想去吃个比萨,然后我们就会转而讨论吃比萨的事情,如果是平常的语音助手,就会陷入如下的场景:
你好,XX。打开空调
已经为您打开了
(转而对老婆说)吃什么比萨,昨天才吃的必胜客,今天又吃,太油了
你说的我还不懂,我不会(语音助手一脸焖逼)
但是,有了语义识别功能就不会了,语义识别可以很好了解你到底在说什么,如果是明显和车辆控制内容无关的话,语义识别都会把他过滤掉。从下面问界的对话视频中,我们也可以看的非常清楚:


https://www.zhihu.com/video/1490456377042243584
四、可见即可说

这个能力实际上就是说,大屏上的各种功能按钮,只要能够看见就能够通过语音操作,比如开大点风,打开摄像头,要去地图的什么地方,甚至控制视频快进几秒等等,绝大多数中控屏幕上手可以操作的内容,语音都可以控制。
这个能力其实非常适合当前的智能汽车,因为现在更多的智能汽车在采用中控大屏,而取消了太多的物理按键,导致使用中控功能的成本非常高,在这样的情况下,通过语音来控制,实现驾驶员想到什么只要说出来,让车机去做到,是一个比较简单的方式。
在下面的视频中,问界上的华为车机非常经典的表现出了控制的功能,包括相机,导航,音乐,设置等全部可以用语音操作:


https://www.zhihu.com/video/1490458087672283136
五、对话速度

对话速度是一个实用性非常高的指标,就向我们平时和人说话一样,如果你遇到一个说话都需要半天才能有反馈的人,你肯定是十分焦急,不愿意和这个人继续交流下去,车机也是一样,在这个方面,现在的车机反馈中,各家的速度都有提升,在我的体验中,我觉得小鹏和问界算是比较领先的。
在下面的视频中,一分钟的时间里,小鹏车机应该是执行了超过20个各种指令,反应速度可以说是相当惊人了。
六、可自定义个性化设置

在这个方面,主要还是因为现阶段的语音助手的预先设计里实际上无法满足每个人个性化的需求,比如有的人上车喜欢先开空调后放音乐再调整座椅,有人喜欢先调整座椅再放音乐再开空调,有人喜欢叫语音助手小甜甜,有人喜欢叫小哥哥,还有人想给副驾驶来个意外惊喜!
针对这些个性化的需求,最好的办法就是来个自定义了,让用户自己来对语音助手的回答和操作进行定义,从而满足车主的要求,比如下面视频中,车机对于小爱同学的一番争风吃醋,就是完全自定义的结果:
所以,整体来说目前的车载语音体验可以来说比起以往有了很大的提高,使用语音操控车机的比例越来越高,随着自动驾驶技术的不断进步,相信将来,开车动动嘴也不是什么难事了,比如下面这个场景,就让人有无限遐想:
<hr/>所以,看到这里,还不点赞+关注再走么?
我是大包子狸,智能科技控和新能源汽车爱好者。
已经陆续免费推荐超过100+朋友选择适合他们的新能源车;
我会持续更新各种新能源车的体验,以及相关知识、股票等经历的分享;
有任何新能源汽车的问题欢迎关注,留言,星辰大海,一起遇见!
也许你对这些内容也感兴趣:
<a href="http://www.zhihu.com/question/500022361/answer/2232727138" class="internal">如何评价广州车展亮相的小鹏 G9?
自动驾驶领域,所谓「全栈」是什么意思?为什么车企都要传播「全栈自研」的概念?
纯电动汽车能跑长途吗?
小鹏 P7、Model 3、比亚迪汉这三款车该如何选择呢?
如何看待特斯拉高速死机后靠手机导航行驶?
如何看待新能源车高速服务区排队 4 小时充电?新能源车在运行中都可能存在哪些问题?
回复
使用道具 举报
深圳足球 | 来自北京
结合了人工智能的车载语音交互系统作为汽车智能网联时代的代表性产物,将被更广泛地运用于汽车之中。
不论是苹果公司iOS系统中的智能语言助手“Siri”,还是微软Windows系统中的“Cortana”,智能语音交互早已融入我们生活之中。随着汽车产业的发展,用户消费形态的改变,自动驾驶、智能座舱、新能源这些概念已经逐渐落地成为现实,智能语音交互与汽车之间也擦出了别样的火花。 由于驾驶汽车无法解放双手,对于人机互动的需求,则更多需要通过语言来实现。因此,结合了人工智能的车载语音交互系统作为汽车智能网联时代的代表性产物,被更广泛地运用于汽车之中。 据盖世汽车研究院报告显示,随着消费者对座舱体验要求的提升,智能座舱将融合更多智能化、数字化功能,使得其单车价值量将大幅提升,2030年有望达到千亿规模。车载语音交互系统作为智能座舱中不可或缺的一部分,是车内最直接、最人性化、最安全的交互方式,随着AI和硬件性能的增强,也将成为未来最主要的车内交互方式。


图片来源:盖世汽车研究院
解决难点成行业首要共识
智能语音交互主要有三大重点,分别是识别、理解、执行。在目前提供解决方案的厂商中,识别部分已经趋于成熟,识别率可以达到90%以上,像是数据堂等公司的识别率已达95%左右。行业的痛点主要聚焦于“理解”部分,大部分的车载语音交互系统在“理解”上并不智能,其主要体现在操作复杂与交互机械两个方面: 现在大部分厂商提供的语音交互解决方案是通过触摸屏与部分语音相结合的方式进行交互。同时在屏幕内的不同应用中还内置了不同的语音方案,这也带来了许多的操作不便。 此前传统主机厂提供的前端语音交互的功能,大部分采用命令控制。用户需按照指定命令去进行交互,机器不具备语义理解能力。交互机械化,导致整个系统功能单一、命令词单一。 此外,虽然语音识别准确率已经达到了一个较高的水平,但是用户毕竟是一个有独立精神的个体而非机器人,“口误”随时可能发生。因此在语音交互时,具有很大的不确定性,由于缺乏适应用户语音使用习惯的系统,以至于达不到正常的交互,无法完成用户设定的目标。 如何让车载语音交互系统像人一样理解我们的话语?这主要涉及到NLP(自然语言处理)技术,它们对于用户输入语音的理解与本身的场景策略、多轮对话有着密不可分的关系,并直接决定着车载语音交互系统的智能化程度。
如何交互,语音识别提供商献计献策
目前谷歌在NLP技术中处于一枝独秀的地位,但在国内中文车载语音交互市场,科大讯飞、微软、数据堂、亚马逊、百度等公司都在云服务和NLP技术领域拥有不俗的实力。 科大讯飞作为汽车智能化领域的先行者,自2003年开始,深耕汽车智能化领域,使人工智能技术在汽车产品上得到了深度应用。目前合作已覆盖90%以上的中国自主品牌和合资品牌车厂,累计前装搭载量突破 3600万套。 对于智能座舱提供了一整套解决方案。以全链路的产品和服务合作为基础,让用户的体验和管理持续迭代、持续在线。他们不仅仅停留于语音交互,还融入视觉和声纹多模感知交互等,让智能语音系统不再只服务于驾驶者。此外,科大讯飞还在车载语音识别系统中加入了深度学习功能,致力于为汽车用户打造一个专属自己的虚拟人工助理。值得一提的是,截止至2021年10月,科大讯飞共夺得38项国际人工智能大赛冠军,在人工智能领域建树颇多。


科大讯飞车载语音系统;图片来源:科大讯飞 车载语音交互系统离不开语音识别技术的支持,即在文中一开始提到“识别”的部分。语音识别作为一种基础层感知类技术,既可以作为核心技术直接应用于终端产品,也可以仅作为一种感知类辅助技术集成于语音助手、车载系统、智慧医疗、智慧法院等场景的产品中。
数据堂专注于AI数据服务,作为国内首家上市的人工智能数据服务企业,拥有国际领先的自主核心数据处理技术,已实现基于ML辅助技术进行大规模数据生产的能力。在语音识别数据领域,数据堂现有20万小时的成品语音数据集,覆盖多设备、多类型、多环境与多语种,可快速帮助企业快速提高语音模型识别准确率。


成品语音数据覆盖30个语种;图片来源:数据堂
如何让系统更懂你,仍有许多思考空间
从专业的角度而言,语音识别作为一门交叉学科,涉及到从语言学到通信理论等多方面内容,还涉及到声纹、TTS、ASR、RNN等等一系列技术,同时要对一些特定领域有着深入理解。此外,汉语语义复杂,各地口音众多,也为系统开发增添了不小的难度。所以为智能语音交互提供解决方案是依靠相关企业共同合作还是一家企业独立完成,成为了未来的一个观察方向。 从产业的角度而言,语音交互的发展趋势正在从单模交互向和其他交互方式配合的多模交互发展。比如在车载系统中,语音识别结合虹网膜识别用来来判断驾驶员的疲劳程度;车载语音机器人通过声音和脸部识别抓取,判断用户的行为轨迹。因此车载语音如何构建与摄像头、座椅等配件的联动,真正实现智能座舱的一体化协同发展,也需要车载语音交互系统提供商们思考。 从市场的角度而言,汽车作为一个整体性销售的产品,无论是硬件还是软件,用户在使用中出现问题,首先想到的一定是寻找车厂解决,所以主机厂在寻找第三方合作的时候都会很谨慎。目前车载语音交互系统的提供商与主机厂合作关系良好,但是作为软件的部分,其涉及后续的OTA与是否付费的探讨。因此,未来主机厂会不会独立开发或者请提供商为其开发一套属于自己的语音交互系统也是一个值得思考的方向。
多方合作方能领创未来
车载语音交互系统需多方合作已经成为行业内的广泛共识。如何合作才能使效益最大化、结果最优化,让汽车真正变成满足消费者情感化与个性化需求发展,进化成围绕乘坐体验的“智能移动空间”是行业内需要思考的问题。
回复
使用道具 举报
漫步江南 | 来自北京
人与车最佳的交互方式是什么?
通过以上视频,我们可以看到帝豪F500+的AI智能语音功能对比老车机有了飞跃性提升,实现“可说即可见”,通过语义分析车主的控制意图,而不再是单纯的关键字的语音指令,能多轮会话、智能纠错、连续打断等,同时支持跨垂类语音回复,交互更加多元化。这是因为GKUI 19系统中搭载了相当于AI智能语音核心大脑的NLU系统(自然语言理解),并在此基础上接入了第三方NLP(自然语言处理)能力,从而支持更多垂类的语义理解。
总结一下AI语音的功能:
智能查询:
帝豪F500+的语音适用范围涵盖了天气询问、酒店、机票/火车票预订、历史、人物、新闻、股票、度量衡、货币兑换、圆周率、数学计算查询等多领域的出行服务查询和知识查询。
连续打断:
在不断的连续提问过程中,帝豪F500+的AI语音不需要再次唤醒,可以正常的保持沟通,且依然能够保持识别语音的准确性,精准回答车主的提问。
语意理解:
在我们查询某一个地区的机票,并同时想要了解当地的信息时,帝豪F500+的AI语音可以明确了解我们的语音意图,关联上段语言,回答出我们想要的答案。
总结一下AI语音的优势:
解放双手:从一句“你好吉利”开始,所有需要额外操作的功能,都可以用语音来解决,比如听歌、导航和信息查询。
易操作性:语音是我们与这个社会交流的基本技能,汽车的语音交互功能无疑节省了我们的学习成本,简单,方便。
自主学习:精准识别车主语音信息,所听所闻皆会思考,多沟通即可深度学习。
回复
使用道具 举报
jjhdptk | 来自北京
要说车载智能语音,还得回到电影《2012》里面那辆炫酷的宾利欧陆飞驰,当时看电影的时候还想着,啥时候自己也能有一辆这么黑科技的车。不管当时多么天真,起码梦想还是要有的,万一实现了呢?
大家看现在,事实是车载智能语音几乎成了标配,尤其是这些年国产自主品牌的强势崛起之后,想要一款搭载智能语音控制的车,已经不再是10万级起步了,10万以下的车型也基本都搭载了。


的确,车载语音确实走进了我们普通人的生活,但识别率确实也是一个大问题。所以说,要想把语音控制做好就得先从语音识别动手。
智能语音包括语音识别和语音合成两大部分。语音识别是一门交叉学科,语音识别技术所涉及的领域包括:信号处理、模式识别、概率论和信息论、发声机理和听觉机理、人工智能等等。语音识别技术就是让机器通过识别和理解过程把语音信号转变为相应的文本或命令的高技术。语音识别技术主要包括特征提取技术、模式匹配准则及模型训练技术三个方面。


目前,在语音识别方面,中国市场数科大讯飞一家独大,放眼整个全球,估计也就siri背后的语音技术支持Nuance可以抗衡。在全球语音技术市场,Nuance占据了2/3的市场份额,并为三星、诺基亚、摩托罗拉、HTC、福特等公司提供语音技术。像福特汽车旗下福克斯搭载的第一代SYNC系统,可识别近100条语音指令,其语音控制功能采用简单的操作方式,通过语音指令可完成电话拨打、短信处理和音乐搜索及播放功能。
但是社会总是在发展的,自从福特汽车进入中国市场,本土化的越来越明显,最近发布的福特领界搭载的智能语音控制系统,就是应用的科大讯飞语音技术,可以识别多种带口音普通话指令。


但对于中国人来说,这远远不够。隔一条河都听不懂对岸方言,才是真正的中国特色。这一点科大讯飞肯定会做重点来抓的,像奇瑞之前出的几款车就是应用了科大讯飞方言识别的语音技术,也算是为国产自主品牌争了一口气。


最近奇瑞不是要上市两款高端车型了么,星途TX/TXL,同时还发布了它们要搭载的i-Connect@Lion 2.0系统,最大的亮点就是AI智能技术,语意词库非常强大。当然,前面提到的福特领界也有这个功能,但是要说强大,还得算星途,为啥?星途有百度做背后的技术支持者啊,百度在AI人工智能这方面在全球来说,也是首屈一指的地位。小度车载OS系统不仅能听懂,还会看脸色行事、说话,当然,这背后肯定和百度这么多年积累的大数据密不可分。


有全球AI智能牛到飞起的小度车载OS系统提供AI智能技术支持,星途搭载的雄狮智云2.0从目前来说,应该可以在前三里面有一席之地了。
以上纯属个人看法,以及来自网上查找的资料,大虾们高抬贵手,不喜勿喷。
回复
使用道具 举报
abc332 | 来自北京
关于这个问题,简单的说说自己的看法吧,抛砖引玉。
其实最早接触智能语音还不是在汽车上,而是手机,很多人比较熟悉的siri,标准普通话/英语说出固定的指令,siri也会遵循指令打开相应的APP,或者予以回复。从使用手机的角度来说,这些还是够用的,仅限于娱乐嘛。


但是类似的系统植入到汽车智能这块,要求肯定会更高一些,事关到安全方面。而且智能语音控制做的好,可以解放很多手动的操作,避免开车分心,实用性好。
早期车载智能语音控制系统的功能是比较单一的,我记得第一次接触是朋友的车,只能调节导航和音乐,但是这些通过方向盘上面的按键就可以解决。然后就是指令的繁复性,通俗点讲,就是流程太多了,操作慢,浪费时间。再就是语音识别了,这真的是一个很大的BUG,想用还得记住标准指令、普通话过级,一步错,又重来。
不过时代总是在发展的,技术也是在不断更新和提升,当前的车载智能语音控制系统,准确的说应该是车载智能语音交互系统,不仅能听懂带口音的普通话,再高级一点就是语义理解。
语音识别,主要依靠的就是科大讯飞的语音识别解决方案,这个不用多说,大家用手机肯定是知道的,现在很多国产都基本能做到这些了。


语义理解,主要靠的就是AI智能了。这方面做的比较好的,还得数互联网起家的造车新势力了,蔚来汽车,是做的很OK的,中控台上的小机器人也是挺萌的。当然,传统造车势力肯定不会甘于落后,比较荣威RX5,搭载了阿里开发的YunOS系统,后来改名AliOS系统,比如车内温度,大冬天的暖和一点肯定舒服一点,唤醒AliOS,说一句”太冷“、”好冷“,系统就能自动识别你的需求,把温度调高一点。这也是当初荣威RX5火爆起来的一大亮点吧。


在车机这块进步最大的,我个人感觉奇瑞是值得一提的。之前发布的艾瑞泽、瑞虎8上面搭载的智能语音交互系统就已经具备方言识别的功能了。


奇瑞一直走的就是亲民路线,所以这项功能对它来说,确实是很有必要的。最近看网上的资讯有说到奇瑞的新款高端EXEED星途,百度Apollo小度车载OS系统的首款量产车,搭载的雄狮智云2.0系统具备AI人工智能语音助理功能和主动关怀的功能,除了像AliOS系统一样可以听懂话,还能通过人脸识别看懂用户的表情,如果表现出疲态,这套系统就会自动说一点关怀的话,比如”你还好吗?“”你累吗?“”想听首轻松的音乐吗?“等等。
看到国产自主品牌在智能语音交互和AI智能这块的成绩,不得不感慨,国产自动驾驶的梦想还是可以实现的。
回复
使用道具 举报
快速回复
您需要登录后才可以回帖 登录 | 立即注册

当贝投影