[汽車之家 新鮮技術(shù)解讀] “一人開車時(shí)喜歡用語(yǔ)音系統(tǒng),全家人都在車上的話就算了。”,跟一位剛買“智能車”的朋友聊天,不經(jīng)意間他說了這樣一句話。
近年來,各家推出的新車或多或少都跟“智能化”有了聯(lián)系。作為實(shí)體按鍵和觸控屏之外的新操作方式,能動(dòng)嘴盡量不用你上手的語(yǔ)音控制,愈發(fā)常見也受到了不少消費(fèi)者歡迎。不過易受其他乘客聊天干擾、對(duì)后排乘客發(fā)出的指令識(shí)別能力較弱,是不少語(yǔ)音系統(tǒng)的不足。可對(duì)上有老下有小的家庭用戶來說,家人的聊天往往是語(yǔ)音交互的背景音。本該大秀一場(chǎng)的好功能施展不開拳腳,文章開頭的那句話,就是車主們的無(wú)奈。
作為中國(guó)新勢(shì)力車企中聚焦家庭用戶的代表,計(jì)劃本月中旬向用戶推送2.2版車機(jī)系統(tǒng)的理想,將帶來哪些新功能、車主們的“無(wú)奈”會(huì)迎刃而解嗎?咱們一起搶先體驗(yàn)一下吧。
2.2版本都有啥?
在2021款理想ONE(參數(shù)|詢價(jià))上市之后,理想發(fā)布了今年的語(yǔ)音系統(tǒng)升級(jí)計(jì)劃。在推出包含喚醒打斷、動(dòng)力與駕駛模式語(yǔ)音控制等功能,并將底層能力換為地平線+思必馳+微軟的FOTA2.1之后,理想將在FOTA2.2加入連續(xù)對(duì)話、可見即可說、四音區(qū)鎖定和跨音區(qū)上下文對(duì)話等功能,同時(shí)上線了“應(yīng)用中心”擴(kuò)充車機(jī)里的軟件。
這些新功能既減少了你說喚醒詞的次數(shù),也能在不打斷家人聊天時(shí),讓語(yǔ)音系統(tǒng)準(zhǔn)確識(shí)別用戶指令。說白了,上圖這些就是針對(duì)全家人駕車出行的場(chǎng)景,以及語(yǔ)音系統(tǒng)的短處研發(fā)的功能。
20秒連續(xù)說/爽點(diǎn)竟是“我也要”
顧名思義,連續(xù)對(duì)話是指喚醒語(yǔ)音系統(tǒng)后,在一段時(shí)間用戶可以連續(xù)說指令,而不用多次說出喚醒詞。
舉個(gè)例子,想打開空調(diào)和座椅通風(fēng),通常需要喚醒兩次語(yǔ)音系統(tǒng)并分別進(jìn)行操作。伴隨說喚醒詞次數(shù)的增加,不僅麻煩還會(huì)覺得自己很“話癆”,更不用說與機(jī)器人對(duì)話產(chǎn)生的違和感造成的“不爽”了。我拍了段視頻,大家感受一下。
除了理想之外,小鵬和長(zhǎng)安等車企也提供了“連續(xù)說”功能,想到哪說到哪、一次不到位還能連續(xù)調(diào)節(jié),過程中減少了說喚醒詞的次數(shù),操作也就沒那么繁瑣了。至于如何讓交互體驗(yàn)不像跟機(jī)器人說話,聽懂上下文邏輯是解決方案之一。
支持連續(xù)識(shí)別、掌握上下文邏輯銜接后,相比“一次一句、反復(fù)喚醒”的傳統(tǒng)語(yǔ)音系統(tǒng),現(xiàn)在的“理想同學(xué)”能省去不少麻煩事。可在用更好的體驗(yàn)吸引更多用戶之前,它還要面對(duì)一個(gè)難題——抗干擾。
生來就會(huì)四音區(qū)識(shí)別的理想ONE,能自動(dòng)判斷語(yǔ)音系統(tǒng)應(yīng)該重點(diǎn)關(guān)注的位置,雖然像打開車窗這種操作,無(wú)需用戶說“右后”等定向詞,但座艙內(nèi)的背景音依舊會(huì)干擾系統(tǒng)識(shí)別。對(duì)于全家自駕游的用戶來說,讓家人們暫停聊天總顯得不太和諧,因而在音源定向識(shí)別的基礎(chǔ)上,理想加入了無(wú)效文本拒識(shí)能力。
所謂無(wú)效文本拒識(shí),就是系統(tǒng)會(huì)在識(shí)別的對(duì)話中,依靠算法“挑出”指令并執(zhí)行。乘客們聊天不會(huì)干擾人機(jī)交互,語(yǔ)音系統(tǒng)也能更好的應(yīng)對(duì)多人出行場(chǎng)景了。文字太蒼白,還是請(qǐng)朋友看視頻吧。
“氣氛組”一番嘗試后,系統(tǒng)依舊能識(shí)別出副駕乘客說出的指令。從聊天話語(yǔ)中找到“指令”后,系統(tǒng)會(huì)用加粗和高光,告訴操作者指令已被識(shí)別。
希望在旅途中享受片刻寧?kù)o的你,想想自家對(duì)科技情有獨(dú)鐘、精力旺盛的“小怪獸”,這個(gè)功能“香”不?掌握應(yīng)對(duì)“小怪獸”的技巧后,理想將多音區(qū)識(shí)別和上下文邏輯銜接合在了一起。如果想系統(tǒng)幫你完成與上一位操作者相同的動(dòng)作,現(xiàn)在只說“理想同學(xué),我也要”就夠了。下面視頻里有完整演示哦。
用“我也要”三個(gè)字復(fù)刻之前乘客的全部操作,體驗(yàn)簡(jiǎn)短卻足夠打消你嫌棄說話字多、太累,不如直接動(dòng)手用實(shí)體按鍵旋鈕操作的念頭。無(wú)論說激發(fā)用戶使用語(yǔ)音系統(tǒng)的潛力,還是弱化了語(yǔ)音操作在個(gè)別場(chǎng)景下效率不高的長(zhǎng)尾問題,這項(xiàng)功能都稱得上2.2版系統(tǒng)的一個(gè)爽點(diǎn)。
想點(diǎn)哪里直接說/體驗(yàn)上的小亮點(diǎn)
一套好的語(yǔ)音系統(tǒng)應(yīng)該讓用戶只動(dòng)嘴不動(dòng)手,可實(shí)現(xiàn)這個(gè)最終目標(biāo)之前,要實(shí)現(xiàn)無(wú)數(shù)個(gè)“小目標(biāo)”,比如部分功能做到“可見即可說”。在理想2.2版系統(tǒng)中,QQ音樂、喜馬拉雅、藍(lán)牙電話和車輛中心四項(xiàng)功能率先做到了這一點(diǎn)。
從視頻中可見,系統(tǒng)不僅能識(shí)別頁(yè)面中的文字,還能根據(jù)“返回”指令選中相應(yīng)圖標(biāo)。同時(shí)只需說出目標(biāo)選項(xiàng)中的幾個(gè)字,系統(tǒng)就能找到你想要的那個(gè)。做到部分場(chǎng)景非必要不上手之余,可見即可說功能也為坐在第二/三排、無(wú)法點(diǎn)擊屏幕的乘客提供了便利。
不過體驗(yàn)過程中我們發(fā)現(xiàn)了兩個(gè)小問題,一來,系統(tǒng)偶有需要操作者放慢語(yǔ)速才能聽懂的情況;二來,彈出音樂列表后只能說歌曲名,系統(tǒng)無(wú)法識(shí)別“第幾個(gè)”這樣的話術(shù),這個(gè)細(xì)節(jié)可以再完善一下。
另外,理想聯(lián)手微軟打造了基于云端的在線神經(jīng)網(wǎng)絡(luò)深度學(xué)習(xí)模型,通過緩存并在有需要時(shí)播放出好聽的聲音,減少了語(yǔ)音系統(tǒng)較為機(jī)械的發(fā)音。這就是上文多段視頻中,“理想同學(xué)”聲音的由來,至少男同學(xué)們應(yīng)該很喜歡“她”。
應(yīng)用中心上線
伴隨理想應(yīng)用中心登陸2.2版系統(tǒng),車機(jī)能覆蓋到的場(chǎng)景和提供的音/視頻內(nèi)容得到了擴(kuò)充。
中控屏與副駕屏中的應(yīng)用不盡相同,前者以在線音樂/音頻類為主,后者主要提供視頻類軟件,提供聲音類內(nèi)容的只有“愛趣聽”。
寫在最后
廠方人員跟我說,這次搶先體驗(yàn)的2.2版車機(jī)系統(tǒng),將在本月中旬推送給理想ONE的車主們,雖然可優(yōu)化的地方還有,但整體上說很值得期待。特別是連續(xù)對(duì)話、無(wú)效文本拒識(shí)和跨音區(qū)上下文對(duì)話功能,可以說是針對(duì)當(dāng)前語(yǔ)音系統(tǒng)短板,以及居家出行的車上場(chǎng)景而來。至于正式版會(huì)把“細(xì)節(jié)”打磨成什么樣?咱們繼續(xù)期待吧。(圖/文 汽車之家 馬一凡)
好評(píng)理由:
差評(píng)理由: