[汽車之家 新鮮技術(shù)解讀] 最初駕駛員只能通過物理按鍵、旋鈕對車輛下達指令,別無他法。隨著智能網(wǎng)聯(lián)汽車的發(fā)展,“語音助手”已經(jīng)漸漸成了人機交互的重要方式,而面對未來的自動駕駛時代,語音交互似乎要有更高的地位;即便是現(xiàn)在,小鵬汽車給出的數(shù)據(jù)顯示,用戶的智能語音日常使用率在90%以上。怎么把大家愛用的語音系統(tǒng)做到更好?小鵬汽車即將用一次OTA給出答案。
此次OTA的推送只針對小鵬汽車P7(參數(shù)|詢價),P7最早于2020年4月27日上市,截至2021年6月份,該車累計銷量已突破3萬輛。除了706km的NEDC續(xù)航里程比較傲人外,該車的輔助駕駛能力、語音識別系統(tǒng)都有出色的表現(xiàn),比如小鵬P7的輔助駕駛具備高速NGP能力,其語音系統(tǒng)具備全場景語音能力,此次新語音系統(tǒng)的升級會為其錦上添花。
●新語音系統(tǒng)有了什么變化?
小鵬汽車將于2021年7月份下旬通過OTA向P7全系車型推送此次的新語音系統(tǒng),此次語音系統(tǒng)最重要的變化點就是語音助手(小P)擁有更加擬人化的音色,同時可實現(xiàn)具有情感變化的聲音輸出。至于語音助手的反應(yīng)速度、識別率、功能實現(xiàn)等方面,新系統(tǒng)基本保持和此前一樣的水平,并不會有顯著優(yōu)化。
『小鵬汽車全新語音系統(tǒng)官方展示視頻』
其實此次語音系統(tǒng)OTA的目的很好理解,就像我們能為小P換裝、換頭像一樣,都是提升人機交互體驗、提升情感交流的一種途徑。對于傳統(tǒng)意義上的語音助手來說,它可能只是用來幫你完成功能操作的機器人,話術(shù)死板、音色機械感強、沒有情緒變化;且不論語音助手的功能性是否強大,面對一個“純正的機器人”,你有欲望和它交流嗎?那如果語音助手的發(fā)音像個真的“小秘書”一樣,結(jié)果是不是不同?
這次的新語音能做到什么水平呢?首先是音色和音質(zhì),音色我們可以通過上面的視頻大致有一個了解,這種擬人化水平確實和目前其它汽車語音助手有了很大的區(qū)分,與此前的小P對比,也是大大削減了機械感。至于音質(zhì),小鵬汽車官方稱新聲音采用了24K采樣技術(shù),實現(xiàn)了高保真音質(zhì)。
針對音質(zhì)和音色水平,我們有一個參考,微軟MOS(Mean Opinion Score)語音質(zhì)量評測是一項國際通用的語音質(zhì)量評測方法,與真人、機器人聲音相對比,越大程度接近真實人聲就能獲得越高分數(shù),滿分5分,小鵬汽車的新語音助手獲得了4.49分,官方稱這是目前MOS評測中得分最高的車載智能語音助手。不過小鵬汽車也提到,這套MOS評測體系也僅是主觀評測,可供參考,但從專業(yè)角度來說,并不代表100%的準確。
另外,官方分享稱,此次升級后的語音助手可以表達情緒變化。現(xiàn)在所有的汽車語音助手都是單純的將文字轉(zhuǎn)化為語音而已,“語氣”平和毫無變化,但“新小P”將具備愉快、溫和、親熱、抒情、嚴肅、不滿、生氣、害怕、悲傷、冷靜等14種強烈情緒的變換能力,可以實現(xiàn)情緒變換、語速變化、抑揚頓挫等;這些會增強語音助手的擬人化屬性。不過我預(yù)計類似情緒轉(zhuǎn)換的能力可能還是只覆蓋部分內(nèi)容,并不會實現(xiàn)全量的覆蓋。
小鵬汽車稱目前這套語音系統(tǒng)也具備“針對實際情況來自行調(diào)節(jié)語速、情緒”的能力,但這個能力離真正上車還有一段距離,仍需要后期不斷培養(yǎng)、調(diào)整。目前為止,我們只有官方的示例視頻來參考,新語音系統(tǒng)的實際體驗會如何,我們會在7月下旬為大家?guī)矸窒,請期待?/p>
●小鵬汽車怎么實現(xiàn)的這些變化?
小鵬汽車的語音系統(tǒng)此次是使用了“超大規(guī)模在線神經(jīng)網(wǎng)絡(luò)引擎+小型離線拼接引擎”的技術(shù)組合,這是實現(xiàn)新語音的關(guān)鍵因素之一。不過這個方案對于運算量、時延、網(wǎng)絡(luò)抖動、與應(yīng)用相結(jié)合、聲音一致性等問題都有著較高的研發(fā)工作量、研發(fā)難度,所以如此的技術(shù)方案并不是目前車企們的普遍選擇。
“在線神經(jīng)網(wǎng)絡(luò)引擎+離線拼接引擎”能為語音系統(tǒng)帶來什么幫助呢?首先是發(fā)音方式、質(zhì)量,新語音助手的所有發(fā)音均由AI合成,現(xiàn)在部分語音設(shè)備的擬人化音色可能是通過錄音實現(xiàn)的,一旦涉及前期沒有進行過錄制的內(nèi)容,呈現(xiàn)出的聲音就會有差別,AI合成就避免了這點。另外,常規(guī)離線引擎的運算體量不是很大,帶來的弊端就是聲音質(zhì)感一般,而小鵬汽車此次用到了云上引擎,巨大體量的運算能力可以支持高質(zhì)量的聲音輸出。
在溝通會上,我們也提到,新聲音是否會對網(wǎng)絡(luò)有強需求?一旦在地庫或隧道等場景中斷網(wǎng),語音系統(tǒng)會不會降質(zhì)(聲音品質(zhì)下降,或降級到偏機械的聲音)?官方稱新語音對網(wǎng)絡(luò)的依賴較小,如果遇到嚴重的網(wǎng)絡(luò)抖動等情況,語音系統(tǒng)會用到離線引擎做保底,那時候的聲音確實會被降質(zhì),小鵬汽車研發(fā)人員表示,在前期測試中,這種情況發(fā)生的比例很低,可能也就1%、2%左右。實車表現(xiàn)如何,后續(xù)我們也會為大家?guī)韺嶋H體驗。
●關(guān)于新語音系統(tǒng)的其它好奇
從小P的角色定位、情感需求(要有自信、有親切感、信任感等)等角度出發(fā),小鵬汽車內(nèi)部從多種音色中選出了現(xiàn)在的小P。目前語音系統(tǒng)不支持在幾種不同音色的擬人化語音中進行切換,因為小鵬汽車認為,很難將每個聲音都打磨到非常好,這其中對AI訓(xùn)練量、服務(wù)器占用、延遲的縮小等諸多方面都有較高要求,所以“打磨出一款好聲音”比“個性化”的優(yōu)先級更高。
不過作為彩蛋,研發(fā)人員稱在某些功能、某些情景下,小P還是會有少數(shù)不一樣的情緒、聲音出現(xiàn),這要靠用戶自己挖掘了。
小鵬汽車的研發(fā)人員表示,他們內(nèi)部也考慮過這個問題,但除了技術(shù)難度、成本以外,還有小P的定位要思考,小P是個助手?秘書?還是用戶的親人?用戶會不會希望一個親人或朋友的聲音出現(xiàn)在語音系統(tǒng)中?針對這些問題,小鵬汽車還在思考中。屏幕前的朋友,你們怎么想?
截至目前,這套語音系統(tǒng)僅會在小鵬汽車P7上全量發(fā)布,至于其它車型,還要以日后的實際車型規(guī)劃為準,目前無法確定。
總結(jié):
還記得小鵬汽車P7語音系統(tǒng)的上一次重大OTA是加入了全場景語音功能,可見即可說,中控屏上的元素你都可以通過語音控制,而且不用記住那些死板的指令語,看見什么念什么就行。
“全場景語音”堪稱做到了汽車語音助手中一流的功能實現(xiàn)水平,它進一步完善了語音助手的功能豐富度;而此次更加擬人化、有情緒、有情感的小P則是從人機情感交流的角度大大提升了用戶體驗!叭珗鼍罢Z音”+“擬人化語音輸出”,小P又長大了,希望7月下旬的實車體驗?zāi)芙o我們帶來驚喜。(文/汽車之家 尤冬青)
好評理由:
差評理由: