OneShot連續(xù)說和免喚醒
在過去一年對車載語音控制的測試中,有兩個“高頻詞匯”——OneShot連續(xù)說和免喚醒。它們也是除“識別率”以外,我們最為看中的語音控制功能。
你有想過為什么一定要喚醒詞嗎?因為人在日常交流中很容易觸發(fā)語音控制中的某些功能,喚醒詞就是要規(guī)定一個時間段(喚醒之后到結束對話),在這個時間段內,語音引擎才對你說的話進行處理反饋。在現(xiàn)階段的語音控制技術下,如果沒有喚醒詞,你將被車載語音控制騷擾到自閉。
那為什么不能像日常交流一樣,直接叫名字呢?比如:李響,幫我打開空調。也是因為兩三個字的名字很容易被誤識別,導致誤觸發(fā)語音控制。所以喚醒詞通常會被設置成“疊詞”、“打招呼+名字”以及“某某同學”等,以降低誤觸發(fā)的概率。
但這也導致一個問題——人與人的交流模式完全不是這樣!下面這張圖是基本的車載語音控制交流模式,你看是不是特別熟悉。
OneShot是什么意思呢,很簡單,即喚醒詞可以和指令一起說,而不是先說喚醒詞,等待系統(tǒng)回應后,再下達指令。有了OneShot連續(xù)說功能后,是這樣的。
免喚醒詞又是是什么意思呢,顧名思義,連喚醒詞都免了,不需要呼出語音控制功能,直接下達指令即可,如下:
發(fā)現(xiàn)沒有,這是一個越來越接近人與人交流方式的過程,同時也是一個越來越缺乏禮貌的過程,對的,人的交流方式就是沒禮貌的。
以上是OneShot和免喚醒的含義和意義。而關于免喚醒詞,這里還要多說兩句,現(xiàn)階段,免喚醒主要分為兩種模式。
或是在音樂播放界面下,你可以直接說“暫!、“下一首”、“增大音量”,而不需要先喚醒語音控制功能。這是目前應用最廣泛的免喚醒方案。
在采用科大訊飛語音引擎的部分車型(長安CS95(參數|詢價)、奇瑞艾瑞澤GX冠軍版等)上使用的就是這套邏輯。
這里我們也看到,在大部分功能都可以直接下達指令的情況下,系統(tǒng)還是要限定一個時長,如果不限定時間,誤喚醒問題出現(xiàn)的概率仍然是難以接受的。試想一下,你和副駕駛愉悅地聊著今天天氣真不錯時,突然,系統(tǒng)開始自說自話:“今天北京天氣晴,空氣質量……”這樣的情況出現(xiàn)兩次,你可能就會永久關閉語音控制功能了。
小結
車聯(lián)網名詞注解系列的第一期,我們解釋了語音控制系統(tǒng)的幾個名詞,聊了它們的定義、背景和價值。人與人的溝通,其實絕大部分都是通過“說”和“聽”來實現(xiàn)的,當然,我們還有表情、手勢等等,相比之下,想要讓機器理解表情和手勢的含義就更難了。各大車企、研究機構、語音交互方案提供商口中的類人交互,就是讓機器學會理解語言、看懂手勢甚至體會情感,語音控制作為其中一項,也才處于起步階段呢。什么時候把“處理”真地變成“理解”,我們才進入了下一個更加智能的階段。(圖/文 汽車之家 鄭旭)
好評理由:
差評理由: