OneShot連續(xù)說和免喚醒
在過去一年對(duì)車載語音控制的測試中,有兩個(gè)“高頻詞匯”——OneShot連續(xù)說和免喚醒。它們也是除“識(shí)別率”以外,我們最為看中的語音控制功能。
你有想過為什么一定要喚醒詞嗎?因?yàn)槿嗽谌粘=涣髦泻苋菀子|發(fā)語音控制中的某些功能,喚醒詞就是要規(guī)定一個(gè)時(shí)間段(喚醒之后到結(jié)束對(duì)話),在這個(gè)時(shí)間段內(nèi),語音引擎才對(duì)你說的話進(jìn)行處理反饋。在現(xiàn)階段的語音控制技術(shù)下,如果沒有喚醒詞,你將被車載語音控制騷擾到自閉。
那為什么不能像日常交流一樣,直接叫名字呢?比如:李響,幫我打開空調(diào)。也是因?yàn)閮扇齻(gè)字的名字很容易被誤識(shí)別,導(dǎo)致誤觸發(fā)語音控制。所以喚醒詞通常會(huì)被設(shè)置成“疊詞”、“打招呼+名字”以及“某某同學(xué)”等,以降低誤觸發(fā)的概率。
但這也導(dǎo)致一個(gè)問題——人與人的交流模式完全不是這樣。∠旅孢@張圖是基本的車載語音控制交流模式,你看是不是特別熟悉。
OneShot是什么意思呢,很簡單,即喚醒詞可以和指令一起說,而不是先說喚醒詞,等待系統(tǒng)回應(yīng)后,再下達(dá)指令。有了OneShot連續(xù)說功能后,是這樣的。
免喚醒詞又是是什么意思呢,顧名思義,連喚醒詞都免了,不需要呼出語音控制功能,直接下達(dá)指令即可,如下:
發(fā)現(xiàn)沒有,這是一個(gè)越來越接近人與人交流方式的過程,同時(shí)也是一個(gè)越來越缺乏禮貌的過程,對(duì)的,人的交流方式就是沒禮貌的。
以上是OneShot和免喚醒的含義和意義。而關(guān)于免喚醒詞,這里還要多說兩句,現(xiàn)階段,免喚醒主要分為兩種模式。
或是在音樂播放界面下,你可以直接說“暫停”、“下一首”、“增大音量”,而不需要先喚醒語音控制功能。這是目前應(yīng)用最廣泛的免喚醒方案。
在采用科大訊飛語音引擎的部分車型(長安CS95(參數(shù)|詢價(jià))、奇瑞艾瑞澤GX冠軍版等)上使用的就是這套邏輯。
這里我們也看到,在大部分功能都可以直接下達(dá)指令的情況下,系統(tǒng)還是要限定一個(gè)時(shí)長,如果不限定時(shí)間,誤喚醒問題出現(xiàn)的概率仍然是難以接受的。試想一下,你和副駕駛愉悅地聊著今天天氣真不錯(cuò)時(shí),突然,系統(tǒng)開始自說自話:“今天北京天氣晴,空氣質(zhì)量……”這樣的情況出現(xiàn)兩次,你可能就會(huì)永久關(guān)閉語音控制功能了。
小結(jié)
車聯(lián)網(wǎng)名詞注解系列的第一期,我們解釋了語音控制系統(tǒng)的幾個(gè)名詞,聊了它們的定義、背景和價(jià)值。人與人的溝通,其實(shí)絕大部分都是通過“說”和“聽”來實(shí)現(xiàn)的,當(dāng)然,我們還有表情、手勢等等,相比之下,想要讓機(jī)器理解表情和手勢的含義就更難了。各大車企、研究機(jī)構(gòu)、語音交互方案提供商口中的類人交互,就是讓機(jī)器學(xué)會(huì)理解語言、看懂手勢甚至體會(huì)情感,語音控制作為其中一項(xiàng),也才處于起步階段呢。什么時(shí)候把“處理”真地變成“理解”,我們才進(jìn)入了下一個(gè)更加智能的階段。(圖/文 汽車之家 鄭旭)
好評(píng)理由:
差評(píng)理由: