智能座艙人機(jī)交互發(fā)展淺析
目前,汽車不僅在動(dòng)力源、驅(qū)動(dòng)方式和駕駛體驗(yàn)上發(fā)生了變化,駕駛艙也告別了傳統(tǒng)的枯燥機(jī)械和電子空間,智能化水平飆升,成為繼家庭和辦公室以外人們生活之后的“第三空間”。通過人臉;指紋識(shí)別、語(yǔ)音 / 手勢(shì)交互、多屏聯(lián)動(dòng)等高新技術(shù),使當(dāng)今汽車智能座艙在環(huán)境感知、信息采集和處理方面的能力顯著增強(qiáng),成為人類駕駛的“智能助手”。
智能座艙告別簡(jiǎn)單的電子化,進(jìn)入智能助理階段的顯著標(biāo)志之一是人與駕駛艙的相互作用從被動(dòng)式進(jìn)入主動(dòng)式,這種“被動(dòng)的”和“主動(dòng)的”是以駕駛艙本身為中心定義的。過去的信息交流主要由人發(fā)起,現(xiàn)在人和機(jī)器都可以啟動(dòng),人和機(jī)器的交互水平已經(jīng)成為定義智能座艙產(chǎn)品水平的重要標(biāo)志。
人機(jī)交互發(fā)展背景
從電腦與手機(jī)的歷史可以折射出機(jī)械與人互動(dòng)方法的發(fā)展脈絡(luò),并從繁雜到單純簡(jiǎn)約從抽象的動(dòng)作到自然的互動(dòng)。未來最主要的人機(jī)交互發(fā)展趨勢(shì),便是將機(jī)械由被動(dòng)響應(yīng)進(jìn)入了主動(dòng)式交互。沿著這種趨勢(shì)的延長(zhǎng)線來看,人與機(jī)器相互作用的終極目標(biāo)是將機(jī)器擬人化,使人與機(jī)器的相互作用像人與人的交流一樣自然順暢。也就是說,人機(jī)交互的歷史就是人從適應(yīng)機(jī)器到通過機(jī)械適應(yīng)人的歷史。
智能座艙的發(fā)展也有類似的過程。隨著電子技術(shù)的進(jìn)展和車主的期望,汽車內(nèi)外的電子信號(hào)和功能也越來越多,以便讓車主降低對(duì)注意力資源的浪費(fèi),從而降低行車分氣,汽車互動(dòng)方法也因此而逐步改變:物理旋鈕 / 鍵盤——數(shù)字觸摸屏——語(yǔ)言操控—自然狀態(tài)互動(dòng)。
自然交互是下一代人機(jī)交互方式的理想模型
什么是自然交互?
簡(jiǎn)而言之,即通過動(dòng)作、目光追蹤、語(yǔ)言等實(shí)現(xiàn)交流。這里的意識(shí)模態(tài)更具體地說類似于人的 " 感知 ",其形態(tài)中混合著各種感知,并對(duì)應(yīng)了人的視野、聆聽、觸覺、嗅覺、味覺等五大感知。相應(yīng)的信息介質(zhì)包括各種傳感器,例如聲音、視頻、文字和紅外、壓力、雷達(dá)。智能汽車實(shí)質(zhì)上就是一個(gè)載人機(jī)器人,其最關(guān)鍵的二個(gè)功能就是自己控制的以及與人互動(dòng)的功能,沒有其中之一,將無法高效的工作于人。所以,一種智慧的人機(jī)交互系統(tǒng)是十分必要的。
自然交互的實(shí)現(xiàn)方式
座艙內(nèi)融合了越來越多的傳感器,傳感器提高了形態(tài)多樣化、數(shù)據(jù)豐富性和準(zhǔn)確性的能力。一方面使駕駛艙內(nèi)的計(jì)算力需求飛躍,另一方面也提供了更好的感知能力支持。這一趨勢(shì)使更豐富的駕駛艙場(chǎng)景創(chuàng)新、更好的互動(dòng)體驗(yàn)成為可能。其中,視覺處理是駕駛艙人機(jī)交互技術(shù)的關(guān)鍵。而且融合技術(shù)才是真正王道,比如在嘈雜條件下的語(yǔ)音識(shí)別時(shí),光靠麥克風(fēng)是沒有的。人在這種情況下能選擇性地聽某人講話,不僅靠耳朵,還靠眼睛。因此,通過視覺上確定音源并閱讀唇語(yǔ),能夠得到比單純的聲音識(shí)別更好的效果。如果傳感器是人的五感,那么計(jì)算力便是一個(gè)自動(dòng)交互的人腦,AI 算法把視覺與語(yǔ)音結(jié)合到一起,通過各種認(rèn)知方法,能夠進(jìn)行人臉、動(dòng)作、姿態(tài)、語(yǔ)音等多種信號(hào)的辨識(shí)。由此,可以實(shí)現(xiàn)更智能的人的目標(biāo)交互,包括眼球追蹤、語(yǔ)音識(shí)別、口語(yǔ)識(shí)別聯(lián)動(dòng)和駕駛員的疲勞狀態(tài)檢測(cè)等。
座艙人員交互的設(shè)計(jì)通常需要通過邊緣運(yùn)算,而非云運(yùn)算來完成。三點(diǎn):安全性、實(shí)時(shí)性和隱私安全性。云計(jì)算依賴于網(wǎng)絡(luò),對(duì)于智能汽車來說,依賴于無線網(wǎng)絡(luò)無法保證其連接的可靠性。同時(shí),數(shù)據(jù)傳輸延遲不可控,不能保證交互平滑。要確保面向自動(dòng)運(yùn)行安全域的完整用戶體驗(yàn),破局之道在于邊緣計(jì)算。
但是,個(gè)人信息安全也是面臨的問題之一。駕駛室內(nèi)的私密空間,安全性保障方面尤為明顯。現(xiàn)在的個(gè)性化聲音識(shí)別主要都是依靠在云上實(shí)現(xiàn)的,里面的聲紋等私人生物信息能夠更方便的顯示私人身份信息。而利用在汽車端的邊緣 AI 設(shè)計(jì),就能夠把圖片、聲音等私人生物信息,轉(zhuǎn)變成汽車語(yǔ)義信息,再上傳到云端,從而有效地保障了汽車的個(gè)人信息安全。
自動(dòng)駕駛時(shí)代,交互智能必須跟駕駛智能相匹配
在可預(yù)期的未來,無人機(jī)協(xié)同飛行將成為一個(gè)長(zhǎng)期存在的現(xiàn)象,座艙的無人機(jī)交互成為人掌握主動(dòng)飛行技能的第一個(gè)界面。目前,智能駕駛領(lǐng)域面臨進(jìn)化不均衡的問題,人機(jī)交互水平落后于自動(dòng)駕駛水平的提升,造成自主行車問題的頻出,阻礙自動(dòng)駕駛的發(fā)展。人機(jī)交互合作行為的特點(diǎn)是人的操作回路上。所以,人機(jī)交互功能必須和自動(dòng)駕駛功能保持一致。否則將導(dǎo)致嚴(yán)重的預(yù)期功能安全風(fēng)險(xiǎn),絕大多數(shù)自動(dòng)駕駛致命事件與此有關(guān)。一旦人機(jī)交互接口可以提供自己行車的認(rèn)知結(jié)果,可以進(jìn)一步了解自動(dòng)駕駛系統(tǒng)的能量邊界這將大大有助于提高 L + 級(jí)自動(dòng)駕駛功能的接受度。
當(dāng)然,目前智能座艙的交互方式主要是手機(jī)安卓生態(tài)的延申,主要是通過主機(jī)屏幕支持?,F(xiàn)在的顯示器也越來越大,而這其實(shí)是由于低優(yōu)先級(jí)的功能占用了高優(yōu)先功能的空間,帶來額外的信號(hào)干擾,影響運(yùn)行安全。在未來,雖然實(shí)物顯示屏仍然存在,但我相信在未來,取而代之的將是自然人機(jī)交互+AR-HUD。
如果把智能駕駛系統(tǒng)發(fā)展到 L四以上,人將從枯燥疲勞的駕駛中解放出來,汽車也將成為 " 人的第三生活空間 "。這樣,未來駕駛室內(nèi)的娛樂區(qū)和安全功能區(qū)(人機(jī)交互和自動(dòng)操縱)的位置會(huì)進(jìn)行改變,安全區(qū)則變成為主控制區(qū)。自動(dòng)駕駛是汽車與環(huán)境的互動(dòng),人與人的互動(dòng)是人與汽車的互動(dòng),兩者融為一體,完成人、車、環(huán)境三者的協(xié)同,形成完整的駕駛閉環(huán)。
第二,自動(dòng)對(duì)話方式+AR-HUD 的對(duì)話界面更加安全,在用語(yǔ)言或者手勢(shì)溝通的情形下,可以避免對(duì)駕車者視線的轉(zhuǎn)移,從而提高了行駛安全。在駕駛艙大屏幕上根本就無法實(shí)現(xiàn)這一點(diǎn),而 ARHUD 則能夠在顯示自動(dòng)行駛感知信號(hào)的同時(shí)規(guī)避了這一問題。
第三,自然交談方法是一個(gè)隱性的、簡(jiǎn)潔的、具有感情的自然交談方法。你不能過分占有車?yán)飳氋F的物理空間,但你可以隨時(shí)隨地陪伴自在者周圍。所以,未來智慧行車和智慧駕駛艙的域內(nèi)結(jié)合是一種更加安全的發(fā)展方式,最后發(fā)展的是汽車中央的系統(tǒng)。
人機(jī)交互實(shí)戰(zhàn)原理
觸控交互
早期的中控臺(tái)屏幕只是顯示收音機(jī)的信息,大部分面積都容納了超多的物理交互按鈕,這些按鈕基本上都是通過觸覺交互來實(shí)現(xiàn)與人類的溝通。
隨著智能交互的發(fā)展,出現(xiàn)了中央控制的大屏幕,物理交互按鈕開始逐漸減少。中控大屏幕越來越大,占據(jù)越來越重要的位置。中控臺(tái)的物理按鍵已經(jīng)減少到?jīng)]有了,此時(shí)乘員已經(jīng)無法用觸覺與人進(jìn)行交互,但在這個(gè)階段逐漸轉(zhuǎn)變?yōu)橐曈X交互,人們不再用觸覺與人進(jìn)行溝通,而是主要用視覺進(jìn)行操作。但如果只用視覺與智能座艙的人類進(jìn)行對(duì)話,人們將絕對(duì)不方便。特別是在駕駛過程中,90% 的人類視覺注意力必須投入到路況的觀察中,才能長(zhǎng)期將視線投入到畫面之上,與智能座艙對(duì)話。
語(yǔ)音交互
(1)語(yǔ)音交互的原理。
自然語(yǔ)音的理解——語(yǔ)音識(shí)別——語(yǔ)音轉(zhuǎn)化語(yǔ)音。
(2)語(yǔ)音交互需要的場(chǎng)景。
語(yǔ)音控制的場(chǎng)景應(yīng)用主要有二個(gè)要素,一是能夠代替在觸摸屏上沒有提示的功能,與人機(jī)界面自然對(duì)話,二是最小化了人機(jī)界面手動(dòng)控制所帶來的影響,提高安全性。
第一,當(dāng)你下班回家的時(shí)候,你想在開車的過程中快速控制車輛,查詢信息,查詢空調(diào)、座椅等。在長(zhǎng)途旅行中,中途調(diào)查服務(wù)區(qū)和加油站,調(diào)查日程。第二個(gè)是用語(yǔ)音把一切鏈接起來。車上的音樂、子屏幕娛樂都能迅速喚起。所以我們要做的就是快速控制車輛。
首先就是對(duì)汽車實(shí)現(xiàn)快速操控,基本功能包括調(diào)整車內(nèi)氛圍燈光、調(diào)整音量、調(diào)控車內(nèi)空調(diào)溫度控制、調(diào)節(jié)窗戶、調(diào)節(jié)后視鏡,快速控制車輛的本意是讓駕駛員更快速地控制車輛,減少注意力分散有助于增加安全運(yùn)行系數(shù)。遠(yuǎn)程語(yǔ)言交互是實(shí)現(xiàn)整個(gè)系統(tǒng)的重要入口,因?yàn)橄到y(tǒng)必須了解司機(jī)的語(yǔ)音指令,提供智能導(dǎo)航。我們不但能夠被動(dòng)接受任務(wù),而且還能夠?yàn)槟峁╆P(guān)于目的地介紹和日程安排等的附加服務(wù)。
接著,是車輛和駕駛員的監(jiān)視,在實(shí)時(shí)運(yùn)行中,能夠隨時(shí)詢問輪胎壓力、箱的溫度、冷卻劑、發(fā)動(dòng)機(jī)油等車輛的性能和車輛的狀態(tài)。實(shí)時(shí)信息查詢有助于駕駛員提前處理信息。當(dāng)然到達(dá)警戒臨界點(diǎn)的時(shí)候也要實(shí)時(shí)注意。除了對(duì)內(nèi)監(jiān)控外當(dāng)然也需要對(duì)外監(jiān)控,生物識(shí)別和語(yǔ)音監(jiān)控的混合監(jiān)控可以監(jiān)控駕駛員的情緒。在適當(dāng)?shù)臅r(shí)候提醒駕駛員打起精神來避免交通事故的發(fā)生。以及長(zhǎng)時(shí)間行駛的疲勞聲音的注意事項(xiàng)。最后,在多媒體娛樂方面,開車的場(chǎng)景、播放音樂和廣播是最高頻的操作和需求。除了簡(jiǎn)單的播放、暫停、歌曲切換等功能外,還等待著收藏、賬號(hào)注冊(cè)、播放歷史的開啟、播放順序的切換、現(xiàn)場(chǎng)互動(dòng)等個(gè)性化功能的開發(fā)。
容納錯(cuò)誤
語(yǔ)音對(duì)話中必須允許容錯(cuò)機(jī)制?;镜娜蒎e(cuò)也按場(chǎng)景進(jìn)行處理。一是聽不懂,此時(shí)讓用戶再說一遍,二是聽了但沒有處理問題的能力,三是識(shí)別為錯(cuò)誤信息,這可以再確認(rèn)。
人臉識(shí)別
(1)人臉識(shí)別的原理。
駕駛艙的人臉特征識(shí)別技術(shù)一般包含以下三方面:人臉特征檢查、模式識(shí)別。隨著互聯(lián)網(wǎng)整體信息的生物化,多平臺(tái)輸入人臉信息,汽車作為萬物互聯(lián)的一個(gè)重點(diǎn),隨著更多移動(dòng)終端使用場(chǎng)景移動(dòng)到車內(nèi),賬戶注冊(cè)、身份認(rèn)證需要在車內(nèi)進(jìn)行。
(2)人臉識(shí)別使用場(chǎng)景。
行駛前,必須上車驗(yàn)證車主信息,注冊(cè)應(yīng)用 ID。行走中,面部識(shí)別是行走中閉眼疲勞的主要工作場(chǎng)景,電話提醒,無眼前,打哈欠。
單純的相互作用可以讓駕駛員更不方便。例如,僅憑語(yǔ)音,容易發(fā)生誤指令、單純觸摸操作,駕駛員無法滿足 3 秒的原則。只有語(yǔ)音、手勢(shì)、視覺等多種交互方式融合在一起,智能系統(tǒng)才能更加準(zhǔn)確、方便、安全地在各種場(chǎng)景中與駕駛員進(jìn)行溝通。
人機(jī)交互挑戰(zhàn)與未來
人機(jī)交互的挑戰(zhàn)
理想的自然互動(dòng)是從使用者感受入手,創(chuàng)造安全、順暢、可預(yù)見的互動(dòng)感受。但不管人生如何豐富,總要腳踏實(shí)地的從事實(shí)出發(fā),目前的挑戰(zhàn)依然很多。
目前自然交互的誤認(rèn)仍然很嚴(yán)重,全工況、全天候的可靠性、準(zhǔn)確性還遠(yuǎn)遠(yuǎn)不夠。因此,在手勢(shì)辨識(shí)中,依靠視覺的手勢(shì)識(shí)別率目前仍很低,所以必須研發(fā)各種算法來提高辨識(shí)的精度與速率。無意中打手勢(shì),或許會(huì)被人誤認(rèn)為是命令動(dòng)作,但其實(shí)這只是無數(shù)誤認(rèn)之一,在移動(dòng)情況下,對(duì)光線的投射、振動(dòng)、遮擋等都是重大技術(shù)的問題。因此,配合運(yùn)轉(zhuǎn)場(chǎng)景,采用多傳感器融合驗(yàn)證方式、聲音確認(rèn)等方式,為了降低誤識(shí)別率,需要綜合性地加持各種技術(shù)手段。其次,目前自然交互的流暢性問題仍是當(dāng)前必須克服的困難,要求更先進(jìn)的傳感器、更強(qiáng)大的能力、更高效率的計(jì)算。同時(shí),自然的語(yǔ)言處理能力與意圖表達(dá)還處在起步階段,還需算法技術(shù)的深入研究。
未來,座艙人機(jī)交互走向虛擬世界與情感連接
消費(fèi)者愿意為汽車移動(dòng)之外附加的智能化功能買單的原因之一是對(duì)話和體驗(yàn)。我們?cè)谏厦嫣岬?,未來智能座艙的發(fā)展是以人為本的,它將在人們的生活中演化為第三個(gè)空間。
這種人機(jī)交互絕不是簡(jiǎn)單的呼叫響應(yīng),而是多渠道、多級(jí)、多模式的交流感覺。從乘員視角,未來的智能座艙人機(jī)交互系統(tǒng)將以智能語(yǔ)言為主要交流手段,并以觸摸、手勢(shì)、動(dòng)態(tài)、表情等為輔助交流手段,解放乘員手與眼睛,以減少駕駛員操控風(fēng)險(xiǎn)。
隨著駕駛艙內(nèi)傳感器的增加,人機(jī)交互服務(wù)對(duì)象以駕駛員為中心向全車乘客服務(wù)轉(zhuǎn)移是一種確定性趨勢(shì)。智能座艙構(gòu)建虛擬空間,人與人的自然互動(dòng)將帶來全新的沉浸式擴(kuò)展現(xiàn)實(shí)娛樂體驗(yàn)。強(qiáng)大的配置,結(jié)合駕駛艙強(qiáng)大的互動(dòng)設(shè)備,可以構(gòu)建車內(nèi)的元宇宙,提供各種沉浸式游戲。智能座艙可能是原太空的好載體。
人機(jī)的自然互動(dòng)也帶來情感上的聯(lián)系,駕駛艙成為人的伴侶,更智能的伴侶,學(xué)習(xí)車主的行為、習(xí)慣、偏好,感知駕駛艙內(nèi)的環(huán)境,結(jié)合車輛當(dāng)前的位置,在需要時(shí)積極提供信息和功能提示。隨著人工智能的發(fā)展,在我們有生之年,有機(jī)會(huì)看到人類的情感聯(lián)系逐漸參與到我們的個(gè)人生活中,確保技術(shù)向善,也許是那時(shí)我們必須面對(duì)的另一個(gè)重大問題。但無論如何,技術(shù)都會(huì)朝這個(gè)方向發(fā)展。
智能座艙人機(jī)交互總結(jié)
在當(dāng)前慘烈的汽車產(chǎn)業(yè)競(jìng)爭(zhēng)中,人工智能座艙系統(tǒng)已然變成了實(shí)現(xiàn)整機(jī)廠功能差異性的關(guān)鍵問題,因?yàn)轳{駛艙人機(jī)交互系統(tǒng)和人的交流行為、語(yǔ)言文化等都息息相關(guān),所以需要高度本地化。智能車輛人機(jī)交互是中國(guó)智能車輛企業(yè)品牌升級(jí)的重要突破口,是中國(guó)智能車輛科技引導(dǎo)世界技術(shù)發(fā)展趨勢(shì)的突破口。
這些相互作用和相互作用的整合,未來將提供更全面的沉浸體驗(yàn),繼續(xù)推動(dòng)新的互動(dòng)方式和技術(shù)的成熟,期望從目前的體驗(yàn)提升功能演化為未來智能座艙的必備功能。未來智能座艙交互技術(shù)無論是基本安全需求還是更深層次的歸屬感、自我實(shí)現(xiàn)心理需求,都有望涵蓋多種多樣的出行需求。
相關(guān)資訊
- 區(qū)塊鏈技術(shù)如何應(yīng)用于城市交通和
- 隨著AI技術(shù)的發(fā)展保持競(jìng)爭(zhēng)力的5
- 超越云計(jì)算巨頭的多元化云環(huán)境探
- 高性能、云原生湖倉(cāng)一體存儲(chǔ)架構(gòu)
- wifi老是斷是什么原因
- 區(qū)塊鏈技術(shù)如何徹底改變ATM安全?
- 提高云中企業(yè)安全性的9項(xiàng)策略和
- 用什么方法來評(píng)估我的信息系統(tǒng)的
- 數(shù)字化轉(zhuǎn)型中IT領(lǐng)導(dǎo)者的四個(gè)關(guān)鍵
- 物聯(lián)網(wǎng)預(yù)計(jì)到2030年可創(chuàng)造5.5兆