亚洲精品久久久久久久久久久,亚洲国产精品一区二区制服,亚洲精品午夜精品,国产成人精品综合在线观看,最近2019中文字幕一页二页

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

汽車(chē)多模態(tài)交互研究:大模型及多模態(tài)融合,推進(jìn)AI Agent上車(chē)

佐思汽車(chē)研究 ? 來(lái)源:佐思汽車(chē)研究 ? 2023-11-24 16:12 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

佐思汽研發(fā)布《2023年中國(guó)汽車(chē)多模態(tài)交互發(fā)展研究報(bào)告》,主要梳理了主流座艙交互方式、2023年上市的重點(diǎn)車(chē)型交互方式應(yīng)用、供應(yīng)商座艙交互方案,以及多模交互融合趨勢(shì)。

通過(guò)梳理最近一年新上市車(chē)型的交互方式和功能來(lái)看,主動(dòng)式、擬人化、自然化交互成為主要方向。從交互方式來(lái)看:?jiǎn)我荒B(tài)交互,如觸覺(jué)、語(yǔ)音等主流交互的控制范圍從車(chē)內(nèi)拓展至車(chē)外,指紋、肌電等新型交互方式的上車(chē)案例開(kāi)始增多;多模態(tài)融合交互下,語(yǔ)音+頭姿/人臉/唇語(yǔ)、面部+情緒/嗅覺(jué)等多種融合交互不斷上車(chē),旨在打造更加主動(dòng)、自然的人車(chē)交互。

單一模態(tài)的縱深發(fā)展

觸覺(jué)交互方面:座艙大屏化、多屏化趨勢(shì)加劇,同時(shí)智能表面材料在艙內(nèi)的擴(kuò)展應(yīng)用,讓觸覺(jué)感知范圍向車(chē)門(mén)、車(chē)窗、座椅等部件擴(kuò)展,并逐步引入觸覺(jué)反饋技術(shù);

語(yǔ)音交互方面:語(yǔ)音交互在AI大模型的賦能下,功能愈加智能化、情感化。唇動(dòng)識(shí)別、聲紋識(shí)別等技術(shù)的上車(chē),使語(yǔ)音交互精準(zhǔn)度得到進(jìn)一步提升,控制范圍也從車(chē)內(nèi)拓展至車(chē)外;

視覺(jué)交互方面:基于視覺(jué)技術(shù)的面部/手勢(shì)識(shí)別范圍開(kāi)始逐漸向肢體識(shí)別擴(kuò)展,包括頭部姿勢(shì)、手臂動(dòng)作,以及身體行為等;

嗅覺(jué)交互方面:原主要用于凈化空氣、祛除異味的嗅覺(jué)交互功能,現(xiàn)今可實(shí)現(xiàn)座艙殺菌消毒、并支持香氛系統(tǒng)與座艙場(chǎng)景/季節(jié)時(shí)令聯(lián)動(dòng)。

案例1

語(yǔ)音控車(chē)實(shí)現(xiàn)車(chē)內(nèi)向車(chē)外延伸

代表車(chē)型:長(zhǎng)安啟源A07、極越01

代表功能:車(chē)外語(yǔ)音開(kāi)啟車(chē)門(mén)、車(chē)窗、輔助泊車(chē)等

長(zhǎng)安啟源A07采用科大訊飛最新XTTS 4.0 技術(shù),車(chē)載語(yǔ)音助手聲音更加自然擬人化,具備高興、抱歉、疑惑等多情感表達(dá)。支持向車(chē)外喊話(huà)(內(nèi)容可自定義);此外,還可在車(chē)外通過(guò)語(yǔ)音實(shí)現(xiàn)對(duì)后備箱、車(chē)窗、音樂(lè)、空調(diào)、出庫(kù)/泊車(chē)等功能的控制。

極越01搭載“SIMO”語(yǔ)音助手,支持全域全離線語(yǔ)音,無(wú)網(wǎng)弱網(wǎng)也可全程在線語(yǔ)音交互;可實(shí)現(xiàn)500毫秒識(shí)別,700毫秒內(nèi)響應(yīng)。在車(chē)外,駕乘人員可通過(guò)聲紋識(shí)別技術(shù)實(shí)現(xiàn)語(yǔ)音操作空調(diào)、音響、燈光、車(chē)窗、車(chē)門(mén)、后尾門(mén)、充電蓋的開(kāi)啟/關(guān)閉等功能,以及支持車(chē)外語(yǔ)音泊車(chē)。

案例2

聲紋識(shí)別擴(kuò)大應(yīng)用

代表車(chē)型:理想L7、合創(chuàng)A06/V09

代表功能:識(shí)別駕乘人員身份,提供針對(duì)性服務(wù)

理想L系列車(chē)型均支持聲紋識(shí)別功能。在乘客聲紋注冊(cè)后,“理想同學(xué)”可分辨乘客是誰(shuí),叫出不同乘客指定的昵稱(chēng),并結(jié)合聲紋記憶對(duì)不同乘客位置執(zhí)行車(chē)控。

合創(chuàng)A06/V09的聲紋識(shí)別VOICE ID,能清楚識(shí)別有效用戶(hù)身份以及指令,并將成為HYCAN ID的入口,為用戶(hù)接入豐富智慧生態(tài),使用100+款?yuàn)蕵?lè)應(yīng)用。另外基于聲紋識(shí)別技術(shù),系統(tǒng)將主動(dòng)屏蔽其他干擾聲音,提高主駕識(shí)別精準(zhǔn)度。

9a96ea44-8a8e-11ee-939d-92fbcf53809c.png

圖片來(lái)源:合創(chuàng)汽車(chē)

案例3

肌電交互實(shí)現(xiàn)車(chē)載商業(yè)化落地

代表車(chē)型:嵐圖追光

代表功能:車(chē)內(nèi)外隔空微手勢(shì)控車(chē)

2023年4月,嵐圖追光與柔靈科技推出肌電交互融合方案。該方案主要通過(guò)肌電手環(huán)實(shí)現(xiàn)。手環(huán)內(nèi)部安裝多通道肌電傳感器和高精度放大器,可以實(shí)時(shí)采集豐富的肌肉電信號(hào)并生成算法,傳導(dǎo)計(jì)算終端,從而生成個(gè)性化的AI手勢(shì)模型,之后再和嵐圖的車(chē)載平臺(tái)整合。使用者將手環(huán)與車(chē)內(nèi)藍(lán)牙連接,即可實(shí)現(xiàn)以微手勢(shì)控制車(chē)輛,包括開(kāi)關(guān)后備箱、升降車(chē)窗等60+種手勢(shì)動(dòng)作。此外,手環(huán)還可以和車(chē)內(nèi)游戲系統(tǒng)無(wú)縫連接。借助肌電手環(huán)的手勢(shì)識(shí)別,用戶(hù)可以更自然、直觀地操控游戲角色,如地鐵跑酷等。

9ae2b03c-8a8e-11ee-939d-92fbcf53809c.png

圖片來(lái)源:柔靈科技

多模態(tài)融合,打造主動(dòng)交互

目前車(chē)企已實(shí)現(xiàn)的多模態(tài)融合包括但不限于語(yǔ)音+唇動(dòng)識(shí)別、語(yǔ)音+面部識(shí)別、語(yǔ)音+手勢(shì)識(shí)別、語(yǔ)音+頭姿、面部+情緒識(shí)別、面部+眼球追蹤、香氛+面部+語(yǔ)音識(shí)別等。其中語(yǔ)音多模態(tài)交互方式為當(dāng)下主流,應(yīng)用車(chē)型包括上文提到的長(zhǎng)安啟源A07、極越01、理想L7、合創(chuàng)A06/V09等車(chē)型。

多模態(tài)融合代表功能(僅列舉部分)

9b005e84-8a8e-11ee-939d-92fbcf53809c.jpg

來(lái)源:佐思汽研《2023年中國(guó)汽車(chē)多模態(tài)交互發(fā)展研究報(bào)告》

案例1

語(yǔ)音+頭姿交互:魏牌藍(lán)山DHT PHEV將語(yǔ)音和頭姿進(jìn)行結(jié)合,交互方式簡(jiǎn)單直觀

當(dāng)駕駛員進(jìn)行語(yǔ)音對(duì)話(huà)時(shí),藍(lán)山座艙利用車(chē)載攝像頭捕捉駕駛員的頭部動(dòng)作,通過(guò)點(diǎn)頭/搖頭進(jìn)行確定/否定答復(fù)。例如語(yǔ)音控制導(dǎo)航時(shí),可通過(guò)點(diǎn)頭/搖頭選擇路線規(guī)劃方案。

案例2

面部+情緒識(shí)別:睿藍(lán)7、極狐考拉等車(chē)型在面部識(shí)別功能上融入情緒識(shí)別技術(shù),提供主動(dòng)交互,增強(qiáng)交互體驗(yàn)

睿藍(lán)7的多模智識(shí)Face-ID系統(tǒng)支持唇動(dòng)識(shí)別、情緒識(shí)別,能記憶關(guān)聯(lián)賬戶(hù)對(duì)應(yīng)語(yǔ)音、座椅、后視鏡、氛圍燈、后備箱設(shè)置等車(chē)輛功能個(gè)性化信息,還可根據(jù)車(chē)主的“臉色”來(lái)選擇合適的音樂(lè)。

極狐考拉位于B柱的攝像頭正對(duì)后排,可實(shí)時(shí)監(jiān)控孩子狀態(tài)。例如孩子在微笑時(shí)將自動(dòng)抓拍傳送至中控屏;哭鬧時(shí)將自動(dòng)播放安撫音樂(lè)/智能座椅表面呼吸律動(dòng),平復(fù)孩子情緒。另外,攝像頭還可與車(chē)內(nèi)毫米波雷達(dá)聯(lián)動(dòng),判斷孩子是否睡著,睡著則自動(dòng)打開(kāi)睡眠模式,開(kāi)啟座椅通風(fēng),空調(diào)溫度適當(dāng)調(diào)整,音響、氛圍燈進(jìn)行聯(lián)動(dòng),產(chǎn)生律動(dòng)效果。

案例3

面部+嗅覺(jué):蔚來(lái)EC7、睿藍(lán)7等車(chē)型實(shí)將駕駛員監(jiān)控系統(tǒng)與香氛系統(tǒng)聯(lián)動(dòng),提升駕車(chē)安全性

蔚來(lái)EC7監(jiān)測(cè)到駕駛員的疲勞狀態(tài)時(shí),將自動(dòng)釋放提神醒腦的香氛,以確保駕駛安全;

睿藍(lán)7位于A柱的攝像頭監(jiān)控到駕駛員犯困時(shí),將自動(dòng)釋放提神香氛,并進(jìn)行語(yǔ)音提醒。

大模型及多模態(tài)融合,將推進(jìn)AI Agent上車(chē)

AI大模型正從單模態(tài)走向多模態(tài)、多任務(wù)融合的趨勢(shì)。相較于單模態(tài)只能處理一種類(lèi)型的數(shù)據(jù),例如文本、圖像、語(yǔ)音等,多模態(tài)則可以處理和理解多種類(lèi)型的數(shù)據(jù),包括視覺(jué)、聽(tīng)覺(jué)、語(yǔ)言等,從而能夠更好地理解和生成復(fù)雜的信息。 隨著多模態(tài)大模型的持續(xù)發(fā)展,其能力也將得到顯著提升。這種提升賦予AI Agent(人工智能體)更強(qiáng)大的感知和環(huán)境理解能力,以實(shí)現(xiàn)更智能、自主的決策和行動(dòng)。同時(shí)也為汽車(chē)領(lǐng)域的應(yīng)用開(kāi)拓了新的可能性,為未來(lái)的智能化發(fā)展提供了更廣闊的前景。

9b78ccac-8a8e-11ee-939d-92fbcf53809c.png

圖片來(lái)源:紅杉資本

科大訊飛基于星火大模型開(kāi)發(fā)的星火座艙OS,支持語(yǔ)音、手勢(shì)、人眼追蹤、DMS/OMS等多種交互模態(tài),星火汽車(chē)助理通過(guò)深度上下文理解實(shí)現(xiàn)多意圖識(shí)別,提供更加自然的人機(jī)交互。訊飛星火大模型首搭車(chē)型星途星紀(jì)元ES,將帶來(lái)五大全新的體驗(yàn):車(chē)輛功能導(dǎo)師、冷暖共情伙伴、知識(shí)百科全書(shū)、旅行規(guī)劃專(zhuān)家、身體健康顧問(wèn)。

9b9f1cc2-8a8e-11ee-939d-92fbcf53809c.png

來(lái)源:科大訊飛

將于2023年12月上市的AITO問(wèn)界M9內(nèi)置HarmonyOS 4車(chē)機(jī)系統(tǒng)。鴻蒙4中智慧助手小藝已經(jīng)接入了盤(pán)古大模型。華為盤(pán)古大模型,包括自然語(yǔ)言大模型、視覺(jué)大模型、多模態(tài)大模型等。鴻蒙4+小藝+盤(pán)古大模型,設(shè)備協(xié)同、AI場(chǎng)景等生態(tài)能力將再度增強(qiáng),借助多模態(tài)交互技術(shù),提供多樣化的交互方式,包括語(yǔ)音識(shí)別、手勢(shì)控制、觸摸屏操作等。

9bbc981a-8a8e-11ee-939d-92fbcf53809c.png

圖片來(lái)源:華為

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 語(yǔ)音交互
    +關(guān)注

    關(guān)注

    3

    文章

    331

    瀏覽量

    29022
  • 聲紋識(shí)別
    +關(guān)注

    關(guān)注

    3

    文章

    142

    瀏覽量

    22221
  • 大模型
    +關(guān)注

    關(guān)注

    2

    文章

    3384

    瀏覽量

    4853

原文標(biāo)題:汽車(chē)多模態(tài)交互研究:大模型及多模態(tài)融合,推進(jìn)AI Agent上車(chē)

文章出處:【微信號(hào):zuosiqiche,微信公眾號(hào):佐思汽車(chē)研究】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    亞馬遜云科技上線Amazon Nova模態(tài)嵌入模型

    Embeddings模態(tài)嵌入模型現(xiàn)已在Amazon Bedrock上線,這是一款專(zhuān)為Agentic RAG與語(yǔ)義搜索應(yīng)用打造的頂尖模態(tài)
    的頭像 發(fā)表于 10-29 17:15 ?29次閱讀
    亞馬遜云科技上線Amazon Nova<b class='flag-5'>多</b><b class='flag-5'>模態(tài)</b>嵌入<b class='flag-5'>模型</b>

    米爾RK3576部署端側(cè)模態(tài)輪對(duì)話(huà),6TOPS算力驅(qū)動(dòng)30億參數(shù)LLM

    “看圖說(shuō)話(huà)+語(yǔ)音問(wèn)答”的融合交互。 五、結(jié)論與未來(lái)發(fā)展方向如果說(shuō) “大模型上云” 是 AI 的 “星辰大?!保敲?“
    發(fā)表于 09-05 17:25

    商湯科技模態(tài)通用智能戰(zhàn)略思考

    時(shí)間是最好的試金石,AI領(lǐng)域尤其如此。當(dāng)行業(yè)熱議大模型走向時(shí),商湯早已錨定“模態(tài)通用智能”——這是我們以深厚研究積累和實(shí)踐反復(fù)驗(yàn)證的可行路
    的頭像 發(fā)表于 08-14 09:33 ?912次閱讀

    “端云+模態(tài)”新范式:《移遠(yuǎn)通信AI模型技術(shù)方案白皮書(shū)》正式發(fā)布

    7月28日,移遠(yuǎn)通信聯(lián)合智次方研究院正式發(fā)布《AI模型技術(shù)方案白皮書(shū)》(以下簡(jiǎn)稱(chēng)“白皮書(shū)”)。這份白皮書(shū)系統(tǒng)梳理了AI模型的技術(shù)特點(diǎn)、產(chǎn)
    的頭像 發(fā)表于 07-28 13:08 ?815次閱讀
    “端云+<b class='flag-5'>多</b><b class='flag-5'>模態(tài)</b>”新范式:《移遠(yuǎn)通信<b class='flag-5'>AI</b>大<b class='flag-5'>模型</b>技術(shù)方案白皮書(shū)》正式發(fā)布

    汽車(chē)模態(tài)交互測(cè)試:智能交互的深度驗(yàn)證

    汽車(chē)智能座艙測(cè)試的關(guān)鍵進(jìn)程中,北京沃華慧通測(cè)控技術(shù)有限公司展現(xiàn)出了獨(dú)特的價(jià)值與優(yōu)勢(shì)。作為一家專(zhuān)注于測(cè)控技術(shù)領(lǐng)域的企業(yè),沃華慧通在智能座艙測(cè)試方面積累了豐富的經(jīng)驗(yàn)和專(zhuān)業(yè)的技術(shù)能力。其研發(fā)的測(cè)試設(shè)備能夠精準(zhǔn)模擬各種復(fù)雜的車(chē)載環(huán)境,對(duì)智能座艙的
    的頭像 發(fā)表于 06-25 09:00 ?1143次閱讀
    <b class='flag-5'>汽車(chē)</b><b class='flag-5'>多</b><b class='flag-5'>模態(tài)</b><b class='flag-5'>交互</b>測(cè)試:智能<b class='flag-5'>交互</b>的深度驗(yàn)證

    商湯日日新SenseNova融合模態(tài)模型 國(guó)內(nèi)首家獲得最高評(píng)級(jí)的大模型

    近日,中國(guó)信息通信研究院(以下簡(jiǎn)稱(chēng)“中國(guó)信通院”)完成可信AI模態(tài)模型首輪評(píng)估。 商湯日日新SenseNova
    的頭像 發(fā)表于 06-11 11:57 ?1055次閱讀

    XMOS為普及AI應(yīng)用推出基于軟件定義SoC的模態(tài)AI傳感器融合接口

    模態(tài)傳感信號(hào)AI處理為智算中心和邊緣智能開(kāi)啟感知智能的新篇章
    的頭像 發(fā)表于 05-12 17:51 ?349次閱讀
    XMOS為普及<b class='flag-5'>AI</b>應(yīng)用推出基于軟件定義SoC的<b class='flag-5'>多</b><b class='flag-5'>模態(tài)</b><b class='flag-5'>AI</b>傳感器<b class='flag-5'>融合</b>接口

    ??低暟l(fā)布模態(tài)模型AI融合巡檢超腦

    基于??涤^瀾大模型技術(shù)體系,??低曂瞥鲂乱淮?b class='flag-5'>多模態(tài)模型AI融合巡檢超腦,全面升級(jí)人、車(chē)、行為
    的頭像 發(fā)表于 04-17 17:12 ?1196次閱讀

    移遠(yuǎn)通信智能模組全面接入模態(tài)AI模型,重塑智能交互新體驗(yàn)

    隨著千行百業(yè)數(shù)智化進(jìn)程的不斷加速,模態(tài)AI模型的應(yīng)用需求不斷攀升,圖像、語(yǔ)音、視頻等多樣化的交互方式正逐漸成為推動(dòng)行業(yè)變革的新動(dòng)力。 ?
    發(fā)表于 03-21 14:12 ?382次閱讀
    移遠(yuǎn)通信智能模組全面接入<b class='flag-5'>多</b><b class='flag-5'>模態(tài)</b><b class='flag-5'>AI</b>大<b class='flag-5'>模型</b>,重塑智能<b class='flag-5'>交互</b>新體驗(yàn)

    移遠(yuǎn)通信智能模組全面接入模態(tài)AI模型,重塑智能交互新體驗(yàn)

    隨著千行百業(yè)數(shù)智化進(jìn)程的不斷加速,模態(tài)AI模型的應(yīng)用需求不斷攀升,圖像、語(yǔ)音、視頻等多樣化的交互方式正逐漸成為推動(dòng)行業(yè)變革的新動(dòng)力。3月
    的頭像 發(fā)表于 03-20 19:03 ?617次閱讀
    移遠(yuǎn)通信智能模組全面接入<b class='flag-5'>多</b><b class='flag-5'>模態(tài)</b><b class='flag-5'>AI</b>大<b class='flag-5'>模型</b>,重塑智能<b class='flag-5'>交互</b>新體驗(yàn)

    商湯“日日新”融合模型登頂大語(yǔ)言與模態(tài)雙榜單

    據(jù)弗若斯特沙利文(Frost & Sullivan, 簡(jiǎn)稱(chēng)“沙利文”)聯(lián)合頭豹研究院發(fā)布的《2025年中國(guó)大模型年度評(píng)測(cè)》結(jié)果顯示:在語(yǔ)言和模態(tài)核心能力測(cè)評(píng)中,商湯“日日新”
    的頭像 發(fā)表于 03-18 10:35 ?781次閱讀

    ?模態(tài)交互技術(shù)解析

    模態(tài)交互 模態(tài)交互( Multimodal Interaction )是指通過(guò)多種感官通道(
    的頭像 發(fā)表于 03-17 15:12 ?3206次閱讀

    ??低暟l(fā)布模態(tài)模型文搜存儲(chǔ)系列產(chǎn)品

    模態(tài)模型為安防行業(yè)帶來(lái)重大技術(shù)革新,基于觀瀾大模型技術(shù)體系,??低晫⒋髤?shù)量、大樣本量的圖文模態(tài)
    的頭像 發(fā)表于 02-18 10:33 ?932次閱讀

    體驗(yàn)MiniCPM-V 2.6 模態(tài)能力

    模態(tài)組網(wǎng)
    jf_23871869
    發(fā)布于 :2025年01月20日 13:40:48

    商湯日日新模態(tài)模型權(quán)威評(píng)測(cè)第一

    剛剛,商湯科技日日新SenseNova模態(tài)模型,在權(quán)威綜合評(píng)測(cè)權(quán)威平臺(tái)OpenCompass的模態(tài)評(píng)測(cè)中取得榜單第一。
    的頭像 發(fā)表于 12-20 10:39 ?1403次閱讀