亚洲精品久久久久久久久久久,亚洲国产精品一区二区制服,亚洲精品午夜精品,国产成人精品综合在线观看,最近2019中文字幕一页二页

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

思必馳高始興對智能語音在車載領(lǐng)域的應用的解讀

思必馳 ? 來源:djl ? 作者:思必馳 ? 2019-08-05 16:09 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

現(xiàn)在語音交互在車載場景下有哪些應用?痛點在哪些地方?難點在哪些地方?現(xiàn)在面臨哪些挑戰(zhàn)?怎么解決?包括產(chǎn)品設(shè)計,諸多的一些想法、問題,我來簡單分享一下幾個觀點,跟各位做一個交流。

我們見了很多的車載的后市場,包括傳統(tǒng)產(chǎn)業(yè)轉(zhuǎn)型,包括互聯(lián)網(wǎng)新型智能硬件開發(fā)者,像后視鏡、HUD等,現(xiàn)在大家普遍的感覺車載的語音交互是一個大的趨勢,但是依然有一些認為在車載場景下語音的交互還是一個噱頭。主要是因為使用率最廣但漸漸成為調(diào)戲工具的SIRI,其次他們擔心在車載場景下的使用語音的安全性。我們認為, SIRI等助手在手機端變成調(diào)戲工具,這是一個必然。早期很多助手應用我們語音技術(shù),接入思必馳語音云,通過數(shù)據(jù)分析發(fā)現(xiàn),很多用戶問的事情是偏帶顏色的,比如問一些AV女優(yōu)、AV大片名字方便查詢。其次,現(xiàn)在應用語音的車載產(chǎn)品大多只能做到簡單交互,只是為了市場跟風而加上的功能,在產(chǎn)品設(shè)計和內(nèi)容方便明顯存在短板,不夠便捷不夠方便。

開車是非常乏味的事情,因此車載交互也在向趣味性方向發(fā)展,比如高德做的林志玲航的導航,我問了一下出租車司機,其中一個司機特別典型,他說我們開車非常悶,林志玲的聲音讓我心里挺激動的,沒有寂寞感。我們現(xiàn)在跟考拉也在做一些個性化的聲音,我們相信有人性化的車載交互會讓語音體驗大幅增加,會讓用戶的黏性大幅提高。林志玲的聲音高德在做了,我相信女孩喜歡聽男神的聲音,我們未來會出很多男神聲音、女神聲音,小孩聲音,個性化的語音合成,這本來也是思必馳的優(yōu)勢之一。

車載環(huán)境的語音交互,更重要的是能提升駕車安全。一般認為,在車載里面的應用操控應該在兩秒之內(nèi),其實我覺得兩秒有點長,甚至應該在一秒、零點幾秒,比如在高速上開車,速度是非常快的,如果分神去做操控非常危險。但在設(shè)置導航、接聽電話、發(fā)微信的時候,緊急情況還是需要去操控它。毫無疑問,語音操控更加安全的?,F(xiàn)在車載產(chǎn)品的市場有1.6億,年增量2000萬,但是統(tǒng)計30%的車主在開車的時候是離不開手機的。這很危險。媒體經(jīng)常曝光拿手機發(fā)微信、發(fā)微博等等導致車禍。電影《2012》大家都看過,比尼說出“enginestar”啟動了保時捷死里逃生。在科幻電影里面的交互我相信在生活中能全部實現(xiàn)。現(xiàn)在市面上馬上會出現(xiàn)全自然語音交互的車載產(chǎn)品,比如像戰(zhàn)斗機應用的HUD技術(shù),樂駕CEO老馬會跟大家分享他們的HUD產(chǎn)品。

車主到底對智能語音交互接受程度怎么樣?沒有用戶接受,一款產(chǎn)品還是rubbish。騰訊做的一個調(diào)研, 76%的用戶對車載智能功能接受度越來越高,全語音控制導航的功能使用占比排第二,僅次于被盜車輛定位,中國太不安全了,小偷太多沒辦法。但即使車輛的定位、被盜的問題我相信未來語音的交互也能解決。比如現(xiàn)在我們汽車還是用鑰匙、用觸摸去開門,未來我們能不能用聲紋,比如說芝麻開門,車能夠識別主人身份,你可以給愛車起名字,你說話汽車就響應,別人說話不好使,這個一定能實現(xiàn)。

另外在汽車前裝市場很多高端車把語音交互系統(tǒng)作為標配,這能引領(lǐng)和培育用戶認知。我個人認為前裝市場還是相對很難進入,而且創(chuàng)新的產(chǎn)品,優(yōu)秀的體驗還是從后裝做起,包括HUD、行車記錄儀、后視鏡,中控設(shè)備。前裝市場的思路相對比較傳統(tǒng),需要被顛覆,而且驗證周期特別長,像語音驗證周期一般兩三年,甚至三五年,飛馳鎂物很有經(jīng)驗,他們做了多年傳統(tǒng)前裝。

思必馳高始興對智能語音在車載領(lǐng)域的應用的解讀

我們現(xiàn)在提智能語音基本上都認為語音導航,其實不單單是導航,車載語音交互在向其他應用擴展,服務性擴展。回頭看,從2011年智能車載化到現(xiàn)在經(jīng)過了大概三個階段,傻瓜式1.0,擴展式2.0,和交互式的3.0。在2.0的時候語音控制還是比較低級,在交互式3.0語音需求和功能已經(jīng)上升第一位,甚至超過了LBS。再一個是相關(guān)的應用的服務,內(nèi)嵌的語音交互在大量拓展,整個車載生態(tài)在更繼續(xù)發(fā)展。

思必馳高始興對智能語音在車載領(lǐng)域的應用的解讀

除了導航,其他很多服務和功能都需要語音交互,而且會做的越來越炫、越來越酷。比如收發(fā)短信,有些車載智能硬件已經(jīng)有這個功能,撥打電話,包括小說朗讀,天氣搜索,網(wǎng)絡(luò)電臺等等都已經(jīng)逐步邁入市場。網(wǎng)絡(luò)電臺方面,考拉做的很棒,未來我們跟老俞這方面會做的更加炫酷,有的人愿意聽謝霆峰的聲音,那你就可以選謝霆峰的聲音給你讀小說,現(xiàn)在這個技術(shù)已經(jīng)基本成熟,未來你把家人的聲音,比如男朋友、女朋友或者孩子聲音傳上去,自己下載一個語音包,未來你聽小說、聽電臺的內(nèi)容、聽新聞等等,這些都可以是你愛人的聲音、孩子的聲音,我們目前跟考拉、跟上海交大實驗室都在做這些事情。再一個微信,微信功能也是一個痛點需求,很多車禍就是因為司機在開車的時候收發(fā)微信,這一塊怎么做到極致體驗?一定要語音解決,樂駕做HUD“車蘿卜”,已經(jīng)解決了這個難點。另外,關(guān)于未來的拓展我很看好O2O,車載生態(tài)不僅僅是解決目前的一些功能,未來能不能我們在搜加油站、停車位、酒店時,像在手機端一樣形成一個閉環(huán),從搜索到導航到支付交易評價。社交,開車的時候我們通過行車記錄儀也好、HUD也好直接給景色拍照,全語音操作,能夠直接分享到微博、微信上。包括聲紋密碼,聲紋密碼不單是解鎖開車,不單是個人支付,我們希望要做到的就是它知道你的身份,知道你的相關(guān)的信息,推送的信息都是個性化的,甚至我們通過登陸查酒店的時候它知道你是男女,你的歷史記錄,你的年齡段。這些都是語音交互在車載方面的應用可能。

現(xiàn)在車載智能硬件層出不窮,車機相對來說是挺主流的設(shè)備。現(xiàn)在后視鏡市場特別火,行車記錄儀防碰瓷現(xiàn)在也非常流行,OBD目前還比較傳統(tǒng),車載音箱比如考拉做得很不錯,再包括一些其他的小智能硬件,車載環(huán)境里面到底哪一塊屏會占主流?還有一個說法,HUD抬頭顯示系統(tǒng)在戰(zhàn)斗機、高端車里面都有,現(xiàn)在全自然語音交互加手勢式交互的HUD概念已經(jīng)出來了,比如樂駕的“車蘿卜”,我覺得HUD也有很大可能,撬動未來車載的生態(tài)。不管怎么樣,絕對離不開語音交互。

從傻瓜式1.0到語音交互式3.0,從語音導航到其他功能,現(xiàn)已經(jīng)一步步成為現(xiàn)實。但現(xiàn)在去暢想O2O、聲紋密碼等,語音技術(shù)是不是已經(jīng)能夠直接應用?我覺得還不到時候。語音交互雖然實現(xiàn)了技術(shù)上的可能性,但離質(zhì)的飛躍還有距離。目前的語音只是在載里面加上一個耳朵、一個嘴巴,還缺一個大腦,如何去協(xié)調(diào)在車載環(huán)境下遇到的種種挑戰(zhàn)。

第一,近場抗噪。語音識別在駕車的噪聲環(huán)境下怎么樣,人跟車機或者車載智能硬件往往有一段距離,0.3~1米的距離范圍里,噪聲很多,發(fā)動機聲噪、路噪、人的說話,音噪等,怎樣抗噪?播放音樂的時候回聲對消我們已經(jīng)能夠?qū)崿F(xiàn),在跟多種車載設(shè)備交互下的算法降噪,我們思必馳一直在研發(fā)并且目前也有一些還比較滿意的進步。

第二,自然語音交互。這是讓車載生態(tài)能夠發(fā)展最核心音素,現(xiàn)在車載交互還大多停留在簡單操控階段,簡單控制、簡單命令、簡單搜索、簡單查詢。但如果我們想撬動O2O,一定要首先形成閉環(huán)。就像人跟手機的關(guān)系,所有的購物、查詢搜索、玩游戲一定會在智能手機完成,不會再跳轉(zhuǎn)另一個設(shè)備上。車載生態(tài)起來一定會形成一個閉環(huán),不僅僅是簡單語音交互,一定是自然語言的交互、一定是對話式交互,這個是應用趨勢。思必馳目前一直在努力地,就是真正的對話式人性化語言交互技術(shù)。

第三,產(chǎn)品設(shè)計層面的邏輯關(guān)系。我們智能車載硬件的麥克風、喇叭、結(jié)構(gòu)布局和錄音收音效果的關(guān)系,怎么保證抗噪,包括我們語音交互跟后端服務怎么結(jié)合。比如語音導航時,能不能跳轉(zhuǎn)到搜音樂,在導航的時候能不能收發(fā)微信等,產(chǎn)品邏輯這是非常大的挑戰(zhàn)。這需要產(chǎn)品開發(fā)者和思必馳一起來討論來解決的問題。

(高總此刻給大家放了兩個視頻,一個是春節(jié)期間的山東糾正哥的網(wǎng)絡(luò)視頻,一個是思必馳最新的可糾正打斷功能的實際演示視頻。涉及到技術(shù)曝光,此刻先不做播放。如有興趣的,可關(guān)注7月中旬的思必馳新技術(shù)發(fā)布會。)

這是我們做的一個語音糾正的功能演示。糾正哥遇到的問題我們在車里面的時候經(jīng)常遇到,在車載噪聲環(huán)境下語音識別很難達到百分之百,現(xiàn)在語音交互還是比較差,經(jīng)常會讓人抓狂,我們就做這批技術(shù),能夠隨時打斷和糾正機器的判斷和識別。我們在7月份會有新技術(shù)的大型發(fā)布會,到時候會邀請各位朋友參加。目前的語音交互僅僅實現(xiàn)操控、命令,簡單的查詢,這是遠遠不行的,一定是真正的智能語音的技術(shù)的進步,才能讓整個生態(tài)進來,才能讓整個整個產(chǎn)品體驗帶來質(zhì)的飛躍。

思必馳高始興對智能語音在車載領(lǐng)域的應用的解讀

最后插播小廣告——關(guān)于思必馳。我們最早成立劍橋大學,現(xiàn)在拿到兩輪投資,我們專注人機對話,以及語音識別、理解、合成、設(shè)備一系列技術(shù),我們把這個技術(shù)做成開放解決方案,提供垂直行業(yè)像車載、家居、穿戴,包括機器人玩具等等這些行業(yè)的開發(fā)者,讓他們結(jié)成了我們的相關(guān)的SDK方案以后提升產(chǎn)品的交互體驗。車載方面我們對芯片廠商、方案廠商,還有車載智能硬件合作伙伴提供我們們相關(guān)的技術(shù)和方案。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 導航
    +關(guān)注

    關(guān)注

    7

    文章

    564

    瀏覽量

    43689
  • 智能語音
    +關(guān)注

    關(guān)注

    11

    文章

    819

    瀏覽量

    49951
  • 思必馳
    +關(guān)注

    關(guān)注

    4

    文章

    366

    瀏覽量

    15843
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    語音平臺項目通過ASPICE 2級能力認證

    近日,為梅賽德斯-奔馳打造的語音平臺項目正式通過Automotive SPICE(ASPICE)2級能力認證。這一成果標志著
    的頭像 發(fā)表于 09-30 11:35 ?700次閱讀

    聲音轉(zhuǎn)換算法通過國家備案

    近日,國家互聯(lián)網(wǎng)信息辦公室公告第十三批深度合成服務算法備案信息,聲音轉(zhuǎn)換算法通過備案,這也是
    的頭像 發(fā)表于 09-18 14:05 ?549次閱讀

    8月份大事件回顧

    近日,與奧迪全新一代智能網(wǎng)聯(lián)車型合作正式量產(chǎn)落地。
    的頭像 發(fā)表于 09-03 09:07 ?585次閱讀

    與奧迪全新一代智能網(wǎng)聯(lián)車型合作正式量產(chǎn)落地

    近日,與奧迪全新一代智能網(wǎng)聯(lián)車型合作正式量產(chǎn)落地。
    的頭像 發(fā)表于 08-15 10:53 ?885次閱讀

    空調(diào)大模型解決方案

    這不是幻想,是基于思空調(diào)大模型解決方案發(fā)生的真實體驗,該方案深度融合了自研的全鏈路智能
    的頭像 發(fā)表于 07-31 17:46 ?639次閱讀

    聲音復刻算法獲得深度合成服務算法備案

    近日,國家互聯(lián)網(wǎng)信息辦公室正式發(fā)布第十二批深度合成服務算法備案信息,聲音復刻算法通過此次備案。該算法能夠高精度復刻人類聲音,為個性化語音服務、
    的頭像 發(fā)表于 07-31 17:42 ?606次閱讀

    7月份大事件回顧

    近日,聲音復刻算法通過國家互聯(lián)網(wǎng)信息辦公室第十二批深度合成服務算法備案。該算法能夠高精度復刻人類聲音,通過少量的錄音訓練得到極為相似的聲音模型,快速“克隆”個性化的聲音,為語音
    的頭像 發(fā)表于 07-28 17:52 ?528次閱讀

    AI辦公本亮相京東直播間

    近日,董事長、CEO始興
    的頭像 發(fā)表于 06-09 11:10 ?811次閱讀

    蘇州市領(lǐng)導蒞臨調(diào)研

    近日,蘇州市委教育局工委書記、市教育局局長周志芳率隊蒞臨進行調(diào)研,董事長、CEO
    的頭像 發(fā)表于 04-24 15:40 ?589次閱讀

    何維率一行蒞臨調(diào)研

    現(xiàn)場,董事長、CEO始興介紹了
    的頭像 發(fā)表于 04-24 15:36 ?618次閱讀

    江蘇省領(lǐng)導蒞臨調(diào)研考察

    近日,江蘇省委常委、省委宣傳部部長徐纓一行蒞臨蘇州進行調(diào)研,受到董事長兼CEO
    的頭像 發(fā)表于 03-24 16:32 ?721次閱讀

    2月份大事件回顧

    董事長、CEO始興受邀參會。習近平總書記召開民營企業(yè)座談會充分肯定了民營經(jīng)濟的重要地位和作用,作為江蘇省土生土長的人工
    的頭像 發(fā)表于 02-28 17:45 ?884次閱讀

    天琴語音助手8.0深度融合DeepSeek

    智能汽車加速向場景化服務迭代的進程中,智能語音助手已成為駕駛體驗中不可或缺的一部分。天琴
    的頭像 發(fā)表于 02-28 17:43 ?2025次閱讀

    完成5億元融資

    近日,完成五億元融資,本輪融資由知名產(chǎn)業(yè)基金、國資平臺、私募基金共同參與。將圍繞“云
    的頭像 發(fā)表于 01-14 14:52 ?967次閱讀

    攜手長城汽車入選2024年人工智能先鋒案例集

    日前,中國人工智能產(chǎn)業(yè)發(fā)展聯(lián)盟《2024年人工智能先鋒案例集》正式發(fā)布,長城汽車與聯(lián)合申報的“長城汽車Coffee Al
    的頭像 發(fā)表于 11-26 17:56 ?1717次閱讀