亚洲精品久久久久久久久久久,亚洲国产精品一区二区制服,亚洲精品午夜精品,国产成人精品综合在线观看,最近2019中文字幕一页二页

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

AI使用音頻剪輯對與語音匹配的真實感面部建模

倩倩 ? 來源:新經網 ? 2020-04-11 10:40 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

您是否曾經僅僅根據他們的聲音來構造一個從未見過的人的心理形象?人工智能AI)現在可以做到這一點,僅使用簡短的音頻剪輯作為參考即可生成人臉的數字圖像。

這個名為“ Speech2Face” 的神經網絡(一種以類似于人腦的方式“思考”的計算機)經過科學家培訓,接受了來自互聯(lián)網的數百萬個教育視頻,顯示了100,000多個不同的人在說話。

研究人員在一項新研究中寫道,Speech2Face通過該數據集學習了語音提示與人臉某些物理特征之間的關聯(lián)。然后,AI使用音頻剪輯對與語音匹配的真實感面部建模。

值得慶幸的是,人工智能還不能僅僅根據他們的聲音確切地知道特定的人是什么樣。研究作者報告說,神經網絡識別語音中的某些標記,這些標記指向性別,年齡和種族,是許多人共有的特征。

科學家寫道:“因此,該模型只會產生看上去普通的面孔?!?“它不會產生特定個人的圖像?!?/p>

盡管坦率地說,對貓的解釋有點讓人恐懼,但AI已經證明它可以產生出異常準確的人臉。

由Speech2Face生成的臉部-均面向正面并具有中性表情-與聲音背后的人并不完全匹配。但是,根據這項研究,這些圖像通常確實可以捕捉到正確的年齡范圍,種族和性別。

但是,該算法的解釋遠非完美。當面對語言變化時,Speech2Face表現出“混合表現”。例如,當AI收聽亞洲人講中文的音頻片段時,該程序會產生亞洲人臉的圖像。然而,據科學家報道,當同一個人用不同的音頻片段講英語時,人工智能產生了白人的面孔。

該算法還顯示出性別偏見,將低音調的聲音與男性面孔相關聯(lián),將高音調的聲音與女性面孔相關聯(lián)。研究人員寫道,由于訓練數據集僅代表YouTube上的教育視頻,因此“并不代表整個世界人口。”

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 數字圖像
    +關注

    關注

    2

    文章

    121

    瀏覽量

    19482
  • 人工智能
    +關注

    關注

    1813

    文章

    49580

    瀏覽量

    259877
  • 數據集
    +關注

    關注

    4

    文章

    1229

    瀏覽量

    25993
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    炬芯科技亮相2025亞洲AI音頻大會

    近日,2025亞洲AI音頻大會在深圳成功舉辦,作為中國行業(yè)現象級盛會之一,大會分享和展示音頻技術的最新成果。炬芯科技便攜式音頻事業(yè)部產品總監(jiān)張洪波受邀出席,以《全場景
    的頭像 發(fā)表于 09-29 11:36 ?2868次閱讀

    廣州唯創(chuàng)電子混音IC播報語音芯片:革新音頻應用的新力量

    音頻源智能混音,開啟音頻交互新紀元在智能化浪潮席卷各行各業(yè)的今天,音頻處理技術正經歷著革命性的變革。傳統(tǒng)的單一路徑語音播放已無法滿足日益復雜的應用場景需求,混音播報
    的頭像 發(fā)表于 09-24 09:25 ?287次閱讀
    廣州唯創(chuàng)電子混音IC播報<b class='flag-5'>語音</b>芯片:革新<b class='flag-5'>音頻</b>應用的新力量

    唯創(chuàng)知音AI語音交互芯片與模組介紹

    AI語音交互已經成為智能產品的基礎配置,比如常見的AI玩具、智能家居、帶AI功能的藍牙音響,還有汽車的智能車機和智能穿戴設備等。唯創(chuàng)知音順應市場趨勢推出了WT2606A系列的
    的頭像 發(fā)表于 09-17 15:51 ?368次閱讀
    唯創(chuàng)知音<b class='flag-5'>AI</b><b class='flag-5'>語音</b>交互芯片與模組介紹

    解鎖高品質音頻體驗:探索音頻質量評估與測試的科學之道

    高品質音頻的科學世界!二、音頻質量評估簡介語音質量評估就是通過人類或自動化的方法評價語音質量。在實踐中,有很多主觀和客觀的方法評價語音質量。
    發(fā)表于 07-22 11:15

    最新人工智能硬件培訓AI基礎入門學習課程參考2025版(離線AI語音視覺識別篇)

    端側離線 AI 智能硬件作為 AI 技術的重要載體之一,憑借其無需依賴網絡即可實現智能功能的特性,在一些網絡條件受限或對數據隱私有較高要求的場景中,發(fā)揮著不可或缺的作用。本章基于CSK6大模型語音
    發(fā)表于 07-04 11:14

    AI玩具爆發(fā),音頻編解碼器如何滿足語音交互需求

    電子發(fā)燒友網綜合報道,在AI玩具已經開始逐漸爆發(fā)的當下,人機交互已經成為標配功能,而最重要的便是語音控制。而語音控制的第一步,便需要讓AI玩具聽懂你在說什么這就需要用到
    的頭像 發(fā)表于 06-20 01:07 ?6789次閱讀

    90元打造小智AI腕表,語音交互超有趣!

    ,分辨率 240*280,支持觸摸。 語音交互:內置麥克風,支持語音喚醒和語音指令。 音頻播放:1609 8Ω/1W 喇叭。 外殼設計:智能手表。 鋰電池:302535 320mAh,
    發(fā)表于 04-16 14:26

    零知開源——ESP32語音交互系統(tǒng)(AI小智)開發(fā)教程

    一、功能介紹小智AI聊天機器人是一個基于嵌入式硬件與人工智能技術深度融合的智能交互系統(tǒng)。該項目以ESP32開發(fā)板為核心,結合語音喚醒、自然語言處理、音頻解碼播放及圖形化交互界面四大核心模塊,實現
    發(fā)表于 03-29 16:30

    零知開源——ESP32語音交互系統(tǒng)(AI小智)開發(fā)教程

    小智AI聊天機器人是一個基于嵌入式硬件與人工智能技術深度融合的智能交互系統(tǒng)。該項目以ESP32開發(fā)板為核心,結合語音喚醒、自然語言處理、音頻解碼播放及圖形化交互界面四大核心模塊,實現人機交互功能
    的頭像 發(fā)表于 03-29 15:33 ?9512次閱讀
    零知開源——ESP32<b class='flag-5'>語音</b>交互系統(tǒng)(<b class='flag-5'>AI</b>小智)開發(fā)教程

    借助Arm技術革新未來手游體驗

    手游正在不斷得到重塑。隨著內容創(chuàng)作、真實感和沉浸式體驗的顯著發(fā)展,移動設備上的游戲開發(fā)和體驗方式正在發(fā)生快速演變。
    的頭像 發(fā)表于 03-10 09:17 ?1035次閱讀

    芯知識 決定語音芯片高音質的因素

    語音芯片高音質因素包括高分辨率音頻、低失真高動態(tài)范圍、高品質音頻編解碼、深度音頻處理及VR/AR音頻體驗,這些因素共同提升
    的頭像 發(fā)表于 02-17 14:56 ?500次閱讀

    用Reality AI Tools創(chuàng)建模

    在第二步采集到的數據基礎之上,用Reality AI Tools創(chuàng)建模型。
    的頭像 發(fā)表于 01-22 14:23 ?2742次閱讀
    用Reality <b class='flag-5'>AI</b> Tools創(chuàng)<b class='flag-5'>建模</b>型

    HarmonyOS NEXT 應用開發(fā)練習:AI智能語音播報

    一、DEMO思路 在這個HarmonyOS NEXT原生應用DEMO中,我們將使用ArkTS開發(fā)語言創(chuàng)建一個簡單的AI智能語音播報應用。 該應用能夠接收用戶輸入的文本,并使用TTS
    發(fā)表于 01-06 15:33

    充電樁語音方案,支持OTA語音升級的音頻芯片NV400F

    1產品市場隨著新能源汽車的普及,充電樁作為其核心配套設施,其智能化、便捷化的需求日益增長。充電樁語音方案,尤其是支持OTA(Over-The-Air)語音升級的音頻芯片NV400F,正逐步成為市場上
    的頭像 發(fā)表于 11-09 01:03 ?1077次閱讀
    充電樁<b class='flag-5'>語音</b>方案,支持OTA<b class='flag-5'>語音</b>升級的<b class='flag-5'>音頻</b>芯片NV400F

    tlv320Ai32在輸出音頻時總有絲絲聲,為什么?

    tlv320Ai32在輸出音頻時總有絲絲聲,即使輸出的濾波將噪聲調整到90mV以下還是存在。測試發(fā)現HPout的噪聲有將近480mV 請問這是什么原因,Ai32還有什么寄存器要設置的? 模擬電源的紋波大概60mV,有影響嗎?
    發(fā)表于 11-05 06:09