亚洲精品久久久久久久久久久,亚洲国产精品一区二区制服,亚洲精品午夜精品,国产成人精品综合在线观看,最近2019中文字幕一页二页

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

聲紋識(shí)別到底是怎么回事呢?

qm9W_gridthink ? 來源:電網(wǎng)智囊團(tuán) ? 作者:電網(wǎng)智囊團(tuán) ? 2021-03-02 10:16 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

國家電網(wǎng)公司在人工智能方向上研究攻關(guān)一直是重點(diǎn)投入,設(shè)備運(yùn)維管理是人工智能應(yīng)用的核心領(lǐng)域之一,涉及圖像識(shí)別、視頻分析、聲紋識(shí)別、知識(shí)圖譜、數(shù)據(jù)智能等多個(gè)方面。

聲紋識(shí)別可以解決那些方面的問題呢?變電設(shè)備異常工況的診斷檢測,如:變壓器、電抗器、斷路器、隔離開關(guān)等主設(shè)備內(nèi)部不可見缺陷的準(zhǔn)確診斷識(shí)別,此外繞組變形、偏磁異常、內(nèi)部放電等方面的診斷也在探索研究。

那聲紋識(shí)別到底是怎么回事呢?

同屬于生物識(shí)別技術(shù),與火爆的人臉識(shí)別相比,聲紋識(shí)別表現(xiàn)得很低調(diào),然而這并不影響這一黑科技魅力的散發(fā),本文將帶你認(rèn)識(shí)一下聲音黑科技-聲紋識(shí)別,讓你了解真正的“聞聲識(shí)人”。

本文將從如下方面為你一一解讀:

什么是聲紋?

聲紋識(shí)別的原理

聲紋識(shí)別算法的技術(shù)指標(biāo)

影響聲紋識(shí)別水平的因素

聲紋識(shí)別的應(yīng)用流程

聲紋識(shí)別的應(yīng)用場景

一、什么是聲紋?

聲紋(Voiceprint),是用電聲學(xué)儀器顯示的攜帶言語信息的聲波頻譜,是由波長、頻率以及強(qiáng)度等百余種特征維度組成的生物特征,具有穩(wěn)定性、可測量性、唯一性等特點(diǎn)。

人類語言的產(chǎn)生是人體語言中樞與發(fā)音器官之間一個(gè)復(fù)雜的生理物理過程,發(fā)聲器官--舌、牙齒、喉頭、肺、鼻腔在尺寸和形態(tài)方面每個(gè)人的差異很大,所以任何兩個(gè)人的聲紋圖譜都有差異。

每個(gè)人的語音聲學(xué)特征既有相對(duì)穩(wěn)定性,又有變異性,不是一成不變的。這種變異可來自生理、病理、心理、模擬、偽裝,也與環(huán)境干擾有關(guān)。

盡管如此,由于每個(gè)人的發(fā)音器官都不盡相同,因此在一般情況下,人們?nèi)阅軈^(qū)別不同的人的聲音或判斷是否是同一人的聲音。

聲紋不如圖像那樣直觀展現(xiàn),在實(shí)際分析中,可通過波形圖和語譜圖進(jìn)行展現(xiàn),如下所示:

二、聲紋識(shí)別的原理

人在講話時(shí)使用的發(fā)聲器官在尺寸和形態(tài)方面每個(gè)人的差異很大,所以任何兩個(gè)人的聲紋圖譜都有差異,主要體現(xiàn)在如下方面:

共鳴方式特征:咽腔共鳴、鼻腔共鳴和口腔共鳴

嗓音純度特征:不同人的嗓音,純度一般是不一樣的,粗略地可分為高純度(明亮)、低純度(沙?。┖椭械燃兌热齻€(gè)等級(jí)

平均音高特征:平均音高的高低就是一般所說的嗓音是高亢還是低沉

音域特征:音域的高低就是通常所說的聲音飽滿還是干癟

不同人的聲音在語譜圖中共振峰的分布情況不同,聲紋識(shí)別正是通過比對(duì)兩段語音的說話人在相同音素上的發(fā)聲來判斷是否為同一個(gè)人,從而實(shí)現(xiàn)“聞聲識(shí)人”的功能。

三、聲紋識(shí)別算法的技術(shù)指標(biāo)

聲紋識(shí)別在算法層面可通過如下基本的技術(shù)指標(biāo)來判斷其性能,除此之外還有其它的一些指標(biāo),如:信道魯棒性、時(shí)變魯棒性、假冒攻擊魯棒性、群體普適性等指標(biāo),這部分后續(xù)于詳細(xì)展開講解。

錯(cuò)誤拒絕率(False Rejection Rate, FRR) :分類問題中,若兩個(gè)樣本為同類(同一個(gè)人),卻被系統(tǒng)誤認(rèn)為異類(非同一個(gè)人),則為錯(cuò)誤拒絕案例。錯(cuò)誤拒絕率為錯(cuò)誤拒絕案例在所有同類匹配案例的比例。

錯(cuò)誤接受率(False Acceptance Rate, FAR) :分類問題中,若兩個(gè)樣本為異類(非同一個(gè)人),卻被系統(tǒng)誤認(rèn)為同類(同一個(gè)人),則為錯(cuò)誤接受案例。錯(cuò)誤接受率為錯(cuò)誤接受案例在所有異類匹配案例的比例。

等錯(cuò)誤率(Equal Error Rate,EER):調(diào)整閾值,使得誤拒絕率(False Rejection Rate,F(xiàn)RR)等于誤接受率 (False Acceptance Rate,F(xiàn)AR),此時(shí)的FAR與FRR的值稱為等錯(cuò)誤率。

準(zhǔn)確率(Accuracy,ACC):調(diào)整閾值,使得FAR+FRR最小,1減去這個(gè)值即為識(shí)別準(zhǔn)確率,即ACC=1 - min(FAR+FRR)

速度:(提取速度:提取聲紋速度與音頻時(shí)長有關(guān)、驗(yàn)證比對(duì)速度):Real Time Factor 實(shí)時(shí)比(衡量提取時(shí)間跟音頻時(shí)長的關(guān)系,比如:1秒能夠處理80s的音頻,那么實(shí)時(shí)比就是1:80)。驗(yàn)證比對(duì)速度是指平均每秒鐘能進(jìn)行的聲紋比對(duì)次數(shù)。

ROC曲線:描述FAR與FRR之間相互變化關(guān)系的曲線,X軸為FAR的值,Y軸為FRR的值。從左到右,當(dāng)閾值增長期間,每一個(gè)時(shí)刻都有一對(duì)FAR和FRR的值,將這些值在圖上描點(diǎn)連成一條曲線,就是ROC曲線。

閾值:在接受/拒絕二元分類系統(tǒng)中,通常會(huì)設(shè)定一個(gè)閾值,分?jǐn)?shù)超過該值時(shí)才做出接受決定。調(diào)節(jié)閾值可以根據(jù)業(yè)務(wù)需求平衡FAR與FRR。當(dāng)設(shè)定高閾值時(shí),系統(tǒng)做出接受決定的得分要求較為嚴(yán)格,F(xiàn)AR降低,F(xiàn)RR升高;當(dāng)設(shè)定低閾值時(shí),系統(tǒng)做出接受決定的得分要求較為寬松,F(xiàn)AR升高,F(xiàn)RR降低。在不同應(yīng)用場景下,調(diào)整不同的閾值,則可在安全性和方便性間平平衡,如下圖所示:

四、影響聲紋識(shí)別水平的因素

訓(xùn)練數(shù)據(jù)和算法是影響聲紋識(shí)別水平的兩個(gè)重要因素,在應(yīng)用落地過程中,還會(huì)受很多因素的影響。

聲源采樣率

人類語音的頻段集中于50Hz ~ 8KHz之間,尤其在4KHz以下頻段

離散信號(hào)覆蓋頻段為信號(hào)采樣率的一半(奈奎斯特采樣定理)

采樣率越高,信息量越大

常用采樣率:8KHz(即0 ~ 4KHz頻段),16KHz(即0 ~ 8KHz頻段)

信噪比(SNR)

信噪比衡量一段音頻中語音信號(hào)與噪聲的能量比,即語音的干凈程度

15dB以上(基本干凈),6dB(嘈雜),0dB(非常吵)

信道

不同的采集設(shè)備,以及通信過程會(huì)引入不同的失真

聲紋識(shí)別算法與模型需要覆蓋盡可能多的信道

手機(jī)麥克風(fēng)、桌面麥克風(fēng)、固話、移動(dòng)通信(CDMA, TD-LTE等)、微信……

語音時(shí)長

語音時(shí)長(包括注冊(cè)語音條數(shù))會(huì)影響聲紋識(shí)別的精度

有效語音時(shí)長越長,算法得到的數(shù)據(jù)越多,精度也會(huì)越高

短語音(1~3s)

長語音(20s+)

文本內(nèi)容

通俗地說,聲紋識(shí)別系統(tǒng)通過比對(duì)兩段語音的說話人在相同音素上的發(fā)聲來判斷是否為同一個(gè)人

固定文本:注冊(cè)與驗(yàn)證內(nèi)容相同

半固定文本:內(nèi)容一樣但順序不同;文本屬于固定集合

自由文本

五、聲紋識(shí)別的應(yīng)用流程

聲紋識(shí)別(VPR) ,生物識(shí)別技術(shù)的一種,也稱為說話人識(shí)別 ,是從說話人發(fā)出的語音信號(hào)中提取聲紋信息,從應(yīng)用上看,可分為:

說話人辨認(rèn)(Speaker Identification):用以判斷某段語音是若干人中的哪一個(gè)所說的,是“多選一”問題;

說話人確認(rèn)(Speaker Verification):用以確認(rèn)某段語音是否是指定的某個(gè)人所說的,是“一對(duì)一判別”問題。

聲紋識(shí)別在應(yīng)用中分注冊(cè)和驗(yàn)證兩個(gè)主流程,根據(jù)不同的應(yīng)用中,部分處理流程會(huì)存在差異,一般的聲紋識(shí)別應(yīng)用流程如下圖所示:

六、聲紋識(shí)別的應(yīng)用場景

聲紋識(shí)別作為生物識(shí)別技術(shù)的一種,有非常多好的應(yīng)用場景,根據(jù)聲音的特性,下面從公共安全、金融、社保、智能硬件四個(gè)領(lǐng)域介紹聲紋識(shí)別的應(yīng)用。

1、安防

聲紋作為一種生物特征,最早在刑偵和鑒識(shí)領(lǐng)域成功應(yīng)用。

近年來,由于互聯(lián)網(wǎng)的發(fā)展,語音案件也呈現(xiàn)出井噴的趨勢(shì),在這些語音案件中,聲紋識(shí)別成了唯一一種有效的技術(shù)偵破手段,通過的聲紋識(shí)別和聲紋大數(shù)據(jù)技術(shù)進(jìn)行重點(diǎn)人員監(jiān)管、反電信詐騙、反恐、刑事案件偵破、身份查詢與核驗(yàn),助力公安有效遏制與打擊犯罪,構(gòu)建和強(qiáng)化安全的社會(huì)公眾環(huán)境。

2、金融

針對(duì)銀行、互聯(lián)網(wǎng)金融等各類金融及服務(wù)機(jī)構(gòu),通過聲紋識(shí)別技術(shù),提供了用戶注冊(cè)、遠(yuǎn)程驗(yàn)證、金融生物識(shí)別解決方案,大幅提高金融機(jī)構(gòu)的風(fēng)險(xiǎn)防范系統(tǒng)安全性,強(qiáng)化風(fēng)控能力,增加用戶的安全性,防范身份欺詐。

另外在電話客服系統(tǒng)中,通過聲紋識(shí)別技術(shù),可實(shí)時(shí)識(shí)別出用戶的身份,從而提供個(gè)性化的客戶服務(wù)。

3、社保

我國針對(duì)離退休人員,每年至少需要進(jìn)行一次生存狀態(tài)驗(yàn)證,并以此為依據(jù)進(jìn)行養(yǎng)老金的發(fā)放,目前可通過到指定社保大廳或自助終端進(jìn)行生存驗(yàn)證,對(duì)于一些行動(dòng)不便的老人家,這種方式也是非常不便利。聲紋識(shí)別技術(shù)在遠(yuǎn)程身份驗(yàn)證中有著天然的優(yōu)勢(shì),只需要一個(gè)電話(手機(jī)或固話都可以),即可完成生存驗(yàn)證,為參保人員提供了便利,同時(shí)也為國家節(jié)省大量成本,避免養(yǎng)老金流失。

4、智能硬件

在智能硬件產(chǎn)品中,聲紋識(shí)別解決了當(dāng)前智能產(chǎn)品只能識(shí)別用戶所說的內(nèi)容,而不能區(qū)分說話人身份的問題,讓智能產(chǎn)品能夠區(qū)分不同的角色,實(shí)現(xiàn)“聽聲識(shí)人”。

讓系統(tǒng)針對(duì)性對(duì)每個(gè)人提供不同的內(nèi)容與服務(wù),讓人機(jī)交互更加簡單,讓用戶享受更輕松、更具個(gè)性化、更安全的產(chǎn)品體驗(yàn)。

七、總結(jié)

聲紋識(shí)別作為最前沿的生物識(shí)別技術(shù),隨著技術(shù)的成熟,將會(huì)在越來越多的應(yīng)用場景下落地,我們相信在不久的將來,在第三代身份證上,聲紋將成為繼指紋、人像后又一個(gè)新增的公民身份ID。聲音將在我們未來的科技生活中扮演眼越來越重要的角色。

責(zé)任編輯:lq

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 生物識(shí)別
    +關(guān)注

    關(guān)注

    3

    文章

    1219

    瀏覽量

    53862
  • 人工智能
    +關(guān)注

    關(guān)注

    1813

    文章

    49551

    瀏覽量

    259560
  • 聲紋識(shí)別
    +關(guān)注

    關(guān)注

    3

    文章

    142

    瀏覽量

    22212

原文標(biāo)題:設(shè)備運(yùn)維管理的人工智能黑科技:聲紋識(shí)別

文章出處:【微信號(hào):gridthink,微信公眾號(hào):電網(wǎng)智囊團(tuán)】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    無功補(bǔ)償控制器顯示功率因數(shù)0.99,可還是被罰款了,這到底是怎么回事?

    用戶說無功補(bǔ)償控制器顯示功率因數(shù)有0.99,可還是被罰款了,具體是怎么回事?通過視頻通話看看能不能找到問題并解決。 視頻接通后看到在功率因數(shù)控制器側(cè)此時(shí)顯示功率因數(shù)值有0.99,同時(shí)還注意到了并未
    的頭像 發(fā)表于 10-15 09:56 ?590次閱讀
    無功補(bǔ)償控制器顯示功率因數(shù)0.99,可還是被罰款了,這<b class='flag-5'>到底是</b><b class='flag-5'>怎么回事</b>?

    IEC 到底是什么?為什么它能影響全球?

    IEC 到底是什么?為什么它能影響全球?
    的頭像 發(fā)表于 09-04 17:07 ?1737次閱讀

    配電房自適應(yīng)濾波聲紋傳感器

    了"智能耳朵",實(shí)現(xiàn)了從被動(dòng)響應(yīng)到主動(dòng)預(yù)防的運(yùn)維模式革新。該技術(shù)的核心在于自適應(yīng)濾波與聲紋識(shí)別的深度結(jié)合。傳感器內(nèi)置的數(shù)字信號(hào)處理器可實(shí)時(shí)分析環(huán)境噪聲特征,通過LMS算法動(dòng)
    的頭像 發(fā)表于 08-08 09:36 ?602次閱讀
    配電房自適應(yīng)濾波<b class='flag-5'>聲紋</b>傳感器

    CY7C65215-32LTXI插入U(xiǎn)SB查到PC上無法識(shí)別到USB端口怎么解決?

    目前的現(xiàn)象就是板子通過USB查到PC上無法識(shí)別到USB端口,沒有任何反應(yīng),電源都是正常的.幫看下電路圖設(shè)計(jì)是否有問題,謝謝!
    發(fā)表于 05-28 06:47

    請(qǐng)問訓(xùn)練平臺(tái)訓(xùn)練完的識(shí)別程序,可以實(shí)現(xiàn)在識(shí)別到物體時(shí)屏幕再顯示出來,沒有識(shí)別到物體時(shí)屏幕不顯示嗎?

    問題如題,訓(xùn)練平臺(tái)訓(xùn)練完的識(shí)別程序,可以實(shí)現(xiàn)在識(shí)別到物體時(shí)屏幕再顯示出來,沒有識(shí)別到物體時(shí)屏幕不顯示嗎?比較小白,可以解釋一下怎么做嗎?或者是我應(yīng)該學(xué)哪里? 如果直接使用平臺(tái)下載的代碼不行,改一改可以。
    發(fā)表于 04-29 06:12

    EMC電機(jī)控制器測試整改:從問題識(shí)別到優(yōu)化實(shí)踐

    深圳南柯電子|EMC電機(jī)控制器測試整改:從問題識(shí)別到優(yōu)化實(shí)踐
    的頭像 發(fā)表于 03-20 09:34 ?651次閱讀
    EMC電機(jī)控制器測試整改:從問題<b class='flag-5'>識(shí)別到</b>優(yōu)化實(shí)踐

    am5728單板不能識(shí)別dlp4500設(shè)備是怎么回事?

    DLPLCR4500GUI-3.0.1代碼移植到am5728上,卻不能 正確的被識(shí)別,請(qǐng)幫忙看看怎么回事?下面是測試的過程: ubuntu與dlp4500模組相連,能正確地識(shí)別dlp4500模組,QT界面
    發(fā)表于 03-03 06:11

    ADS1298的操作溫度范圍到底是多少?

    ADS1298是 0°Cto +70°C;工業(yè)級(jí)ADS1298I 是 –40°Cto +85°C。 現(xiàn)在不知道ADS1298的操作溫度范圍到底是多少?
    發(fā)表于 02-10 07:19

    ADS1298ECG-FE原理圖上看見很多NI的符號(hào), 到底是什么意思?

    我們?cè)贏DS1298ECG-FE原理圖上看見很多NI的符號(hào), 到底是什么意思? 具體的值是多少? 如下面兩個(gè)圖所示: R1, R2電阻的值是多少? 這個(gè)比較重要。 R59 - R66又是多少? 麻煩你們回答一下。 謝
    發(fā)表于 02-05 08:16

    ADS1254上電啟動(dòng),DOUT/DRDY總是高電平,一直為高電平是怎么回事?

    ADS上電,DOUT/DRDY總是高電平,一直為高電平,多插幾次電源,偶爾能正常啟動(dòng)DOUT/DRDY有正常的下降沿。 到底是怎么回事? 下面是啟動(dòng)順序: InitSPI3SEL();//設(shè)置
    發(fā)表于 01-23 07:01

    電流是ADS1256內(nèi)部采樣電容的充電電流,那么方向應(yīng)該是流進(jìn)輸入腳而不是流出,這到底是怎么回事

    這個(gè)電流是ADS1256內(nèi)部采樣電容的充電電流,那么方向應(yīng)該是流進(jìn)輸入腳而不是流出,這到底是怎么回事?請(qǐng)大牛解釋下
    發(fā)表于 01-16 07:50

    ads1256進(jìn)入初始化函數(shù)后,DRDY引腳一直是高電平,是怎么回事?

    進(jìn)入初始化函數(shù)后,DRDY引腳一直是高電平,是怎么回事,求TI的老師和大神指導(dǎo)指導(dǎo)!!
    發(fā)表于 01-02 08:09

    Wine原理介紹和開發(fā)教程

    說起 Wine,稍微資深一點(diǎn)的 Linux 用戶應(yīng)該都聽過,但是真要說起 Wine 到底是怎么回事,可能大多數(shù)人不見得說得清。這篇文章會(huì)簡單地介紹 Wine 的工作原理,以及如何開始 Wine 的開發(fā)。
    的頭像 發(fā)表于 12-31 10:06 ?1.1w次閱讀

    LDC1101EVM GUI不能識(shí)別串口是怎么回事?

    請(qǐng)問一下,LDC1101EVM GUI不能識(shí)別我的串口是怎么回事,在電腦設(shè)備管理器上顯示EVM串口,但是在GUI的窗口只顯示一個(gè)刷新,但是怎么也刷新不了。換了WIN7、WIN8、WIN10都不行。
    發(fā)表于 12-09 08:14

    LMK05318BEVM Tics pro無法識(shí)別到該開發(fā)板,為什么?如何解決?

    第一次usb連接時(shí),tics提示升級(jí)開發(fā)板,升級(jí)過程中,vm虛擬機(jī)識(shí)別到了設(shè)備進(jìn)行了打斷,導(dǎo)致Tics pro再也無法識(shí)別到開發(fā)板,不知有何解決方法
    發(fā)表于 11-12 08:13