亚洲精品久久久久久久久久久,亚洲国产精品一区二区制服,亚洲精品午夜精品,国产成人精品综合在线观看,最近2019中文字幕一页二页

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

如何為Google翻譯上的性別中性詞提供女性化和男性化兩種翻譯結果的技術原理

電子工程師 ? 來源:lq ? 2018-12-12 09:44 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

如何消除 AI 帶來的性別偏見是個令人頭疼的問題,那究竟有沒有方法去解決?

12 月 6 日,Google 宣布他們邁出了減少 Google 翻譯中性別偏見的第一步,并且還詳細介紹了如何為 Google 翻譯上的性別中性詞提供女性化和男性化兩種翻譯結果的技術原理。

過去幾年,Google 翻譯通過使用基于端到端的神經網絡系統(tǒng)大大提高了翻譯質量,但與此同時,模型的翻譯結果呈現出了社會偏見,尤其是性別偏見。具體而言,由于 Google 翻譯的結果一直都是從網上數以億計的已翻譯數據中學習得到,這造成的后果是,即使翻譯結果可能具有女性化或男性化形式的傾向,但它也只為查詢提供一種翻譯。因而,這無可避免地復制了已有的性別偏見。例如,像“強壯”或“醫(yī)生”這樣的詞語,它會生成偏向于男性化的翻譯結果,而對于“護士”或“美麗”等詞匯,則會生成偏向于女性化的翻譯。

現在,Google 翻譯解決了上述問題。當你把諸如“外科醫(yī)生”這樣的單字從英語翻譯成法語、意大利語、葡萄牙語或西班牙語時,會得到的男性化和女性化的兩種翻譯結果。另外,當把短語和句子從土耳其語翻譯成英語時,你也會得到這兩類翻譯,比如你用土耳其語輸入“o bir doktor”,就會得到“she is a doctor”和“he is a doctor”這兩種按性別翻譯的結果。

Google 翻譯中有特定性別的翻譯

Google 團隊是如何做的?

要知道,支持單字查詢的特定性別翻譯涉及到用性別屬性豐富 Google 的底層詞庫。支持較長(短語和句子)查詢的性別翻譯尤其具有挑戰(zhàn)性,這甚至需要對翻譯框架進行部分重構。對于這些較長的查詢,他們最初將重點放在從土耳其語到英文的翻譯上??傮w而言,他們制訂了三步法來解決土耳其語中性別中立查詢的問題,即同時提供英文的男性化和女性化翻譯結果。

檢測性別中立查詢

許多土耳其語中提到人的句子都是性別中立的,但并不是全部都這樣。檢測哪些查詢符合特定性別的翻譯是一個難題,由于土耳其語在形態(tài)學上的很復雜,這意味著指代一個人可以是明確的性別中立代詞(例如 O,Ona)或隱式編碼。例如,“Biliyor mu?”沒有明確的性別中立代名詞,可以翻譯為“她知道嗎?”或“他知道嗎?”這種復雜性導致我們不能使用簡單的性別中性代詞列表來檢測性別中立的土耳其語查詢,另外我們還需要一個機器學習系統(tǒng)。Google 團隊估計大約有 10% 的土耳其語的翻譯查詢含糊不清,能同時符合女性化和男性化翻譯的條件。

為了檢測這些查詢,他們使用了最先進的文本分類算法(與他們的云自然語言 API 中使用的算法相同)來構建一個系統(tǒng),該系統(tǒng)能夠檢測給定的土耳其語查詢何時是性別中立的。這就導致在翻譯前新增了一個步驟,所以他們必須平衡模型在延遲時的復雜性。Google 團隊對數千個土耳其人進行系統(tǒng)培訓,要求這些人判斷出一個給定的例子是否是性別中立的。而他們最終的分類系統(tǒng)是卷積神經網絡,以此可以準確檢測出需要按性別翻譯的查詢。

生成特定性別翻譯

隨后,Google 團隊增強了基礎神經機器翻譯(NMT)系統(tǒng),以便在需要時生成女性化和男性化翻譯。當沒有要求區(qū)分性別時,訓練模型生成的是默認翻譯。這主要包括:

識別并將平行訓練數據劃分為具有女性化詞語、男性化詞語和性別不明詞語。

在句子的開頭添加一個新增的輸入標記,以指定要翻譯的所需性別,類似于已構建的多語言 NMT 系統(tǒng)的方式:

<2MALE> O bir doktor→他是一名醫(yī)生

<2FEMALE> O bir doktor→她是一名醫(yī)生

訓練增強的 NMT 模型對女性、男性和性別中立數據源的影響。他們對這些來源進行了各種混合比試驗,使模型在這三個任務中的表現同樣出色。

如果確定用戶查詢是性別中立的,他們會在翻譯請求中添加性別前綴。對于這些要求,他們的最終 NMT 模型可以在 99% 情況下生成可靠的女性化和男性化性別的翻譯結果。此外,系統(tǒng)在沒有性別前綴的查詢中還能保持翻譯質量。

檢查準確性

最后的一個步驟決定是否顯示特定性別的翻譯結果。由于產生男性化翻譯的訓練數據與產生女性化翻譯的訓練數據不同,因此在與性別無關的兩種翻譯間可能存在差異。如果確定特定性別的翻譯質量低,則只顯示單一的默認翻譯。為了確定特定性別的句子翻譯質量,他們進行以下驗證:

要求的女性翻譯是女性化的;

要求的男性化翻譯是男性化的;

除了與性別相關的變化,如果女性化和男性化翻譯完全相同,即使翻譯結果間的措辭發(fā)生微小變化也會被系統(tǒng)過濾掉。

男性化和女性化翻譯僅在性別方面有所不同,即“he”和“his”與“she”和“her”。因此,他們展示了特定性別的翻譯。底部:男性化和女性化翻譯在性別方面有所不同,即“he”與“she”。但是,從“really”到“actually”的變化與性別無關。因此,系統(tǒng)將過濾特定性別的翻譯并顯示默認翻譯結果。

如果將所有內容放在一起,輸入句子首先會通過分類器,分類器檢測它們是否可以進行特定性別翻譯。如果分類器說“是”,系統(tǒng)則向增強型 NMT 模型發(fā)送三個請求:女性化翻譯請求、男性化翻譯請求和性別中立翻譯請求。最后一步考慮了所有的三個答案,并決定是否顯示特定性別翻譯或單個默認翻譯。Google 團隊認為,這一步仍然相當保守,為了最大限度提高所顯示的特定性別的翻譯質量,因此系統(tǒng)的整體召回率僅為 60% 左右。

對 Google來說,這只是他們解決機器翻譯系統(tǒng)中性別偏見的第一步,未來,他們計劃將特定性別的翻譯擴展到更多語言,并解決自動完成查詢等功能中的性別偏見問題。此外,他們已經在考慮如何在翻譯中解決非二元性別的問題。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • Google
    +關注

    關注

    5

    文章

    1797

    瀏覽量

    60134
  • 神經網絡
    +關注

    關注

    42

    文章

    4821

    瀏覽量

    106429
  • 機器翻譯
    +關注

    關注

    0

    文章

    141

    瀏覽量

    15435

原文標題:“男醫(yī)生,女護士?”消除偏見,Google有大招

文章出處:【微信號:rgznai100,微信公眾號:rgznai100】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    亮亮視野AR翻譯眼鏡亮相HICOOL 2025全球創(chuàng)業(yè)者峰會

    、IASP世界大會和京臺科技論壇獨家提供AR翻譯技術服務之后,亮亮視野再次亮相大型國際論壇,旗下AR翻譯眼鏡逐漸成為北京文化科技新符號,也是北京打造“全球創(chuàng)新創(chuàng)業(yè)生態(tài)之都”的最新實例。
    的頭像 發(fā)表于 10-23 17:34 ?811次閱讀

    聲智科技AI翻譯耳機重塑智能聽覺體驗

    在日益緊密的全球浪潮中,跨語言溝通的障礙正在被前沿的聲學AI技術逐步瓦解。聲智AI翻譯耳機,憑借深厚的聲學AI積累,率先實現了“跨語種音色與情感復刻技術”在實時
    的頭像 發(fā)表于 10-21 15:28 ?365次閱讀
    聲智科技AI<b class='flag-5'>翻譯</b>耳機重塑智能聽覺體驗

    亮亮視野AR翻譯眼鏡亮相2025北京文化論壇

    近日,2025北京文化論壇在北京隆重開幕。源自北京科創(chuàng)土壤的國家級“專精特新小巨人”企業(yè)亮亮視野,成為論壇指定AR翻譯眼鏡技術服務商,為主論壇等重要環(huán)節(jié)提供實時翻譯服務。這是繼日前為北
    的頭像 發(fā)表于 09-30 11:14 ?695次閱讀

    國慶出國游,時空壺新T1翻譯機,首個端側模型突破助力跨語言交流

    國慶將至,眾多游客計劃出國旅行,跨語言交流的順暢與否成為影響旅行體驗的重要因素。時空壺新T1翻譯機作為行業(yè)技術領先產品,憑借其獨特優(yōu)勢,為游客在海外的溝通交流保駕護航。新T1作為時空壺翻譯機品類中
    的頭像 發(fā)表于 09-12 12:20 ?727次閱讀
    國慶出國游,時空壺新T1<b class='flag-5'>翻譯</b>機,首個端側模型突破助力跨語言交流

    翻譯失去網絡,時空壺新T1翻譯機開創(chuàng)首個離線模型賦能全球溝通新體驗

    在全球交流日益緊密的當下,跨語言溝通工具的重要性愈發(fā)凸顯。近日,時空壺推出的T1翻譯機憑借其強大的離線模型與便捷應用,成為市場焦點,為人們在跨國交流場景中帶來前所未有的便利。時空壺T1翻譯機搭載了
    的頭像 發(fā)表于 09-08 16:52 ?805次閱讀
    當<b class='flag-5'>翻譯</b>失去網絡,時空壺新T1<b class='flag-5'>翻譯</b>機開創(chuàng)首個離線模型賦能全球溝通新體驗

    CC-Link IE 轉 Modbus TCP,閥門通訊的“雙語翻譯官”

    。這就好比一位說“高速實時語”的PLC,要和只會“經典通用語”的閥門對話,此時,一位可靠的“雙語翻譯官”——耐達訊通信技術協(xié)議轉換網關,就顯得至關重要了。 協(xié)議轉換網關的核心工作原理就是“翻譯”。它在 CC-Link IE 網絡
    的頭像 發(fā)表于 07-09 09:46 ?318次閱讀

    CAN收發(fā)器:總線信號的“翻譯官”

    在CAN總線通信中,CAN收發(fā)器(Transceiver)扮演著至關重要的角色——它就像一位“翻譯官”,負責將微控制器(MCU)的數字信號轉換為總線上的差分信號,同時把總線信號翻譯回MCU能理解
    的頭像 發(fā)表于 06-27 11:34 ?1381次閱讀
    CAN收發(fā)器:總線信號的“<b class='flag-5'>翻譯</b>官”

    時空壺 T1 離線翻譯機:解鎖無網生活溝通自由

    在全球浪潮席卷之下,跨國交流已然成為現代人生活的重要組成部分。無論是出國旅行、商務洽談,還是文化體驗,語言障礙始終是橫亙在人們面前的一道難題。而網絡覆蓋的局限性,更是讓依賴在線翻譯的設備在關鍵時刻
    的頭像 發(fā)表于 06-05 10:30 ?602次閱讀
    時空壺 T1 離線<b class='flag-5'>翻譯</b>機:解鎖無網生活溝通自由

    Ethercat轉Profinet網關如何用“協(xié)議翻譯術”打通自動產線任督二脈

    Ethercat轉Profinet網關如何用“協(xié)議翻譯術”打通自動產線任督二脈
    的頭像 發(fā)表于 05-10 14:42 ?372次閱讀
    Ethercat轉Profinet網關如何用“協(xié)議<b class='flag-5'>翻譯</b>術”打通自動<b class='flag-5'>化</b>產線任督二脈

    “System Level EOS Testing Method”可以翻譯為: “系統(tǒng)級電性過應力測試方法”

    “System Level EOS Testing Method”可以翻譯為: “系統(tǒng)級電性過應力測試方法”
    的頭像 發(fā)表于 05-05 15:55 ?602次閱讀
    “System Level EOS Testing Method”可以<b class='flag-5'>翻譯</b>為: “系統(tǒng)級電性過應力測試方法”

    EtherCAT轉Profinet網關:紡織業(yè)設備互聯(lián)的“翻譯官”

    EtherCAT轉Profinet網關不僅是紡織車間設備互聯(lián)的“翻譯官”,更是推動生產模式革新的“加速器”。其價值在于打破協(xié)議壁壘的同時,為紡織業(yè)的精益、柔性化生產提供了可落地的技術
    的頭像 發(fā)表于 04-28 15:39 ?679次閱讀
    EtherCAT轉Profinet網關:紡織業(yè)設備互聯(lián)的“<b class='flag-5'>翻譯</b>官”

    女性機器人能否代替女性

    ? ? ? 在探討“女性機器人能否代替女性”這一議題時,我們首先需要明確幾個核心概念:何為女性機器人?何為替代?以及這一替代是基于何種維度和
    的頭像 發(fā)表于 02-08 15:49 ?2662次閱讀

    AI助力實時翻譯耳機

    是一能夠實時將一語言翻譯成另一語言的耳機設備。它通常由一個耳機和一個配套的應用程序組成,用戶可以通過應用程序選擇需要翻譯的語言,并通過
    的頭像 發(fā)表于 01-24 11:14 ?2905次閱讀
    AI助力實時<b class='flag-5'>翻譯</b>耳機

    LLMWorld上線代碼翻譯新工具——問丫·碼語翻譯俠,快來體驗!

    應用案例 aicode.llmworld.net 案例一 閱讀復雜算法,將計算機語言翻譯成自然語言和偽代碼,快速幫助用戶理解算法實現邏輯。 Input(C++): 正弦波信號進行傅里葉變換,并輸出其頻域結果的C++
    的頭像 發(fā)表于 12-09 11:11 ?1532次閱讀
    LLMWorld上線代碼<b class='flag-5'>翻譯</b>新工具——問丫·碼語<b class='flag-5'>翻譯</b>俠,快來體驗!

    IMAX攜手Camb.AI實現影院實時語言翻譯

    內容和精彩紀錄片精準地本地化為多達140語言,以滿足全球不同地區(qū)觀眾的多樣需求。傳統(tǒng)配音方式不僅成本高昂,而且耗時較長,難以滿足快速變化的市場需求。而Camb.AI的DubStudio平臺則憑借其先進的人工智能技術,承諾能夠
    的頭像 發(fā)表于 11-26 13:55 ?1079次閱讀