亚洲精品久久久久久久久久久,亚洲国产精品一区二区制服,亚洲精品午夜精品,国产成人精品综合在线观看,最近2019中文字幕一页二页

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

知乎搜索中文本相關(guān)性和知識(shí)蒸餾的工作實(shí)踐

深度學(xué)習(xí)自然語言處理 ? 來源:深度學(xué)習(xí)自然語言處理 ? 作者:申站 ? 2021-01-18 17:20 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

導(dǎo)讀:大家好,我是申站,知乎搜索團(tuán)隊(duì)的算法工程師。今天給大家分享下知乎搜索中文本相關(guān)性和知識(shí)蒸餾的工作實(shí)踐,主要內(nèi)容包括:

知乎搜索文本相關(guān)性的演進(jìn)

BERT在知乎搜索的應(yīng)用和問題

知識(shí)蒸餾及常見方案

知乎搜索在BERT蒸餾上的實(shí)踐

01

知乎搜索文本相關(guān)性的演進(jìn)

1. 文本相關(guān)性的演進(jìn)

51d17038-58b2-11eb-8b86-12bb97331649.jpg

我們首先來介紹下知乎搜索中的文本相關(guān)性。在搜索場(chǎng)景中,文本相關(guān)性可以定義為?戶搜索query的意圖與召回 doc 內(nèi)容的相關(guān)程度。我們需要通過不同模型來對(duì)這種相關(guān)程度進(jìn)行建模。整體而言,文本的相關(guān)性一般可以分為兩個(gè)維度,字面匹配和語義相關(guān)。知乎搜索中文本相關(guān)性模型的演進(jìn)也是從這兩個(gè)方面出發(fā)并有所側(cè)重和發(fā)展。在知乎搜索的整個(gè)架構(gòu)中,文本相關(guān)性模型主要定位于為二輪精排模型提供更高維/抽象的特征,同時(shí)也兼顧了一部分召回相關(guān)的工作。

2. Before NN

5203607a-58b2-11eb-8b86-12bb97331649.png

知乎搜索中的文本相關(guān)性整體演進(jìn)可以分為三個(gè)階段。在引入深度語義匹配模型前,知乎搜索的文本相關(guān)性主要是基于TF-IDF/BM25的詞袋模型,下圖右邊是BM25的公式。詞袋模型通常來說是一個(gè)系統(tǒng)的工程,除了需要人工設(shè)計(jì)公式外,在統(tǒng)計(jì)詞的權(quán)重、詞頻的基礎(chǔ)上,還需要覆蓋率、擴(kuò)展同義詞,緊密度等各種模塊的協(xié)同配合,才能達(dá)到一個(gè)較好的效果。知乎搜索相關(guān)性的一個(gè)比較早期的版本就是在這個(gè)基礎(chǔ)上迭代的。右下部分為在基于詞袋模型的基礎(chǔ)上,可以參考使用的一些具體特征。

3. Before BERT

533732d2-58b2-11eb-8b86-12bb97331649.png

基于 BM25 的詞袋模型不管如何設(shè)計(jì),主要還是只解決文本相關(guān)性中的字面匹配這部分問題。第二階段引入的深度語義匹配模型則聚焦于解決語義相關(guān)的問題,主要分為兩部分:雙塔表示模型和底層交互模型。微軟的DSSM(左下)是雙塔模型的典型代表。雙塔模型通過兩個(gè)不同的 encoder來分別獲取query和doc的低維語義句向量表示,然后針對(duì)兩個(gè)語義向量來設(shè)計(jì)相關(guān)性函數(shù)(比如cosine)。DSSM擺脫了詞袋模型復(fù)雜的特征工程和子模塊設(shè)計(jì),但也存在固有的缺陷:query和doc的語義表示是通過兩個(gè)完全獨(dú)立的 encoder 來獲取的,兩個(gè)固定的向量無法動(dòng)態(tài)的擬合doc在不同 query的不同表示。這個(gè)反應(yīng)到最后的精度上,肯定會(huì)有部分的損失。

底層交互模型一定程度上解決了這個(gè)問題。這個(gè)交互主要體現(xiàn)在 query 和 doc term/char 交互矩陣(中)的設(shè)計(jì)上,交互矩陣使模型能夠在靠近輸入層就能獲取 query 和 doc 的相關(guān)信息。在這個(gè)基礎(chǔ)上,后續(xù)通過不同的神經(jīng)網(wǎng)絡(luò)設(shè)計(jì)來實(shí)現(xiàn)特征提取得到 query-doc pair 的整體表示,最后通過全連接層來計(jì)算最終相關(guān)性得分。Match-Pyramid(右下)、KNRM(右上)是交互模型中比較有代表性的設(shè)計(jì),我們?cè)谶@兩個(gè)模型的基礎(chǔ)上做了一些探索和改進(jìn),相比于傳統(tǒng)的 BM25 詞袋模型取得了很大的提升。

4.BERT

540a2aca-58b2-11eb-8b86-12bb97331649.jpg

BERT模型得益于 transformer 結(jié)構(gòu)擁有非常強(qiáng)大的文本表示能力。第三階段我們引入了 BERT希望能夠進(jìn)一筆提高知乎搜索中文本相關(guān)性的表型。BERT 的應(yīng)用也分為表示模型和交互模型。

對(duì)于交互模型來說,如下左圖,query和doc分別為sentence1和sentence2直接輸入到BERT模型中,通過BERT做一個(gè)整體的encoder去得到sentence pair的向量表示,再通過全連接層得到相似性打分,因?yàn)槊總€(gè)doc都是依賴query的,每個(gè)query-doc pair都需要線上實(shí)時(shí)計(jì)算,對(duì)GPU機(jī)器資源的消耗非常大,對(duì)整體的排序服務(wù)性能有比較大的影響。

基于上述原因,我們也做了類似于DSSM形式的表示模型,將BERT作為encoder,訓(xùn)練數(shù)據(jù)的中的每個(gè)query和doc在輸入層沒有區(qū)分,都是做為不同的句子輸入,得到每個(gè)句向量表示,之后再對(duì)兩個(gè)表示向量做點(diǎn)乘,得到得到相關(guān)度打分。通過大量的實(shí)驗(yàn),我們最終采用了 BERT 輸出 token 序列向量的 average 作為句向量的表示。從交互模型到表示模型的妥協(xié)本質(zhì)是空間換時(shí)間,因?yàn)閐oc是可以全量離線計(jì)算存儲(chǔ)的,在線只需要實(shí)時(shí)計(jì)算比較短的 query ,然后doc直接通過查表,節(jié)省了大量的線上計(jì)算。相比于交互模型,精度有一部分損失。

02

BERT在知乎搜索的應(yīng)用和問題

1.搜索業(yè)務(wù)架構(gòu)中的BERT

544c0576-58b2-11eb-8b86-12bb97331649.jpg

在下圖中我們可以看到,BERT在知乎搜索業(yè)務(wù)的召回和排序階段都扮演了比較重要的角色。交互模型的主要服務(wù)于二輪精排模型,依賴于線上實(shí)時(shí)的計(jì)算query和doc,為精排模塊提供相關(guān)性特征。表示模型又分為在線和離線兩塊,在線表示模型實(shí)時(shí)的為用戶輸入的query提供句向量表示,離線表示模型為庫中的doc進(jìn)行批量句向量計(jì)算。一方面,doc向量通過TableStore/TiDB 和Redis的兩級(jí)存儲(chǔ)設(shè)計(jì),為線上排序做查詢服務(wù);另一方面,使用 faiss 對(duì)批量doc 向量構(gòu)建語義索引,在傳統(tǒng)的 term 召回基礎(chǔ)上補(bǔ)充向量語義召回。

2. BERT表示模型語義召回

549e1fdc-58b2-11eb-8b86-12bb97331649.jpg

下面詳細(xì)介紹下我們的語義召回模型。首先看個(gè)例子,對(duì)于「瑪莎拉蒂 ghlib」這個(gè)case,用戶真正想搜的是「瑪莎拉蒂 Ghibli」這款車,但用戶一般很難記住完整的名稱,可能會(huì)輸錯(cuò)。在輸錯(cuò)的情況下,基于傳統(tǒng)的term匹配方式(Google搜索的例子)只能召回“瑪莎拉蒂”相關(guān)的 doc,而無法進(jìn)行這輛車型的召回,這種場(chǎng)景下就需要進(jìn)行語義召回。更通用的來說,語義召回可以理解為增加了字面不匹配但是語義相關(guān)的 doc 的召回。

語義召回模型整體是BERT 相關(guān)性任務(wù)中雙塔表示模型的一個(gè)應(yīng)用。BERT做為encoder來對(duì)query和doc進(jìn)行向量的表示,基于faiss對(duì)全量 doc 向量構(gòu)建語義索引,線上實(shí)時(shí)的用query向量進(jìn)行召回。這個(gè)策略上線后,線上top20 doc中語義召回doc數(shù)量占總召回 doc 數(shù)量的比例能到達(dá) 5%+。

3. BERT帶來的問題

54c6aa42-58b2-11eb-8b86-12bb97331649.jpg

BEER 模型上線后,為不同的模塊都取得了不錯(cuò)收益的同時(shí),也給整個(gè)系統(tǒng)帶來了不少問題。這些問題整體可以歸結(jié)為線上實(shí)時(shí)計(jì)算、離線存儲(chǔ)、模型迭代三個(gè)方面。具體的見上圖。

4. 蒸餾前的嘗試

針對(duì)上述性能或存儲(chǔ)的問題,在對(duì)BERT 蒸餾之前,我們也進(jìn)行了很多不同的嘗試。

5503b086-58b2-11eb-8b86-12bb97331649.jpg

BERT 交互模型的部署放棄了使用原生TF serving,而是在cuda 的基礎(chǔ)上用c++ 重寫了模型的加載和serving,加上混合精度的使用。在我們的業(yè)務(wù)規(guī)模上,線上實(shí)時(shí)性能提高到原來的約 1.5 倍,使BERT交互模型滿足了的最低的可上線要求。在這個(gè)基礎(chǔ)上,對(duì)線上的 BERT 表示模型增加 cache,減少約 60% 的請(qǐng)求,有效減少了GPU 機(jī)器資源的消耗。

另一個(gè)思路是嘗試給BERT在橫向和縱向維度上瘦身。橫向上,一方面可以減小serving 時(shí) max_seq_length長度,減少計(jì)算量;另一方面可以對(duì)表示向量進(jìn)行維度壓縮來降低存儲(chǔ)開銷。這兩種嘗試在離線和在線指標(biāo)上都有不同程度的損失,因此被放棄??v向上,主要是減少模型的深度,即減少 transformer層數(shù)。這對(duì)于顯存和計(jì)算量都能得到顯著的優(yōu)化。前期嘗試過直接訓(xùn)練小模型,以及使用BERT-base若干層在下游的相關(guān)性任務(wù)上進(jìn)行fine-tune。這兩種方案,在離線指標(biāo)上的表現(xiàn)就沒法達(dá)到要求,因此也沒有上線。

針對(duì) doc數(shù)量過大,存儲(chǔ)開銷過大和語義索引構(gòu)建慢的問題。在這方面做了一個(gè)妥協(xié)的方案:通過wilson score 等規(guī)則過濾掉大部分低質(zhì)量的 doc,只對(duì)約 1/3 的doc 存儲(chǔ)表示向量和構(gòu)建語義索引。該方案會(huì)導(dǎo)致部分文檔的相關(guān)性特征存在缺失。對(duì)于表示模型存在的低交互問題,嘗試Poly-encoder(Facebook方案)將固定的 768維表示向量轉(zhuǎn)為多個(gè)head的形式,用多個(gè)head做attention的計(jì)算,保證性能在部分下降的前提得到部分精度的提升。

03

智知識(shí)蒸餾及常見方案

1.知識(shí)蒸餾

5542ddb0-58b2-11eb-8b86-12bb97331649.jpg

下面簡單介紹下知識(shí)蒸餾。從下圖中看,我們可以把知識(shí)蒸餾的整體形式簡化為:大模型不考慮性能問題盡量學(xué)習(xí)更多的知識(shí)(數(shù)據(jù)),小模型通過適量的數(shù)據(jù)去高效地學(xué)習(xí)大模型的輸出,達(dá)到一個(gè)知識(shí)遷移的效果。實(shí)際 serving 使用的是小模型。

556b0740-58b2-11eb-8b86-12bb97331649.jpg

知識(shí)蒸餾為什么能有效?關(guān)鍵點(diǎn)在于 soft target 和 temperature。soft target對(duì)應(yīng)的是teacher模型的輸出,類似于概率分布,知識(shí)蒸餾從hard target轉(zhuǎn)為soft target的學(xué)習(xí)有利于模型更好的去擬合標(biāo)簽,引入temperature則是為了進(jìn)一步平滑標(biāo)簽,讓模型去學(xué)習(xí)到類別和類別中的知識(shí)。這里需要注意的是,temperature 的選取不宜過大,太大的 temperature 會(huì)導(dǎo)致不同類別之間的差異被完全平滑掉。

2.BERT蒸餾方案

5592633a-58b2-11eb-8b86-12bb97331649.jpg

對(duì)與BERT的蒸餾我們做了大量的調(diào)研,并對(duì)目前主流的蒸餾方案做了歸納分類。基于任務(wù)維度來說,主要對(duì)應(yīng)于現(xiàn)在的pretrain + fine-tune 的兩段式訓(xùn)練。在預(yù)訓(xùn)練階段和下游任務(wù)階段都有不少的方案涉及。技巧層面來分的話,主要包括不同的遷移知識(shí)和模型結(jié)構(gòu)的設(shè)計(jì)兩方面。后面我會(huì)選兩個(gè)典型的模型簡單介紹一下。

3. 蒸餾-MiniLM

55e2c29e-58b2-11eb-8b86-12bb97331649.jpg

MiniLM是基于預(yù)訓(xùn)練任務(wù)的蒸餾,其是一種通用的面向Transformer-based預(yù)訓(xùn)練模型壓縮算法。主要改進(jìn)點(diǎn)有三個(gè),一是蒸餾teacher模型最后一層Transformer的自注意力模塊,二是在自注意模塊中引入 values-values點(diǎn)乘矩陣的知識(shí)遷移,三是使?了 assistant ?絡(luò)來輔助蒸餾。

4.蒸餾-BERT to Simple NN

562d325c-58b2-11eb-8b86-12bb97331649.jpg

BERT to Simple NN更多的是做了一些loss形式的設(shè)計(jì),使其訓(xùn)練方式更高效。

04

知乎搜索再BERT蒸餾上的實(shí)踐

1.BERT蒸餾上的實(shí)踐和收益

5650a430-58b2-11eb-8b86-12bb97331649.jpg

前面的介紹中我有提到,在做 BERT蒸餾前其實(shí)已經(jīng)做了很多嘗試,但是多少都會(huì)有精度的損失。因此,我們做蒸餾的第一目標(biāo)是離線模型對(duì)?線上 BERT精度?損。但對(duì)BERT-base 直接進(jìn)行蒸餾,無論如何都沒辦法避免精度的損失,所以我們嘗試用更大的模型(比如BERT-large/Robert-large/XLNET)來作為 teacher 進(jìn)行蒸餾。這些多層的模型均在我們知乎全量語料先做pretrain,再做fine-tune,得到微調(diào)后的模型再做蒸餾。

2.蒸餾-Patient KD

5697a07e-58b2-11eb-8b86-12bb97331649.jpg

我們對(duì)交互模型和表示模型都做了蒸餾,主要采用了Patient KD模型的結(jié)構(gòu)設(shè)計(jì),Student模型基于BERT-base的若干層運(yùn)用不同的策略進(jìn)行參數(shù)的初始化,去學(xué)習(xí)Robert-large大模型的方案。

其中知識(shí)遷移主要有三部分:student的預(yù)測(cè)與真實(shí)標(biāo)簽的交叉熵、student與teacher的預(yù)測(cè)的交叉熵和中間隱層的向量之間的normalized MSE。

3.BERT交互模型蒸餾

56d60756-58b2-11eb-8b86-12bb97331649.jpg

對(duì)于我們選的teacher模型Robert-large,單純預(yù)訓(xùn)練模型其nDCG指標(biāo)為0.914,線上之前使用的BERT-base 是0.907,若對(duì)BERT-base的若干6層直接去做fine-tune能達(dá)到的最高指標(biāo)是0.903,對(duì)比于BERT-base精度會(huì)損失很多。

我們這塊做了一些嘗試,基于Robert-large從24層蒸餾到6層的話能到0.911,能超過線上BERT-base的效果。

訓(xùn)練數(shù)據(jù)方面,我們經(jīng)歷了點(diǎn)擊日志數(shù)據(jù)挖掘到逐漸建立起完善的標(biāo)注數(shù)據(jù)集。目前,相關(guān)性任務(wù)訓(xùn)練和蒸餾主要均基于標(biāo)注數(shù)據(jù)集。標(biāo)注數(shù)據(jù)分為 title和 content兩部分,Query 數(shù)量達(dá)到 10w+ 的規(guī)模,標(biāo)注 doc 在 300w ~ 400w 之間。

4. BERT表示模型蒸餾

5757fc8e-58b2-11eb-8b86-12bb97331649.jpg

在BERT表示模型上,蒸餾時(shí)我們希望對(duì)向量維度和模型層數(shù)同時(shí)進(jìn)行壓縮,但蒸餾后得到的student模型表現(xiàn)不及預(yù)期。所以最后上線的方案中,表示模型層數(shù)還是維持了12層。在蒸餾時(shí),為了提高精度,選取交互模型作為teacher進(jìn)行蒸餾。因?yàn)榻换ツP褪莙uery和doc之間的打分,交互模型得到的logits與表示模型點(diǎn)乘后的打分在數(shù)量值會(huì)有較大差值,所以用pairwise形式通過teacher差值擬合來進(jìn)行l(wèi)oss的計(jì)算。

在維度壓縮方面我們做了對(duì)比實(shí)驗(yàn),BERT模型輸出做 average pooling 后接全連接層分別壓縮至8維到768維。如圖所示,128維和64維的表現(xiàn)跟768維差別不大,在上線時(shí)選擇維度為64和128進(jìn)行嘗試,兩者在線上表現(xiàn)沒有太明顯的差異,最終選擇了64維的方案,把模型的維度壓縮了12倍,存儲(chǔ)消耗更低。

5. 蒸餾的收益

蒸餾的收益主要分為在線和離線兩部分。

579a5d40-58b2-11eb-8b86-12bb97331649.jpg

在線方面:

交互模型的層數(shù)從12層壓縮到6層,排序相關(guān)性特征P95減少為原本的1/2,整體搜索入口下降40ms,模型部署所需的GPU機(jī)器數(shù)也減少了一半,降低了資源消耗。

表示模型語義索引存儲(chǔ)規(guī)模title減為1/4,content維度從768維壓縮至64維,雖然維度減少了12倍,但增加了倒排索引doc的數(shù)量,所以content最終減為1/6,

語義索引召回也有比較大的提升,title減少為1/3,content減少為1/2。精排模塊需要線上實(shí)時(shí)查詢離線計(jì)算好的向量,所以查詢服務(wù)也有提升。

離線方面:

表示模型語義索引的構(gòu)建時(shí)間減少為1/4,底層知乎自研的TableStore/TIDB存儲(chǔ)減為原來的1/6,LTR訓(xùn)練數(shù)據(jù)和訓(xùn)練時(shí)間都有很大的提升,粗排早期用的是BM25等基礎(chǔ)特征,后來引入了32維的BERT向量,提升了精排精度。

責(zé)任編輯:xj

原文標(biāo)題:知乎搜索文本相關(guān)性與知識(shí)蒸餾

文章出處:【微信公眾號(hào):深度學(xué)習(xí)自然語言處理】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 文本
    +關(guān)注

    關(guān)注

    0

    文章

    119

    瀏覽量

    17708
  • 相關(guān)性
    +關(guān)注

    關(guān)注

    0

    文章

    4

    瀏覽量

    1376
  • 自然語言
    +關(guān)注

    關(guān)注

    1

    文章

    292

    瀏覽量

    13885

原文標(biāo)題:知乎搜索文本相關(guān)性與知識(shí)蒸餾

文章出處:【微信號(hào):zenRRan,微信公眾號(hào):深度學(xué)習(xí)自然語言處理】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    聲入選國家知識(shí)產(chǎn)權(quán)示范企業(yè)創(chuàng)建推薦單位

    近日,上海市知識(shí)產(chǎn)權(quán)局公示了《2025-2027年知識(shí)產(chǎn)權(quán)強(qiáng)國建設(shè)示范創(chuàng)建工作推薦結(jié)果》。云聲(上海)智能科技有限公司憑借其卓越的自主創(chuàng)新能力與
    的頭像 發(fā)表于 11-04 10:28 ?194次閱讀

    【好書推薦】RT-Thread第22本相關(guān)書籍!《嵌入式實(shí)時(shí)操作系統(tǒng)開發(fā)實(shí)踐》| 技術(shù)集結(jié)

    教學(xué)的首選平臺(tái)。本次推薦的第22本RT-Thread相關(guān)書籍——《嵌入式實(shí)時(shí)操作系統(tǒng)開發(fā)實(shí)踐(基于英飛凌PSoC62和RT-Thread)》正是一本將理論與實(shí)踐
    的頭像 發(fā)表于 10-16 18:46 ?223次閱讀
    【好書推薦】RT-Thread第22<b class='flag-5'>本相關(guān)</b>書籍!《嵌入式實(shí)時(shí)操作系統(tǒng)開發(fā)<b class='flag-5'>實(shí)踐</b>》| 技術(shù)集結(jié)

    開源“智能預(yù)渲染框架” 幾行代碼實(shí)現(xiàn)鴻蒙應(yīng)用頁面“秒開”

    近日,在Gitee平臺(tái)開源了其自研的鴻蒙“智能預(yù)渲染框架”,并將該框架的Har包上架到OpenHarmony三方庫中心倉。該框架在鴻蒙平臺(tái)首創(chuàng)“智能預(yù)渲染”技術(shù),旨在破解應(yīng)用復(fù)雜頁面加載緩慢
    的頭像 發(fā)表于 08-29 14:32 ?411次閱讀
    <b class='flag-5'>知</b><b class='flag-5'>乎</b>開源“智能預(yù)渲染框架” 幾行代碼實(shí)現(xiàn)鴻蒙應(yīng)用頁面“秒開”

    用拼多多 API 實(shí)現(xiàn)拼多多店鋪商品搜索權(quán)重提升

    將分步講解如何利用 API 實(shí)現(xiàn)這一目標(biāo),確保內(nèi)容真實(shí)可靠。 1. 理解搜索權(quán)重及其重要 搜索權(quán)重是平臺(tái)算法對(duì)商品排名的綜合評(píng)分,基于多個(gè)因素計(jì)算。例如: 關(guān)鍵詞相關(guān)性:商品標(biāo)題和描
    的頭像 發(fā)表于 08-19 17:23 ?427次閱讀
    用拼多多 API 實(shí)現(xiàn)拼多多店鋪商品<b class='flag-5'>搜索</b>權(quán)重提升

    開源——STM32F4結(jié)合BMP581氣壓傳感器實(shí)現(xiàn)ST7789中文顯示教程

    STM32F407VET6零增強(qiáng)板上實(shí)現(xiàn)ST7789顯示屏的中文顯示功能,結(jié)合BMP581傳感器數(shù)據(jù)展示。項(xiàng)目使用I2C通信讀取傳感器數(shù)據(jù),通過SPI接口在TFT屏幕上顯示中文界面。(2)項(xiàng)目亮點(diǎn)&
    發(fā)表于 07-08 18:55

    海外數(shù)字經(jīng)濟(jì)信任度報(bào)告正式發(fā)布,首度揭示消費(fèi)者數(shù)字支付信任度與GDP增長的正相關(guān)性

    對(duì)輔助消費(fèi) AI 工具的高度不信任而表現(xiàn)滯后 ● ? ? ? ?該報(bào)告首次揭示消費(fèi)者數(shù)字信任度與國家 GDP 增長的相關(guān)性 倫敦,2025年5月14日——全球領(lǐng)先數(shù)字支付服務(wù)商 Checkout.com 今日發(fā)布首份《海外數(shù)字經(jīng)濟(jì)信任度報(bào)告》,該報(bào)告基于對(duì) 16 個(gè)國家消費(fèi)者數(shù)字支付安全、透明
    的頭像 發(fā)表于 05-15 17:50 ?552次閱讀
    海外數(shù)字經(jīng)濟(jì)信任度報(bào)告正式發(fā)布,首度揭示消費(fèi)者數(shù)字支付信任度與GDP增長的正<b class='flag-5'>相關(guān)性</b>

    變頻器維修相關(guān)知識(shí)

    變頻器維修是一項(xiàng)涉及理論知識(shí)、實(shí)踐經(jīng)驗(yàn)與操作水平的工作,其維修過程需要遵循一定的步驟和方法。以下是一些關(guān)于變頻器維修的相關(guān)知識(shí): 一、變頻器
    的頭像 發(fā)表于 03-09 07:40 ?957次閱讀
    變頻器維修<b class='flag-5'>相關(guān)</b><b class='flag-5'>知識(shí)</b>

    《AI Agent 應(yīng)用與項(xiàng)目實(shí)戰(zhàn)》閱讀心得3——RAG架構(gòu)與部署本地知識(shí)

    。RAG技術(shù)建立在向量數(shù)據(jù)庫的基礎(chǔ)上,通過高維向量空間中的相似度計(jì)算來實(shí)現(xiàn)語義層面的匹配,這比傳統(tǒng)的關(guān)鍵詞搜索更能捕捉文本的深層語義關(guān)聯(lián)。 第七章通過一個(gè)本地知識(shí)庫的搭建案例展示了RAG技術(shù)的工程
    發(fā)表于 03-07 19:49

    【「基于大模型的RAG應(yīng)用開發(fā)與優(yōu)化」閱讀體驗(yàn)】RAG基本概念

    工作,同時(shí)通過Prompt工程優(yōu)化輸入內(nèi)容,甚至實(shí)現(xiàn)多模型的協(xié)同推理,充分發(fā)揮不同模型的優(yōu)勢(shì)。結(jié)果優(yōu)化層,基于用戶反饋學(xué)習(xí)不斷改進(jìn)輸出,通過可信度評(píng)估算法判斷結(jié)果的可靠,實(shí)時(shí)知識(shí)蒸餾
    發(fā)表于 02-08 00:22

    大連理工提出基于Wasserstein距離(WD)的知識(shí)蒸餾方法

    自 Hinton 等人的開創(chuàng)工作以來,基于 Kullback-Leibler 散度(KL-Div)的知識(shí)蒸餾一直占主導(dǎo)地位。 然而,KL-Div 僅比較教師和學(xué)生在相應(yīng)類別上的概率,
    的頭像 發(fā)表于 01-21 09:45 ?901次閱讀

    【「基于大模型的RAG應(yīng)用開發(fā)與優(yōu)化」閱讀體驗(yàn)】+Embedding技術(shù)解讀

    生成回答。在特定領(lǐng)域或任務(wù)中,可以通過微調(diào)Embedding模型來提高檢索的相關(guān)性和準(zhǔn)確。Embedding在大模型RAG技術(shù)中發(fā)揮著至關(guān)重要的作用。它不僅實(shí)現(xiàn)了文本向量化,還為信息檢索和
    發(fā)表于 01-17 19:53

    #新年新氣象,大家新年快樂!#AIGC入門及鴻蒙入門

    和大數(shù)據(jù)技術(shù)的創(chuàng)新內(nèi)容生成工具,正逐漸成為矚目的焦點(diǎn)。它為創(chuàng)意工作打開了全新的大門,尤其在文本和視覺內(nèi)容創(chuàng)作方面表現(xiàn)卓越。對(duì)于初學(xué)者來說,可以通過學(xué)習(xí)相關(guān)基礎(chǔ)
    發(fā)表于 01-13 10:46

    AIGC入門及鴻蒙入門

    人工智能和大數(shù)據(jù)技術(shù)的創(chuàng)新內(nèi)容生成工具,正逐漸成為矚目的焦點(diǎn)。它為創(chuàng)意工作打開了全新的大門,尤其在文本和視覺內(nèi)容創(chuàng)作方面表現(xiàn)卓越。對(duì)于初學(xué)者來說,可以通過學(xué)習(xí)相關(guān)基礎(chǔ)
    發(fā)表于 01-13 10:32

    聲榮獲“2024年上海市專利工作示范單位”認(rèn)定

    近日,上海市知識(shí)產(chǎn)權(quán)局印發(fā)《關(guān)于公布2024年上海市專利工作試點(diǎn)示范單位的通知》(滬局促[2024]44號(hào)),云聲(上海)智能科技有限公司獲“2024年上海市專利
    的頭像 發(fā)表于 12-06 20:16 ?956次閱讀

    正式公布三季度財(cái)報(bào):月活躍用戶數(shù)穩(wěn)步增長

    近日,公司正式公布了其2024年第三季度的業(yè)績報(bào)告,展示了公司在該季度的經(jīng)營成果。 據(jù)報(bào)告顯示,盡管在第三季度的營收出現(xiàn)了同比下降,具體數(shù)字為下降17.32%至8.45億元人民
    的頭像 發(fā)表于 11-27 10:44 ?1549次閱讀