亚洲精品久久久久久久久久久,亚洲国产精品一区二区制服,亚洲精品午夜精品,国产成人精品综合在线观看,最近2019中文字幕一页二页

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

借助浪潮信息元腦企智EPAI高效創(chuàng)建大模型RAG

浪潮AIHPC ? 來源:浪潮AIHPC ? 2024-12-19 14:32 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

面對大量不斷迭代的新知識,大模型必須“終身學習”才能滿足實際應用的需求。RAG(Retrieval-augmented Generation,檢索增強生成)讓生成式大模型能夠利用外部的知識源來增強生成能力,提高生成質量和可靠性。但企業(yè)構建知識檢索系統(tǒng)并非易事,通常面臨開發(fā)門檻高、生成內容差等難題。而借助浪潮信息元腦企智EPAI企業(yè)大模型開發(fā)平臺,企業(yè)僅需三步即可高效創(chuàng)建大模型RAG,讓企業(yè)內部積累的大量數據得到有效利用,喚醒企業(yè)沉睡的知識,顯著提升大模型回答的準確性。

RAG:生成式大模型落地的最佳實踐方案

在AIGC大模型落地企業(yè)應用過程中,必然會碰到的一個問題是,大模型從訓練到完成部署,并不意味著抵達了開發(fā)工作的“終點”。在真實場景中,每時每刻都在產生大量數據,知識會迭代得飛快,如新學說的出現(xiàn)、領域知識的更新、某個定義的延展、某個指標的調整等,“終身學習”不僅適用于人類本身,對AI來說同樣是必須具備的能力。一旦喪失這種能力,大模型會很快表現(xiàn)出能力的“天花板”,包括產生幻覺、缺乏對生成文本的可解釋性、專業(yè)領域知識理解差,以及對最新知識的了解有限等等。

針對這一問題,業(yè)界主要有兩種解決途徑:一種是微調(Fine Tune)來更新模型,另一種是讓AI能夠與外部世界互動,以不同的形式和方式獲取知識,即大模型+RAG。

微調固然效果好,可以讓模型真正的“學會”一些私域知識。但是微調也會帶來幾個問題:首先,由于生成模型依賴于內在知識(權重),因此模型還是無法擺脫幻覺的產生,在對理解門檻高且準確性要求嚴格的場景下,這是完全無法接受的。其次,模型微調并不是一個簡單的工作,無論是從數據準備、算力消耗、微調效果、訓練時間等各個角度來看,隨時用新產生的數據來進行微調都是不現(xiàn)實的,且最終微調的效果也無法保證,能夠做到每月更新一次都已經是很理想的狀態(tài)。

相比之下,RAG讓生成式大模型能夠利用外部的知識源(非模型本身的知識庫)來增強模型的生成能力,減少生成內容的偏差和錯誤,提高生成質量和可靠性,在有效緩解模型幻覺的同時,也能夠“喚醒沉睡的知識”,讓企業(yè)內部積累的大量數據得到有效利用。由于接入外部實時動態(tài)數據,RAG在理論上沒有知識邊界的限制,且無需頻繁進行模型訓練,故已經成為生成式大模型行業(yè)落地最佳實踐方案。

RAG很好,但好的RAG不好開發(fā)

RAG雖好,但在實際開發(fā)應用的場景中,企業(yè)構建知識檢索系統(tǒng)并非易事,通常面臨較高的開發(fā)門檻和較差的生成內容等難題。

■ 技術門檻高,開發(fā)效率低

首先,即便技術人員編程能力扎實、深悟大模型架構原理,從海量開源方案里挑選出最合適的大模型+ RAG組合,也需要不斷的試錯,定制化開發(fā)的時間成本高昂。其次,RAG的構建包含知識文檔的準備、嵌入模型(embedding model)、向量數據庫、查詢檢索和生成回答五個基本環(huán)節(jié),各個環(huán)節(jié)均有著極大的優(yōu)化空間。如在處理企業(yè)數據時,仍需設計流程,清洗、分類、標注各類數據,保其質量達模型訓練標準;檢索參數配置同樣如此,向量模型選取與優(yōu)化若有差池,也易使模型訓練失敗、檢索不準。而遵循效果相乘疊加的定律,90%×90%×90%×90%×90%=59%,這意味著任何一個環(huán)節(jié)優(yōu)化效果不佳,將會導致最終的生成效果與最初設想相距甚遠。

■ 復雜文檔解析能力不足,生成效果差

企業(yè)數據文檔種類繁雜,高質量的文檔解析能力會極大影響最終的知識檢索成效。以金融機構為例,合同、報告、Excel 財務數據表及 PPT 產品介紹等文檔多格式并行,開源RAG方案對此的解析能力較差,如在合同關鍵條款的提取方面失準,條款解讀發(fā)生偏差;進行產品比對推薦時,易導致檢索參數及大模型抉擇失當,推薦金融產品難以滿足個性化需求,使客戶對企業(yè)信任與滿意度滑坡。

元腦企智EPAI:構建大模型RAG僅需三步,喚醒企業(yè)沉睡的知識

針對當前企業(yè)在構建RAG上普遍面臨的難題,浪潮信息元腦企智EPAI(Enterprise Platform of AI)為企業(yè)發(fā)掘數據資產、“喚醒沉睡的知識”提供了強大的開發(fā)平臺,文檔解析、知識庫構建、檢索增強生成等特色功能,不僅極大提升了企業(yè)知識管理系統(tǒng)的構建效率,還顯著增強了大模型回答的準確性。

■ 高效的文檔解析與知識庫構建

元腦企智EPAI適配PDF、TXT、DOCX等多類文檔格式上傳解析,可深度處理文檔內容,通過強大數據清洗和靈活的知識分塊,幫助企業(yè)建立高質量私域知識庫,并支持復雜問題、大型數據集或跨多個文檔查詢。

■ 更優(yōu)的檢索增強生成效果

元腦企智EPAI囊括關鍵詞檢索、語義檢索、混合檢索等多元檢索模式,精準適配各類場景檢索訴求。用戶可依自身特定需求,選擇最合適的檢索方法。借由自動化 RAG pipeline技術,能敏捷抓取最新知識融入大模型,實現(xiàn)檢索庫的定期更新,從而確保生成的文本內容基于最新的信息,提升生成內容的準確性和效率,切實滿足企業(yè)多樣化的使用需求。

經過浪潮信息在大模型+RAG開發(fā)上的反復實踐與驗證,元腦企智EPAI封裝了浪潮信息深度優(yōu)化的RAG環(huán)境,開發(fā)者僅需三步即可快速完成檢索增強生成系統(tǒng)的構建。

Step1創(chuàng)建知識庫,奠定知識基石

首先,用戶需要在元腦企智EPAI上創(chuàng)建一個知識庫并上傳企業(yè)文檔。元腦企智EPAI支持多種文檔格式,包括PDF、TXT、DOCX等。然后選配解析參數,如編碼模型、文本分塊長度等。開始文檔解析。文檔解析是將文檔的內容進行抽取并對其進行分塊,元腦企智EPAI在解析中支持文檔版式識別,對表格、圖片的文字都能做到精準提取。

文檔解析成功后,內容將被存儲在知識庫中,形成結構化的知識塊。

Step2配置檢索參數,優(yōu)化檢索效能

在文檔解析完成后,用戶需要配置大模型和檢索參數,以優(yōu)化檢索效果。元腦企智EPAI提供了多種檢索參數,包括粗排引用數量、引用數量、檢索類型等。在檢索策略上,支持混合檢索、關鍵詞檢索、向量檢索等。

配置好檢索參數后,用戶可以進行檢索測試,以驗證文檔分塊和檢索效果。在檢索測試界面,用戶可以輸入測試文本,查看檢索結果。

Step3對話交互,實現(xiàn)智能應用

測試完成后,元腦企智EPAI可以將知識庫發(fā)布為知識助手,并且提供在線交互和API兩種使用方式。

在線交互中,用戶輸入問題,元腦企智EPAI將結合知識庫內容,通過大模型生成準確的回答,并展示引用源。下圖展示,元腦企智EPAI作為營養(yǎng)問答助手,通過檢索增強生成,提供營養(yǎng)方面的回答。

如果選擇用API的方式,用戶可以通過元腦企智EPAI創(chuàng)建自定義助手,將配置好的模型和知識庫保存為助手,并通過API接口調用。這一功能使得用戶可以輕松地將元腦企智EPAI的RAG能力集成到現(xiàn)有的信息系統(tǒng)中,提升系統(tǒng)的智能化水平。

eb78afdc-bd9c-11ef-8732-92fbcf53809c.png元腦企智EPAI讓某領先IT企業(yè)智能生產力激增

業(yè)界領先的某IT企業(yè)積極利用元腦企智EPAI平臺推動內部的智能化轉型,目前已“零代碼”開發(fā)出IT售前助手“元小智”和撰稿助手“元小墨”。

在“元小智”開發(fā)過程中,該企業(yè)售前團隊(非專業(yè)開發(fā)人員)利用元腦企智EPAI內置的數據處理工具,自動化解析結構及非結構化數據,從超 1500份涵蓋 PDF、DOCX、DOC、XLS等多樣格式的數據資源里,成功構筑8大業(yè)務線所有在售產品知識庫,整個開發(fā)時間僅耗時1人1月,有力驅動知識集成與業(yè)務精進。

在“元小墨”開發(fā)過程中,該企業(yè)市場部團隊(非專業(yè)開發(fā)人員)按照不同業(yè)務線、稿件類型收集了1300+篇成文稿件、背景資料、速記、白皮書,一鍵打包上傳,不用任何代碼即構建起專用知識庫。同時通過自動化的RAG pipeline 技術將最新的知識融入大模型,通過選擇關鍵詞檢索、語義檢索、混合檢索等不同的檢索策略,有效提升檢索生成內容的準確性。

在“元小墨”的加持下,該企業(yè)市場部團隊資料搜索時間縮減80%,同時內容生成質量躍升,緊密貼合多元需求,驅動市場傳播創(chuàng)新。如在內容策劃時,關鍵詞檢索鎖定產品亮點與市場趨勢報告;定制文案階段,語義檢索精準捕捉品牌意圖,推送契合風格文案;官微運營中,利用混合檢索融合優(yōu)勢,從海量素材中精準定位熱點關聯(lián)素材助力推文。

元腦企智EPAI(Enterprise Platform of AI)是浪潮信息的大模型應用落地解決之道,能夠為企業(yè)AI大模型落地應用提供高效、易用、安全的端到端開發(fā)平臺,提供數據準備、模型訓練、知識檢索、應用框架等系列工具,支持調度多元算力和多模算法,幫助企業(yè)高效開發(fā)部署生成式AI應用、打造智能生產力。在大模型技術持續(xù)演進的進程中,元腦企智EPAI 將以持續(xù)創(chuàng)新,助力企業(yè)智能應用創(chuàng)新與效率提升。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 浪潮
    +關注

    關注

    1

    文章

    475

    瀏覽量

    25261
  • AI
    AI
    +關注

    關注

    89

    文章

    37440

    瀏覽量

    292895
  • 大模型
    +關注

    關注

    2

    文章

    3390

    瀏覽量

    4855

原文標題:喚醒企業(yè)沉睡的知識,元腦企智EPAI三步高效創(chuàng)建大模型RAG

文章出處:【微信號:浪潮AIHPC,微信公眾號:浪潮AIHPC】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    浪潮信息發(fā)布"SD200"超節(jié)點,面向萬億參數大模型創(chuàng)新設計

    北京2025年8月8日 /美通社/ -- 8月7日,浪潮信息發(fā)布面向萬億參數大模型的超節(jié)點AI服務器"SD200"。該產品基于浪潮信息創(chuàng)
    的頭像 發(fā)表于 08-08 22:17 ?467次閱讀
    <b class='flag-5'>浪潮信息</b>發(fā)布&quot;<b class='flag-5'>元</b><b class='flag-5'>腦</b>SD200&quot;超節(jié)點,面向萬億參數大<b class='flag-5'>模型</b>創(chuàng)新設計

    萬億參數!智一體機率先支持Kimi K2大模型

    北京2025年7月21日 /美通社/ --?浪潮信息宣布智一體機已率先完成對Kimi K2 萬億參數大模型的適配支持,并實現(xiàn)單用戶70
    的頭像 發(fā)表于 07-22 09:27 ?352次閱讀
    萬億參數!<b class='flag-5'>元</b><b class='flag-5'>腦</b><b class='flag-5'>企</b>智一體機率先支持Kimi K2大<b class='flag-5'>模型</b>

    筑基&quot;AI+人才&quot;培養(yǎng),浪潮信息攜手伙伴拓爾思推出智慧教育新平臺

    北京2025年3月22日?/美通社/ -- 近期,生態(tài)伙伴拓爾思信息技術股份有限公司(以下簡稱:拓爾思)攜手浪潮信息,聯(lián)合為高校AI人才培養(yǎng)推出"AI創(chuàng)新培養(yǎng)綜合服務平臺",基于該
    的頭像 發(fā)表于 03-27 16:56 ?567次閱讀
    筑基&quot;AI+人才&quot;培養(yǎng),<b class='flag-5'>浪潮信息</b>攜手<b class='flag-5'>元</b><b class='flag-5'>腦</b>伙伴拓爾思推出智慧教育新平臺

    浪潮信息智DeepSeek一體機將舉辦生態(tài)伙伴推介體驗會

    ?3月11日,浪潮信息將面向全國生態(tài)伙伴舉辦"智DeepSeek一體機生態(tài)伙伴推介體驗
    的頭像 發(fā)表于 03-09 14:20 ?434次閱讀
    <b class='flag-5'>浪潮信息</b>:<b class='flag-5'>元</b><b class='flag-5'>腦</b><b class='flag-5'>企</b>智DeepSeek一體機將舉辦生態(tài)伙伴推介體驗會

    浪潮信息EPAI已接入DeepSeek,大幅提升DeepSeek企業(yè)應用準確率

    北京2025年2月21日?/美通社/ -- 浪潮信息宣布EPAI企業(yè)大模型開發(fā)平臺已全面
    的頭像 發(fā)表于 02-23 07:32 ?816次閱讀
    <b class='flag-5'>浪潮信息</b>:<b class='flag-5'>元</b><b class='flag-5'>腦</b><b class='flag-5'>EPAI</b>已接入DeepSeek,大幅提升DeepSeek企業(yè)應用準確率

    浪潮信息發(fā)布R1推理服務器

    。 DeepSeek R1 671B模型作為業(yè)界領先的深度學習模型,其部署一直面臨著較高的難度和成本。而浪潮信息R1推理服務器通過一系
    的頭像 發(fā)表于 02-17 10:32 ?959次閱讀

    天銳醫(yī)健加入生態(tài),采用EPAI打造全流程醫(yī)療大模型應用

    北京2025年2月7日?/美通社/ -- 近日,廣州天銳醫(yī)健信息科技有限公司(以下簡稱"天銳醫(yī)健")與浪潮信息簽署生態(tài)戰(zhàn)略合作協(xié)議。雙方針對醫(yī)院提升門診效率的現(xiàn)實需求,共同研發(fā)覆蓋
    的頭像 發(fā)表于 02-08 12:18 ?466次閱讀

    【「基于大模型RAG應用開發(fā)與優(yōu)化」閱讀體驗】RAG基本概念

    隨著大模型在25年初的進一步發(fā)展,RAG應用已成為新的一個趨勢,很榮幸有機會試讀這本<基于大模型RAG應用開發(fā)與優(yōu)化>,書本很厚,有500多頁,誠意滿滿。 本書所闡述
    發(fā)表于 02-08 00:22

    【「基于大模型RAG應用開發(fā)與優(yōu)化」閱讀體驗】+Embedding技術解讀

    引入外部知識庫來增強生成模型的能力。而Embedding在 Embedding模型將用戶的問題和文檔庫中的文本轉換為向量表示,這是RAG系統(tǒng)進行信息檢索和文本生成的基礎。
    發(fā)表于 01-17 19:53

    浪潮信息與智源研究院攜手共建大模型多元算力生態(tài)

    人工智能技術的快速發(fā)展。浪潮信息與智源研究院將充分整合各自在算力、算法和技術創(chuàng)新方面的優(yōu)勢資源,共同探索大模型多元算力的新應用和新模式。 目前,智源研究院的Triton算子庫FlagGems已正式接入浪潮信息
    的頭像 發(fā)表于 12-31 11:49 ?803次閱讀

    浪潮信息與智源研究院達成戰(zhàn)略合作協(xié)議

    正式接入浪潮信息EPAI企業(yè)大模型開發(fā)平臺,助力企業(yè)實現(xiàn)更快速、更廣泛、更
    的頭像 發(fā)表于 12-26 10:25 ?812次閱讀

    浪潮信息發(fā)布&quot;源&quot;Yuan-EB,刷新RAG檢索最高成績

    檢索任務的第一名,以78.41的平均精度刷新了大模型RAG檢索的最高成績。 "源"Yuan-EB的發(fā)布,標志著浪潮信息在知識向量化技術方面取得了重要進展。該模型基于
    的頭像 發(fā)表于 12-25 15:54 ?748次閱讀

    浪潮信息與17家伙伴共簽億級分銷協(xié)議

    近日,一場意義非凡的簽約儀式——2025年浪潮信息億級分銷伙伴簽約大會圓滿落幕。在這場盛會中,浪潮信息與來自全國12個省區(qū)的17家生態(tài)伙伴共同簽署了億級分銷合作協(xié)議,攜手開啟合作共
    的頭像 發(fā)表于 12-25 15:46 ?1141次閱讀

    浪潮信息發(fā)布“源”Yuan-EB助力RAG檢索精度新高

    近日,浪潮信息發(fā)布 “源”Yuan-EB(Yuan-embedding-1.0,嵌入模型),在C-MTEB榜單中斬獲檢索任務第一名,以78.41的平均精度刷新大模型RAG檢索最高成績,
    的頭像 發(fā)表于 11-26 13:54 ?1019次閱讀
    <b class='flag-5'>浪潮信息</b>發(fā)布“源”Yuan-EB助力<b class='flag-5'>RAG</b>檢索精度新高

    EPAI認證訓戰(zhàn)營成功舉辦

    近日,浪潮信息合作伙伴EPAI認證訓戰(zhàn)營暨認證儀式在濟南成功舉辦,來自25家
    的頭像 發(fā)表于 11-04 13:44 ?758次閱讀