案例簡介
在本案例中,Dify 以模型中立以及開源生態(tài)的優(yōu)勢,為廣大 AI 創(chuàng)新者提供豐富的模型選擇。其集成的 NVIDIAAPI Catalog、NVIDIA NIM和Triton 推理服務(wù)器產(chǎn)品,為 Dify.AI 提供了靈活多樣的模型集成選擇,專業(yè)、高效的模型接入方式讓開發(fā)者用戶能夠構(gòu)建豐富的 AI 應(yīng)用場景。
AI 應(yīng)用面臨落地挑戰(zhàn)
隨著 AI 應(yīng)用場景的不斷豐富,Dify 在 AI 應(yīng)用的落地方面面臨了幾個關(guān)鍵挑戰(zhàn),這些挑戰(zhàn)成為了采用 NVIDIA 產(chǎn)品和技術(shù)的主要驅(qū)動力:
復(fù)雜應(yīng)用場景需要多個模型結(jié)合使用:隨著越來越豐富的 AI 應(yīng)用情景探索,越來越多的企業(yè)都期望能靈活使用當(dāng)前最先進的閉源或開源模型,來定制落地方案,以獲得模型在不同情境下的能力表現(xiàn)、成本、性能等方面的最佳組合結(jié)果。
大模型的性能和穩(wěn)定性風(fēng)險:?模型的訓(xùn)練和推理對算力、算法、數(shù)據(jù)都有很高要求,如果選型不當(dāng)或優(yōu)化不足,可能影響應(yīng)?的性能和穩(wěn)定性。
數(shù)據(jù)安全和隱私保護風(fēng)險:企業(yè)在落地 AI 應(yīng)用時,出于對敏感場景應(yīng)用和企業(yè)數(shù)據(jù)安全的考慮,會更傾向本地部署推理框架來運行他們的本地模型。
NVIDIA 助力提供多樣、靈活的模型選擇
Dify 平臺與數(shù)百種專有/開源模型以及數(shù)十種推理提供商、自托管解決方案無縫集成,包括 LLM 推理框架、Rerank 模型、Embedding 模型等類型,允許用戶根據(jù)其具體場景需要,隨時切換/使用不同的模型能力。其中,Dify 集成了 API Catalog、NVIDIA NIM 和 Triton 推理服務(wù)器開源軟件產(chǎn)品作為可選模型平臺之一,具體作用如下所述:
提供豐富的預(yù)訓(xùn)練模型,滿足多樣化需求
API Catalog 提供了大量針對NVIDIA GPU優(yōu)化的預(yù)訓(xùn)練模型,涵蓋了 LLM、Embedding、Rerank 和 Vision 多個種類。它主要用于評估和測試,提供一個統(tǒng)一的接口,可以測試各種模型,節(jié)省開發(fā)成本。API Catalog 會持續(xù)更新最新的模型,幫助 Dify 用戶加速前期的測試和評估,并為之后的量產(chǎn)部署做好鋪墊,加速 AI 應(yīng)用的開發(fā)和落地。
簡化部署流程,加速生成式 AI 模型上線
NVIDIA NIM 將 AI 模型打包為容器化微服務(wù),開發(fā)者只需幾行代碼即可完成部署,部署時間可從數(shù)周縮短到數(shù)分鐘。這種簡化的部署流程可以顯著加速生成式 AI 模型的上線,使企業(yè)能夠快速將模型集成到 Dify 的 AI 工作流中,實現(xiàn) AI 應(yīng)用落地。
優(yōu)化推理性能,提供高效穩(wěn)定的 AI 服務(wù)
Triton 推理服務(wù)器提供了一個優(yōu)化和標準化的平臺,用于部署和執(zhí)行來自多種深度學(xué)習(xí)和機器學(xué)習(xí)框架的 AI 模型。它適用于通用的 AI 推理工作負載,為開發(fā)者在 Dify 平臺上編排 AI 應(yīng)用提供高效穩(wěn)定的模型服務(wù)。
靈活調(diào)用模型,適應(yīng)不同場景需求
通過 Triton 推理服務(wù)器和 NVIDIA NIM 完成模型部署后,用戶可以在 Dify 平臺中輕松調(diào)用所需的模型。只需在模型設(shè)置中填寫 Server URL、Model Name 等憑據(jù),即可根據(jù)具體的場景需求,隨時切換或使用不同的模型能力。這種靈活的模型調(diào)用方式可以幫助企業(yè)快速適應(yīng)不斷變化的業(yè)務(wù)需求,提高 AI 應(yīng)用的適應(yīng)性和可擴展性。
加入 NVIDIA Inception,
融入全球開發(fā)者社區(qū)生態(tài)
Dify 不僅與 NVIDIA 在模型層面實現(xiàn)了深度集成,其還于 2024 年 4 月入選了NVIDIA Inception 初創(chuàng)加速計劃。Dify 也受邀參加了 NVIDIA 初創(chuàng)加速計劃最新開啟的系列技術(shù)加速營,獲得了與眾多 AI 創(chuàng)新者、行業(yè)客戶、生態(tài)上下游企業(yè)交流合作和極大的市場曝光機會。
加入 NVIDIA 初創(chuàng)加速計劃對 Dify 來說,標志著一個新的里程碑,Dify 將借助 NVIDIA 的影響力鏈接全球開發(fā)者,在其領(lǐng)先技術(shù)的助力下,不斷突破,打造更繁榮的生態(tài)和產(chǎn)品。
Dify 創(chuàng)始人兼 CEO 張路宇表示:“Dify 成立的第一天,就定位是一個面向全球開發(fā)者用戶的產(chǎn)品,我們希望接入全球領(lǐng)先的大模型,共創(chuàng) AI 解決方案,為不同行業(yè)落地 AI 的企業(yè)、AI 創(chuàng)新者們提供開箱即用的 LLM 應(yīng)用開發(fā)平臺,這也是我們首選 NVIDIA 的原因。在全球的客戶生態(tài)、開發(fā)者生態(tài)經(jīng)營上,NVIDIA 毋庸置疑是我們最好的選擇?!?/p>
繁榮的開源社區(qū)生態(tài),
加速 AI 創(chuàng)新應(yīng)用落地
Dify 團隊成立于 2023 年 3 月,同年 5 月發(fā)布 Dify.AI 第一個版本并開源?;?LLMOps 及后端即服務(wù)的理念,為企業(yè)提供從 Agent 構(gòu)建到 AI workflow 編排、RAG 檢索、模型管理等能力,致力于打造?個開放的 LLM 應(yīng)?開發(fā)平臺,降低 LLM 應(yīng)?程序的開發(fā)和部署復(fù)雜性,幫助應(yīng)?開發(fā)者更快地搭建和運營?產(chǎn)級的?成式 AI 應(yīng)?。
Dify 在開源社區(qū)受到全球開發(fā)者的關(guān)注和喜愛,在短短一年的時間內(nèi),stars 數(shù)已超過 36,000+,達到數(shù)十萬次下載量,多次登榜 GitHub 全球趨勢榜單。GitHub stars 已超越知名 AI Infra 產(chǎn)品如 LlamaIndex、flowise 等,僅次于 LangChain。面向需要探索 AI 應(yīng)用創(chuàng)新、AI 應(yīng)用落地業(yè)務(wù)的開發(fā)者或企業(yè)客戶,Dify 提供成熟的應(yīng)用開發(fā)工具平臺,加速 AI 落地業(yè)務(wù)的過程。
截至 2024 年 4 月,Dify.AI 已經(jīng)服務(wù)了十余家 500 強企業(yè)和數(shù)十家上市公司。全球領(lǐng)先企業(yè)選擇 Dify 作為 LLM App Stack,標桿客戶覆蓋汽車、先進制造、消費、半導(dǎo)體、醫(yī)藥等行業(yè),如理想汽車、研華股份、百勝中國、Panasonic、Advantech、安克創(chuàng)新、得到等。Dify.AI 同時也吸引了全球范圍內(nèi)關(guān)注 LLM 應(yīng)用技術(shù)的創(chuàng)業(yè)者和服務(wù)商,他們可以基于 NVIDIA 的資源和生態(tài),利用 Dify 作為開發(fā)工具,創(chuàng)造出更多創(chuàng)新性 AI 產(chǎn)品和服務(wù),帶來更多生態(tài)合作的空間。
NVIDIA 初創(chuàng)加速計劃
Dify.AI是 NVIDIA 初創(chuàng)加速計劃 (NVIDIA Inception) 會員企業(yè)。 NVIDIA 初創(chuàng)加速計劃為免費會員制,旨在培養(yǎng)顛覆行業(yè)格局的優(yōu)秀創(chuàng)業(yè)公司。該計劃聯(lián)合國內(nèi)外知名的風(fēng)投機構(gòu)、創(chuàng)業(yè)孵化器、創(chuàng)業(yè)加速器、行業(yè)合作伙伴以及科技創(chuàng)業(yè)媒體等,打造創(chuàng)業(yè)加速生態(tài)系統(tǒng)。能夠提供產(chǎn)品折扣、技術(shù)支持、市場宣傳、融資對接、業(yè)務(wù)推薦等一系列服務(wù),加速創(chuàng)業(yè)公司的發(fā)展。
-
NVIDIA
+關(guān)注
關(guān)注
14文章
5448瀏覽量
108647 -
AI
+關(guān)注
關(guān)注
88文章
37304瀏覽量
292295 -
大模型
+關(guān)注
關(guān)注
2文章
3375瀏覽量
4832
原文標題:初創(chuàng)加速計劃 | NVIDIA 賦能 Dify.AI,加速企業(yè) AI 應(yīng)用落地
文章出處:【微信號:NVIDIA_China,微信公眾號:NVIDIA英偉達】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
NVIDIA ACE現(xiàn)已支持開源Qwen3-8B小語言模型
NVIDIA 利用全新開源模型與仿真庫加速機器人研發(fā)進程
NVIDIA助力湯元科技突破智能駕駛數(shù)據(jù)獲取與生成瓶頸
NVIDIA Nemotron Nano 2推理模型發(fā)布
如何本地部署NVIDIA Cosmos Reason-1-7B模型
歐洲借助NVIDIA Nemotron優(yōu)化主權(quán)大語言模型
NVIDIA助力解決量子計算領(lǐng)域重大挑戰(zhàn)
NVIDIA發(fā)布全球首個開源人形機器人基礎(chǔ)模型Isaac GR00T N1
NVIDIA 推出開放推理 AI 模型系列,助力開發(fā)者和企業(yè)構(gòu)建代理式 AI 平臺

NVIDIA助力提供多樣、靈活的模型選擇
評論