亚洲精品久久久久久久久久久,亚洲国产精品一区二区制服,亚洲精品午夜精品,国产成人精品综合在线观看,最近2019中文字幕一页二页

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

NVIDIA Grace Hopper 超級芯片橫掃 MLPerf 推理基準測試

NVIDIA英偉達 ? 來源:未知 ? 2023-09-12 20:40 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

從云端到網(wǎng)絡(luò)邊緣,NVIDIA GH200、H100 和 L4 GPU 以及 Jetson Orin 模組在運行生產(chǎn)級 AI 時均展現(xiàn)出卓越性能。



NVIDIA GH200 Grace Hopper 超級芯片首次亮相 MLPerf 行業(yè)基準測試,其運行了所有數(shù)據(jù)中心推理測試,進一步擴大了 NVIDIA H100 Tensor Core GPU 的領(lǐng)先優(yōu)勢。


總體測試結(jié)果表明,NVIDIA AI 平臺無論是在云端還是網(wǎng)絡(luò)邊緣均展現(xiàn)出卓越的性能和通用性。


此外,NVIDIA 宣布推出全新推理軟件,該軟件將為用戶帶來性能、能效和總體擁有成本的大幅提升。


GH200 超級芯片在 MLPerf 一騎絕塵


GH200 將一顆 Hopper GPU 和一顆 Grace CPU 連接到一個超級芯片中。這種組合提供了更大內(nèi)存、更快帶寬,能夠在 CPU 和 GPU 之間自動切換計算所需要的資源,實現(xiàn)性能最優(yōu)化。


具體而言,內(nèi)置 8 顆 H100 GPU 的 NVIDIA HGX H100系統(tǒng),在本輪每項 MLPerf 推理測試中均實現(xiàn)了最高吞吐量。


Grace Hopper 超級芯片和 H100 GPU 在所有 MLPerf 數(shù)據(jù)中心測試中均處于領(lǐng)先地位,包括針對計算機視覺、語音識別醫(yī)學(xué)成像的推理,以及應(yīng)用于生成式 AI 的推薦系統(tǒng)和大語言模型(LLM) 等對性能要求更高的用例。


總體而言,此次測試結(jié)果延續(xù)了自 2018 年 MLPerf 基準測試推出以來,NVIDIA 在每一輪 AI 訓(xùn)練和推理中都處于領(lǐng)先性能的紀錄。


最新一輪 MLPerf 測試包括一項更新的推薦系統(tǒng)測試,并新增首個 GPT-J 上的推理基準測試。GPT-J 是一個由 60 億個參數(shù)組成的大語言模型(LLM),而 AI 模型的大小通常根據(jù)它有多少參數(shù)來衡量。


TensorRT-LLM 大幅提升推理能力


為了應(yīng)對各類復(fù)雜的工作負載,NVIDIA 開發(fā)了一款能夠優(yōu)化推理的生成式 AI 軟件——TensorRT-LLM。該開源庫使客戶能夠在不增加成本的情況下將現(xiàn)有 H100 GPU 的推理性能提升兩倍以上。由于時間原因,TensorRT-LLM 沒有參加 8 月的 MLPerf 提交。



NVIDIA 的內(nèi)部測試表明, 在運行 GPT-J 6B 模型時,相較于沒有使用 TensorRT-LLM 的上一代 GPU,在 H100 GPU 上使用 TensorRT-LLM 能夠?qū)崿F(xiàn)高達 8 倍的性能提升。


該軟件始于 NVIDIA 在對 Meta、AnyScale、Cohere、Deci、Grammarly、Mistral AI、MosaicML(現(xiàn)為 Databricks 的一部分)、OctoML、Tabnine 和Together AI 等領(lǐng)先公司進行加速和優(yōu)化 LLM 推理時所做的工作。


MosaicML 在 TensorRT-LLM 的基礎(chǔ)上添加了所需的功能,并將這些功能集成到他們現(xiàn)有的服務(wù)堆棧中。Databricks 工程副總裁 Naveen Rao 表示:“這已成為相當輕而易舉的事情?!?/p>


Rao 補充說:“TensorRT-LLM 簡單易用、功能豐富且高效。它為正在使用 NVIDIA GPU 的 LLM 服務(wù)提供了最先進的性能,并使我們能夠?qū)⒐?jié)省的成本回饋給我們的客戶?!?/p>


TensorRT-LLM 是 NVIDIA 全棧 AI 平臺持續(xù)創(chuàng)新的最新實例。這類持續(xù)的軟件進步為用戶帶來了無需額外成本即可實現(xiàn)隨著時間不斷提升的性能,并且廣泛適用于多樣化的 AI 工作負載。


L4 為主流服務(wù)器增強推理能力


在最新 MLPerf 基準測試中,NVIDIA L4 GPU 運行了所有工作負載,并全面展現(xiàn)了出色的性能。


例如,在緊湊型 72W PCIe 加速器中運行時,L4 GPU 的性能比功耗超出其近 5 倍的 CPU 提高了 6 倍。


此外,L4 GPU 具有專用媒體引擎,與 CUDA 軟件搭配使用,在 NVIDIA 的測試中為計算機視覺提供了高達 120 倍的加速。


谷歌云和許多系統(tǒng)制造商現(xiàn)已支持 L4 GPU,為從消費互聯(lián)網(wǎng)服務(wù)到藥物研發(fā)各行業(yè)的客戶提供服務(wù)。


大幅提升邊緣性能


此外,NVIDIA 采用了一種全新模型壓縮技術(shù)來展示在一個 L4 GPU 上運行 BERT LLM 的性能提升高達 4.7 倍。該結(jié)果體現(xiàn)在 MLPerf 的“開放分區(qū)”中,這個類別旨在展示新能力。


這項技術(shù)有望應(yīng)用于所有 AI 工作負載。它尤其適用于在空間和功耗受限的邊緣設(shè)備上運行模型。


在另一個體現(xiàn)邊緣計算領(lǐng)導(dǎo)力的例證中,NVIDIA Jetson Orin 模塊化系統(tǒng)將邊緣 AI 和機器人應(yīng)用場景中常見的計算機視覺用例——目標檢測的性能比上一輪測試提升高達 84%。



Jetson Orin 性能的提升得益于軟件可以充分利用該芯片的最新核心,如一個可編程視覺加速器、一顆 NVIDIA Ampere 架構(gòu) GPU 和一個專用深度學(xué)習(xí)加速器等。


靈活的性能與龐大的生態(tài)


MLPerf 基準測試是透明且客觀的,因此用戶可以根據(jù)其結(jié)果做出明智的購買決定。該測試還涵蓋了豐富的用例和場景,能夠讓用戶獲得可靠且可以靈活部署的性能。


本輪提交測試結(jié)果的合作伙伴包括微軟 Azure 和 Oracle Cloud Infrastructure 等云服務(wù)提供商以及華碩、Connect Tech、戴爾科技、富士通、技嘉、惠與、聯(lián)想、QCT、超微等系統(tǒng)制造商。


總體而言,MLPerf 已得到 70 多家機構(gòu)的支持,包括阿里巴巴、Arm、思科、谷歌、哈佛大學(xué)、英特爾、Meta、微軟和多倫多大學(xué)等。


NVIDIA 在基準測試中使用的所有軟件均可從 MLPerf 軟件庫中獲得,因此每個人都能實現(xiàn)全球領(lǐng)先的結(jié)果。我們不斷將這些優(yōu)化措施整合到 NVIDIA NGC 軟件中心的容器中供 GPU 應(yīng)用使用。


點擊“閱讀原文”閱讀技術(shù)博客,詳細了解我們?nèi)绾螌崿F(xiàn)這些最新的成果。


GTC 2024 將于 2024 年 3 月 18 至 21 日在美國加州圣何塞會議中心舉行,線上大會也將同期開放。掃描下方海報二維碼,關(guān)注更多會議及活動信息。



原文標題:NVIDIA Grace Hopper 超級芯片橫掃 MLPerf 推理基準測試

文章出處:【微信公眾號:NVIDIA英偉達】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 英偉達
    +關(guān)注

    關(guān)注

    23

    文章

    4028

    瀏覽量

    97330

原文標題:NVIDIA Grace Hopper 超級芯片橫掃 MLPerf 推理基準測試

文章出處:【微信號:NVIDIA_China,微信公眾號:NVIDIA英偉達】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    MediaTek攜手NVIDIA開啟個人AI算力新紀元

    即將上市的 NVIDIA DGX Spark 個人 AI 超級計算機,搭載 MediaTek 與 NVIDIA 合作設(shè)計的 GB10 Grace Blackwell
    的頭像 發(fā)表于 10-16 11:26 ?345次閱讀

    NVIDIA助力AI超級計算機Isambard-AI投入使用

    英國布里斯托大學(xué)的超級計算機 Isambard-AI 采用 NVIDIA Grace Hopper 超級
    的頭像 發(fā)表于 07-28 15:07 ?757次閱讀

    NVIDIA技術(shù)賦能歐洲最快超級計算機JUPITER

    NVIDIA 宣布,搭載 NVIDIA Grace Hopper 平臺的 JUPITER 超級計算機成為歐洲最快
    的頭像 發(fā)表于 06-12 15:33 ?926次閱讀

    借助NVIDIA技術(shù)加速半導(dǎo)體芯片制造

    NVIDIA Blackwell GPU、NVIDIA Grace CPU、高速 NVIDIA NVLink 網(wǎng)絡(luò)架構(gòu)和交換機,以及諸如 NVIDI
    的頭像 發(fā)表于 05-27 13:59 ?781次閱讀

    NVIDIA Grace CPU C1獲得廣泛支持

    NVIDIA 在本周 COMPUTEX 上重點展示了其全新的 Grace CPU C1,并獲得多家主要原始設(shè)計制造商合作伙伴的大力支持。
    的頭像 發(fā)表于 05-22 10:01 ?548次閱讀

    1.9倍性能提升!英特爾至強6在MLPerf基準測試中表現(xiàn)卓越

    與第五代至強處理器相比,英特爾至強6性能核的性能平均提高了1.9倍。 今日,MLCommons公布了最新的MLPerf推理v5.0基準測試結(jié)果,其中,英特爾??至強??6性能核處理器在
    的頭像 發(fā)表于 04-07 10:58 ?433次閱讀

    NVIDIA 宣布推出 DGX Spark 個人 AI 計算機

    臺式超級計算機由 NVIDIA Grace Blackwell 驅(qū)動,為開發(fā)者、研究人員和數(shù)據(jù)科學(xué)家提供加速 AI 功能;系統(tǒng)由頭部計算機制造商(包括華碩、Dell Technologies、HP
    發(fā)表于 03-19 09:59 ?444次閱讀
       <b class='flag-5'>NVIDIA</b> 宣布推出 DGX Spark 個人 AI 計算機

    使用修改后的基準C++工具推斷灰度圖像時的推理速度慢怎么解決?

    修改了 基準測試 C++ 工具 ,以加載灰度圖像。 獲得的推理速度非常低。
    發(fā)表于 03-06 07:11

    使用NVIDIA推理平臺提高AI推理性能

    NVIDIA推理平臺提高了 AI 推理性能,為零售、電信等行業(yè)節(jié)省了數(shù)百萬美元。
    的頭像 發(fā)表于 02-08 09:59 ?1161次閱讀
    使用<b class='flag-5'>NVIDIA</b><b class='flag-5'>推理</b>平臺提高AI<b class='flag-5'>推理</b>性能

    MediaTek與NVIDIA攜手設(shè)計GB10 Grace Blackwell超級芯片

    MediaTek與NVIDIA近日宣布了一項重要合作,雙方將共同設(shè)計NVIDIA GB10 Grace Blackwell超級芯片。這款
    的頭像 發(fā)表于 01-13 10:48 ?825次閱讀

    MediaTek與NVIDIA攜手打造超級芯片

    近日,在即將舉行的CES2025消費電子展上,MediaTek宣布了一項重大合作——與NVIDIA共同設(shè)計NVIDIA GB10 Grace Blackwell超級
    的頭像 發(fā)表于 01-10 13:49 ?749次閱讀

    MediaTek與NVIDIA攜手打造GB10 Grace Blackwell超級芯片

    MediaTek近日正式宣布與NVIDIA攜手合作,共同設(shè)計NVIDIA GB10 Grace Blackwell超級芯片。這款
    的頭像 發(fā)表于 01-08 15:32 ?1254次閱讀

    NVIDIA推出個人AI超級計算機Project DIGITS

    NVIDIA 推出個人 AI 超級計算機 NVIDIA Project DIGITS,全球的 AI 研究員、數(shù)據(jù)科學(xué)家和學(xué)生都可獲取 NVIDIA
    的頭像 發(fā)表于 01-08 11:03 ?1086次閱讀

    聯(lián)發(fā)科與NVIDIA合作 為NVIDIA 個人AI超級計算機設(shè)計NVIDIA GB10超級芯片

    聯(lián)發(fā)科近日宣布與NVIDIA合作設(shè)計NVIDIA GB10 Grace Blackwell超級芯片,將應(yīng)用于
    的頭像 發(fā)表于 01-07 16:26 ?795次閱讀

    MLCommons推出AI基準測試0.5版

    開放式機器學(xué)習(xí)工程聯(lián)盟 MLCommons 在美國加州當?shù)貢r間公布推出適用于消費類 PC 的 AI 性能的 MLPerf Client 基準測試的 0.5 版,這是該測試的第一個公開版
    的頭像 發(fā)表于 12-12 16:47 ?1091次閱讀