亚洲精品久久久久久久久久久,亚洲国产精品一区二区制服,亚洲精品午夜精品,国产成人精品综合在线观看,最近2019中文字幕一页二页

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

MLPerf V2.0推理結(jié)果放榜,NVIDIA表現(xiàn)搶眼

荷葉塘 ? 來源:電子發(fā)燒友 ? 作者:程文智 ? 2022-04-15 22:12 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

(文/程文智)不久前,AI性能基準(zhǔn)評測平臺MLPerf公布了2022年首次推理(Inference v2.0)測試成績,NVIDIA的AI平臺表現(xiàn)依然搶眼。

據(jù)MLPerf官方介紹,它是由來自學(xué)術(shù)界、研究實(shí)驗(yàn)室和相關(guān)行業(yè)的 AI 領(lǐng)導(dǎo)者組成的聯(lián)盟,旨在“構(gòu)建公平和有用的基準(zhǔn)測試”,在規(guī)定的條件下,針對硬件、軟件和服務(wù)的訓(xùn)練和推理性能提供公平的評估。每年組織AI推理和AI訓(xùn)練測試各兩次,以對迅速增長的AI計(jì)算需求與性能進(jìn)行及時的跟蹤測評。MLPerf比賽通常分為固定任務(wù)(Closed)和開放優(yōu)化(Open)兩類任務(wù),開放優(yōu)化能力著重考察參測廠商的AI技術(shù)創(chuàng)新力,固定任務(wù)則因更公平地考察參測廠商的硬件系統(tǒng)和軟件優(yōu)化的能力,成為更具參考價值的AI性能基準(zhǔn)測試。因此,目前MLPerf被看作是AI領(lǐng)域的風(fēng)向標(biāo),誰能夠在這個測試中取得更多的領(lǐng)先,誰的AI能力就越突出。


在最新一期的榜單中,浪潮、NVIDIA、英特爾、高通、阿里巴巴、戴爾、Deci.ai、Azure、富士通、技嘉、聯(lián)想、寧暢、美超微、華碩、浙江實(shí)驗(yàn)室、及新華三等廠商參與了競賽。評測以最新MLPerf Inference V2.0為基準(zhǔn),涵蓋了圖像分類、目標(biāo)檢測、醫(yī)療圖像分割、自然語言處理、語音轉(zhuǎn)文字和推薦系統(tǒng)6類AI應(yīng)用場景,分為數(shù)據(jù)中心和邊緣兩類處理場景,每類場景都包含固定任務(wù)(Closed)和開放優(yōu)化(Open)兩類性能競賽。其中,在最新的V2.0規(guī)范中,在邊緣運(yùn)算環(huán)境導(dǎo)入多資料流(Multi Stream)測試項(xiàng)目,測量邊緣運(yùn)算設(shè)備在多攝影機(jī)、多傳感器場景的性能表現(xiàn),以得到更貼近真實(shí)使用情況的數(shù)據(jù)。


據(jù)統(tǒng)計(jì),本輪測試一共展示了超過3900 次性能測試和 2200 次功耗測試,分別是上一輪的2倍和6倍。根據(jù)公開的數(shù)據(jù)顯示,本次測試中除了戴爾科技、富士通、技嘉、浪潮、聯(lián)想、寧暢和美超微等外,華碩和新華三本次測試中首次使用了NVIDIA AI平臺提交MLPerf結(jié)果。

Jetson AGX Orin提升邊緣AI性能,取得不俗成績

值得一提的是基于NVIDIA Ampere架構(gòu)的低功耗系統(tǒng)級芯片NVIDIA Orin首次參加MLPerf基準(zhǔn)測試,就取得了不俗的成績。在邊緣AI領(lǐng)域,NVIDIA Orin預(yù)生產(chǎn)版本在六項(xiàng)性能測試中的五項(xiàng)處于領(lǐng)先地位,其運(yùn)行速度比上一代Jetson AGX Xavier快了5倍,能效平均提高了2倍。


根據(jù)NVIDIA官網(wǎng)的介紹,Jetson AGX Orin 系列有32GB和64GB兩個版本,該系列具有高達(dá)275TOPS的AI性能,由 Ampere GPU深度學(xué)習(xí)加速器 (DLA) 提供支持。CPU配備了多達(dá)12個Arm Cortex A78AE內(nèi)核。

Orin配備了其第三代Tensor Cores,可提高性能并支持稀疏矩陣?;贜VIDIA為 Xavier 所做的多處理器構(gòu)建,它不僅具有 GPU 和CPU,還具有其他處理器,可以幫助從GPU和CPU卸載應(yīng)用程序的某些部分。它包括一個專用于 AI 應(yīng)用的深度學(xué)習(xí)加速器、一個用于計(jì)算機(jī)視覺應(yīng)用和ISP的視覺加速器,以及一個視頻解碼和視頻編碼引擎。與 Xavier 相比,NVIDIA還為 Orin 帶來了 LPDDR5 以提高帶寬,傳輸速度可達(dá)204.8GB/s。 Orin 還具備豐富的IO連接,比如其具有多達(dá)22個PCIe4.0通道、4個千兆以太網(wǎng)、16個MIPI CSI通道,以及各種其他傳感器接口等。


根據(jù)測試,Jetson AGX Orin提供了8倍于Jetson AGX Xavier的性能,Jetson AGX Orin是能夠運(yùn)行所有六項(xiàng)MLPerf基準(zhǔn)測試的邊緣加速器。憑借JetPack SDK,Orin可以運(yùn)行整個NVIDIA AI平臺,這個軟件堆棧已經(jīng)在數(shù)據(jù)中心和云端得到了驗(yàn)證,并且獲得了NVIDIA Jetson平臺100萬名開發(fā)者的支持。


在應(yīng)用方面,目前,Orin主要關(guān)注三大領(lǐng)域,分別為:工業(yè)、自動駕駛和醫(yī)療。Orin現(xiàn)已加入到用于機(jī)器人和自動化系統(tǒng)的NVIDIA Jetson AGX Orin開發(fā)者套件。包括亞馬遜網(wǎng)絡(luò)服務(wù)、約翰迪爾、小松、美敦力和微軟Azure在內(nèi)的6000多家客戶使用NVIDIA Jetson平臺進(jìn)行AI推理或其他任務(wù)。

Orin也是NVIDIA Hyperion自動駕駛汽車平臺的關(guān)鍵組成部分。據(jù)NVIDIA介紹,Orin可處理在自動駕駛汽車和機(jī)器人中同時運(yùn)行的大量應(yīng)用和深度神經(jīng)網(wǎng)絡(luò),并且達(dá)到了ISO 26262 ASIL-D 等系統(tǒng)安全標(biāo)準(zhǔn)。而且,比亞迪近期已經(jīng)宣布,他們將在其新一代自動駕駛電動汽車中使用內(nèi)置Orin的DRIVE Hyperion架構(gòu)。

Orin同樣也是NVIDIA Clara Holoscan醫(yī)療設(shè)備平臺的關(guān)鍵組成部分,且該平臺可供系統(tǒng)制造商和研究人員用來開發(fā)新一代AI儀器。

NVIDIA其他AI成果

除了Orin之外,本輪MLPerf,驗(yàn)證了NVIDIA的多項(xiàng)成果,包括多實(shí)例GPU(MIG)、TensorRT等。比如MIG可提升每個 NVIDIA A100 Tensor 核心 GPU 的性能和價值。MIG可將 A100 GPU 劃分為多達(dá)七個實(shí)例,每個實(shí)例均與各自的高帶寬顯存、緩存和計(jì)算核心完全隔離。管理員可以支持從大到小的各項(xiàng)工作負(fù)載,為每項(xiàng)工作提供規(guī)模適當(dāng)?shù)?GPU,而且服務(wù)質(zhì)量 (QoS) 穩(wěn)定可靠,從而優(yōu)化利用率,讓每位用戶都能享用加速計(jì)算資源。


而根據(jù)實(shí)際測試結(jié)果,在使用7個實(shí)例時的性能為僅用一個實(shí)例的98%,這也意味著MIG可以充分利用GPU,避免了算力的浪費(fèi)。


軟件是性能提升的關(guān)鍵驅(qū)動因素,NVIDIA在AI推理方面的軟件包括了用于優(yōu)化 AI 模型的 NVIDIA TensorRT 和用于有效部署它們的 NVIDIA Triton開源推理服務(wù)軟件。NVIDIA AI 推理和云高級產(chǎn)品經(jīng)理David Salvator在媒體發(fā)布會上介紹了NVIDIA的Triton開源推理服務(wù)軟件。


目前TensorRT廣泛的優(yōu)化GPU內(nèi)核庫已支持Jetson Orin,MLPerf中使用的插件已全部移植到Orin并添加到 TensorRT 8.4。Triton則Kubernetes緊密集成,可以管理GPU以及x86和Arm CPU上的AI推理工作,NVIDIA宣布,Triton現(xiàn)在可以只在CPU上運(yùn)行,而無需GPU。

而也正是因?yàn)镹VIDIA的跨平臺管理能力,使A100在Arm和x86-64平臺上的性能幾乎相同。并且,通過NVIDIA的軟件優(yōu)化,AI性能在過去一年中就增長了高達(dá)50%。

結(jié)語

這幾年,NVIDIA在AI領(lǐng)域一路狂奔,不僅僅在數(shù)據(jù)中心方面優(yōu)勢明顯,在汽車、邊緣計(jì)算方面也正推出優(yōu)勢產(chǎn)品,另外在他們還在準(zhǔn)備推出工業(yè)級的AI產(chǎn)品,進(jìn)入傳統(tǒng)工業(yè)領(lǐng)域。AI正在不斷滲透到人們生活的各個方面。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • NVIDIA
    +關(guān)注

    關(guān)注

    14

    文章

    5461

    瀏覽量

    108710
  • AI
    AI
    +關(guān)注

    關(guān)注

    89

    文章

    37450

    瀏覽量

    292901
  • 人工智能
    +關(guān)注

    關(guān)注

    1813

    文章

    49580

    瀏覽量

    259877
  • 推理
    +關(guān)注

    關(guān)注

    0

    文章

    9

    瀏覽量

    7398
  • MLPerf
    +關(guān)注

    關(guān)注

    0

    文章

    37

    瀏覽量

    936
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點(diǎn)推薦

    項(xiàng)目效率翻倍!迅為RK3568?V2.0硬件接口升級,開發(fā)流程再提速

    項(xiàng)目效率翻倍!迅為RK3568?V2.0硬件接口升級,開發(fā)流程再提速
    的頭像 發(fā)表于 10-29 10:53 ?105次閱讀
    項(xiàng)目效率翻倍!迅為RK3568?<b class='flag-5'>V2.0</b>硬件接口升級,開發(fā)流程再提速

    嵌入式入門必看!迅為RK3568?V2.0升級,新手也能輕松玩轉(zhuǎn)

    嵌入式入門必看!迅為RK3568?V2.0升級,新手也能輕松玩轉(zhuǎn)
    的頭像 發(fā)表于 10-28 13:26 ?110次閱讀
    嵌入式入門必看!迅為RK3568?<b class='flag-5'>V2.0</b>升級,新手也能輕松玩轉(zhuǎn)

    NVIDIA TensorRT LLM 1.0推理框架正式上線

    TensorRT LLM 作為 NVIDIA 為大規(guī)模 LLM 推理打造的推理框架,核心目標(biāo)是突破 NVIDIA 平臺上的推理性能瓶頸。為實(shí)
    的頭像 發(fā)表于 10-21 11:04 ?475次閱讀

    華為推出人工智能氣象預(yù)報模型V2.0版本

    華為全聯(lián)接大會2025期間,在氣象海洋論壇上,華為聯(lián)合重慶市氣象局、云輯數(shù)科發(fā)布“天資·12h”人工智能氣象預(yù)報模型(V2.0),助力成渝地區(qū)氣象災(zāi)害精準(zhǔn)防御、城市安全運(yùn)行與高質(zhì)量發(fā)展。
    的頭像 發(fā)表于 09-20 14:34 ?1531次閱讀

    使用env v2.0執(zhí)行scons --dist產(chǎn)生缺失依賴報錯怎么解決?

    使用env v2.0版本的工具到rt-thread &gt; v5.1.0版本的bsp中使用scons指令,會出現(xiàn)缺失packages依賴的報錯,并提示更新pkgs,但是更新也會產(chǎn)生
    發(fā)表于 09-11 08:28

    NVIDIA Nemotron Nano 2推理模型發(fā)布

    NVIDIA 正式推出準(zhǔn)確、高效的混合 Mamba-Transformer 推理模型系列 NVIDIA Nemotron Nano 2。
    的頭像 發(fā)表于 08-27 12:45 ?1222次閱讀
    <b class='flag-5'>NVIDIA</b> Nemotron Nano 2<b class='flag-5'>推理</b>模型發(fā)布

    請問是否可以將 Nu-Link2-Me V1.0 的固件升級到 V2.0

    可與 Crossworks for ARM IDE 配合使用。 以下是我在比較兩塊板以找出它不起作用的原因時發(fā)現(xiàn)的差異。NuMaker-M433 連接了 Nu-Link2-Me V2.0
    發(fā)表于 08-18 08:09

    登頂!華為OceanStor A系列存儲再登MLPerf全球性能之巔

    2025年8月5日,全球權(quán)威AI性能評測組織公布最新MLPerf? Storage v2.0基準(zhǔn)測試結(jié)果,華為OceanStor A系列存儲聯(lián)合濟(jì)南超級計(jì)算技術(shù)研究院(簡稱“JNIST”)斬獲佳績
    的頭像 發(fā)表于 08-07 14:02 ?529次閱讀

    智嵌云V2.0獲軟件著作權(quán)登記,賦能行業(yè)數(shù)字化升級

    深圳智嵌物聯(lián)網(wǎng)電子技術(shù)有限公司,自主研發(fā)的智嵌云V2.0,成功斬獲國家版權(quán)局頒發(fā)的軟件著作權(quán)登記證書。這一成果不僅是該公司在技術(shù)創(chuàng)新與知識產(chǎn)權(quán)保護(hù)領(lǐng)域的重大突破,更為相關(guān)行業(yè)的數(shù)字化轉(zhuǎn)型注入了強(qiáng)勁動能,同時也標(biāo)志著 “智嵌云” 從 V1.0 到
    的頭像 發(fā)表于 06-27 15:32 ?375次閱讀
    智嵌云<b class='flag-5'>V2.0</b>獲軟件著作權(quán)登記,賦能行業(yè)數(shù)字化升級

    使用MicroPython部署中的ocrrec_image.py推理得到的輸出結(jié)果很差,如何解決呢?

    使用在線平臺訓(xùn)練OCR識別任務(wù),測試結(jié)果表現(xiàn)很好。 期待結(jié)果和實(shí)際結(jié)果 實(shí)際的推理結(jié)果很差,
    發(fā)表于 04-29 06:54

    1.9倍性能提升!英特爾至強(qiáng)6在MLPerf基準(zhǔn)測試中表現(xiàn)卓越

    與第五代至強(qiáng)處理器相比,英特爾至強(qiáng)6性能核的性能平均提高了1.9倍。 今日,MLCommons公布了最新的MLPerf推理v5.0基準(zhǔn)測試結(jié)果,其中,英特爾??至強(qiáng)??6性能核處理器在
    的頭像 發(fā)表于 04-07 10:58 ?434次閱讀

    英偉達(dá)GTC25亮點(diǎn):NVIDIA Blackwell Ultra 開啟 AI 推理新時代

    英偉達(dá)GTC25亮點(diǎn):NVIDIA Blackwell Ultra 開啟 AI 推理新時代
    的頭像 發(fā)表于 03-20 15:35 ?1126次閱讀

    英偉達(dá)GTC25亮點(diǎn):NVIDIA Dynamo開源庫加速并擴(kuò)展AI推理模型

    NVIDIA Dynamo 提高了推理性能,同時降低了擴(kuò)展測試時計(jì)算 (Scaling Test-Time Compute) 的成本;在 NVIDIA Blackwell 上的推理優(yōu)化
    的頭像 發(fā)表于 03-20 15:03 ?965次閱讀

    使用NVIDIA推理平臺提高AI推理性能

    NVIDIA推理平臺提高了 AI 推理性能,為零售、電信等行業(yè)節(jié)省了數(shù)百萬美元。
    的頭像 發(fā)表于 02-08 09:59 ?1165次閱讀
    使用<b class='flag-5'>NVIDIA</b><b class='flag-5'>推理</b>平臺提高AI<b class='flag-5'>推理</b>性能

    ANSVG-G-A混合動態(tài)濾波補(bǔ)償裝置使用說明書 V2.0

    電子發(fā)燒友網(wǎng)站提供《ANSVG-G-A混合動態(tài)濾波補(bǔ)償裝置使用說明書 V2.0 .pdf》資料免費(fèi)下載
    發(fā)表于 12-16 14:08 ?0次下載