亚洲精品久久久久久久久久久,亚洲国产精品一区二区制服,亚洲精品午夜精品,国产成人精品综合在线观看,最近2019中文字幕一页二页

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

為何要使用NVIDIA HPC SDK

NVIDIA英偉達(dá)企業(yè)解決方案 ? 來源:NVIDIA英偉達(dá)企業(yè)解決方案 ? 作者:NVIDIA英偉達(dá)企業(yè)解 ? 2022-10-09 10:22 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

NVIDIA HPC SDK包含經(jīng)過驗(yàn)證的編譯器、庫和軟件工具,對(duì)于更大程度提高開發(fā)者的工作效率以及 HPC 應(yīng)用的性能和可移植性至關(guān)重要。

NVIDIA HPC SDK C、C++ 和 Fortran 編譯器支持使用標(biāo)準(zhǔn) C++ 和 Fortran、OpenACC 指令和 CUDA 實(shí)現(xiàn) HPC 建模和模擬應(yīng)用的 GPU 加速。GPU 加速的數(shù)學(xué)庫可更大限度地提升常用 HPC 算法的性能,而經(jīng)過優(yōu)化的通信庫支持基于標(biāo)準(zhǔn)的多 GPU 和可擴(kuò)展的系統(tǒng)編程。性能分析和調(diào)試工具可簡(jiǎn)化 HPC 應(yīng)用的移植和優(yōu)化流程,而容器化工具支持在本地或云端輕松部署。HPC SDK 支持 NVIDIA GPU 和 Arm、OpenPOWER 或運(yùn)行 Linux 的 x86-64 CPU,為您提供構(gòu)建 NVIDIA GPU 加速的 HPC 應(yīng)用所需的工具。

為何要使用 NVIDIA HPC SDK?

性能

除了應(yīng)用廣泛的 HPC 應(yīng)用(包括 VASP、Gaussian、ANSYS Fluent、GROMACS 和 NAMD),還可以使用 CUDA、OpenACC 和 GPU 加速的數(shù)學(xué)庫,為用戶提供突破性性能。您可以使用這些相同的軟件工具對(duì)應(yīng)用進(jìn)行 GPU 加速,還可以使用 NVIDIA GPU 實(shí)現(xiàn)速度和能效大幅提升。

可移植性

為 99% 以上的 500 強(qiáng)系統(tǒng)(包括基于 NVIDIA GPU 或 x86-64、Arm 或 OpenPOWER CPU 的系統(tǒng))構(gòu)建和優(yōu)化應(yīng)用。您可以使用嵌入式庫、C++17 并行算法和 OpenACC 指令對(duì)您的代碼進(jìn)行 GPU 加速,并確保應(yīng)用完全可移植到其他編譯器和系統(tǒng)。

工作效率

借助能夠讓您快速移植、并行和優(yōu)化 GPU 加速的單一集成套件(包括用于多 GPU 和可擴(kuò)展計(jì)算的行業(yè)標(biāo)準(zhǔn)通信庫,以及用于分析的分析和調(diào)試工具),可以更大限度地提高科學(xué)和工程吞吐量,更大限度地減少編碼時(shí)間。

支持您喜歡的編程語言

C++17 并行算法

C++17 并行算法使用標(biāo)準(zhǔn)模板庫(STL)實(shí)現(xiàn)可移植的并行編程。NVIDIA HPC SDK C++ 編譯器在 CPU 上支持完整的 C++17,可將并行算法分流至 NVIDIA GPU,支持無指令、雜注或標(biāo)注的 GPU 編程。使用 C++17 并行算法的程序很容易移植到常用 C++ 的 Linux、Windows 和 macOS。

Fortran 2003 編譯器

NVIDIA Fortran 編譯器支持 Fortran 2003,以及 Fortran 2008 的許多功能。它支持在 GPU 上的 OpenACC 和 CUDA Fortran,也支持在 x86-64、Arm 和 OpenPOWER 這些多核 CPU 上的 SIMD 向量化、OpenACC 和 OpenMP。這樣,他就具有在當(dāng)今由 GPU 加速的異構(gòu) HPC 系統(tǒng)上移植和優(yōu)化 Fortran 應(yīng)用所需的功能。

OpenACC 指令

NVIDIA Fortran、C 和 C++ 編譯器支持基于 OpenACC 指令的并行編程,適用于 NVIDIA GPU 和多核 CPU。超過 200 款 HPC 應(yīng)用端口已使用 OpenACC 啟動(dòng)或啟用,包括 VASP、Gaussian、ANSYS Fluent、WRF 和 MPAS 等量產(chǎn)型應(yīng)用。OpenACC 適用于 GPU 和多核 CPU,是經(jīng)過驗(yàn)證的性能可移植指令解決方案。

主要功能

GPU 數(shù)學(xué)庫

NVIDIA HPC SDK 包括一套GPU 加速的數(shù)學(xué)庫,適用于計(jì)算密集型應(yīng)用。cuBLAS 和 cuSOLVER 庫可提供來自 LAPACK 的各種 BLAS 例程和核心例程的經(jīng) GPU 優(yōu)化的多 GPU 的實(shí)施,并盡可能自動(dòng)使用 NVIDIA GPU Tensor Core。cuFFT 包括用于真實(shí)和復(fù)雜數(shù)據(jù)的 GPU 加速的 1D、2D 和 3D FFT 例程,cuSPARSE 為稀疏矩陣提供基礎(chǔ)線性代數(shù)子例程。可以通過使用 C、C++ 和 Fortran 編寫的 CUDA 和 OpenACC 程序調(diào)用這些庫。

對(duì) Tensor Core 進(jìn)行優(yōu)化

通過NVIDIA GPU Tensor Core,科學(xué)家和工程師能夠使用混合精度或雙精度大幅加速合適的算法。這些 NVIDIA HPC SDK 數(shù)學(xué)庫對(duì) Tensor Core 和多 GPU 節(jié)點(diǎn)進(jìn)行了優(yōu)化,無需多費(fèi)力編碼,即可提供系統(tǒng)的全部性能潛力。利用 NVIDIA Fortran 編譯器,通過將可轉(zhuǎn)換的數(shù)組內(nèi)聯(lián)函數(shù)自動(dòng)映射至 cuTENSOR 庫,您可以使用 Tensor Core。

對(duì)您的 CPU 進(jìn)行優(yōu)化

異構(gòu) HPC 服務(wù)器使用 GPU 進(jìn)行加速計(jì)算,并基于 x86-64、OpenPOWER 或 Arm 指令集架構(gòu)使用多核 CPU。NVIDIA HPC 編譯器和工具在這些 CPU 上受支持,并且所有編譯器優(yōu)化可在支持這些編譯器的 CPU 上完全啟用。借助跨所有受支持系統(tǒng)的統(tǒng)一功能、命令行選項(xiàng)、語言實(shí)現(xiàn)、編程模型、工具和庫用戶界面,NVIDIA HPC SDK 可簡(jiǎn)化開發(fā)者在各種 HPC 環(huán)境中的體驗(yàn)。

多 GPU 編程

NVIDIA 集合通信庫(NCCL)使用 MPI 兼容的 all-gather、all-reduce、broadcast、reduce 和 reduce-scatter 例程實(shí)現(xiàn)高度優(yōu)化的多 GPU 和多節(jié)點(diǎn)集合通信基元,以利用 HPC 服務(wù)器節(jié)點(diǎn)內(nèi)和跨 HPC 服務(wù)器節(jié)點(diǎn)的所有可用 GPU。NVSHMEM 可實(shí)現(xiàn) GPU 顯存的 OpenSHMEM 標(biāo)準(zhǔn),并提供多 GPU 和多節(jié)點(diǎn)通信基元,這些基元可通過主機(jī) CPU 或 GPU 啟動(dòng),也可在 CUDA 內(nèi)核中調(diào)用。

可擴(kuò)展系統(tǒng)編程

MPI是編程分布式內(nèi)存可擴(kuò)展系統(tǒng)的標(biāo)準(zhǔn)。NVIDIA HPC SDK 包括基于 Open MPI 的 CUDA-aware MPI 庫,支持 GPUDirect,這樣您可以直接使用遠(yuǎn)程直接數(shù)據(jù)存?。≧DMA)來發(fā)送和接收 GPU 緩沖區(qū),包括在 CUDA 統(tǒng)一內(nèi)存中分配的緩沖區(qū)。CUDA-aware Open MPI 完全兼容 CUDA C / C++、CUDA Fortran 和 NVIDIA OpenACC 編譯器。

Nsight 性能分析

Nsight 系統(tǒng)可在系統(tǒng)范圍內(nèi)可視化 HPC 服務(wù)器上的應(yīng)用性能,并使您能夠在多核 CPU 和 GPU 中優(yōu)化瓶頸并擴(kuò)展并行應(yīng)用。Nsight Compute 允許您通過圖形或命令行用戶界面,在交互式分析器中深入探討 GPU 內(nèi)核,以用于 GPU 加速的應(yīng)用,并允許您使用 NVTX API 直接檢測(cè)源代碼的區(qū)域,從而確定性能瓶頸。

隨時(shí)隨地部署

容器將應(yīng)用及其依賴項(xiàng)捆綁到便攜式虛擬環(huán)境中,從而簡(jiǎn)化軟件部署。NVIDIA HPC SDK 包含使用 HPC Container Maker 開發(fā)、分析和部署軟件簡(jiǎn)化容器鏡像創(chuàng)建流程的說明。NVIDIA Container Runtime可在幾乎所有容器框架(包括 Docker 和 Singularity)中實(shí)現(xiàn)無縫 GPU 支持。

審核編輯:湯梓紅

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • NVIDIA
    +關(guān)注

    關(guān)注

    14

    文章

    5461

    瀏覽量

    108711
  • gpu
    gpu
    +關(guān)注

    關(guān)注

    28

    文章

    5065

    瀏覽量

    134096
  • SDK
    SDK
    +關(guān)注

    關(guān)注

    3

    文章

    1092

    瀏覽量

    50928

原文標(biāo)題:DevZone | NVIDIA HPC SDK

文章出處:【微信號(hào):NVIDIA-Enterprise,微信公眾號(hào):NVIDIA英偉達(dá)企業(yè)解決方案】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    NVIDIA開源Audio2Face模型及SDK

    NVIDIA 現(xiàn)已開源 Audio2Face 模型與 SDK,讓所有游戲和 3D 應(yīng)用開發(fā)者都可以構(gòu)建并部署帶有先進(jìn)動(dòng)畫的高精度角色。NVIDIA 開源 Audio2Face 的訓(xùn)練框架,任何人都可以針對(duì)特定用例對(duì)現(xiàn)有模型進(jìn)行微
    的頭像 發(fā)表于 10-21 11:11 ?372次閱讀
    <b class='flag-5'>NVIDIA</b>開源Audio2Face模型及<b class='flag-5'>SDK</b>

    Nordic nRF5 SDK和softdevice介紹

    SDK和Softdevice的區(qū)別是什么?怎么選擇SDK和softdevice版本?芯片,SDK和softdevice有沒有版本兼容問題?怎么理解SDK目錄結(jié)構(gòu)?
    的頭像 發(fā)表于 08-20 09:54 ?2481次閱讀
    Nordic nRF5 <b class='flag-5'>SDK</b>和softdevice介紹

    NVIDIA Jetson + Isaac SDK 人形機(jī)器人方案全面解析

    NVIDIA Jetson + Isaac SDK 人形機(jī)器人方案全面解析 一、方案概述 Jetson 硬件平臺(tái) :提供 AI + GPU 運(yùn)算能力,配合多傳感器、視覺、傳動(dòng)控制體系 Isaac
    的頭像 發(fā)表于 07-30 16:12 ?1729次閱讀

    NVIDIA Jetson + Isaac SDK 在人形機(jī)器人領(lǐng)域的方案詳解

    NVIDIA Jetson + Isaac SDK 在人形機(jī)器人領(lǐng)域的 方案詳解 ,涵蓋芯片型號(hào)、軟件平臺(tái)、開發(fā)工具鏈、應(yīng)用場(chǎng)景與典型客戶等。 一、方案概述:Jetson + Isaac SDK
    的頭像 發(fā)表于 07-30 16:05 ?2936次閱讀

    NVIDIA技術(shù)賦能歐洲最快超級(jí)計(jì)算機(jī)JUPITER

    NVIDIA 宣布,搭載 NVIDIA Grace Hopper 平臺(tái)的 JUPITER 超級(jí)計(jì)算機(jī)成為歐洲最快超級(jí)計(jì)算機(jī),其運(yùn)行 HPC 和 AI 工作負(fù)載的速度是第二名的兩倍以上。
    的頭像 發(fā)表于 06-12 15:33 ?926次閱讀

    NVIDIA Isaac Sim與NVIDIA Isaac Lab的更新

    在 COMPUTEX 2025 上,NVIDIA 宣布了機(jī)器人仿真參考應(yīng)用 NVIDIA Isaac Sim 和機(jī)器人學(xué)習(xí)框架 NVIDIA Isaac Lab 的更新,以加速各種形態(tài)機(jī)器人的開發(fā)。
    的頭像 發(fā)表于 05-28 10:06 ?1603次閱讀

    NVIDIA RTX 4500 Ada與NVIDIA RTX A5000的對(duì)比

    基于大眾所熟知的 NVIDIA Ada Lovelace 架構(gòu),NVIDIA RTX 4500 Ada Generation是一款介于 NVIDIA RTX 4000 Ada 和 NVIDIA
    的頭像 發(fā)表于 03-05 10:30 ?3062次閱讀

    康佳特推出高性能COM-HPC模塊conga-HPC/cBLS

    德國(guó)康佳特,作為嵌入式和邊緣計(jì)算技術(shù)的領(lǐng)先供應(yīng)商,近日宣布擴(kuò)展其高性能COM-HPC計(jì)算機(jī)模塊產(chǎn)品線,推出了全新的conga-HPC/cBLS模塊。這款模塊專為需要強(qiáng)大計(jì)算性能的邊緣與基礎(chǔ)設(shè)施
    的頭像 發(fā)表于 02-08 16:49 ?838次閱讀

    HPC工作負(fù)載管理的關(guān)鍵要素

    HPC工作負(fù)載管理是一個(gè)復(fù)雜而精細(xì)的過程,涉及資源分配、作業(yè)調(diào)度、性能監(jiān)控與優(yōu)化以及故障處理與恢復(fù)等多個(gè)關(guān)鍵要素。下面,AI部落小編帶您了解HPC工作負(fù)載管理的關(guān)鍵要素。
    的頭像 發(fā)表于 02-08 09:53 ?496次閱讀

    HPC云計(jì)算的技術(shù)架構(gòu)

    HPC云計(jì)算結(jié)合了HPC的強(qiáng)大計(jì)算能力和云計(jì)算的彈性、可擴(kuò)展性,為用戶提供了按需獲取高性能計(jì)算資源的便利。下面,AI部落小編帶您了解HPC云計(jì)算的技術(shù)架構(gòu)。
    的頭像 發(fā)表于 02-05 14:51 ?607次閱讀

    HPC按需計(jì)費(fèi)模式的優(yōu)勢(shì)

    當(dāng)下,HPC按需計(jì)費(fèi)模式不僅降低了用戶的經(jīng)濟(jì)負(fù)擔(dān),提高了資源利用效率,還推動(dòng)了科技創(chuàng)新的普及和發(fā)展。以下,是對(duì)HPC按需計(jì)費(fèi)模式優(yōu)勢(shì)的梳理,由AI部落小編整理。
    的頭像 發(fā)表于 01-24 09:55 ?581次閱讀

    云計(jì)算HPC軟件關(guān)鍵技術(shù)

    云計(jì)算HPC軟件關(guān)鍵技術(shù)涉及系統(tǒng)架構(gòu)、處理器技術(shù)、操作系統(tǒng)、計(jì)算加速、網(wǎng)絡(luò)技術(shù)以及軟件優(yōu)化等多個(gè)方面。下面,AI部落小編帶您探討云計(jì)算HPC軟件的關(guān)鍵技術(shù)。
    的頭像 發(fā)表于 12-18 11:23 ?683次閱讀

    云計(jì)算和HPC的關(guān)系

    盡管云計(jì)算和HPC在架構(gòu)、應(yīng)用場(chǎng)景和成本效益等方面存在顯著差異,但云計(jì)算和HPC之間并非孤立存在,而是相互補(bǔ)充、協(xié)同發(fā)展的關(guān)系。下面,AI部落小編帶您探討云計(jì)算和HPC的關(guān)系。
    的頭像 發(fā)表于 12-14 10:35 ?618次閱讀

    ADC07D1520評(píng)估板的FMC接口是HPC的對(duì)嗎?

    您好,ADC07D1520評(píng)估板的FMC接口是HPC的對(duì)嗎?可以連接具有LPC接口的FPGA板子嗎?
    發(fā)表于 12-13 14:56

    通過Google Play SDK管理中心打造更安全、更優(yōu)質(zhì)的SDK

    ? 雖然 SDK 可以為應(yīng)用開發(fā)者帶來許多好處,但也可能會(huì)以不易識(shí)別或難以控制的方式影響應(yīng)用。因此,我們?cè)?2021 年推出了 Google Play SDK 管理中心,并在其中納入了一些被廣泛采用
    的頭像 發(fā)表于 11-14 10:36 ?1089次閱讀
    通過Google Play <b class='flag-5'>SDK</b>管理中心打造更安全、更優(yōu)質(zhì)的<b class='flag-5'>SDK</b>