亚洲精品久久久久久久久久久,亚洲国产精品一区二区制服,亚洲精品午夜精品,国产成人精品综合在线观看,最近2019中文字幕一页二页

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

盤點國產GPU在支持大模型應用方面的進展

Carol Li ? 來源:電子發(fā)燒友 ? 作者:李彎彎 ? 2024-03-29 00:27 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

電子發(fā)燒友網報道(文/李彎彎)目前談到GPU,大家首先想到的應該就是英偉達了。近一年多時間來,隨著大模型的發(fā)展,英偉達GPU的強大實力可謂無人不知。而相比之下,國產GPU的聲勢就小了許多。事實上,近些年國內也有不少GPU企業(yè)在逐步成長,雖然在大模型的訓練和推理方面,與英偉達GPU差距極大,但是不可忽視的是,不少國產GPU企業(yè)也在AI的訓練和推理應用上找到位置。

wKgZomYFRmmARSpxAAFSRafzhM0753.png

景嘉微

景嘉微是國產GPU市場的主要參與者,目前已經完成JM5、JM7和JM9系列三代圖形處理芯片的研發(fā),并成功實現產業(yè)化。

2024年3月12日,該公司發(fā)布公告稱,其面向AI 訓練、AI推理、科學計算等應用領域的景宏系列高性能智算模塊及整機產品研發(fā)成功,并將盡快面向市場推廣。

根據公告,景宏系列支持INT8、FP16、FP32、FP64等混合精度運算,支持全新的多卡互聯技術進行算力擴展,適配國內外主流CPU操作系統(tǒng)及服務器廠商,能夠支持當前主流的計算生態(tài)、深度學習框架和算法模型庫,大幅縮短用戶適配驗證周期。

海光信息

海光信息的產品包括海光通用處理器(CPU)和海光協處理器(DCU)。海光DCU屬于GPGPU 的一種,采用“類CUDA”通用并行計算架構,能夠較好地適配、適應國際主流商業(yè)計算軟件和人工智能軟件。

海光8000系列具有全精度浮點數據和各種常見整型數據計算能力,具有最多64個計算單元,能夠充分挖掘應用的并行性,發(fā)揮其大規(guī)模并行計算的能力,快速開發(fā)高能效的應用程序。

海光DCU主要部署在服務器集群或數據中心,為應用程序提供性能高、能效比高的算力,支撐高復雜度和高吞吐量的數據處理任務。在AIGC持續(xù)快速發(fā)展的時代背景下,海光DCU 能夠完整支持大模型訓練,實現LLaMa、GPT、Bloom、ChatGLM、悟道、紫東太初等為代表的大模型的全面應用,與國內包括文心一言等大模型全面適配,達到國內領先水平。

瀚博半導體

瀚博半導體成立于2018年12月,是一家GPU芯片提供商,致力于為人工智能核心算力和圖形渲染、內容生成、AIGC提供全棧式芯片解決方案。瀚博目前擁有自主研發(fā)的核心IP以及兩代GPU芯片,并衍生AI、渲染、視頻三大產品線。

據介紹,其2023年推出的第二代GPU SG100芯片,采用7nm先進制程,具備業(yè)界一流的渲染性能,同時兼具低延時高吞吐的AI算力和強大的視頻處理能力,可廣泛支持數字孿生、數字人、云桌面、云手機、云游戲、云渲染、工業(yè)軟件等多領域應用。

同時針對大模型時代算力需求,瀚博還首發(fā)了LLM大模型AI加速卡VA1L,具備200 TOPS INT8/72 TFLOPS FP16算力,并支持ChatGPT、LLaMA、Stable Diffusion等主流AIGC網絡模型。同時,瀚博更重磅推出AIGC大模型一體機,共使用8張LLM大模型AI加速卡VA1L,支持512GB顯存,進而支持1750億參數的大模型。

摩爾線程

摩爾線程成立于2020年10月,是一家以全功能GPU芯片設計為主的集成電路公司。該公司已經發(fā)布兩款自主研發(fā)的GPU芯片產品,2022年3月發(fā)布GPU產品“蘇堤”,11月又發(fā)布了第二款GPU芯片“春曉”。

“春曉”內置MUSA架構通用計算核心以及張量計算核心,可支持FP32、FP16和INT8三種計算精度;相較于其首款自研的GPU“蘇堤”,“春曉”內置的四大計算引擎都進行了全面升級,性能顯著提升,AI計算加速平均提升4倍。

沐曦集成

沐曦成立于2020年9月,致力于為異構計算提供全棧GPU芯片及解決方案,可廣泛應用于智算、智慧城市、云計算、自動駕駛、數字孿生、元宇宙等前沿領域。

沐曦集成目前有三條產品線規(guī)劃,曦思N系列GPU產品用于智算推理,曦云C系列GPU產品用于通用計算,曦彩G系列GPU產品用于圖形渲染。據沐曦此前對外透露,公司N系列云端推理芯片已經量產出貨,C系列于2023年6月13日回片并完成測試。

沐曦產品均采用完全自主研發(fā)的GPU IP,擁有完全自主知識產權的指令集和架構,配以兼容主流GPU生態(tài)的完整軟件棧(MXMACA),具備高能效和高通用性的天然優(yōu)勢,能夠為客戶構建軟硬件一體的全面生態(tài)解決方案。

天數智芯

天數智芯致力于開發(fā)自主可控、國際領先的高性能通用GPU產品,探索通用GPU趕超發(fā)展道路,加快建設自主產業(yè)生態(tài),為全產業(yè)提供高端算力解決方案。

天數智芯2018年正式啟動通用GPU芯片設計,在2021年發(fā)布了其通用GPU“天垓100”芯片及天垓100加速卡,2021年10月宣布天垓100正式進入量產環(huán)節(jié)。2022年9月,又發(fā)布了首款7nm制程的云端推理通用GPU產品“智鎧100”。

智鎧 100 芯片支持 FP32、FP16、INT8 等多精度混合計算,實現了指令集增強、算力密度提升、計算存儲再平衡,支持多種視頻規(guī)格解碼。

燧原科技

燧原科技專注人工智能領域云端和邊緣算力產品,致力為通用人工智能打造算力底座,提供原始創(chuàng)新、具備自主知識產權的AI加速卡、系統(tǒng)集群和軟硬件解決方案。產品可廣泛應用于泛互聯網、智算中心、智慧城市,智慧金融、科學計算、自動駕駛等多個行業(yè)和場景。

該公司于2018年3月成立,僅用18個月時間,即發(fā)布第一代AI芯片邃思1.0,又于2021年7月發(fā)布邃思2.0。到現在,該公司已經在兩款芯片的基礎上迭代了兩代訓練和推理產品,第三代產品也已經在研發(fā)中。并且,燧原科技已經在科研領域和智慧城市的應用中落地了訓練和推理的超千卡算力集群。

登臨科技

登臨科技專注于芯片研發(fā)與技術創(chuàng)新,致力于打造云邊端一體、軟硬件協同的前沿芯片產品和平臺化基礎系統(tǒng)軟件。公司自主創(chuàng)新的GPU+(基于GPGPU的軟件定義的片內異構計算架構),在兼容CUDA/OpenCL在內的編程模型和軟件生態(tài)的基礎上,通過架構創(chuàng)新,完美解決了通用性和高效率的雙重難題。

登臨首款基于GPU+的創(chuàng)新AI計算加速器Goldwasser已規(guī)?;\用在各個應用場景。未來將繼續(xù)秉承核心IP全自研的架構實現,以AI計算為主線,以創(chuàng)新為靈魂,加強核心IP自主研發(fā),加速產品在高級自動駕駛,圖形加速等相關領域的開拓創(chuàng)新和商業(yè)化進程。

寫在最后

GPU最初是為解決CPU在圖形處理領域性能不足的問題而誕生的,早期它多用于圖形處理,而如今大家談到用于AI訓練和推理多是通用計算GPGPU,它脫胎于早期的圖形處理器。

上述談到的GPU企業(yè),有些既有用于AI計算的GPU產品,也有用于圖形處理的產品,如景嘉微,是國內較早入局GPU市場的企業(yè),之前已經發(fā)布過多個系列的產品,主要用于圖形處理。近期才公布面向AI 訓練、AI推理、科學計算等應用領域的GPU產品研發(fā)成功。

如沐曦入局GPU市場較晚,像用于AI訓練、推理的產品,以及用于圖形渲染的產品都有規(guī)劃,不過它是先推出了用于AI計算的GPU芯片,而用于圖形渲染的產品預計要到2025年才發(fā)布。像瀚博半導體、摩爾線程等也是面向圖形渲染和AI計算都有產品。

面對現在關注比較多的大模型的訓練和推理,國產GPU企業(yè)也在積極跟進,如海光DCU就能夠完整支持大模型訓練,實現LLaMa、GPT、Bloom、ChatGLM、悟道、紫東太初等為代表的大模型的全面應用;瀚博基于新一代GPU芯片首發(fā)了LLM大模型AI加速卡VA1L,能支持ChatGPT、LLaMA、Stable Diffusion等主流AIGC網絡模型。天數智芯、燧原科技等也都在支持大模型的應用上取得進展。


聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯系本站處理。 舉報投訴
  • gpu
    gpu
    +關注

    關注

    28

    文章

    5067

    瀏覽量

    134134
  • 大模型
    +關注

    關注

    2

    文章

    3396

    瀏覽量

    4872
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    首款全國產通用GPU芯片發(fā)布 沐曦集成推出曦云C600

    ,并支持MetaXLink超節(jié)點擴展技術,硬件性能和軟件兼容上完全滿足下一代生成式AI的訓練和推理需求。 而且,沐曦股份與中國科學院合作的國產千卡集群,已完成多個大模型全參數訓練,證
    的頭像 發(fā)表于 10-19 20:04 ?3w次閱讀

    為什么無法GPU上使用INT8 和 INT4量化模型獲得輸出?

    安裝OpenVINO? 2024.0 版本。 使用 optimum-intel 程序包將 whisper-large-v3 模型轉換為 int 4 和 int8,并在 GPU 上使用 OpenVINO? 運行推理。 沒有可用的輸出。
    發(fā)表于 06-23 07:11

    Imagination與澎峰科技攜手推動GPU+AI解決方案,共拓計算生態(tài)

    的深度融合展開合作。雙方將結合 Imagination 領先的 GPU IP 技術與澎峰科技 AI 模型壓縮與性能優(yōu)化方面的軟硬協同能力,共同開拓面向 AI 行業(yè)應用的計算解決方案
    發(fā)表于 05-21 09:40 ?1077次閱讀

    壁仞科技完成Qwen3旗艦模型適配

    近日,高效適配Qwen3系列模型推理后,壁仞科技宣布完成旗艦版Qwen3-235B-A22B模型的訓練適配和優(yōu)化。由此,壁仞科技已實現Qwen3系列模型
    的頭像 發(fā)表于 05-16 16:23 ?699次閱讀

    摩爾線程GPU率先支持Qwen3全系列模型

    近日,阿里云正式發(fā)布Qwen3系列的8款開源混合推理模型。摩爾線程團隊模型發(fā)布當天,率先完成了Qwen3全系列模型全功能
    的頭像 發(fā)表于 05-07 15:24 ?790次閱讀

    摩爾線程GPU原生FP8計算助力AI訓練

    并行訓練和推理,顯著提升了訓練效率與穩(wěn)定性。摩爾線程是國內率先原生支持FP8計算精度的國產GPU企業(yè),此次開源不僅為AI訓練和推理提供了全新的國產化解決方案,更對推動
    的頭像 發(fā)表于 03-17 17:05 ?1103次閱讀
    摩爾線程<b class='flag-5'>GPU</b>原生FP8計算助力AI訓練

    國產AI芯片破局:國產TCB設備首次完成CoWoS封裝工藝測試

    DeepSeek的突破性進展,讓中國AI產業(yè)領域似乎迅速縮小了和美國的差距,然而整個國產模型的運行仍高度依賴英偉達的芯片支持。盡管
    的頭像 發(fā)表于 03-14 11:09 ?1294次閱讀
    <b class='flag-5'>國產</b>AI芯片破局:<b class='flag-5'>國產</b>TCB設備首次完成CoWoS封裝工藝測試

    無法GPU上運行ONNX模型的Benchmark_app怎么解決?

    CPU 和 GPU 上運行OpenVINO? 2023.0 Benchmark_app推斷的 ONNX 模型。 CPU 上推理成功,但在
    發(fā)表于 03-06 08:02

    摩爾線程全面支持DeepSeek開源周成果

    DeepSeek開源周正式收官,作為國內率先原生支持FP8計算精度的國產GPU企業(yè),摩爾線程迅速響應,并在短時間內,成功實現對DeepSeek各個開源項目的全面支持,涵蓋FlashML
    的頭像 發(fā)表于 03-04 10:06 ?747次閱讀

    飛騰CPU成功支持DeepSeek全系列大模型

    成功實現了對DeepSeek全系列大模型的端到端支持。 這一成就不僅覆蓋了數據中心場景,還全面擴展到了終端場景,標志著國產CPUAI大模型
    的頭像 發(fā)表于 02-10 14:26 ?961次閱讀

    AMD將DeepSeek-V3模型集成至Instinct MI300X GPU

    AMD近日宣布了一項重要進展,成功將全新的DeepSeek-V3模型集成到其Instinct MI300X GPU上。這一舉措標志著AMDAI推理優(yōu)化
    的頭像 發(fā)表于 02-06 09:41 ?766次閱讀

    國產工控機軌道交通方面的應用創(chuàng)新

    科技飛速發(fā)展的當下,軌道交通作為現代城市交通的重要支柱,其高效運行離不開先進技術的支持。高能計算機推出的飛騰國產工控機GA-A3203憑借其卓越性能用FT2000/4 CPU,軌道
    的頭像 發(fā)表于 01-15 08:44 ?535次閱讀

    小米加速布局AI大模型,搭建GPU萬卡集群

    近日,有消息稱小米正在緊鑼密鼓地搭建自己的GPU萬卡集群,旨在加大對AI大模型的投入力度。據悉,小米的大模型團隊成立之初就已經擁有了6500張GP
    的頭像 發(fā)表于 12-28 14:25 ?721次閱讀

    GPU是如何訓練AI大模型

    AI模型的訓練過程中,大量的計算工作集中矩陣乘法、向量加法和激活函數等運算上。這些運算正是GPU所擅長的。接下來,AI部落小編帶您了解GPU
    的頭像 發(fā)表于 12-19 17:54 ?1133次閱讀

    《CST Studio Suite 2024 GPU加速計算指南》

    的各個方面,包括硬件支持、操作系統(tǒng)支持、許可證、GPU計算的啟用、NVIDIA和AMD GPU的詳細信息以及相關的使用指南和故障排除等內容。
    發(fā)表于 12-16 14:25