亚洲精品久久久久久久久久久,亚洲国产精品一区二区制服,亚洲精品午夜精品,国产成人精品综合在线观看,最近2019中文字幕一页二页

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線(xiàn)課程
  • 觀(guān)看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

強(qiáng)強(qiáng)聯(lián)手!愛(ài)丁堡大學(xué)與算能破局:RISC-V進(jìn)軍高性能計(jì)算,SG2044多核性能飆漲近5倍

算能開(kāi)發(fā)者社區(qū) ? 2025-08-26 16:31 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

RISC-V 架構(gòu)的普及浪潮中,嵌入式領(lǐng)域的成功早已眾人皆知,但高性能計(jì)算(HPC)始終是其難以突破的 “高地”。算能SOPHON SG2044的出現(xiàn)打破了僵局, 其 64 核高性能 CPU 不僅在愛(ài)丁堡大學(xué)的權(quán)威測(cè)試中展現(xiàn)出顛覆性實(shí)力,更以實(shí)打?qū)嵉臄?shù)據(jù)證明:RISC-V 終于能在 HPC 賽場(chǎng)與 x86、ARM 同臺(tái)競(jìng)技。

多核算力突破性躍升:HPC 基準(zhǔn)測(cè)試數(shù)據(jù)碾壓前代

作為專(zhuān)為工作站與服務(wù)器級(jí) HPC 負(fù)載設(shè)計(jì)的芯片,SG2044 最核心的突破在于多核并行算力的指數(shù)級(jí)躍升。愛(ài)丁堡大學(xué) Nick Brown 教授在《Is RISC-V ready for High Performance Computing? An evaluation of the Sophon SG2044》中明確指出:“We find that the SG2044 is most advantageous when running at higher core counts, delivering up to 4.91 greater performance than the SG2042 over 64-cores.”(在 64 核配置下,SG2044 性能較前代 SG2042 提升高達(dá)4.91倍)。

1fdd3444-8257-11f0-9080-92fbcf53809c.png

這一數(shù)據(jù)并非孤立存在,通過(guò) NASA NAS 并行基準(zhǔn)測(cè)試(NPB)的實(shí)測(cè)驗(yàn)證:

在內(nèi)存延遲敏感型的 IS(整數(shù)排序)基準(zhǔn)中,SG2044 64 核性能達(dá) 3038.14 Mop/s,而 SG2042 僅為 618.50 Mop/s,前者是后者的 4.91 倍,徹底解決了 SG2042 在多核心下性能 “卡頓” 的問(wèn)題;即便是對(duì)計(jì)算效率要求極高的FT(快速傅里葉變換)基準(zhǔn),SG2044 64 核性能也達(dá) 22582.2 Mop/s,較 SG2042 的 8317.91 Mop/s 提升 2.71 倍;

20056ca2-8257-11f0-9080-92fbcf53809c.png

更關(guān)鍵的是,當(dāng)核心數(shù)超過(guò) 8 核后,SG2042 的內(nèi)存帶寬便進(jìn)入 “平臺(tái)期”,而 SG2044 能持續(xù)線(xiàn)性增長(zhǎng),在 64 核時(shí)通過(guò) STREAM 基準(zhǔn)測(cè)試實(shí)現(xiàn)3 倍于 SG2042 的內(nèi)存帶寬,完美適配 HPC 場(chǎng)景下 “多核心滿(mǎn)負(fù)載” 的需求。

20188c38-8257-11f0-9080-92fbcf53809c.png

雙關(guān)鍵升級(jí)破局 HPC 瓶頸:數(shù)據(jù)實(shí)測(cè)縮小架構(gòu)代差

SG2044 的性能飛躍,源于對(duì)前代SG2042 兩大瓶頸的精準(zhǔn)突破 ——RVV v1.0 向量指令集支持與增強(qiáng)型內(nèi)存子系統(tǒng),這也是 HPC 場(chǎng)景最核心的技術(shù)需求。

RVV v1.0:讓 RISC-V 向量計(jì)算 “能用、好用”

不同于 SG2042 僅支持 RVV v0.7.1(需定制編譯器,無(wú)法兼容主流工具鏈),SG2044 的 C920v2 核心直接兼容 RVV v1.0 標(biāo)準(zhǔn),可直接使用 GCC 15.2、LLVM 等主流編譯器實(shí)現(xiàn)自動(dòng)向量化。實(shí)測(cè)數(shù)據(jù)顯示:

在MG(多重網(wǎng)格)向量密集型基準(zhǔn)中,SG2044 單核心性能達(dá) 1382.91 Mop/s,較 SG2042 的 1175.69 Mop/s 提升 18%;更重要的是,借助 RVV v1.0 的 128 位向量單元,SG2044 在EP(并行計(jì)算)基準(zhǔn)(純計(jì)算密集型)中,單核心性能達(dá) 40.76 Mop/s,較 SG2042 提升 30%,成為單核心場(chǎng)景下性能提升最顯著的 HPC 負(fù)載。

202b6844-8257-11f0-9080-92fbcf53809c.png

這意味著,開(kāi)發(fā)者無(wú)需再為適配 RISC-V 向量計(jì)算修改代碼,直接沿用主流 HPC 軟件棧即可發(fā)揮 SG2044 的算力優(yōu)勢(shì),大幅降低了 RISC-V 進(jìn)入 HPC 領(lǐng)域的門(mén)檻。

通道內(nèi)存 + DDR5,突破瓶頸

SG2042 的最大痛點(diǎn) —— 內(nèi)存 subsystem 瓶頸,在 SG2044 上被徹底重構(gòu)。內(nèi)存控制器從 4 個(gè)增至 32 個(gè),內(nèi)存通道從 4 條擴(kuò)至 32 條,同時(shí)升級(jí)至 DDR5-4266 內(nèi)存,帶來(lái)了顛覆性的內(nèi)存性能:

  • 內(nèi)存帶寬方面,SG2044 在 64 核時(shí)通過(guò) STREAM 基準(zhǔn)實(shí)現(xiàn)超 3 倍于 SG2042 的帶寬,且核心數(shù)越多,優(yōu)勢(shì)越明顯(8 核內(nèi)兩者帶寬相近,64 核時(shí) SG2044 徹底拉開(kāi)差距);
  • 內(nèi)存延遲從 SG2042 的 98ns 降至 68ns,降幅達(dá) 35%,在CG(共軛梯度)基準(zhǔn)(不規(guī)則內(nèi)存訪(fǎng)問(wèn))中,64 核性能達(dá) 7728.80 Mop/s,較 SG2042 的 3508.95 Mop/s 提升 2.2 倍;

更關(guān)鍵的是,SG2044 所有核心處于單一 NUMA 區(qū)域,避免了多 NUMA 節(jié)點(diǎn)間的數(shù)據(jù)傳輸延遲,在數(shù)據(jù)密集型 HPC 場(chǎng)景中,降低了內(nèi)存瓶頸導(dǎo)致的性能損耗。

對(duì)標(biāo) x86/ARM:64 核滿(mǎn)負(fù)載,RISC-V實(shí)現(xiàn)性能突破

過(guò)去,RISC-V HPC 芯片面對(duì) x86、ARM 總是 “單核心差距大,多核心追不上”,但 SG2044 用實(shí)測(cè)數(shù)據(jù)打破了這一局面。

通過(guò)與 HPC 領(lǐng)域主流芯片的對(duì)比(AMD EPYC 7742、Intel Xeon Platinum 8170、Marvell ThunderX2): 在MG(內(nèi)存帶寬敏感)基準(zhǔn)中,SG2044 64 核性能達(dá) 32457.83 Mop/s,雖不及 AMD EPYC 的 10 萬(wàn)級(jí) Mop/s,但已與 26 核 Intel Skylake(約 3 萬(wàn) Mop/s)、32 核 Marvell ThunderX2(約 2.8 萬(wàn) Mop/s)基本持平,遠(yuǎn)超 SG2042 的 14397.69 Mop/s;

2040fc2c-8257-11f0-9080-92fbcf53809c.png

在EP(純計(jì)算)基準(zhǔn)中,SG2044 單核心性能與 Intel Skylake 差距僅 30%,64 核時(shí)性能達(dá) 2538.38 Mop/s,較 SG2042 提升 52%,且核心數(shù)超過(guò) 26 核后,性能曲線(xiàn)與 AMD EPYC 基本平行,展現(xiàn)出優(yōu)秀的多核擴(kuò)展性;

207ddfd4-8257-11f0-9080-92fbcf53809c.png

即便是復(fù)雜的BT/LU/SP 偽應(yīng)用(模擬真實(shí) HPC 流體力學(xué)、數(shù)值模擬場(chǎng)景),SG2044 在 64 核時(shí)也實(shí)現(xiàn)了對(duì) SG2042 的 2 倍以上性能碾壓,其中 BT 基準(zhǔn)性能是 SG2042 的 2.22 倍,SP 基準(zhǔn)是 2.08 倍。

更值得關(guān)注的是,SG2044 的定位是 “工作站 / 服務(wù)器級(jí)”,而非頂級(jí)超算芯片,但在價(jià)格更低、功耗更優(yōu)的前提下,能在 64 核滿(mǎn)負(fù)載場(chǎng)景下追平入門(mén)級(jí) x86/ARM HPC 芯片,已足以證明 RISC-V 在 HPC 領(lǐng)域的性?xún)r(jià)比優(yōu)勢(shì)。

RISC-V 架構(gòu)的發(fā)展為處理器領(lǐng)域帶來(lái)了新的活力,算能 SG2044 的意義不僅是一款高性能芯片,更在于它驗(yàn)證了 RISC-V 的技術(shù)潛力 —— 通過(guò)解決 “向量計(jì)算兼容性” 和 “內(nèi)存帶寬” 兩大核心痛點(diǎn),RISC-V 終于能從嵌入式領(lǐng)域走向 HPC 這一 “高端戰(zhàn)場(chǎng)”。

Nick Brown簡(jiǎn)介

Nick Brown教授是英國(guó)愛(ài)丁堡大學(xué)EPCC(愛(ài)丁堡并行計(jì)算中心)的研究員,在國(guó)際高性能計(jì)算(HPC)領(lǐng)域具有重要影響力。他的研究聚焦于并行編程模型、高性能計(jì)算系統(tǒng)優(yōu)化及能效提升,致力于推動(dòng)大規(guī)??茖W(xué)計(jì)算應(yīng)用的發(fā)展。

作為HPC社區(qū)活躍的學(xué)術(shù)代表,他多次主導(dǎo)國(guó)際合作項(xiàng)目,并在頂級(jí)會(huì)議發(fā)表多項(xiàng)突破性成果,特別是在混合編程與性能可移植性方面貢獻(xiàn)突出。Nick Brown的工作顯著提升了超級(jí)計(jì)算機(jī)在氣候科學(xué)、計(jì)算流體力學(xué)等領(lǐng)域的應(yīng)用效率,是當(dāng)代高性能計(jì)算領(lǐng)域的關(guān)鍵推動(dòng)者之一。


聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀(guān)點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 測(cè)試
    +關(guān)注

    關(guān)注

    8

    文章

    5932

    瀏覽量

    130421
  • HPC
    HPC
    +關(guān)注

    關(guān)注

    0

    文章

    342

    瀏覽量

    24772
  • RISC-V
    +關(guān)注

    關(guān)注

    48

    文章

    2713

    瀏覽量

    51275
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    提高RISC-V在Drystone測(cè)試中得分的方法

    性能:內(nèi)存的讀寫(xiě)速度、延遲和帶寬等都會(huì)影響到 Drystone 的性能。 指令集優(yōu)化:對(duì)RISC-V指令集的優(yōu)化也會(huì)影響性能。例如,對(duì)于特定的應(yīng)用或
    發(fā)表于 10-21 13:58

    RISC-V HPC新標(biāo)桿Sophon SG2044深度評(píng)估:支持RVV v1.0適配GCC 15.2,多核性能潛力巨大!

    RISC-V架構(gòu)的普及浪潮中,嵌入式領(lǐng)域的成功早已眾人皆知,但高性能計(jì)算(HPC)始終是其難以突破的“高地”。SOPHONSG
    的頭像 發(fā)表于 10-16 13:23 ?236次閱讀
    <b class='flag-5'>RISC-V</b> HPC新標(biāo)桿Sophon <b class='flag-5'>SG2044</b>深度評(píng)估:支持RVV <b class='flag-5'>v</b>1.0適配GCC 15.2,<b class='flag-5'>多核</b><b class='flag-5'>性能</b>潛力巨大!

    知合計(jì)算RISC-V架構(gòu)創(chuàng)新,阿基米德系列劍指高性能計(jì)算

    在于更高的性能。這主要取決于單位性能的提升,以及先進(jìn)工藝帶來(lái)的PPA優(yōu)化。只有出現(xiàn)標(biāo)桿性的產(chǎn)品才能真正引領(lǐng)整個(gè)RISC-V高性能
    的頭像 發(fā)表于 07-18 14:17 ?2114次閱讀
    知合<b class='flag-5'>計(jì)算</b>:<b class='flag-5'>RISC-V</b>架構(gòu)創(chuàng)新,阿基米德系列劍指<b class='flag-5'>高性能</b><b class='flag-5'>計(jì)算</b>

    RISC-V如何盈利?本土企業(yè)率先

    7月16日,第五屆RISC-V中國(guó)峰會(huì)在上海盛大開(kāi)幕,規(guī)模和全球影響力遠(yuǎn)超歷屆。去年峰會(huì)圓桌討論如何盈利,今年就有本土企業(yè)率先。據(jù)峰會(huì)現(xiàn)場(chǎng)消息,沁恒青稞RISC-V已商用五年并持續(xù)
    的頭像 發(fā)表于 07-18 11:32 ?2962次閱讀
    <b class='flag-5'>RISC-V</b>如何盈利?本土企業(yè)率先<b class='flag-5'>破</b><b class='flag-5'>局</b>

    孟建熠:攀登 RISC-V 高性能高峰,打造標(biāo)桿產(chǎn)品

    RISC-V高性能計(jì)算領(lǐng)域的崛起,是近年來(lái)全球芯片架構(gòu)競(jìng)爭(zhēng)的重要趨勢(shì)之一。其開(kāi)源、靈活、可擴(kuò)展的特性,使其在高性能處理器設(shè)計(jì)、人工智能
    發(fā)表于 07-17 15:56 ?4761次閱讀

    ROCm 6.2.4 成功移植至 SG2044: 大模型部署速率飆升,RISC-V + AI 新紀(jì)元!代碼已經(jīng)開(kāi)源,一起來(lái)試試!

    AMDROCm6.2.4版本已成功移植到SG2044平臺(tái)!這一重大突破為SG2044帶來(lái)了強(qiáng)大的GPU計(jì)算能力,為
    的頭像 發(fā)表于 07-14 17:04 ?881次閱讀
    ROCm 6.2.4 成功移植至 <b class='flag-5'>SG2044</b>: 大模型部署速率飆升,<b class='flag-5'>RISC-V</b> + AI 新紀(jì)元!代碼已經(jīng)開(kāi)源,一起來(lái)試試!

    香橙派發(fā)布RISC-V高性能智能網(wǎng)關(guān)解決方案OrangePi R2S,賦智能家居和工業(yè)互聯(lián)網(wǎng)

    隨著5G、云計(jì)算等技術(shù)的快速發(fā)展,RISC-V架構(gòu)憑借其精簡(jiǎn)與開(kāi)源的特性大幅降低了行業(yè)門(mén)檻,為物聯(lián)網(wǎng)市場(chǎng)提供了低成本、高效率的處理器解決方案。香橙派日前推出RISC-V
    的頭像 發(fā)表于 06-06 17:29 ?880次閱讀
    香橙派發(fā)布<b class='flag-5'>RISC-V</b><b class='flag-5'>高性能</b>智能網(wǎng)關(guān)解決方案OrangePi R2S,賦<b class='flag-5'>能</b>智能家居和工業(yè)互聯(lián)網(wǎng)

    Condor使用Cadence托管云服務(wù)開(kāi)發(fā)高性能RISC-V微處理器

    Condor 是一家美國(guó)初創(chuàng)企業(yè),致力于開(kāi)發(fā)高性能 RISC-V 微處理器。公司的目標(biāo)是通過(guò)創(chuàng)新技術(shù)徹底革新整個(gè)行業(yè),打破高性能計(jì)算的極限。
    的頭像 發(fā)表于 05-08 09:03 ?703次閱讀

    大象機(jī)器人×進(jìn)迭時(shí)空聯(lián)合發(fā)布全球首款RISC-V全棧開(kāi)源小六軸機(jī)械臂

    高性能RISC-V CPU核、RISC-V AI核、NoC總線(xiàn)、RISC-V AI CPU芯片、軟件系統(tǒng)等全棧計(jì)算技術(shù),提供軟硬協(xié)同優(yōu)化的完
    的頭像 發(fā)表于 04-25 14:19 ?1241次閱讀
    大象機(jī)器人×進(jìn)迭時(shí)空聯(lián)合發(fā)布全球首款<b class='flag-5'>RISC-V</b>全棧開(kāi)源小六軸機(jī)械臂

    RISC-V生態(tài)崛起:政策落地與高性能芯片的崛起

    近期,RISC-V生態(tài)取得重要進(jìn)展,包括高性能核心板的推出和在工業(yè)自動(dòng)化、物聯(lián)網(wǎng)等領(lǐng)域的廣泛應(yīng)用。其中,致遠(yuǎn)電子MR6450系列RISC-V核心板,憑借高性能和豐富的通信接口,成為工業(yè)
    的頭像 發(fā)表于 03-06 11:35 ?1070次閱讀
    <b class='flag-5'>RISC-V</b>生態(tài)崛起:政策落地與<b class='flag-5'>高性能</b>芯片的崛起

    關(guān)于RISC-V芯片的應(yīng)用學(xué)習(xí)總結(jié)

    RISC-V憑借其開(kāi)源性、可擴(kuò)展性和高性能特性,正在逐步滲透到這一領(lǐng)域。例如,美國(guó)國(guó)家航空航天(NASA)就計(jì)劃基于RISC-V架構(gòu)打造下一代高性
    發(fā)表于 01-29 08:38

    risc-v芯片在電機(jī)領(lǐng)域的應(yīng)用展望

    活、更定制化的解決方案。 在電機(jī)控制領(lǐng)域,RISC-V芯片的高性能、低功耗和可定制性等特點(diǎn)尤為突出。傳統(tǒng)的電機(jī)控制芯片往往采用固定的指令集架構(gòu),難以滿(mǎn)足日益增長(zhǎng)的多樣化需求。而RISC-V芯片則可以根據(jù)
    發(fā)表于 12-28 17:20

    圣誕特輯 |開(kāi)源芯片系列講座第25期:RISC-V架構(gòu)在高性能領(lǐng)域的進(jìn)展與挑戰(zhàn)

    報(bào)告簡(jiǎn)介隨著以AI應(yīng)用為代表的高性能力芯片應(yīng)用場(chǎng)景不斷產(chǎn)生多樣化需求,RISC-V架構(gòu)正依靠其開(kāi)放開(kāi)源的優(yōu)勢(shì),成為力芯片架構(gòu)創(chuàng)新的主要技術(shù)基礎(chǔ)。目前,包括RIS
    的頭像 發(fā)表于 12-24 08:03 ?1087次閱讀
    圣誕特輯 |開(kāi)源芯片系列講座第25期:<b class='flag-5'>RISC-V</b>架構(gòu)在<b class='flag-5'>高性能</b>領(lǐng)域的進(jìn)展與挑戰(zhàn)

    SiFive 推出高性能 Risc-V CPU 開(kāi)發(fā)板 HiFive Premier P550

    “ ?HiFive Premier P550:世界上性能最高的 RISC-V CPU 開(kāi)發(fā)板,以 Mini-DTX 外形提供高性能 Linux 開(kāi)發(fā)平臺(tái),支持下一波 RISC-V 開(kāi)發(fā)
    的頭像 發(fā)表于 12-16 11:16 ?2493次閱讀
    SiFive 推出<b class='flag-5'>高性能</b> <b class='flag-5'>Risc-V</b> CPU 開(kāi)發(fā)板 HiFive Premier P550

    直播預(yù)約 |開(kāi)源芯片系列講座第25期:RISC-V架構(gòu)在高性能領(lǐng)域的進(jìn)展與挑戰(zhàn)

    與挑戰(zhàn)報(bào)告簡(jiǎn)介隨著以AI應(yīng)用為代表的高性能力芯片應(yīng)用場(chǎng)景不斷產(chǎn)生多樣化需求,RISC-V架構(gòu)正依靠其開(kāi)放開(kāi)源的優(yōu)勢(shì),成為力芯片架構(gòu)創(chuàng)新的主要技術(shù)基礎(chǔ)。目前,包括
    的頭像 發(fā)表于 12-13 17:01 ?690次閱讀
    直播預(yù)約 |開(kāi)源芯片系列講座第25期:<b class='flag-5'>RISC-V</b>架構(gòu)在<b class='flag-5'>高性能</b>領(lǐng)域的進(jìn)展與挑戰(zhàn)