亚洲精品久久久久久久久久久,亚洲国产精品一区二区制服,亚洲精品午夜精品,国产成人精品综合在线观看,最近2019中文字幕一页二页

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

ARM Mali GPU 深度解讀

eeDesigner ? 2025-05-29 10:12 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

ARM Mali GPU 深度解讀

ARM Mali 是 Arm 公司面向移動(dòng)設(shè)備、嵌入式系統(tǒng)和基礎(chǔ)設(shè)施市場(chǎng)設(shè)計(jì)的圖形處理器(GPU)IP 核,憑借其異構(gòu)計(jì)算架構(gòu)、能效優(yōu)化和生態(tài)協(xié)同,成為全球移動(dòng)設(shè)備 GPU 市場(chǎng)的核心力量。以下從技術(shù)演進(jìn)、架構(gòu)特性、產(chǎn)品布局及生態(tài)戰(zhàn)略等維度展開分析:


一、架構(gòu)演進(jìn):從 Utgard 到 Valhall

Mali GPU 的架構(gòu)迭代以 ?北歐神話元素命名,技術(shù)特性與性能提升同步推進(jìn):

?Utgard 架構(gòu)(2007-2012)??:

  • 代表型號(hào):Mali-200、Mali-400 MP
  • 特性:基于 ?分離式頂點(diǎn)與片段著色器,僅支持 OpenGL ES 2.0 及以下標(biāo)準(zhǔn),適用于早期智能手機(jī)嵌入式設(shè)備。例如 Mali-400 MP 支持 4 核擴(kuò)展,像素填充率達(dá) 275M/秒(65nm 工藝)。
  • 局限:能效比低,多核擴(kuò)展能力有限,無法滿足復(fù)雜 3D 渲染需求。

?Midgard 架構(gòu)(2013-2018)??:

  • 代表型號(hào):Mali-T760、Mali-T880
  • 突破:
    • ?統(tǒng)一著色器架構(gòu)?:支持 OpenGL ES 3.0/3.1 和 OpenCL 1.2,實(shí)現(xiàn) GPU 通用計(jì)算(GPGPU)。
    • ?多核擴(kuò)展?:?jiǎn)涡酒罡咧С?16 核(如 Mali-T760MP16),三角形輸出率提升至 30M/秒,并首次引入 ?DirectX 11 支持?(如 Mali-T760)。
  • 應(yīng)用:三星 Exynos 8890(T880)、聯(lián)發(fā)科 Helio P10(T860)等中高端芯片。

?Bifrost 架構(gòu)(2016-2020)??:

  • 代表型號(hào):Mali-G71、G72、G76
  • 創(chuàng)新:
    • ?標(biāo)量執(zhí)行單元?:將向量拆解為標(biāo)量處理,提升 16/8bit 低精度計(jì)算效率,支持 ?AI 推理加速?(如 int8 dot 指令優(yōu)化神經(jīng)網(wǎng)絡(luò))。
    • ?動(dòng)態(tài)電源管理?:能效較 Midgard 提升 30%,如 Mali-G76 在三星 Exynos 9820 中實(shí)現(xiàn) 1.4 倍性能提升。

?Valhall 架構(gòu)(2019-至今)??:

  • 代表型號(hào):Mali-G77、G78、G710
  • 技術(shù)飛躍:
    • ?超標(biāo)量設(shè)計(jì)?:16-wide warp 并行計(jì)算,ALU 單元密度翻倍,支持 ?可變速率著色(VRS)?? 和光線追蹤。
    • ?AI 與圖形協(xié)同?:Mali-G77 的機(jī)器學(xué)習(xí)性能較前代提升 60%,支持本地運(yùn)行 ?100 億參數(shù)模型?(如端側(cè) Stable Diffusion)。
  • 旗艦應(yīng)用:華為麒麟 960(G71)、聯(lián)發(fā)科天璣 2000(G710)。

二、核心特性:性能與能效的平衡

Mali GPU 的技術(shù)優(yōu)勢(shì)體現(xiàn)在 ?異構(gòu)計(jì)算? 與 ?標(biāo)準(zhǔn)化支持?:

?圖形渲染能力?:

  • ?Tile-Based Rendering?:分塊渲染減少內(nèi)存帶寬消耗,支持 8K 實(shí)時(shí)渲染與光線追蹤(如 Mali-G710 集成 ASR 超分技術(shù))。
  • ?API 兼容性?:覆蓋 OpenGL ES 3.2、Vulkan 1.3、OpenCL 2.0 及 DirectX 12,適配多平臺(tái)開發(fā)需求。

?AI 與通用計(jì)算?:

  • ?NPU 協(xié)同?:Ethos-U NPU 與 GPU 共享內(nèi)存,支持 Transformer 等大模型推理(如 Mali-G710 提供 8 TOPS 算力)。
  • ?低精度優(yōu)化?:BF16/INT8 量化加速,單位功耗下 MLPerf 性能提升 8 倍。

?能效創(chuàng)新?:

  • ?動(dòng)態(tài)調(diào)頻(DVFS)??:每核獨(dú)立電源管理,功耗較 x86 GPU 降低 40%(如 Mali-G710 無風(fēng)扇設(shè)計(jì)覆蓋 80% 輕薄本市場(chǎng))。
  • ?Chiplet 封裝?:基于 Arm CSA 標(biāo)準(zhǔn)支持多晶?;ミB,提升擴(kuò)展靈活性(如 Socionext 2nm 工藝芯粒方案)。

三、產(chǎn)品線布局:全場(chǎng)景覆蓋

Mali GPU 按性能劃分為四大系列,適配不同市場(chǎng)需求:

?高端旗艦(V/Valhall 系列)??:

  • Mali-G710:16 核設(shè)計(jì),支持 4K 120Hz 顯示與 AI 超分,應(yīng)用于旗艦手機(jī)(如三星 Galaxy S25)和 AI PC。
  • Mali-G78:24 核配置,3DMark Wild Life 跑分超 8500 分,媲美蘋果 M1 GPU。

?中端主流(Bifrost 系列)??:

  • Mali-G57:8 核設(shè)計(jì),主打千元機(jī)市場(chǎng)(如 Redmi Note 系列),支持 Vulkan 1.1 和 OpenCL 1.2。
  • Mali-G68:6 核精簡(jiǎn)版,適配平板和車載娛樂系統(tǒng)。

?入門級(jí)(Midgard 系列)??:

  • Mali-T720:?jiǎn)魏思軜?gòu),用于智能電視和低端物聯(lián)網(wǎng)設(shè)備(如小米電視 6A)。

?定制化方案?:

  • ?Mali Nano?:針對(duì)教育終端和工控設(shè)備推出子平臺(tái),支持 300 美元以下設(shè)備本地化 AI 功能。

四、生態(tài)戰(zhàn)略:軟硬協(xié)同與開發(fā)者支持

ARM 通過 ?工具鏈優(yōu)化? 和 ?生態(tài)聯(lián)盟? 鞏固市場(chǎng)地位:

?開發(fā)工具鏈?:

  • ?KleidiAI?:集成 TensorFlow Lite、PyTorch,模型部署時(shí)間縮短 50%(如阿里倚天 710 部署 Llama3 效率提升 1.9 倍)。
  • ?Mali 調(diào)試套件?:支持 OpenGL ES 仿真器和 Vulkan 性能分析,覆蓋 2200 萬開發(fā)者。

?合作伙伴網(wǎng)絡(luò)?:

  • ?芯片廠商?:聯(lián)發(fā)科(天璣系列)、三星(Exynos)、華為(麒麟)均采用 Mali 公版架構(gòu)。
  • ?云服務(wù)商?:騰訊云、AWS 推出基于 Mali 的 GPU 實(shí)例(如 Graviton3 推理能效提升 60%)。

?標(biāo)準(zhǔn)化認(rèn)證?:


五、挑戰(zhàn)與未來方向

盡管 Mali 占據(jù)安卓 GPU 市場(chǎng) 30% 份額,但仍面臨競(jìng)爭(zhēng)與技術(shù)挑戰(zhàn):

?市場(chǎng)壓力?:

  • ?x86 生態(tài)壁壘?:PC 領(lǐng)域 AMD/Intel 加速布局混合架構(gòu),2025 年 Arm PC 份額僅 13%。
  • ?競(jìng)品追趕?:高通 Adreno 740 光追性能反超,蘋果 M2 GPU 能效優(yōu)勢(shì)顯著。

?技術(shù)突破方向?:

  • ?光線追蹤普及?:Valhall 架構(gòu)需進(jìn)一步優(yōu)化實(shí)時(shí)光追效率,追趕 NVIDIA DLSS 3.0。
  • ?端云協(xié)同計(jì)算?:通過 CoreLink CI-700 互連技術(shù)實(shí)現(xiàn)“端-邊-云”一體化(如騰訊云 Mali 邊緣節(jié)點(diǎn))。

?長(zhǎng)期愿景?:

  • ARM 目標(biāo) 2030 年賦能 ?50 億臺(tái)智能設(shè)備,成為 AIoT 與 6G 網(wǎng)絡(luò)的算力底座。

總結(jié)

ARM Mali 通過持續(xù)架構(gòu)迭代(Utgard → Valhall)和生態(tài)整合,已成為移動(dòng) GPU 領(lǐng)域的核心力量。其技術(shù)特性與 ?異構(gòu)計(jì)算、能效優(yōu)化? 的深度結(jié)合,使其在智能手機(jī)、AI PC 及邊緣計(jì)算場(chǎng)景中展現(xiàn)出強(qiáng)大競(jìng)爭(zhēng)力。未來,隨著 Chiplet 技術(shù)和光線追蹤的進(jìn)一步成熟,Mali 或?qū)⒃诟咝阅苡?jì)算市場(chǎng)開辟新戰(zhàn)場(chǎng),推動(dòng)“端側(cè)智能普惠化”進(jìn)程。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • ARM
    ARM
    +關(guān)注

    關(guān)注

    135

    文章

    9469

    瀏覽量

    387023
  • gpu
    gpu
    +關(guān)注

    關(guān)注

    28

    文章

    5055

    瀏覽量

    134054
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    Arm助力MediaTek天璣9500重塑旗艦體驗(yàn)

    Arm 合作伙伴產(chǎn)品上“芯”!近日,MediaTek 發(fā)布了天璣 9500 旗艦 5G 智能體 AI 芯片,該芯片基于啟用 SME2 的全新 Arm C1 CPU 集群打造,并搭載 Arm M
    的頭像 發(fā)表于 10-10 11:28 ?688次閱讀

    Arm神經(jīng)技術(shù)是業(yè)界首創(chuàng)在 Arm GPU 上增添專用神經(jīng)加速器的技術(shù),移動(dòng)設(shè)備上實(shí)現(xiàn)PC級(jí)別的AI圖形性能

    Arm 神經(jīng)技術(shù)是業(yè)界首創(chuàng)在 Arm GPU 上增添專用神經(jīng)加速器的技術(shù),首次在移動(dòng)設(shè)備上實(shí)現(xiàn) PC 級(jí)別的 AI 圖形性能,為未來的端側(cè) AI 創(chuàng)新奠定基礎(chǔ) 神經(jīng)超級(jí)采樣是 Arm
    的頭像 發(fā)表于 08-14 17:59 ?2377次閱讀

    瑞薩365 深度解讀

    技術(shù)架構(gòu)、核心功能、行業(yè)影響及未來展望四個(gè)維度進(jìn)行深度解讀: 一、技術(shù)架構(gòu):融合硬件與設(shè)計(jì)軟件的跨領(lǐng)域協(xié)作平臺(tái) 瑞薩365基于Altium 365云平臺(tái)構(gòu)建,整合了瑞薩的半導(dǎo)體產(chǎn)品組合與Altium的設(shè)計(jì)工具鏈,形成從芯片選型到系統(tǒng)部署的全流程數(shù)字環(huán)境。其核心架構(gòu)圍繞 五
    的頭像 發(fā)表于 06-06 09:58 ?1429次閱讀
    瑞薩365 <b class='flag-5'>深度</b><b class='flag-5'>解讀</b>

    GPU架構(gòu)深度解析

    GPU架構(gòu)深度解析從圖形處理到通用計(jì)算的進(jìn)化之路圖形處理單元(GPU),作為現(xiàn)代計(jì)算機(jī)中不可或缺的一部分,已經(jīng)從最初的圖形渲染專用處理器,發(fā)展成為強(qiáng)大的并行計(jì)算引擎,廣泛應(yīng)用于人工智能、科學(xué)計(jì)算
    的頭像 發(fā)表于 05-30 10:36 ?948次閱讀
    <b class='flag-5'>GPU</b>架構(gòu)<b class='flag-5'>深度</b>解析

    Arm 公司面向 PC 市場(chǎng)的 ?Arm Niva? 深度解讀

    面向 PC 市場(chǎng)的 ? Arm Niva ? 深度解讀 ? Arm Niva ? 是 Arm 公司為 PC 市場(chǎng)推出的核心計(jì)算平臺(tái),屬于其“
    的頭像 發(fā)表于 05-29 09:56 ?1198次閱讀

    Arm 公司面向移動(dòng)端市場(chǎng)的 ?Arm Lumex? 深度解讀

    面向移動(dòng)端市場(chǎng)的 ? Arm Lumex ? 深度解讀 ? Arm Lumex ? 是 Arm 公司面向移動(dòng)設(shè)備市場(chǎng)推出的新一代計(jì)算平臺(tái),隸
    的頭像 發(fā)表于 05-29 09:54 ?3905次閱讀

    Arm 公司面向汽車市場(chǎng)的 ?Arm Zena? 深度解讀

    面向汽車市場(chǎng)的 ? Arm Zena ? 深度解讀 Arm Zena 是 Arm 公司面向智能汽車領(lǐng)域推出的核心計(jì)算平臺(tái),屬于其“平臺(tái)優(yōu)先”
    的頭像 發(fā)表于 05-29 09:51 ?1868次閱讀

    摩爾線程與當(dāng)虹科技達(dá)成深度合作

    近日,摩爾線程與當(dāng)虹科技達(dá)成深度合作,基于國(guó)產(chǎn)GPU成功完成了與BlackEye多模態(tài)視聽大模型的深度融合。雙方聯(lián)手打造專業(yè)級(jí)視聽“引擎”,并在超高清GPU算力場(chǎng)景中成功落地。
    的頭像 發(fā)表于 03-20 15:22 ?1117次閱讀

    瑞芯微米爾RK3562國(guó)產(chǎn)核心板,ARM中量級(jí)多面手

    網(wǎng)關(guān)、邊緣計(jì)算等領(lǐng)域提供了高性價(jià)比的解決方案。 核心板基于 RK3562 或RK3562J處理器,采用四核ARM Cortex-A53架構(gòu),主頻高達(dá)2GHz,集成Mali-G52 GPU,支持4K視頻解碼
    發(fā)表于 02-28 15:32

    NVIDIA GPU助力科研人員探索外星世界

    NVIDIA GPU 驅(qū)動(dòng)的深度學(xué)習(xí)在短短幾秒內(nèi)解讀出了卡西尼號(hào)土星探測(cè)器多年來收集的海量數(shù)據(jù),為科研人員探索外星世界提供了更加智能的方式。
    的頭像 發(fā)表于 02-27 10:37 ?755次閱讀

    深度解讀 30KPA64A 單向 TVS:64V 擊穿機(jī)制與高效防護(hù)策略

    深度解讀 30KPA64A 單向 TVS:64V 擊穿機(jī)制與高效防護(hù)策略
    的頭像 發(fā)表于 02-24 13:52 ?527次閱讀
    <b class='flag-5'>深度</b><b class='flag-5'>解讀</b> 30KPA64A 單向 TVS:64V 擊穿機(jī)制與高效防護(hù)策略

    深度學(xué)習(xí)工作負(fù)載中GPU與LPU的主要差異

    ,一個(gè)新的競(jìng)爭(zhēng)力量——LPU(Language Processing Unit,語言處理單元)已悄然登場(chǎng),LPU專注于解決自然語言處理(NLP)任務(wù)中的順序性問題,是構(gòu)建AI應(yīng)用不可或缺的一環(huán)。 本文旨在探討深度學(xué)習(xí)工作負(fù)載中GPU與LPU的主要差異,并深入分析它們的架構(gòu)
    的頭像 發(fā)表于 12-09 11:01 ?3754次閱讀
    <b class='flag-5'>深度</b>學(xué)習(xí)工作負(fù)載中<b class='flag-5'>GPU</b>與LPU的主要差異

    GPU深度學(xué)習(xí)中的應(yīng)用 GPUs在圖形設(shè)計(jì)中的作用

    隨著人工智能技術(shù)的飛速發(fā)展,深度學(xué)習(xí)作為其核心部分,已經(jīng)成為推動(dòng)技術(shù)進(jìn)步的重要力量。GPU(圖形處理單元)在深度學(xué)習(xí)中扮演著至關(guān)重要的角色,其強(qiáng)大的并行處理能力使得訓(xùn)練復(fù)雜的神經(jīng)網(wǎng)絡(luò)模型成為可能
    的頭像 發(fā)表于 11-19 10:55 ?2014次閱讀

    4G模組加解密藝術(shù):通用函數(shù)的深度解讀

    今天是對(duì)加解密通用函數(shù)的深度解讀,我將詳細(xì)講解,建議收藏,不可錯(cuò)過。
    的頭像 發(fā)表于 11-12 09:58 ?819次閱讀
    4G模組加解密藝術(shù):通用函數(shù)的<b class='flag-5'>深度</b><b class='flag-5'>解讀</b>

    PyTorch GPU 加速訓(xùn)練模型方法

    深度學(xué)習(xí)領(lǐng)域,GPU加速訓(xùn)練模型已經(jīng)成為提高訓(xùn)練效率和縮短訓(xùn)練時(shí)間的重要手段。PyTorch作為一個(gè)流行的深度學(xué)習(xí)框架,提供了豐富的工具和方法來利用GPU進(jìn)行模型訓(xùn)練。 1. 了解
    的頭像 發(fā)表于 11-05 17:43 ?2005次閱讀