亚洲精品久久久久久久久久久,亚洲国产精品一区二区制服,亚洲精品午夜精品,国产成人精品综合在线观看,最近2019中文字幕一页二页

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

英特爾AMX助華棲云多場(chǎng)景AI推理性能大幅提升多達(dá)96倍

英特爾中國 ? 來源:英特爾中國 ? 2024-01-13 10:46 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

AI技術(shù)應(yīng)用已經(jīng)深入到各行各業(yè),特別是云服務(wù)提供商將AI能力集成到云服務(wù)中,能夠更好地滿足用戶對(duì)性能、效率和體驗(yàn)的需求。而在主流媒體全面進(jìn)入互聯(lián)網(wǎng)陣地的大趨勢(shì)下,媒體行業(yè)面臨融合、高效、智能化的挑戰(zhàn)。成都華棲云科技有限公司(簡(jiǎn)稱:華棲云)正是這樣一家面向蓬勃興起的泛媒體、大視頻時(shí)代的企業(yè)用戶市場(chǎng),為用戶提供媒體云服務(wù)的提供商。

為了給用戶帶來更加智慧的應(yīng)用體驗(yàn),大幅提升內(nèi)容來源的寬度,內(nèi)容生產(chǎn)的速度、內(nèi)容發(fā)布的廣度,華棲云媒體云平臺(tái)正在集成廣泛的AI技術(shù),推動(dòng)光學(xué)字符識(shí)別(OCR) 識(shí)別、圖像超分修復(fù)、人體姿態(tài)識(shí)別、大型語言模型 (LLM) 等應(yīng)用的落地。

對(duì)于最終用戶而言,這些 AI 技術(shù)對(duì)于媒體云基礎(chǔ)設(shè)施帶來了 AI 推理等方面的算力挑戰(zhàn),用戶需要通過高性能、低成本、高靈活度的算力方案,來滿足實(shí)際應(yīng)用的嚴(yán)苛需求。于是,華棲云與英特爾合作,在媒體云平臺(tái)上驗(yàn)證了第四代英特爾至強(qiáng)可擴(kuò)展處理器及其內(nèi)置的英特爾高級(jí)矩陣擴(kuò)展(英特爾AMX)加速器。驗(yàn)證結(jié)果顯示,在英特爾AMX 的加持下,第四代英特爾至強(qiáng)可擴(kuò)展處理器可顯著提升大型語言模型、人體姿態(tài)識(shí)別、CLIP 圖像文本分類處理模型、OCR 識(shí)別、圖像超分修復(fù)等模型的推理能力,提供了高性價(jià)比、高靈活性的 AI 基礎(chǔ)設(shè)施構(gòu)建選項(xiàng)。

英特爾AMX及CPU大模型推理與主流GPU性能一致

華棲云之所以選擇基于英特爾 CPU 的 AI 推理方案,是因?yàn)樵摲桨改軌虺浞掷妹襟w云已有的服務(wù)器資源,在架構(gòu)上無需進(jìn)行大幅變動(dòng),性價(jià)比較高,且在性能上足以滿足智能資源管理、智能審核、智能生產(chǎn)等場(chǎng)景所需。

現(xiàn)在,AIGC技術(shù)得到越來越多應(yīng)用。華棲云同樣采用了基于大語言模型的 AIGC 技術(shù),使智能媒體云平臺(tái)能夠自動(dòng)進(jìn)行要點(diǎn)歸納及內(nèi)容創(chuàng)作、改寫,做到一課一虛擬助教,提高師生教學(xué)互動(dòng)能力。此外,AIGC 技術(shù)還能用于課程內(nèi)容識(shí)別理解等更多場(chǎng)景,帶來智慧教育新體驗(yàn)。所以,大語言模型的推理能力對(duì)于華棲云至關(guān)重要。

華棲云采用內(nèi)置AI加速器英特爾AMX的第四代英特爾至強(qiáng)可擴(kuò)展處理器,在大語言模型推理性能上表現(xiàn)出強(qiáng)勁實(shí)力。在華棲云的測(cè)試中,對(duì)比了某主流 GPU 與第四代英特爾至強(qiáng)可擴(kuò)展處理器的大語言模型推理性能,測(cè)試數(shù)據(jù)如圖1 所示,兩者性能基本保持在同一層面。這得益于英特爾AMX 針對(duì)廣泛的硬件和軟件優(yōu)化,通過提供矩陣類型的運(yùn)算,顯著增加了人工智能應(yīng)用程序的每時(shí)鐘指令數(shù) (IPC),可為 AI 工作負(fù)載中的訓(xùn)練和推理上提供顯著的性能提升。從而使華棲云使用CPU不額外增加成本的情況下,獲得了同樣的AI推理性能。

70fe09d6-b1b9-11ee-8b88-92fbcf53809c.png

圖1:大語言模型推理性能測(cè)試1

英特爾助華棲云多個(gè)AI推理場(chǎng)景性能大幅提升

除了大語言模型推理之外,華棲云多項(xiàng)AI推理性能均在英特爾至強(qiáng)可擴(kuò)展處理器和英特爾AMX的加持下得到顯著提升。

第一,對(duì)比語言圖像預(yù)訓(xùn)練 (CLIP)是一種在各種(圖像、文本)對(duì)上訓(xùn)練的神經(jīng)網(wǎng)絡(luò),可以用自然語言指示它在給定圖像的情況下推理最相關(guān)的文本片段,而無需直接針對(duì)任務(wù)進(jìn)行優(yōu)化。在媒體云平臺(tái)場(chǎng)景中,CLIP 不僅提供了先進(jìn)的圖像分類結(jié)果,而且還提供了對(duì)象分類、視頻中的動(dòng)作識(shí)別和 OCR 等其他視覺任務(wù)。CLIP 有助于媒體云平臺(tái)在不構(gòu)建巨大數(shù)據(jù)集的前提下,訓(xùn)練高質(zhì)量的模型,同時(shí)降低計(jì)算成本。

華棲云 CLIP 算法推理性能測(cè)試數(shù)據(jù)如圖 2 所示,在將模型轉(zhuǎn)化為BF16 后,第四代英特爾至強(qiáng)可擴(kuò)展處理器的 CLIP 推理性能相較第二代英特爾至強(qiáng)可擴(kuò)展處理器最高提升了 95.63 倍2。

711d3d2e-b1b9-11ee-8b88-92fbcf53809c.png

圖2:華棲云 CLIP 算法推理性能測(cè)試3

第二,OCR 識(shí)別在媒體云平臺(tái)中,常用于圖像中的信息提取,如課件識(shí)別、版面識(shí)別、試卷識(shí)別等。華棲云在測(cè)試中,對(duì)比了第二代英特爾至強(qiáng)可擴(kuò)展處理器與第四代英特爾至強(qiáng)可擴(kuò)展處理器的單線程吞吐性能差異。測(cè)試數(shù)據(jù)如圖 3 所示,對(duì)比第二代英特爾至強(qiáng)可擴(kuò)展處理器,第四代英特爾至強(qiáng)可擴(kuò)展處理器的性能最高可提升約 6.41 倍4。

7131926a-b1b9-11ee-8b88-92fbcf53809c.png

圖3:OCR 單線程吞吐測(cè)試5

第三,超分辨率 (Super-Resolution) 是指通過硬件或軟件的方法提高原有圖像的分辨率,超分辨率算法有效提高放大后圖像的質(zhì)量,同時(shí)節(jié)約帶寬、存儲(chǔ)等方面的資源。ESRGAN 是一種基于生成對(duì)抗網(wǎng)絡(luò) (GAN) 的圖像超分辨率算法,其主要思想是通過學(xué)習(xí)低分辨率 (LR) 圖像與其高分辨率 (HR) 對(duì)應(yīng)物之間的映射,來實(shí)現(xiàn)從 LR 圖像到 HR 圖像的映射過程,從而實(shí)現(xiàn)圖像的超分辨率。SwinIR 則是一種基于 Swin Transformer 的圖像超分辨率重建算法,相對(duì)于傳統(tǒng)的 Transformer 模型,在處理圖像等二維數(shù)據(jù)時(shí),具有更好的并行性和更高的計(jì)算效率。

華棲云測(cè)試了第二代/第四代英特爾至強(qiáng)可擴(kuò)展處理器在ESRGAN 算法推理中的性能表現(xiàn),測(cè)試數(shù)據(jù)如圖 4 所示,在將模型轉(zhuǎn)化為 BF16 后,第四代英特爾至強(qiáng)可擴(kuò)展處理器的ESRGAN 推理性能相較第二代英特爾至強(qiáng)可擴(kuò)展處理器最高提升了 3 倍6。

7147808e-b1b9-11ee-8b88-92fbcf53809c.png

圖4:ESRGAN 算法吞吐性能測(cè)試7

SwinIR 模型推理性能測(cè)試數(shù)據(jù)如圖 5 所示,在將模型轉(zhuǎn)化為BF16 后,第四代英特爾至強(qiáng)可擴(kuò)展處理器的 SwinIR 推理性能相較第二代英特爾至強(qiáng)可擴(kuò)展處理器最高提升了 7.4 倍8。

7156acda-b1b9-11ee-8b88-92fbcf53809c.png

圖5:SwinIR 模型推理性能測(cè)試9

第四,人體姿態(tài)識(shí)別算法能夠通過圖像獲取并識(shí)別人體骨架信息,通過算法判斷動(dòng)作類別和姿態(tài),從而實(shí)現(xiàn)動(dòng)作識(shí)別。華棲云在智能媒體云平臺(tái)中采用了基于 OpenPose 方法與 EfficientHRNet 方法的多人 2D 姿勢(shì)估計(jì)網(wǎng)絡(luò),針對(duì)圖像中的每個(gè)人,網(wǎng)絡(luò)都會(huì)檢測(cè)到一個(gè)人體姿勢(shì):一個(gè)由關(guān)鍵點(diǎn)和關(guān)鍵點(diǎn)之間的連接組成的身體骨架。

華棲云基于 OpenPose 方法的人體姿態(tài)識(shí)別算法推理性能測(cè)試數(shù)據(jù)如圖 6 所示,在將模型轉(zhuǎn)化為 BF16 后,第四代英特爾至強(qiáng)可擴(kuò)展處理器的 OpenPose 推理性能相較第二代英特爾至強(qiáng)可擴(kuò)展處理器最高提升了 64.82 倍10。

7170307e-b1b9-11ee-8b88-92fbcf53809c.png

圖6:基于 OpenPose 方法的人體姿態(tài)識(shí)別推理性能測(cè)試11

基于CPU的AI推理方案為華棲云降低TCO并增加靈活性

在采用內(nèi)置了英特爾AMX 的第四代英特爾至強(qiáng)可擴(kuò)展處理器之后,華棲云提升了多種典型算法的推理性能,滿足了教育、廣電等客戶對(duì)于智能媒體云平臺(tái)的性能要求,為客戶帶來以下價(jià)值:

在保證模型精度的前提下,顯著提升多個(gè) AI 模型的性能表現(xiàn),有助于提供更加高效的智能媒體云服務(wù); 通過軟件優(yōu)化充分釋放了硬件潛力,支持有效利用服務(wù)器資源,無需獨(dú)立、專用的 AI 加速器,有助于降低媒體云平臺(tái)構(gòu)建的 TCO; 通用的 CPU 平臺(tái)不僅能夠高效支撐 AI 推理,而且能夠靈活應(yīng)對(duì)編解碼、轉(zhuǎn)碼等負(fù)載,更具可擴(kuò)展性。

AIGC 等AI技術(shù)的應(yīng)用正在為媒體行業(yè)注入充沛的活力,推動(dòng)媒體行業(yè)的智能化轉(zhuǎn)型。華棲云以超高清智能媒體處理云平臺(tái)為驅(qū)動(dòng)引擎,在泛媒體、大教育、政企等行業(yè)形成了成熟的云服務(wù)及云解決方案。通過與英特爾合作,并利用英特爾AMX 等創(chuàng)新技術(shù),華棲云正在推動(dòng)新一代智能融媒體平臺(tái)覆蓋媒體內(nèi)容生產(chǎn)、管理、發(fā)布、運(yùn)營和數(shù)據(jù)化管理全流程應(yīng)用。

英特爾AMX及英特爾至強(qiáng)可擴(kuò)展處理器以不遜于GPU的AI推理性能,為華棲云降低了云平臺(tái)TCO的同時(shí),提供了更大的靈活性和擴(kuò)展性,支持華棲云智能媒體云平臺(tái)以新思維、新技術(shù)重塑媒體全鏈路生產(chǎn)與運(yùn)營模型,建立集內(nèi)容、產(chǎn)品、用戶、數(shù)據(jù)一體的全媒體融合運(yùn)營體系,實(shí)現(xiàn)媒體基于內(nèi)容的價(jià)值再造。






審核編輯:劉清

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 處理器
    +關(guān)注

    關(guān)注

    68

    文章

    20115

    瀏覽量

    244699
  • 英特爾
    +關(guān)注

    關(guān)注

    61

    文章

    10247

    瀏覽量

    178723
  • OCR
    OCR
    +關(guān)注

    關(guān)注

    0

    文章

    170

    瀏覽量

    17012
  • ai技術(shù)
    +關(guān)注

    關(guān)注

    1

    文章

    1311

    瀏覽量

    25558
  • AI加速器
    +關(guān)注

    關(guān)注

    1

    文章

    73

    瀏覽量

    9381

原文標(biāo)題:英特爾? AMX 助華棲云多場(chǎng)景 AI 推理性能大幅提升,最多達(dá) 96 倍

文章出處:【微信號(hào):英特爾中國,微信公眾號(hào):英特爾中國】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    發(fā)力圖形工作站和AI推理市場(chǎng),英特爾大顯存GPU亮相灣芯展

    英特爾發(fā)布了面向?qū)I(yè)的銳炫Pro B50和B60。這兩款顯卡比較RTX2000和5660Ti,有哪些性能上的優(yōu)勢(shì)?在支持AI推理工作站和大模型部署上,B60有哪些獨(dú)到之處?10月16日
    的頭像 發(fā)表于 10-22 13:40 ?1w次閱讀
    發(fā)力圖形工作站和<b class='flag-5'>AI</b><b class='flag-5'>推理</b>市場(chǎng),<b class='flag-5'>英特爾</b>大顯存GPU亮相灣芯展

    到端:英特爾展示全棧AI能力,覆蓋、邊、PC場(chǎng)景

    2025年9月25日,杭州——今日,在2025云棲大會(huì)上,英特爾與阿里帶來了多項(xiàng)基礎(chǔ)設(shè)施創(chuàng)新成果,包括兼容代際服務(wù)器(支持第五代英特爾
    的頭像 發(fā)表于 09-26 17:27 ?1167次閱讀
    從<b class='flag-5'>云</b>到端:<b class='flag-5'>英特爾</b>展示全棧<b class='flag-5'>AI</b>能力,覆蓋<b class='flag-5'>云</b>、邊、PC<b class='flag-5'>多</b><b class='flag-5'>場(chǎng)景</b>

    直擊Computex 2025:英特爾重磅發(fā)布新一代GPU,圖形和AI性能躍升3.4

    電子發(fā)燒友原創(chuàng)? 章鷹 5月19日,在Computex 2025上,英特爾發(fā)布了最新全新圖形處理器(GPU)和AI加速器產(chǎn)品系列。包括全新英特爾銳炫? Pro B系列GPU——英特爾
    的頭像 發(fā)表于 05-21 00:57 ?6769次閱讀
    直擊Computex 2025:<b class='flag-5'>英特爾</b>重磅發(fā)布新一代GPU,圖形和<b class='flag-5'>AI</b><b class='flag-5'>性能</b>躍升3.4<b class='flag-5'>倍</b>

    直擊Computex2025:英特爾重磅發(fā)布新一代GPU,圖形和AI性能躍升3.4

    5月19日,在Computex 2025上,英特爾發(fā)布了最新全新圖形處理器(GPU)和AI加速器產(chǎn)品系列。包括全新英特爾銳炫? Pro B系列GPU——英特爾銳炫Pro B60和
    的頭像 發(fā)表于 05-20 12:27 ?5010次閱讀
    直擊Computex2025:<b class='flag-5'>英特爾</b>重磅發(fā)布新一代GPU,圖形和<b class='flag-5'>AI</b><b class='flag-5'>性能</b>躍升3.4<b class='flag-5'>倍</b>

    英特爾發(fā)布全新GPU,AI和工作站迎來新選擇

    Pro B50 GPU,搭載了為AI推理和專業(yè)工作站量身定制的配置,擴(kuò)展了英特爾銳炫Pro產(chǎn)品系列。 英特爾 ? Gaudi 3 AI 加速
    發(fā)表于 05-20 11:03 ?1620次閱讀

    1.9性能提升英特爾至強(qiáng)6在MLPerf基準(zhǔn)測(cè)試中表現(xiàn)卓越

    關(guān)鍵項(xiàng)目中,性能表現(xiàn)卓越。測(cè)試結(jié)果顯示,相較于上一代產(chǎn)品,該處理器的AI性能實(shí)現(xiàn)了高達(dá)1.9的顯著提升,這也充分顯示了至強(qiáng)6處理器作為現(xiàn)代
    的頭像 發(fā)表于 04-07 10:58 ?437次閱讀

    英特爾?獨(dú)立顯卡與OpenVINO?工具套件結(jié)合使用時(shí),無法運(yùn)行推理怎么解決?

    使用英特爾?獨(dú)立顯卡與OpenVINO?工具套件時(shí)無法運(yùn)行推理
    發(fā)表于 03-05 06:56

    全新英特爾至強(qiáng)6處理器來襲,現(xiàn)代數(shù)據(jù)中心的性能與能效平衡“大師”

    英特爾進(jìn)一步豐富至強(qiáng)6處理器產(chǎn)品組合,為行業(yè)提供多款滿足廣泛工作負(fù)載的CPU選擇。 新聞亮點(diǎn) ·?英特爾推出全新英特爾??至強(qiáng)??6性能核處理器,以卓越
    的頭像 發(fā)表于 02-25 17:39 ?582次閱讀

    英特爾至強(qiáng)6助力HPE Gen12,AI推理性能提升3!

    ,CPU處理器永遠(yuǎn)都是C位的存在,沒有它的基礎(chǔ)性支撐,其他一切都是空中樓閣。 當(dāng)然,CPU處理器也在積極適應(yīng)新的時(shí)代趨勢(shì),既要不斷增強(qiáng)計(jì)算性能,也要低碳環(huán)保提高能效,但它們倆如同硬幣的正反面,不可能完美兼顧,那該怎么辦呢? 對(duì)此,英特爾的解決方案是兵分
    的頭像 發(fā)表于 02-18 14:18 ?481次閱讀
    <b class='flag-5'>英特爾</b>至強(qiáng)6助力HPE Gen12,<b class='flag-5'>AI</b><b class='flag-5'>推理性能</b><b class='flag-5'>提升</b>3<b class='flag-5'>倍</b>!

    英特爾Gaudi 2D AI加速器助力DeepSeek Janus Pro模型性能提升

    近日,DeepSeek公司發(fā)布了備受矚目的Janus Pro模型,其憑借超強(qiáng)性能和高精度在業(yè)界引發(fā)了廣泛關(guān)注。為了進(jìn)一步提升該模型的應(yīng)用效能,英特爾宣布其Gaudi 2D AI加速器已
    的頭像 發(fā)表于 02-10 11:10 ?878次閱讀

    使用NVIDIA推理平臺(tái)提高AI推理性能

    NVIDIA推理平臺(tái)提高了 AI 推理性能,為零售、電信等行業(yè)節(jié)省了數(shù)百萬美元。
    的頭像 發(fā)表于 02-08 09:59 ?1173次閱讀
    使用NVIDIA<b class='flag-5'>推理</b>平臺(tái)提高<b class='flag-5'>AI</b><b class='flag-5'>推理性能</b>

    英特爾塑造未來出行:AI增強(qiáng)型軟件定義汽車

    近日,英特爾正引領(lǐng)一場(chǎng)汽車行業(yè)的革命,通過其創(chuàng)新技術(shù)為用戶帶來前所未有的車載體驗(yàn)?;?b class='flag-5'>英特爾第一代AI增強(qiáng)型軟件定義車載SoC(系統(tǒng)級(jí)芯片)和全新英特爾銳炫?車載獨(dú)立顯卡,
    的頭像 發(fā)表于 01-14 11:20 ?798次閱讀

    英特爾與扣子平臺(tái)合作推出AI PC Bot專區(qū)和端側(cè)插件商店

    通過創(chuàng)新的端協(xié)同技術(shù),為開發(fā)者提供更為便捷、高效的智能應(yīng)用開發(fā)環(huán)境。 通過扣子的“端插件”機(jī)制,英特爾AI PC的PC操控、本地知識(shí)庫、本地推理以及本地生成等核心功能被巧妙地嵌入到扣
    的頭像 發(fā)表于 12-31 10:24 ?1381次閱讀

    英特爾與扣子平臺(tái)合作推出AI PC Bot專區(qū)與端側(cè)插件商店

    。 Coze-AIPC是扣子平臺(tái)與英特爾聯(lián)合發(fā)布的增強(qiáng)版智能體開發(fā)平臺(tái),它深度整合了英特爾AI PC的端側(cè)能力與扣子平臺(tái)的優(yōu)勢(shì)。通過扣子
    的頭像 發(fā)表于 12-27 14:11 ?1332次閱讀

    英特爾帶您解鎖上智算新引擎

    在近日舉辦的2024火山引擎FORCE原動(dòng)力大會(huì)上,英特爾與火山引擎聯(lián)合發(fā)布基于英特爾 至強(qiáng) 6 性能核處理器的第四代服務(wù)器實(shí)例,以打造彈性算力底座的產(chǎn)品化實(shí)踐。同時(shí),英特爾也攜手扣子
    的頭像 發(fā)表于 12-23 14:05 ?1168次閱讀