從理論上講,異構(gòu)多核設(shè)備可以配備一個計算塊,該計算塊針對給定用例的任何類型的操作進行了優(yōu)化。用于視頻處理的 GPU、用于對象識別的神經(jīng)網(wǎng)絡(luò)處理器、運行操作系統(tǒng)的 CPU 等等。與同級別的同質(zhì)處理器相比,不同用途的內(nèi)核為 SoC 提供了更大的靈活性,因此在更廣泛的工作負載范圍內(nèi)具有更高的性能和更低的功耗。
但當您開始考慮基于邊緣的 AI、計算機視覺等應(yīng)用程序的要求時,事實是 I/O 和內(nèi)存變得與原始處理性能一樣受到限制,甚至更多。
“內(nèi)存速度只會這么快,對吧?” 英偉達嵌入式與邊緣計算副總裁兼總經(jīng)理 Deepu Talla “它并沒有呈指數(shù)級增長。由于大小,位寬大致相同:它可以是 16 位、32 位、64 位、128 位,等等。大多數(shù)嵌入式處理器通常具有 32 位甚至 16 位接口,這也是出于成本和尺寸的原因。
“內(nèi)存的速度只是一代比一代增長 2 倍,而且這通常每三年發(fā)生一次,”他繼續(xù)說道?!叭欢?,SoC 中的計算需求可能增加了 10 倍或 20 倍?!?/p>
您如何協(xié)調(diào)計算性能的這種不成比例的增長與內(nèi)存技術(shù)的相對較小的進步?特別是當處理器演變成獨特的邏輯集合時,它們都需要自己訪問內(nèi)存等資源。
根據(jù)塔拉的說法,你把它給了他們。以下是嵌入式存儲器架構(gòu)為滿足下一代異構(gòu)多核處理器的需求而發(fā)展的三種方式。
1、內(nèi)核專用 SRAM
“如果你看很多這些嵌入式處理器,它們過去一直都有 SRAM,”Talla 說?!艾F(xiàn)在,對于每個特定單元,我們都有本地 SRAM,它從 DRAM 獲取數(shù)據(jù),在本地存儲并處理它,然后發(fā)回最終輸出?!?/p>
特定于內(nèi)核的 SRAM 提供了幾個優(yōu)勢,首先是由于不必將臨時數(shù)據(jù)寫回片外 DRAM 所帶來的內(nèi)存性能提升。
這種架構(gòu)還具有降低功耗的額外好處,因為超低電壓 SRAM 模塊位于 SoC 內(nèi)相應(yīng)的邏輯 IP 附近或附近。
“如果你使用 DRAM,這可能是一個數(shù)量級的功率,所以你實際上是通過使用這些技術(shù)來節(jié)省功率,”Talla 解釋道。
2、增加系統(tǒng)內(nèi)存
今天的嵌入式處理器具有高達 4 MB 到 8 MB 的系統(tǒng)內(nèi)存。此系統(tǒng)內(nèi)存并非專用于任何特定內(nèi)核,并且可以在 CPU、GPU 和加速器等元素之間共享。
與專用 SRAM 類似,更多共享系統(tǒng)內(nèi)存的主要好處是更少的 DRAM 訪問。例如,傳統(tǒng)的視頻編碼序列如下所示:
DRAM -》 視頻編碼器 -》 DRAM -》 附加計算 -》 DRAM
增加的系統(tǒng)緩存可以實現(xiàn)這一點:
DRAM -》 視頻編碼器 -》 系統(tǒng)內(nèi)存 -》 附加計算 -》 DRAM
如前所述,不同之處在于單獨的內(nèi)核不必不斷地從片外 DRAM 中獲取數(shù)據(jù),因為大系統(tǒng)內(nèi)存消除了對中間步驟的需要。
3、增加緩存大小
最后,隨著更新的工藝技術(shù)使更高容量的內(nèi)存更便宜,緩存大小將不可避免地增加。在異構(gòu) SoC 上發(fā)現(xiàn)的用于 CPU、GPU、DSP 和其他核心架構(gòu)的更大緩存也將減少 DRAM 流量。
并且將增加的緩存大小與前兩個進步配對開始產(chǎn)生一些重大收益。
“更多的 SRAM、通用的系統(tǒng)內(nèi)存以及更多的大容量緩存可以讓您在接下來的三到五年內(nèi)將性能提高 10 倍到 100 倍,即使內(nèi)存帶寬可能只增加了一倍或四倍,”Talla 指出出去。
審核編輯:郭婷
-
嵌入式
+關(guān)注
關(guān)注
5178文章
20066瀏覽量
326749 -
DRAM
+關(guān)注
關(guān)注
40文章
2365瀏覽量
187651 -
編碼器
+關(guān)注
關(guān)注
45文章
3886瀏覽量
141090
發(fā)布評論請先 登錄
嵌入式達到什么水平才能就業(yè)?
【老法師】多核異構(gòu)處理器中M核程序的啟動、編寫和仿真
嵌入式和單片機,是同一個東西嗎?
Linux嵌入式和單片機嵌入式的區(qū)別?
嵌入式力矩電機的設(shè)計方法研究
精選好文!噪聲系數(shù)測量的三種方法
智能配電新紀元:基于飛凌嵌入式T536核心板的DTU解決方案
智能配電新紀元:基于飛凌嵌入式T536核心板的DTU解決方案
嵌入式系統(tǒng)中的代碼優(yōu)化與壓縮技術(shù)
如何提高嵌入式代碼質(zhì)量?
嵌入式主板的概述與發(fā)展
FPGA頻率測量的三種方法
新手怎么學嵌入式?
什么是嵌入式人工智能
三種常見平方根算法的電路設(shè)計及Verilog實現(xiàn)與仿真

為異構(gòu)多核實現(xiàn)十倍嵌入式內(nèi)存性能的三種方法
評論