亚洲精品久久久久久久久久久,亚洲国产精品一区二区制服,亚洲精品午夜精品,国产成人精品综合在线观看,最近2019中文字幕一页二页

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

64 位 CPU 的計算性能一定比 32 位 CPU 高很多嗎

Linux愛好者 ? 來源:Linux愛好者 ? 作者:Linux愛好者 ? 2020-10-14 14:12 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

前言

代碼寫了那么多,你知道a = 1 + 2這條代碼是怎么被 CPU 執(zhí)行的嗎?

軟件用了那么多,你知道軟件的 32 位和 64 位之間的區(qū)別嗎?再來 32 位的操作系統(tǒng)可以運(yùn)行在 64 位的電腦上嗎?64 位的操作系統(tǒng)可以運(yùn)行在 32 位的電腦上嗎?如果不行,原因是什么?

CPU 看了那么多,我們都知道 CPU 通常分為 32 位和 64 位,你知道 64 位相比 32 位 CPU 的優(yōu)勢在哪嗎?64 位 CPU 的計算性能一定比 32 位 CPU 高很多嗎?

不知道也不用慌張,接下來就循序漸進(jìn)的、一層一層的攻破這些問題。

正文

圖靈機(jī)的工作方式

要想知道程序執(zhí)行的原理,我們可以先從「圖靈機(jī)」說起,圖靈的基本思想是用機(jī)器來模擬人們用紙筆進(jìn)行數(shù)學(xué)運(yùn)算的過程,而且還定義了計算機(jī)由哪些部分組成,程序又是如何執(zhí)行的。

圖靈機(jī)長什么樣子呢?你從下圖可以看到圖靈機(jī)的實(shí)際樣子:

圖來源自:http://www.kristergustafsson.me/turing-machine/

圖靈機(jī)的基本組成如下:

有一條「紙帶」,紙帶由一個個連續(xù)的格子組成,每個格子可以寫入字符,紙帶就好比內(nèi)存,而紙帶上的格子的字符就好比內(nèi)存中的數(shù)據(jù)或程序;

有一個「讀寫頭」,讀寫頭可以讀取紙帶上任意格子的字符,也可以把字符寫入到紙帶的格子;

讀寫頭上有一些部件,比如存儲單元、控制單元以及運(yùn)算單元:
1、存儲單元用于存放數(shù)據(jù);
2、控制單元用于識別字符是數(shù)據(jù)還是指令,以及控制程序的流程等;
3、運(yùn)算單元用于執(zhí)行運(yùn)算指令;

知道了圖靈機(jī)的組成后,我們以簡單數(shù)學(xué)運(yùn)算的1 + 2作為例子,來看看它是怎么執(zhí)行這行代碼的。

首先,用讀寫頭把 「1、2、+」這 3 個字符分別寫入到紙帶上的 3 個格子,然后讀寫頭先停在 1 字符對應(yīng)的格子上;

接著,讀寫頭讀入 1 到存儲設(shè)備中,這個存儲設(shè)備稱為圖靈機(jī)的狀態(tài);

然后讀寫頭向右移動一個格,用同樣的方式把 2 讀入到圖靈機(jī)的狀態(tài),于是現(xiàn)在圖靈機(jī)的狀態(tài)中存儲著兩個連續(xù)的數(shù)字, 1 和 2;

讀寫頭再往右移動一個格,就會碰到 + 號,讀寫頭讀到 + 號后,將 + 號傳輸給「控制單元」,控制單元發(fā)現(xiàn)是一個 + 號而不是數(shù)字,所以沒有存入到狀態(tài)中,因?yàn)?號是運(yùn)算符指令,作用是加和目前的狀態(tài),于是通知「運(yùn)算單元」工作。運(yùn)算單元收到要加和狀態(tài)中的值的通知后,就會把狀態(tài)中的 1 和 2 讀入并計算,再將計算的結(jié)果 3 存放到狀態(tài)中;

最后,運(yùn)算單元將結(jié)果返回給控制單元,控制單元將結(jié)果傳輸給讀寫頭,讀寫頭向右移動,把結(jié)果 3 寫入到紙帶的格子中;

通過上面的圖靈機(jī)計算1 + 2的過程,可以發(fā)現(xiàn)圖靈機(jī)主要功能就是讀取紙帶格子中的內(nèi)容,然后交給控制單元識別字符是數(shù)字還是運(yùn)算符指令,如果是數(shù)字則存入到圖靈機(jī)狀態(tài)中,如果是運(yùn)算符,則通知運(yùn)算符單元讀取狀態(tài)中的數(shù)值進(jìn)行計算,計算結(jié)果最終返回給讀寫頭,讀寫頭把結(jié)果寫入到紙帶的格子中。

事實(shí)上,圖靈機(jī)這個看起來很簡單的工作方式,和我們今天的計算機(jī)是基本一樣的。接下來,我們一同再看看當(dāng)今計算機(jī)的組成以及工作方式。

馮諾依曼模型

在 1945 年馮諾依曼和其他計算機(jī)科學(xué)家們提出了計算機(jī)具體實(shí)現(xiàn)的報告,其遵循了圖靈機(jī)的設(shè)計,而且還提出用電子元件構(gòu)造計算機(jī),并約定了用二進(jìn)制進(jìn)行計算和存儲,還定義計算機(jī)基本結(jié)構(gòu)為 5 個部分,分別是中央處理器(CPU)、內(nèi)存、輸入設(shè)備、輸出設(shè)備、總線。

這 5 個部分也被稱為馮諾依曼模型,接下來看看這 5 個部分的具體作用。

內(nèi)存

我們的程序和數(shù)據(jù)都是存儲在內(nèi)存,存儲的區(qū)域是線性的。

數(shù)據(jù)存儲的單位是一個二進(jìn)制位(bit),即 0 或 1。最小的存儲單位是字節(jié)(byte),1 字節(jié)等于 8 位。

內(nèi)存的地址是從 0 開始編號的,然后自增排列,最后一個地址為內(nèi)存總字節(jié)數(shù) - 1,這種結(jié)構(gòu)好似我們程序里的數(shù)組,所以內(nèi)存的讀寫任何一個數(shù)據(jù)的速度都是一樣的。

中央處理器

中央處理器也就是我們常說的 CPU,32 位和 64 位 CPU 最主要區(qū)別在于一次能計算多少字節(jié)數(shù)據(jù):

32 位 CPU 一次可以計算 4 個字節(jié);

64 位 CPU 一次可以計算 8 個字節(jié);

這里的 32 位和 64 位,通常稱為 CPU 的位寬。

之所以 CPU 要這樣設(shè)計,是為了能計算更大的數(shù)值,如果是 8 位的 CPU,那么一次只能計算 1 個字節(jié)0~255范圍內(nèi)的數(shù)值,這樣就無法一次完成計算10000 * 500,于是為了能一次計算大數(shù)的運(yùn)算,CPU 需要支持多個 byte 一起計算,所以 CPU 位寬越大,可以計算的數(shù)值就越大,比如說 32 位 CPU 能計算的最大整數(shù)是4294967295。

CPU 內(nèi)部還有一些組件,常見的有寄存器、控制單元和邏輯運(yùn)算單元等。其中,控制單元負(fù)責(zé)控制 CPU 工作,邏輯運(yùn)算單元負(fù)責(zé)計算,而寄存器可以分為多種類,每種寄存器的功能又不盡相同。

CPU 中的寄存器主要作用是存儲計算時的數(shù)據(jù),你可能好奇為什么有了內(nèi)存還需要寄存器?原因很簡單,因?yàn)閮?nèi)存離 CPU 太遠(yuǎn)了,而寄存器就在 CPU 里,還緊挨著控制單元和邏輯運(yùn)算單元,自然計算時速度會很快。

常見的寄存器種類:

通用寄存器,用來存放需要進(jìn)行運(yùn)算的數(shù)據(jù),比如需要進(jìn)行加和運(yùn)算的兩個數(shù)據(jù)。

程序計數(shù)器,用來存儲 CPU 要執(zhí)行下一條指令「所在的內(nèi)存地址」,注意不是存儲了下一條要執(zhí)行的指令,此時指令還在內(nèi)存中,程序計數(shù)器只是存儲了下一條指令的地址。

指令寄存器,用來存放程序計數(shù)器指向的指令,也就是指令本身,指令被執(zhí)行完成之前,指令都存儲在這里。

總線

總線是用于 CPU 和內(nèi)存以及其他設(shè)備之間的通信,總線可分為 3 種:

地址總線,用于指定 CPU 將要操作的內(nèi)存地址;

數(shù)據(jù)總線,用于讀寫內(nèi)存的數(shù)據(jù);

控制總線,用于發(fā)送和接收信號,比如中斷、設(shè)備復(fù)位等信號,CPU 收到信號后自然進(jìn)行響應(yīng),這時也需要控制總線;

當(dāng) CPU 要讀寫內(nèi)存數(shù)據(jù)的時候,一般需要通過兩個總線:

首先要通過「地址總線」來指定內(nèi)存的地址;

再通過「數(shù)據(jù)總線」來傳輸數(shù)據(jù);

輸入、輸出設(shè)備

輸入設(shè)備向計算機(jī)輸入數(shù)據(jù),計算機(jī)經(jīng)過計算后,把數(shù)據(jù)輸出給輸出設(shè)備。期間,如果輸入設(shè)備是鍵盤,按下按鍵時是需要和 CPU 進(jìn)行交互的,這時就需要用到控制總線了。

線路位寬與 CPU 位寬

數(shù)據(jù)是如何通過線路傳輸?shù)哪??其?shí)是通過操作電壓,低電壓表示 0,高壓電壓則表示 1。

如果構(gòu)造了高低高這樣的信號,其實(shí)就是 101 二進(jìn)制數(shù)據(jù),十進(jìn)制則表示 5,如果只有一條線路,就意味著每次只能傳遞 1 bit 的數(shù)據(jù),即 0 或 1,那么傳輸 101 這個數(shù)據(jù),就需要 3 次才能傳輸完成,這樣的效率非常低。

這樣一位一位傳輸?shù)姆绞?,稱為串行,下一個 bit 必須等待上一個 bit 傳輸完成才能進(jìn)行傳輸。當(dāng)然,想一次多傳一些數(shù)據(jù),增加線路即可,這時數(shù)據(jù)就可以并行傳輸。

為了避免低效率的串行傳輸?shù)姆绞?,線路的位寬最好一次就能訪問到所有的內(nèi)存地址。CPU 要想操作的內(nèi)存地址就需要地址總線,如果地址總線只有 1 條,那每次只能表示 「0 或 1」這兩種情況,所以 CPU 一次只能操作 2 個內(nèi)存地址,如果想要 CPU 操作 4G 的內(nèi)存,那么就需要 32 條地址總線,因?yàn)? ^ 32 = 4G。

知道了線路位寬的意義后,我們再來看看 CPU 位寬。

CPU 的位寬最好不要小于線路位寬,比如 32 位 CPU 控制 40 位寬的地址總線和數(shù)據(jù)總線的話,工作起來就會非常復(fù)雜且麻煩,所以 32 位的 CPU 最好和 32 位寬的線路搭配,因?yàn)?32 位 CPU 一次最多只能操作 32 位寬的地址總線和數(shù)據(jù)總線。

如果用 32 位 CPU 去加和兩個 64 位大小的數(shù)字,就需要把這 2 個 64 位的數(shù)字分成 2 個低位 32 位數(shù)字和 2 個高位 32 位數(shù)字來計算,先加個兩個低位的 32 位數(shù)字,算出進(jìn)位,然后加和兩個高位的 32 位數(shù)字,最后再加上進(jìn)位,就能算出結(jié)果了,可以發(fā)現(xiàn) 32 位 CPU 并不能一次性計算出加和兩個 64 位數(shù)字的結(jié)果。

對于 64 位 CPU 就可以一次性算出加和兩個 64 位數(shù)字的結(jié)果,因?yàn)?64 位 CPU 可以一次讀入 64 位的數(shù)字,并且 64 位 CPU 內(nèi)部的邏輯運(yùn)算單元也支持 64 位數(shù)字的計算。

但是并不代表 64 位 CPU 性能比 32 位 CPU 高很多,很少應(yīng)用需要算超過 32 位的數(shù)字,所以如果計算的數(shù)額不超過 32 位數(shù)字的情況下,32 位和 64 位 CPU 之間沒什么區(qū)別的,只有當(dāng)計算超過 32 位數(shù)字的情況下,64 位的優(yōu)勢才能體現(xiàn)出來。

另外,32 位 CPU 最大只能操作 4GB 內(nèi)存,就算你裝了 8 GB 內(nèi)存條,也沒用。而 64 位 CPU 尋址范圍則很大,理論最大的尋址空間為2^64。

程序執(zhí)行的基本過程

在前面,我們知道了程序在圖靈機(jī)的執(zhí)行過程,接下來我們來看看程序在馮諾依曼模型上是怎么執(zhí)行的。

程序?qū)嶋H上是一條一條指令,所以程序的運(yùn)行過程就是把每一條指令一步一步的執(zhí)行起來,負(fù)責(zé)執(zhí)行指令的就是 CPU 了。

那 CPU 執(zhí)行程序的過程如下:

第一步,CPU 讀取「程序計數(shù)器」的值,這個值是指令的內(nèi)存地址,然后 CPU 的「控制單元」操作「地址總線」指定需要訪問的內(nèi)存地址,接著通知內(nèi)存設(shè)備準(zhǔn)備數(shù)據(jù),數(shù)據(jù)準(zhǔn)備好后通過「數(shù)據(jù)總線」將指令數(shù)據(jù)傳給 CPU,CPU 收到內(nèi)存?zhèn)鱽淼臄?shù)據(jù)后,將這個指令數(shù)據(jù)存入到「指令寄存器」。

第二步,CPU 分析「指令寄存器」中的指令,確定指令的類型和參數(shù),如果是計算類型的指令,就把指令交給「邏輯運(yùn)算單元」運(yùn)算;如果是存儲類型的指令,則交由「控制單元」執(zhí)行;

第三步,CPU 執(zhí)行完指令后,「程序計數(shù)器」的值自增,表示指向下一條指令。這個自增的大小,由 CPU 的位寬決定,比如 32 位的 CPU,指令是 4 個字節(jié),需要 4 個內(nèi)存地址存放,因此「程序計數(shù)器」的值會自增 4;

簡單總結(jié)一下就是,一個程序執(zhí)行的時候,CPU 會根據(jù)程序計數(shù)器里的內(nèi)存地址,從內(nèi)存里面把需要執(zhí)行的指令讀取到指令寄存器里面執(zhí)行,然后根據(jù)指令長度自增,開始順序讀取下一條指令。

CPU 從程序計數(shù)器讀取指令、到執(zhí)行、再到下一條指令,這個過程會不斷循環(huán),直到程序執(zhí)行結(jié)束,這個不斷循環(huán)的過程被稱為CPU 的指令周期。

a = 1 + 2 執(zhí)行具體過程

知道了基本的程序執(zhí)行過程后,接下來用a = 1 + 2的作為例子,進(jìn)一步分析該程序在馮諾伊曼模型的執(zhí)行過程。

CPU 是不認(rèn)識a = 1 + 2這個字符串,這些字符串只是方便我們程序員認(rèn)識,要想這段程序能跑起來,還需要把整個程序翻譯成匯編語言的程序,這個過程稱為編譯成匯編代碼。

針對匯編代碼,我們還需要用匯編器翻譯成機(jī)器碼,這些機(jī)器碼由 0 和 1 組成的機(jī)器語言,這一條條機(jī)器碼,就是一條條的計算機(jī)指令,這個才是 CPU 能夠真正認(rèn)識的東西。

下面來看看 a = 1 + 2在 32 位 CPU 的執(zhí)行過程。

程序編譯過程中,編譯器通過分析代碼,發(fā)現(xiàn) 1 和 2 是數(shù)據(jù),于是程序運(yùn)行時,內(nèi)存會有個專門的區(qū)域來存放這些數(shù)據(jù),這個區(qū)域就是「數(shù)據(jù)段」。如下圖,數(shù)據(jù) 1 和 2 的區(qū)域位置:

數(shù)據(jù) 1 被存放到 0x100 位置;

數(shù)據(jù) 2 被存放到 0x104 位置;

注意,數(shù)據(jù)和指令是分開區(qū)域存放的,存放指令區(qū)域的地方稱為「正文段」。

編譯器會把a(bǔ) = 1 + 2翻譯成 4 條指令,存放到正文段中。如圖,這 4 條指令被存放到了 0x200 ~ 0x20c 的區(qū)域中:

0x200 的內(nèi)容是load指令將 0x100 地址中的數(shù)據(jù) 1 裝入到寄存器R0;

0x204 的內(nèi)容是load指令將 0x104 地址中的數(shù)據(jù) 2 裝入到寄存器R1;

0x208 的內(nèi)容是add指令將寄存器R0和R1的數(shù)據(jù)相加,并把結(jié)果存放到寄存器R2;

0x20c 的內(nèi)容是store指令將寄存器R2中的數(shù)據(jù)存回數(shù)據(jù)段中的 0x108 地址中,這個地址也就是變量a內(nèi)存中的地址;

編譯完成后,具體執(zhí)行程序的時候,程序計數(shù)器會被設(shè)置為 0x200 地址,然后依次執(zhí)行這 4 條指令。

上面的例子中,由于是在 32 位 CPU 執(zhí)行的,因此一條指令是占 32 位大小,所以你會發(fā)現(xiàn)每條指令間隔 4 個字節(jié)。

而數(shù)據(jù)的大小是根據(jù)你在程序中指定的變量類型,比如int類型的數(shù)據(jù)則占 4 個字節(jié),char類型的數(shù)據(jù)則占 1 個字節(jié)。

指令

上面的例子中,圖中指令的內(nèi)容我寫的是簡易的匯編代碼,目的是為了方便理解指令的具體內(nèi)容,事實(shí)上指令的內(nèi)容是一串二進(jìn)制數(shù)字的機(jī)器碼,每條指令都有對應(yīng)的機(jī)器碼,CPU 通過解析機(jī)器碼來知道指令的內(nèi)容。

不同的 CPU 有不同的指令集,也就是對應(yīng)著不同的匯編語言和不同的機(jī)器碼,接下來選用最簡單的 MIPS 指集,來看看機(jī)器碼是如何生成的,這樣也能明白二進(jìn)制的機(jī)器碼的具體含義。

MIPS 的指令是一個 32 位的整數(shù),高 6 位代表著操作碼,表示這條指令是一條什么樣的指令,剩下的 26 位不同指令類型所表示的內(nèi)容也就不相同,主要有三種類型R、I 和 J。

一起具體看看這三種類型的含義:

R 指令,用在算術(shù)和邏輯操作,里面由讀取和寫入數(shù)據(jù)的寄存器地址。如果是邏輯位移操作,后面還有位移操作的「位移量」,而最后的「功能碼」則是再前面的操作碼不夠的時候,擴(kuò)展操作碼來表示對應(yīng)的具體指令的;

I 指令,用在數(shù)據(jù)傳輸、條件分支等。這個類型的指令,就沒有了位移量和操作碼,也沒有了第三個寄存器,而是把這三部分直接合并成了一個地址值或一個常數(shù);

J 指令,用在跳轉(zhuǎn),高 6 位之外的 26 位都是一個跳轉(zhuǎn)后的地址;

接下來,我們把前面例子的這條指令:「add指令將寄存器R0和R1的數(shù)據(jù)相加,并把結(jié)果放入到R3」,翻譯成機(jī)器碼。

加和運(yùn)算 add 指令是屬于 R 指令類型:

add 對應(yīng)的 MIPS 指令里操作碼是000000,以及最末尾的功能碼是100000,這些數(shù)值都是固定的,查一下 MIPS 指令集的手冊就能知道的;

rs 代表第一個寄存器 R0 的編號,即00000;

rt 代表第二個寄存器 R1 的編號,即00001;

rd 代表目標(biāo)的臨時寄存器 R2 的編號,即00010;

因?yàn)椴皇俏灰撇僮?,所以位移量?0000

把上面這些數(shù)字拼在一起就是一條 32 位的 MIPS 加法指令了,那么用 16 進(jìn)制表示的機(jī)器碼則是0x00011020。

編譯器在編譯程序的時候,會構(gòu)造指令,這個過程叫做指令的編碼。CPU 執(zhí)行程序的時候,就會解析指令,這個過程叫作指令的解碼。

現(xiàn)代大多數(shù) CPU 都使用來流水線的方式來執(zhí)行指令,所謂的流水線就是把一個任務(wù)拆分成多個小任務(wù),于是一條指令通常分為 4 個階段,稱為 4 級流水線,如下圖:

四個階段的具體含義:

CPU 通過程序計數(shù)器讀取對應(yīng)內(nèi)存地址的指令,這個部分稱為Fetch(取得指令);

CPU 對指令進(jìn)行解碼,這個部分稱為Decode(指令譯碼);

CPU 執(zhí)行指令,這個部分稱為Execution(執(zhí)行指令);

CPU 將計算結(jié)果存回寄存器或者將寄存器的值存入內(nèi)存,這個部分稱為Store(數(shù)據(jù)回寫);

上面這 4 個階段,我們稱為指令周期(Instrution Cycle),CPU 的工作就是一個周期接著一個周期,周而復(fù)始。

事實(shí)上,不同的階段其實(shí)是由計算機(jī)中的不同組件完成的:

取指令的階段,我們的指令是存放在存儲器里的,實(shí)際上,通過程序計數(shù)器和指令寄存器取出指令的過程,是由控制器操作的;

指令的譯碼過程,也是由控制器進(jìn)行的;

指令執(zhí)行的過程,無論是進(jìn)行算術(shù)操作、邏輯操作,還是進(jìn)行數(shù)據(jù)傳輸、條件分支操作,都是由算術(shù)邏輯單元操作的,也就是由運(yùn)算器處理的。但是如果是一個簡單的無條件地址跳轉(zhuǎn),則是直接在控制器里面完成的,不需要用到運(yùn)算器。

指令的類型

指令從功能角度劃分,可以分為 5 大類:

數(shù)據(jù)傳輸類型的指令,比如store/load是寄存器與內(nèi)存間數(shù)據(jù)傳輸?shù)闹噶?,mov是將一個內(nèi)存地址的數(shù)據(jù)移動到另一個內(nèi)存地址的指令;

運(yùn)算類型的指令,比如加減乘除、位運(yùn)算、比較大小等等,它們最多只能處理兩個寄存器中的數(shù)據(jù);

跳轉(zhuǎn)類型的指令,通過修改程序計數(shù)器的值來達(dá)到跳轉(zhuǎn)執(zhí)行指令的過程,比如編程中常見的if-else、swtich-case、函數(shù)調(diào)用等。

信號類型的指令,比如發(fā)生中斷的指令trap;

閑置類型的指令,比如指令nop,執(zhí)行后 CPU 會空轉(zhuǎn)一個周期;

指令的執(zhí)行速度

CPU 的硬件參數(shù)都會有GHz這個參數(shù),比如一個 1 GHz 的 CPU,指的是時鐘頻率是 1 G,代表著 1 秒會產(chǎn)生 1G 次數(shù)的脈沖信號,每一次脈沖信號高低電平的轉(zhuǎn)換就是一個周期,稱為時鐘周期。

對于 CPU 來說,在一個時鐘周期內(nèi),CPU 僅能完成一個最基本的動作,時鐘頻率越高,時鐘周期就越短,工作速度也就越快。

一個時鐘周期一定能執(zhí)行完一條指令嗎?答案是不一定的,大多數(shù)指令不能在一個時鐘周期完成,通常需要若干個時鐘周期。不同的指令需要的時鐘周期是不同的,加法和乘法都對應(yīng)著一條 CPU 指令,但是乘法需要的時鐘周期就要比加法多。

如何讓程序跑的更快?

程序執(zhí)行的時候,耗費(fèi)的 CPU 時間少就說明程序是快的,對于程序的 CPU 執(zhí)行時間,我們可以拆解成CPU 時鐘周期數(shù)(CPU Cycles)和時鐘周期時間(Clock Cycle Time)的乘積。

時鐘周期時間就是我們前面提及的 CPU 主頻,主頻越高說明 CPU 的工作速度就越快,比如我手頭上的電腦的 CPU 是 2.4 GHz 四核 Intel Core i5,這里的 2.4 GHz 就是電腦的主頻,時鐘周期時間就是 1/2.4G。

要想 CPU 跑的更快,自然縮短時鐘周期時間,也就是提升 CPU 主頻,但是今非彼日,摩爾定律早已失效,當(dāng)今的 CPU 主頻已經(jīng)很難再做到翻倍的效果了。

另外,換一個更好的 CPU,這個也是我們軟件工程師控制不了的事情,我們應(yīng)該把目光放到另外一個乘法因子 —— CPU 時鐘周期數(shù),如果能減少程序所需的 CPU 時鐘周期數(shù)量,一樣也是能提升程序的性能的。

對于 CPU 時鐘周期數(shù)我們可以進(jìn)一步拆解成:「指令數(shù) x 每條指令的平均時鐘周期數(shù)(Cycles Per Instruction,簡稱CPI)」,于是程序的 CPU 執(zhí)行時間的公式可變成如下:

因此,要想程序跑的更快,優(yōu)化這三者即可:

指令數(shù),表示執(zhí)行程序所需要多少條指令,以及哪些指令。這個層面是基本靠編譯器來優(yōu)化,畢竟同樣的代碼,在不同的編譯器,編譯出來的計算機(jī)指令會有各種不同的表示方式。

每條指令的平均時鐘周期數(shù) CPI,表示一條指令需要多少個時鐘周期數(shù),現(xiàn)代大多數(shù) CPU 通過流水線技術(shù)(Pipline),讓一條指令需要的 CPU 時鐘周期數(shù)盡可能的少;

時鐘周期時間,表示計算機(jī)主頻,取決于計算機(jī)硬件。有的 CPU 支持超頻技術(shù),打開了超頻意味著把 CPU 內(nèi)部的時鐘給調(diào)快了,于是 CPU 工作速度就變快了,但是也是有代價的,CPU 跑的越快,散熱的壓力就會越大,CPU 會很容易奔潰。

很多廠商為了跑分而跑分,基本都是在這三個方面入手的哦,特別是超頻這一塊。

總結(jié)

最后我們再來回答開頭的問題。

64 位相比 32 位 CPU 的優(yōu)勢在哪嗎?64 位 CPU 的計算性能一定比 32 位 CPU 高很多嗎?

64 位相比 32 位 CPU 的優(yōu)勢主要體現(xiàn)在兩個方面:

64 位 CPU 可以一次計算超過 32 位的數(shù)字,而 32 位 CPU 如果要計算超過 32 位的數(shù)字,要分多步驟進(jìn)行計算,效率就沒那么高,但是大部分應(yīng)用程序很少會計算那么大的數(shù)字,所以只有運(yùn)算大數(shù)字的時候,64 位 CPU 的優(yōu)勢才能體現(xiàn)出來,否則和 32 位 CPU 的計算性能相差不大。

64 位 CPU 可以尋址更大的內(nèi)存空間,32 位 CPU 最大的尋址地址是 4G,即使你加了 8G 大小的內(nèi)存,也還是只能尋址到 4G,而 64 位 CPU 最大尋址地址是2^64,遠(yuǎn)超于 32 位 CPU 最大尋址地址的2^32。

你知道軟件的 32 位和 64 位之間的區(qū)別嗎?再來 32 位的操作系統(tǒng)可以運(yùn)行在 64 位的電腦上嗎?64 位的操作系統(tǒng)可以運(yùn)行在 32 位的電腦上嗎?如果不行,原因是什么?

64 位和 32 位軟件,實(shí)際上代表指令是 64 位還是 32 位的:

如果 32 位指令在 64 位機(jī)器上執(zhí)行,需要一套兼容機(jī)制,就可以做到兼容運(yùn)行了。但是如果 64 位指令在 32 位機(jī)器上執(zhí)行,就比較困難了,因?yàn)?32 位的寄存器存不下 64 位的指令;

操作系統(tǒng)其實(shí)也是一種程序,我們也會看到操作系統(tǒng)會分成 32 位操作系統(tǒng)、64 位操作系統(tǒng),其代表意義就是操作系統(tǒng)中程序的指令是多少位,比如 64 位操作系統(tǒng),指令也就是 64 位,因此不能裝在 32 位機(jī)器上。

總之,硬件的 64 位和 32 位指的是 CPU 的位寬,軟件的 64 位和 32 位指的是指令的位寬。

責(zé)任編輯:xj

原文標(biāo)題:CPU 執(zhí)行程序的秘密,藏在了這 15 張圖里

文章出處:【微信公眾號:Linux愛好者】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • cpu
    cpu
    +關(guān)注

    關(guān)注

    68

    文章

    11193

    瀏覽量

    221989
  • 程序執(zhí)行
    +關(guān)注

    關(guān)注

    0

    文章

    3

    瀏覽量

    2289
  • 圖靈機(jī)
    +關(guān)注

    關(guān)注

    1

    文章

    8

    瀏覽量

    2375

原文標(biāo)題:CPU 執(zhí)行程序的秘密,藏在了這 15 張圖里

文章出處:【微信號:LinuxHub,微信公眾號:Linux愛好者】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點(diǎn)推薦

    PIC64GX1000 RISC-V MPU:款面向嵌入式計算的高性能64多核處理器

    Microchip Technology PIC64GX1000 64RISC-V四核微處理器 (MPU) 支持Linux^?^ 操作系統(tǒng),基于RISC-V指令集架構(gòu),提供高效節(jié)能的嵌入式
    的頭像 發(fā)表于 09-30 14:47 ?332次閱讀
    PIC<b class='flag-5'>64</b>GX1000 RISC-V MPU:<b class='flag-5'>一</b>款面向嵌入式<b class='flag-5'>計算</b>的高<b class='flag-5'>性能</b><b class='flag-5'>64</b><b class='flag-5'>位</b>多核處理器

    探索CPU架構(gòu)的奧秘,揭秘高性能計算的隱形引擎

    的深海,揭開那些隱藏在高性能計算背后的神秘面紗。1.取指令(Fetch)程序計數(shù)器(PC):CPU通過程序計數(shù)器獲取下條指令的內(nèi)存地址。指令讀?。簭拇鎯ζ骰蚓彺嬷凶x
    的頭像 發(fā)表于 08-13 11:58 ?417次閱讀
    探索<b class='flag-5'>CPU</b>架構(gòu)的奧秘,揭秘高<b class='flag-5'>性能</b><b class='flag-5'>計算</b>的隱形引擎

    瑞薩電子推出64RZ/G3E MPU

    瑞薩電子于2025年7月推出64RZ/G3E MPU,為需要AI加速和邊緣計算的高性能HMI系統(tǒng)設(shè)計提供助力。
    的頭像 發(fā)表于 08-04 13:55 ?1377次閱讀
    瑞薩電子推出<b class='flag-5'>64</b><b class='flag-5'>位</b>RZ/G3E MPU

    單核CPU網(wǎng)關(guān)和雙核CPU網(wǎng)關(guān)有什么區(qū)別

    單核CPU網(wǎng)關(guān)與雙核CPU網(wǎng)關(guān)的核心區(qū)別在于處理能力、多任務(wù)效率、性能表現(xiàn)及適用場景,雙核CPU網(wǎng)關(guān)在多任務(wù)處理、復(fù)雜計算和響應(yīng)速度上具有顯
    的頭像 發(fā)表于 07-05 14:37 ?614次閱讀

    基于瑞薩64MPU RZ/G2L進(jìn)行32應(yīng)用軟件開發(fā)

    本文主要介紹基于瑞薩64MPU RZ/G2L進(jìn)行32應(yīng)用軟件開發(fā)的介紹,用于解決客戶32軟件移植相關(guān)問題,供客戶參考。
    的頭像 發(fā)表于 06-26 15:48 ?1480次閱讀
    基于瑞薩<b class='flag-5'>64</b><b class='flag-5'>位</b>MPU RZ/G2L進(jìn)行32<b class='flag-5'>位</b>應(yīng)用軟件開發(fā)

    片主板可以有多少路CPU?

    CPU計算機(jī)的中央處理器,可以直接影響到服務(wù)器的并行處理能力。CPU路數(shù)越多,服務(wù)器可以同時處理的任務(wù)數(shù)量就越多,從而提高了整體的處理效率和性能,特別是在處理大量并發(fā)任務(wù)時,多路服務(wù)
    的頭像 發(fā)表于 06-13 09:14 ?464次閱讀
    <b class='flag-5'>一</b>片主板可以有多少路<b class='flag-5'>CPU</b>?

    CPU Socket的基本結(jié)構(gòu)和工作原理

    CPU Socket是連接中央處理單元(CPU)與計算機(jī)主板之間的關(guān)鍵部件,它充當(dāng)著傳遞電信號、電源和散熱等多重功能的樞紐。在整個計算機(jī)系統(tǒng)中,CP
    的頭像 發(fā)表于 05-08 17:14 ?1476次閱讀

    國產(chǎn)電腦CPU性能排行榜TOP7:CPU緩存/主頻/多核實(shí)測數(shù)據(jù)分析

    在科技飛速發(fā)展的今天,電腦CPU(中央處理器)無疑是計算機(jī)性能的核心部件。而長久以來,國際品牌在這領(lǐng)域占據(jù)著主導(dǎo)地位,給人種國產(chǎn)
    的頭像 發(fā)表于 04-29 10:38 ?1927次閱讀
    國產(chǎn)電腦<b class='flag-5'>CPU</b><b class='flag-5'>性能</b>排行榜TOP7:<b class='flag-5'>CPU</b>緩存/主頻/多核實(shí)測數(shù)據(jù)分析

    CPU到GPU:渲染技術(shù)的演進(jìn)和趨勢

    渲染技術(shù)是計算機(jī)圖形學(xué)的核心內(nèi)容之,它是將三維場景轉(zhuǎn)換為二維圖像的過程。渲染技術(shù)直在不斷演進(jìn),從最初的CPU渲染到后來的GPU渲染,性能
    的頭像 發(fā)表于 02-21 11:11 ?1166次閱讀
    從<b class='flag-5'>CPU</b>到GPU:渲染技術(shù)的演進(jìn)和趨勢

    RK3588性能設(shè)置 CPU GPU DDR NPU 頻率設(shè)置

    RK3588 CPU GPU DDR頻策略
    的頭像 發(fā)表于 02-15 16:09 ?2574次閱讀

    hyper cpu,Hyper CPU優(yōu)化:提升虛擬機(jī)性能

    :提升虛擬機(jī)性能。 ? ?在虛擬化環(huán)境中,CPU性能優(yōu)化對于提升虛擬機(jī)的整體性能至關(guān)重要。Hyper-V提供了多種工具和策略,幫助用戶根據(jù)虛擬機(jī)的工作負(fù)載需求合理分配和優(yōu)化
    的頭像 發(fā)表于 02-06 10:25 ?1421次閱讀
    hyper <b class='flag-5'>cpu</b>,Hyper <b class='flag-5'>CPU</b>優(yōu)化:提升虛擬機(jī)<b class='flag-5'>性能</b>

    進(jìn)迭時空 K1 系列 8 核 64 RISC - V AI CPU 芯片介紹

    、云電腦、智能機(jī)器人、工業(yè)控制、邊緣計算機(jī)等領(lǐng)域。二、具體特性()卓越的 CPU 性能核心配置 :具有 8 核 RISC - V AI CPU
    發(fā)表于 01-06 17:37

    華為云 X 實(shí)例 CPU 性能測試詳解與優(yōu)化策略

    分析 ? 3.2 CPU性能瓶頸分析 ? 4. CPU性能優(yōu)化策略 ? 4.1 優(yōu)化CPU性能
    的頭像 發(fā)表于 12-30 14:52 ?1030次閱讀
    華為云 X 實(shí)例 <b class='flag-5'>CPU</b> <b class='flag-5'>性能</b>測試詳解與優(yōu)化策略

    Flexus X 實(shí)例 CPU、內(nèi)存及磁盤性能實(shí)測與分析

    引言 隨著云計算的普及,企業(yè)對于云資源的需求日益增加,而選擇性能強(qiáng)勁、穩(wěn)定性的云實(shí)例成為了關(guān)鍵。華為云 Flexus X 實(shí)例作為華為云最新推出的高
    的頭像 發(fā)表于 12-24 17:35 ?795次閱讀

    SiFive 推出高性能 Risc-V CPU 開發(fā)板 HiFive Premier P550

    波 RISC-V 開發(fā)浪潮。P550 Premier 采用 ESWIN EIC7700X SoC,配備四核 SiFive P550 64 OOO CPU 集群,為開發(fā)人員提供了創(chuàng)建高性能
    的頭像 發(fā)表于 12-16 11:16 ?2494次閱讀
    SiFive 推出高<b class='flag-5'>性能</b> Risc-V <b class='flag-5'>CPU</b> 開發(fā)板 HiFive Premier P550