當(dāng)您準(zhǔn)備選購一臺嶄新的計算機時,會面臨兩種主要的 CPU 架構(gòu)抉擇。Windows 個人電腦通?;?Intel 和 AMD 所采用的 x86 平臺構(gòu)建,而 Apple 的計算機則運用其自主研發(fā)的、基于 ARM 架構(gòu)的 M1 和 M2 處理器。
這兩種架構(gòu)之間存在著顯著差異,這些差異對于性能的表現(xiàn)有著至關(guān)重要的影響,讓我們深入探究其中的奧秘。
x86 和 ARM 處理器平臺雖然都致力于實現(xiàn)相同的計算任務(wù),但它們達(dá)成目標(biāo)的方式卻截然不同。它們的內(nèi)部邏輯布線方式各異,內(nèi)部數(shù)據(jù)寄存器的配置有所差別,并且硬編碼指令集也不一樣。這就意味著,它們在運行軟件時采用了不同的模式和路徑。
在 x86 平臺的發(fā)展歷程中,其處理器的內(nèi)部結(jié)構(gòu)和指令集最初源于 Intel 8008,這是一款早在 1972 年就已嶄露頭角的 8 位 CPU。令人驚嘆的是,當(dāng)年為這款芯片編寫的機器碼程序,經(jīng)過匯編后,依然能夠在英特爾或 AMD 的最新處理器上順利運行。
當(dāng)然,自那時起,硬件技術(shù)已經(jīng)取得了飛躍式的發(fā)展。在 8008 之后,依次誕生了 8088,接著是為最初的 IBM PC 提供服務(wù)的 16 位 8086。到了 20 世紀(jì) 80 年代,80186、80286 等相繼問世,“x86” 這一綽號也由此而來。
歷經(jīng)數(shù)代的演進(jìn),x86 平臺不斷引入新的特性,諸如支持多任務(wù)處理和虛擬內(nèi)存的功能;同時,對 32 位和 64 位操作的支持也得以增強,這使得計算機能夠高效地應(yīng)對海量數(shù)據(jù)集的處理需求。此外,一系列的擴(kuò)展指令集被開發(fā)出來,用以加速特定的任務(wù),例如圖形處理、虛擬化以及數(shù)據(jù)加密等領(lǐng)域,極大地拓展了其應(yīng)用范圍和性能表現(xiàn)。
Apple 的處理器則扎根于 ARM 架構(gòu),其起源可以追溯到 20 世紀(jì) 80 年代中期的 Acorn Computers。與當(dāng)時其他家用電腦從外部供應(yīng)商采購芯片的做法不同,Acorn Computers 毅然決定自主設(shè)計一款性能超越現(xiàn)有競爭對手的新型處理器。功夫不負(fù)有心人,他們成功了:在推出之時,基于 ARM 的 Acorn Archimedes 成為了當(dāng)時市面上性能最為強勁的家用計算機之一。
時至今日,ARM 平臺由位于劍橋的 Arm 集團(tuán)持有并持續(xù)開發(fā)。如同 x86 平臺一樣,ARM 架構(gòu)自誕生以來也在不斷發(fā)展壯大,持續(xù)進(jìn)化。后續(xù)版本的 ARM 平臺增添了 64 位支持以及大量的擴(kuò)展功能,旨在加速常見的數(shù)學(xué)運算,尤其是在最新的 ARMv9 版本中,對安全和人工智能(AI)功能進(jìn)行了著重強化,使其在現(xiàn)代科技領(lǐng)域中占據(jù)了一席之地。
除了架構(gòu)上的差異,這兩種主要計算架構(gòu)之間還存在另一個顯著的區(qū)別:與英特爾親自制造自家處理器不同,Arm 并不生產(chǎn)任何處理器。相反,Arm 公司選擇將其設(shè)計授權(quán)給其他公司,這些獲得授權(quán)的公司可以根據(jù)自身的特定需求對設(shè)計進(jìn)行定制化修改,并按照自己的標(biāo)準(zhǔn)和規(guī)格來制造處理器。以 Apple Silicon 為例,蘋果公司運用了核心 ARM 邏輯,但在此基礎(chǔ)上增添了諸多自家獨有的優(yōu)化措施,并將芯片制造環(huán)節(jié)外包給了臺積電,通過這種方式打造出了獨具特色的芯片產(chǎn)品。
芯片在面向最終用戶的市場推廣方式上也大相徑庭。英特爾的所有 x86 處理器均基于相同的底層架構(gòu),但卻提供了數(shù)量繁多的不同配置選項。在每一代酷睿 CPU 產(chǎn)品系列中,都包含了酷睿 i3、i5、i7 和 i9 等多種變體,并且這些變體還進(jìn)一步細(xì)分為針對移動設(shè)備、臺式電腦或游戲系統(tǒng)等不同應(yīng)用場景的特定型號范圍。這些不同型號在處理內(nèi)核數(shù)量、緩存內(nèi)存容量、時鐘速度以及電源要求等方面都存在差異,這無疑給消費者在選擇計算機時帶來了一定的困惑,需要他們仔細(xì)斟酌,根據(jù)自身的實際需求挑選出最適合自己的一款型號。
相較而言,截至本文撰寫之時,蘋果公司總共推出了七種計算機芯片,分別是 M1、M1 Pro、M1 Max、M1 Ultra、M2、M2 Pro 和 M2 Max。其產(chǎn)品陣容相較于英特爾而言要簡潔明了許多,即便是普通的 M1 芯片,在性能表現(xiàn)上也能夠與中端英特爾芯片一較高下,為消費者提供了更為清晰明確的選擇。
蘋果的芯片和英特爾的芯片之間還存在最后一個區(qū)別,需要注意的是,這一區(qū)別并非 ARM 架構(gòu)本身所固有,而是蘋果公司基于自身設(shè)計理念所做出的獨特決策。英特爾的芯片在運行過程中依賴于外部系統(tǒng)的 RAM,而蘋果則別出心裁地將內(nèi)存直接集成到其 M 系列處理器的芯片內(nèi)部。
這種設(shè)計方案帶來了一定的局限性,意味著用戶永遠(yuǎn)無法對 Apple Silicon 計算機上的內(nèi)存進(jìn)行升級,這在用戶選擇計算機規(guī)格時可能會引發(fā)一些頗為糾結(jié)的決策過程。同時,這也導(dǎo)致在主流芯片上,內(nèi)存容量的配置相對有限:M1 芯片所能提供的最大內(nèi)存為 16GB,而 M2 芯片的內(nèi)存上限則為 24GB。倘若用戶需要 32GB 甚至更多的內(nèi)存,就不得不升級到價格昂貴的 M1 Pro、Max 或 Ultra 系統(tǒng),這無疑增加了用戶獲取高內(nèi)存配置計算機的成本。相比之下,英特爾的所有第 12 代和第 13 代處理器都能夠支持高達(dá) 128GB 的內(nèi)存,為那些對內(nèi)存容量有較高要求的用戶提供了更為廣闊的選擇空間。
然而,這種設(shè)計也并非毫無優(yōu)勢。由于蘋果的 RAM 實際上緊鄰處理器邏輯,并通過速度極快的架構(gòu)與之相連,使得其處理器能夠以極其迅速且高效的方式訪問代碼和數(shù)據(jù)。標(biāo)準(zhǔn) M1 芯片的最大內(nèi)存帶寬可達(dá) 68GB / 秒,而 M2 芯片更是高達(dá) 100GB / 秒,M1 Pro、Max 和 Ultra 型號的內(nèi)存帶寬則分別能夠達(dá)到 200GB / 秒、400GB / 秒和 800GB / 秒,這樣的內(nèi)存帶寬表現(xiàn)為數(shù)據(jù)的快速傳輸和處理提供了有力保障。對于英特爾處理器而言,內(nèi)存帶寬則完全取決于處理器、RAM 和主板的具體組合情況,即便在最新、最快的酷睿 i9 處理器上,其內(nèi)存帶寬在理論上的最大值也被限制在 90GB / 秒左右,與蘋果芯片相比略顯遜色。
更為重要的是,蘋果采用了所謂的 “統(tǒng)一內(nèi)存架構(gòu)(unified memory architecture)”,這意味著整個內(nèi)存空間都能夠被 CPU 或片上 GPU 直接訪問。相較于傳統(tǒng)的 PC 架構(gòu),這種設(shè)計在效率上具有顯著的優(yōu)勢。在傳統(tǒng) PC 架構(gòu)中,CPU 和 GPU 各自擁有獨立的內(nèi)存庫,在協(xié)同處理相同數(shù)據(jù)時,往往需要頻繁地進(jìn)行數(shù)據(jù)的來回復(fù)制,這無疑會降低處理效率,而蘋果的統(tǒng)一內(nèi)存架構(gòu)則巧妙地避免了這一問題,大大提高了數(shù)據(jù)處理的效率和速度。
在英特爾和蘋果之外,CPU 市場還存在著第三個主要參與者 ——AMD。不過,AMD 的芯片在架構(gòu)上并沒有像蘋果那樣鮮明獨特的身份標(biāo)識,因為它們采用的是與英特爾相同的核心 x86 架構(gòu)以及指令集。
回顧英特爾和 AMD 的發(fā)展歷程,兩者之間存在著一種頗為有趣的共生關(guān)系。
為何英特爾會允許其最大的競爭對手使用其專有的架構(gòu)呢?這要追溯到 20 世紀(jì) 80 年代初期,當(dāng)時 IBM 計劃在最初的 IBM PC 中使用英特爾的芯片,但又不想僅僅依賴于單一的芯片供應(yīng)源。
于是,IBM 向英特爾提出要求,只有在第二家公司能夠在獲得許可的情況下制造硬件時,才會選用 x86 處理器。就這樣,AMD 獲得了制造 Intel 8086、80186 和 80286 處理器的授權(quán)。此后,AMD 憑借自身的技術(shù)實力,創(chuàng)造出了屬于自己的芯片設(shè)計,開始與英特爾的芯片展開競爭。在 20 世紀(jì) 90 年代后期推出的 K5 和 K6 處理器,以低于英特爾奔騰處理器的價格優(yōu)勢,實現(xiàn)了 x86 兼容性,在市場上贏得了一席之地。
進(jìn)入 2000 年后,AMD 創(chuàng)新性地將新的 64 位處理模式融入到 x86 架構(gòu)中,并對其進(jìn)行了強化,使其能夠更好地處理更大的數(shù)字、更龐大的數(shù)據(jù)集以及更多的 RAM。英特爾也對這些擴(kuò)展技術(shù)進(jìn)行了許可使用,從此,兩家公司在技術(shù)發(fā)展的道路上形成了一種相互依賴的關(guān)系。
盡管 AMD 的處理器能夠運行與英特爾相同的程序,但兩者之間仍然存在一些關(guān)鍵的差異。AMD 主要專注于芯片的設(shè)計和銷售,而并不親自涉足芯片的制造環(huán)節(jié);這一策略使得 AMD 能夠靈活地選擇任何能夠提供最先進(jìn)技術(shù)的代工廠進(jìn)行合作。例如,在前兩代 Ryzen CPU 產(chǎn)品中,AMD 選擇了 Global Foundries 作為代工廠商,而到了 2019 年,為了充分利用臺積電的 7nm 制造工藝優(yōu)勢,AMD 轉(zhuǎn)而與臺積電合作,其最新的 Ryzen 7000 系列芯片更是采用了臺積電的 5nm 先進(jìn)工藝,不斷提升產(chǎn)品的性能和競爭力。
AMD 的芯片設(shè)計在某些方面也展現(xiàn)出了獨特的優(yōu)勢。與價格相近的英特爾芯片相比,AMD 的設(shè)計往往會集成更多的內(nèi)核,這在一定程度上得益于 AMD 所采用的 “chiplet” 技術(shù)方法。AMD 并非將所有的組件都集成在一個單一的芯片上,而是將設(shè)計分解為多個處理器內(nèi)核(chiplets),然后通過共享資源(如緩存)將它們連接在一起,形成一個完整的芯片系統(tǒng)。然而,需要注意的是,實際的核心數(shù)量可能會給消費者帶來一定的誤導(dǎo),因為兩家公司都廣泛運用了多線程技術(shù),使得單個核心能夠同時為兩個執(zhí)行線程提供服務(wù),從而在一定程度上提升了處理器的并行處理能力。此外,英特爾最近推出的效率核心進(jìn)一步增加了情況的復(fù)雜性,這些效率核心雖然對峰值性能的提升貢獻(xiàn)有限,但在某些特定場景下也能發(fā)揮一定的作用。
總體而言,通常情況下,AMD 芯片在多核處理能力方面會表現(xiàn)得更為出色 —— 為了充分支持這些內(nèi)核的高效運行,AMD 往往會提供比英特爾更多的片上內(nèi)存。雖然 Ryzen 處理器沒有像 Apple 的芯片那樣將整個 RAM 分配集成在芯片內(nèi)部,但它們通常配備了較大容量的緩存,這些緩存能夠幫助處理器在全速處理數(shù)據(jù)和指令時,減少對外部 DIMM 內(nèi)存獲取信息的等待時間,從而提高整體的運行效率和性能表現(xiàn)。
然而,多核性能究竟能為用戶帶來多大的價值,這仍然是一個值得探討的問題。對于大型數(shù)據(jù)庫服務(wù)器和圖形渲染程序等對并行處理能力要求較高的應(yīng)用場景而言,多核性能無疑能夠帶來顯著的性能提升和效率改善;但對于許多日常的桌面應(yīng)用程序來說,它們大多屬于單線程應(yīng)用,在這種情況下,使用更少但速度更快的內(nèi)核可能反而會為用戶帶來更為流暢的使用體驗。因此,消費者在選擇 CPU 時,需要綜合考慮自身的實際使用需求、預(yù)算以及對性能的期望等多方面因素,權(quán)衡利弊,做出最為明智的決策。