a一级爱做片免费观看欧美,久久国产一区二区,日本一二三区免费,久草视频手机在线观看

博客專欄

EEPW首頁 > 博客 > Alder Lake處理器深入把玩:雙內核效能對比,未來移動版性能預覽

Alder Lake處理器深入把玩:雙內核效能對比,未來移動版性能預覽

發布人:超能網 時間:2021-12-19 來源:工程師 發布文章

其實自Intel Alder Lake處理器要用x86混合架構的消息傳出,與之相關的爭論就沒停過,爭論的重點基本上都在桌面處理器有沒有必要用E-Core這一點,對于移動處理器來說,E-Core確實挺有用的,畢竟筆記本的體積是有限的,要控制發熱量,而且還需要考慮續航問題,降低發熱和功耗這正是E-Core在行的。但臺式機的散熱器大得多,處理器的熱功耗設計和筆記本相比可以大許多, 也不需要太過在意節能的問題。

1.jpg

那么為什么Intel還要在Alder Lake-S里面塞E-Core呢?Alder Lake所用的P-Core也就是Golden Cove的IPC與頻率都很高,有著很強的單線程性能,而想提升多線程性能的話就需要堆砌大量的P-Core,不過P-Core的核心面積實在是太大了,堆太多的話發熱太大就會影響頻率。還有就是芯片面積的問題,下一代Xeon可擴展處理器Sapphire Rapids單個芯片里面就有15個Golden Cove,根據Intel的資料它的芯片面積大約是400mm2,這尺寸肯定不能直接扔主流消費市場。

那么如果確保處理器有足夠的單線程性能,又在不大幅增加芯片面積的情況下增加多線程性能呢?Intel給出的答案就是混合架構的Alder Lake,在此架構里P-Core的目的是提升處理器的單線程性能,而E-Core的設計目的則是用更低的功耗來提升多線程性能,因為E-Core相當省晶體管,大概4個E-Core的芯片面積才和1個P-Core這么大。

2.jpg

這里直接借用一下@Locuza_做的圖

從上圖可以看到,1個E-Core的芯片面積大概1.7mm2,而4個E-Core加上2MB L2緩存的面積是8.78mm2,只是略大于一個P-Core加上它的1.25MB L2緩存,但根據官方的說法,4個E-Core所提供的多線程性能是要遠高于1個開啟超線程的P-Core的,所以桌面的Alder Lake-S上那8個E-Core的主要作用確實是用來拉高處理器的多線程性能的,節能作用只是其次。

3.jpg

桌面版Alder Lake-S的8P+8E組合是Alder Lake里面核心數量最多的,移動版的Alder Lake-P最多只有6P+8E,但核顯的規模增大,并且增加了Thunderbolt 4控制器和IPU圖像處理單元,低功耗移動版更是只有2P+8E,而下一代的Raptor Lake處理器更是打算把E-Core數量增加到16個 ,看來這E-Core是真的好用,而且堆起來性價比也很高。

其實我們在首測的時候是想單獨測試P-Core和E-Core的性能的,但實際上只能單獨把E-Core完全關閉,P-Core至少得保留一個,所以那時候就沒關于E-Core的測試,現在我們換個思路,來試下不同P-Core和E-Core的組合會對性能有什么影響。

測試平臺與說明

4.png

測試平臺就是同步評測那套,使用Core i9-12900K處理器,華碩ROG MAXIMUS Z690 HERO主板,兩條16GB芝奇RIPJAWS S5 DDR5-5200內存,時序是CL40-40-40-76,顯卡是NVIDIA GeForce RTX 3090 Founder Edition。這次測試是通過關閉Core i9-12900K的P-Core和E-Core來驗證不同核心組合性能,我們并不會處理器的頻率做任何改動,如果沒特殊說明的話就是默認解鎖功耗限制,這次只是一個驗證性的測試,所以測試的項目會比首發評測少很多。

Core i9-12900K默認的睿頻設置請看下表:

5.png

驗證一:4P和2P+8E誰更強

為什么會選這樣的組合來測呢?因為4個E-Core的芯片面積和1個P-Core大致相同,Intel也說過2個P-Core加8個E-Core的多線程性能是比4個P-Core更好的,所以我們就來驗證一下,附帶測下1 P-Core+8 E-Core以及1 P-Core+4 E-Core的組合。

理論測試

6.png7.png8.png9.png

單純看各個測試的多線程測試的話,2P+8E的組合多線程性能是要比4P更強的,畢竟核心線程數量差距擺在那里,兩個P-Core多線程性能確實不如8個E-Core,甚至1P+8E的多線程性能也和4P差不多。

但認真去看這些數據的話,你會發現只剩1個P-Core時單線程性能是明顯下降了的,這可能與Windows的顯存輔助均衡調度算法有關。

此外看3DMark CPU Profile的測試結果,4個P-Core在4線程和8線程時得分是要比2P+8E要高的,單線程性能相同,雙線程的結果可能是單純的測試誤差,說明在8個線程內P-Core其實要比2P+8E更強,只有在兩個都是最大線程時多線程性能才會拉開差距。

其實如果光看多線程性能的話,8個E-Core是肯定要比2個P-Core更好的,兩者的芯片面積也差不多,那在有限尺寸的晶圓上全堆E-Core多線程性能不是更好?更何況Gracemont架構本身是支持超線程的,只不過在Alder Lake里面它是E-Core沒這個必要所以沒開而已,事情肯定沒這么簡單,不然Intel也不會畫這么大力氣去搞個混合架構了。

游戲性能

10.png

消費級處理器在絕大部分情況下都不會全線程一齊負載的,單線程性能有多重要這個游戲就會告訴你,測試的4個游戲里面4P與2P+8E在《全面戰爭:三國》和《Far Cry 6》幀數差距不大,但《古墓麗影:暗影》與 《銀河破碎者》里2P+8E就明顯落后4P很多,如果進一步削減P-Core數量的話性能下降得更厲害,1P+8E的游戲性能與2P+8E差很多,1P+4E的性能下降幅度反而沒那么大。

很明顯,E-Core在游戲里面幫不上太大的忙,主要還是得看單線程性能強得多的P-Core,就如Intel在架構日上所說的那樣,P-Core是用來提供單線程性能的,而E-Core則是在盡量節能的情況下提升多線程性能。

功耗測試

11.png12.png

雖然我沒對Core i9-12900K的頻率進行改動,但因為睿頻的關系它在不同核心數量時頻率還是不一樣的,核心數量越少全核頻率就越高,這會對CPU的功耗帶來微妙的影響,但整體來說還是關閉核心帶來的影響更大,4個P-Core的功率是要比2個P-Core加8個E-Core功耗高8%的,后者的組合帶來的多線程提升反而更大一點,怪不得Intel下一代產品還要繼續增加E-Core數量。

2P+8E跑FPU的功耗是112W,而1P+8E則是84W,大致可推算出一個P-Core的功耗是28W,而1P+4E的功耗是60W,大致可推算出一組4個E-Core的功耗是24W,當然這只是大致的推算,并不是十分準確的數值,但依然看得出E-Core在能耗方面確實要比P-Core好不少。

驗證二:超線程有多大作用

由于Core i9-12900K是16核24線程的,然后你會發現把E-Core關閉或者把P-Core的超線程關閉的話都會變成16線程,只是這16線程的組成成分不太一樣,下面就來對比一下這兩個組合的性能,并且會放上完整的Core i9-12900K的成績作為參照。

理論測試

13.png14.png15.png16.png

基本上這三種組合單線程性能沒多大差別,多線程性能大部分情況下8P+8E 16T是要優于8P 16T的,畢竟多了8個物理核心怎么都比8個邏輯核心要強,當然7-Zip的解壓縮測試是個例外,只有這里8P 16T是要比8P+8E 16T更強的。

3DMark CPU Profile這個分線程數的測試我們能看出更多有趣的事,8P 16T在4線程和8線程的成績是要遠比8P+8E 16T和8P+8E 24T更低的,2線程時也略微低一些,這很有可能是線程調用出了問題,在E-Core開啟的時候線程被正確分配到P-Core上,沒有調用到虛擬的邏輯核心,但在只有P-Core的時候調度可能出了問題,線程被分配到邏輯核心上,導致性能明顯下降。

16線程時8P 16T的得分也是低于8P+8E 16T的,不過這就不是線程調度的原因了,單純是8個E-Core性能比8個P-Core超線程弄出來的邏輯核心性能更強。8P+8E 16T在8線程和16線程時性能比8P+8E 24T好一點,這是因為P-Core在關閉超線程后全核頻率從4.8GHz提升到4.9GHz,而且我們可以從16線程的得分看出此時Core i9-12900K是優先使用E-Core來進行負載的,而不是使用P-Core的超線程。

游戲性能

17.png

這三個組合的游戲性能差別倒是不大,畢竟P-Core數量管夠,硬要說的話就是關閉超線程后性能會高那么一點點,因為這種情況下P-Core的全核頻率更高,關閉超線程也對CPU的單線程性能有輕微提升,但不怎么明顯就是了。

功耗測試

18.png19.png

Core i9-12900K在華碩ROG Z690 Hero主板上跑AIDA 64 FPU AVX2負載時功耗是242W,關閉全部E-Core的話功耗會降低到213W,而關閉超線程的功耗則是214W,兩者的功耗如此接近比較意外的,當然了兩者的溫度其實相差很遠,關閉E-Core后會讓熱量更為集中,就算用360一體式水冷也很難壓住,關閉超線程的話會降低P-Core的發熱,讓CPU溫度下降到只有70多度。

驗證三:預測下未來的移動版Alder Lake

移動版的Alder Lake-P會在明年1月的CES上發布,和桌面版Alder Lake-S相比,核顯的EU單元從32個增加到96個,而CPU則從8P+E8變成了6P+8E,核顯規模我們沒法模擬,但CPU性能我們可以通過減少兩個P-Core和限制CPU的PL1和PL2功耗進行模擬,當然了,Core i9-12900K的L3緩存應該會比移動版處理器多6MB,這個就沒辦法了。

這個測試里面我們會把Core i9-12900K關到6P+8E的狀態,會分別測試解鎖功耗以及把功耗限制到PL2=105W,PL1=45W,Tau=56秒的性能,這功耗限制是我們根據現在的11代酷睿H45處理器來設定的,未來的Alder Lake H45的標準功耗估計也差不多這樣,而測試解鎖功耗限制的是單純想看看這種核心組合的性能上限,畢竟不少游戲本也會把處理器的PL1和PL2值設置到很高,當然性能肯定會和我們現在用桌面處理器模擬有一定差距。

理論測試

20.png21.png22.png23.png24.png

從各個測試來看,單線程性能基本沒太大影響,畢竟只有單線程輔助時根本摸不到PL2的105W,基本可以滿血跑完所有的測試。多線程的話,如果不限制功耗,6P+E8依然會比8P+8E性能下降10%~20%,加上功耗限制影響就大了,像CPU-Z這樣的短時間測試性能降幅不會很明顯,因為都在PL2的時間范圍內,而R23這種10分鐘以上的長時間測試,只有56秒的PL2就可以忽略不計了,絕大部分時間都只有45W,性能降幅相當明顯。

但換個角度去看,Core i9-12900K關掉兩個核后FPU烤機功率是175W,把它限制成只有45W的話依然能發揮出原本60%的性能,Alder Lake架構以及Intel 7工藝在能耗方面確實做得很不錯。

游戲性能

25.png

把Core i9-12900K關兩個P-Core游戲性能影響不大,也就《銀河破碎者》這個比較吃CPU的有一點下降,限制功耗后,有三款游戲大概有10%的幀率下降,《全面戰爭:三國》這游戲這么吃CPU性能居然沒變我是比較驚訝的。

從測試結果來看未來的移動版Alder Lake處理器性能還是比較不錯的,在限制了功耗的情況下最差情況下依然有Core i9-12900K的一半性能,如果負載較輕時會發揮出更佳性能,當然實際在筆記本上肯定會被散熱設計以及搭配的內存影響性能發揮,我們的測試只是大致模擬。

總結

簡單歸納一下這次測試,Alder Lake里面的一個P-Core和四個E-Core芯片面積接近,四個E-Core的多線程性能大概比一個P-Core高出10~15%,而且功耗要低15%左右,在提升多線程性能和降低功耗方面,E-Core功不可沒,所以Intel下一代的Raptor Lake打算繼續堆E-Core來提升多線程性能。

當然了,只有E-Core是肯定不行的,因為E-Core的IPC只比Skylake好一點,而且它的頻率并不算高,實踐證明P-Core數量太少的話會嚴重影響游戲性能,至于需要多少個P-Core那就得看游戲需求了,每個主線程能分到一個獨立的P-Core那當然是最好的狀態,Alder Lake以及Raptor Lake最多8個P-Core的設計Intel肯定是在多年的數據收集后統計出來的。

關閉P-Core的超線程對Core i9-12900K來說大概會讓多線程性能降低10~30%,具體數值得看負載是什么,不過可以確定的是在16線程內的負載是不會造成任何影響的,只有在需要調用超過16線程時才會動用到邏輯核心,關閉超線程的話可以讓CPU的溫度與功耗大幅降低,這也是解決Core i9-12900K溫度過高的其中一個方法,當然不怎么建議這么做就是,限制功耗同樣可以達到降溫的目的,而且性能損失沒那么大。

在對未來移動版的Alder Lake處理器的模擬當中,我們可以看出這處理器的能耗比其實是相當棒的,在關閉兩個核心并且限制PL1=45W后,此時滿載功耗只有原來的18.5%,它依然能發揮出接近Core i9-12900K至少50%的多線程性能,而游戲性能方面至少有80%,明年的Alder Lake-P移動處理器是相當值得期待的。

*博客內容為網友個人發布,僅代表博主個人觀點,如有侵權請聯系工作人員刪除。



關鍵詞: CPU

相關推薦

技術專區

關閉