看片91_日日综合_成人黄色短视频在线观看_91视频 - v11=Av_国产高潮失禁喷水爽到抽搐视频_天天都色视频

一文看懂CPU算力測算方法(Cpu算力)

小編:大悶頭 更新時間:2022-08-23 23:38

說到CPU算力,就不能不提到FLOPS了。

一文看懂CPU算力測算方法(Cpu算力)

FLOPS是CPU每秒浮點運算次數,也稱為每秒峰值速度,英語是Floating-point operations per second;簡寫就是FLOPS,flops 或者 flop/s。

在多數情況下,測算FLOPS比測算每秒指令數(IPS)要準確。

要測算FLOPS就要搞清楚浮點數的精度。

一文看懂CPU算力測算方法(Cpu算力)

浮點(floating-point)指的是帶有小數的數值,浮點運算就是小數的四則運算,常用來測量計算機運算速度或被用來估算計算機性能,特別是在科學計算領域會使用到大量的浮點運算,對CPU的算力性能要求就比較高了。

說到浮點計算能力,就涉及到半精度、單精度、雙精度三種類型,雙精度是64位的(FP64),單精度是32位的(FP32),半精度是16位的(FP16),半精度是英偉達在2002年搞出來的,雙精度和單精度是為了計算,而半精度更多是為了降低數據傳輸和存儲成本。

雙精度浮點數

一文看懂CPU算力測算方法(Cpu算力)

單精度浮點數

一文看懂CPU算力測算方法(Cpu算力)

半精度浮點數

一文看懂CPU算力測算方法(Cpu算力)

雙精度、單精度、半精度都分成3部分,符號位,指數和尾數。

不同精度只不過是指數位和尾數位的長度不一樣。

解析一個浮點數就5條規則

1、如果指數位全零,尾數位是全零,那就表示0

2、如果指數位全零,尾數位是非零,就表示一個很小的數(subnormal),計算方式 (?1)^signbit × 2^?126 × 0.fractionbits

3、如果指數位全是1,尾數位是全零,表示正負無窮

4、如果指數位全是1,尾數位是非零,表示不是一個數NAN

5、剩下的計算方式為 (?1)^signbit × 2^(exponentbits?127) × 1.fractionbits

常用的語言幾乎都不提供半精度的浮點數,這時候需要我們自己轉化。

所以,要做算力規劃時要結合其使用場景來分析,其實很多場景對于精度要求也沒那么高,例如:分布式深度學習里面,如果用半精度的話,比起單精度來可以節省一半傳輸成本。考慮到深度學習的模型可能會有幾億個參數,使用半精度傳輸還是非常有價值的。

通常,在沒有特別明確算力算法的前提下,我們默認都是按照雙精度去測算算力能力的。

一般做算力規模分析時會明確算力單位如EFLOPS,或PFLOPS,這就需要自己根據情況去換算了,但都是通過FLOPS換算而來的。

浮點計算值的換算單位:

一個MFLOPS(megaFLOPS)等于每秒一佰萬(=10^6)次的浮點運算

一個GFLOPS(gigaFLOPS)等于每秒拾億(=10^9)次的浮點運算

一個TFLOPS(teraFLOPS)等于每秒萬億(=10^12)次的浮點運算

一個PFLOPS(petaFLOPS)等于每秒千萬億(=10^15)次的浮點運算

一個EFLOPS(exaFLOPS)等于每秒百億億(=10^18)次的浮點運算

一個ZFLOPS(zettaFLOPS)等于每秒十萬京(=10^21)次的浮點運算

對于FLOPS的計算公式為: FLOPS=CPU核數*單核主頻*CPU單個周期浮點計算值*1000000

只要我們知道CPU的型號,就可以到對應的CPU廠商網站上查詢相關參數了。

下面我們拿intel的CPU為例,到Intel官網進行查詢,網址如下:https://ark.intel.com/content/www/us/en/ark/search.html

輸入具體的CPU型號,如 6240R,進入對應參數頁面。

https://ark.intel.com/content/www/us/en/ark/products/199343/intel-xeon-gold-6240r-processor-35-75m-cache-2-40-ghz.html

一文看懂CPU算力測算方法(Cpu算力)

CPU單個周期浮點計算值有點復雜,具體如下表

instruction set(指令集)

每時鐘周期的單精度運算次數

每時鐘周期的雙精度運算次數

SSE(128-bits)

8

4

AVX(256-bits)

16

8

AXV2(256-bits)

32

16

AXV256(512-bits)

64

16(FMA=1)

32(FMA=2)

那么,6240R的核數為10,主頻為2.4Hz,每時鐘周期的雙精度運算次數32,其單顆CPU的GFLOPS算力算法就是24*2.4*32=1843.2 GFLOPS

索性將之前用過的CPU都拿出來分析了一下,順便按照CPU計算能力排個序。

一文看懂CPU算力測算方法(Cpu算力)一文看懂CPU算力測算方法(Cpu算力)
主站蜘蛛池模板: av免费网站在线观看 | 国产在线一二 | 99草在线 | 91视频精品 | 国产综合视频在线观看 | 一区二区三区在线播放 | 久久久穴| 国产成人精品久久久 | 91精品久久久久 | 国产一区精品在线 | 夜夜导航 | 欧美福利网站 | 久久久久亚洲一区二区三区 | 久久国产精品无码网站 | 青草网| 91精品久久久久久久久久入口 | 久久久久久国产精品免费免费 | 精品欧美一区二区久久久伦 | 国产欧美日韩综合精品一区二区 | 福利视频在线导航 | 欧美成人国产va精品日本一级 | 久久久久国产精品 | 成人av福利 | 黄色网址入口 | 国产区av | 亚洲国产精品久久久久秋霞不卡 | 亚洲专区久久 | 亚洲精品av在线 | 97视频在线观看免费 | 亚洲视频观看 | 九九在线免费视频 | 精品欧美一区二区精品久久久 | 在线观看视频一区 | 一区在线观看视频 | 在线视频国产一区 | 亚洲一区二区免费看 | 在线国产精品视频 | 欧美成人a | 玖玖久久 | 亚洲 欧洲 日韩 | 日本在线不卡视频 |