AMD 线程撕裂者3970x确实很猛

xiasite
01月12日 字数 362

刚装好两台3970x做蒙特卡罗计算集群,程序主要是矩阵运算。编译用的Intel的MKL

库。实测单核能力大约是以前用的Intel至强 E5 2650 V2 的三倍(同样蒙特卡罗步用时

为至强的1/3)。看CPUZ或者CPU benchmark上的打分,单核3970x不到 E5 2650的两

倍,大概是 3:1.7的样子?说明科学计算3970x不虚?

用的安耐美的360水冷,一开始担心24小时运行散热会不过关,实际看上去好像还行, 基

本不会高于80度。

CompMarket 电脑市场
37 个回复
hgoldfish
老鱼 01月12日

用的 mkl 有没有负优化?

【 在 xiasite (夏) 的大作中提到: 】

: 刚装好两台3970x做蒙特卡罗计算集群,程序主要是矩阵运算。编译用的Intel的MKL

: 库。实测单核能力大约是以前用的Intel至强 E5 2650 V2 的三倍(同样蒙特卡罗步用时

: 为至强的1/3)。看CPUZ或者CPU benchmark上的打分,单核3970x不到 E5 2650的两

: ...................

xiasite
01月12日

确实有。用了著名的export MKL_DEBUG_CPU_TYPE=5后加速将近一倍。

【 在 hgoldfish (老鱼) 的大作中提到: 】

: 用的 mkl 有没有负优化?

myspam
mys/梅艳珊/珊珊/Pam/帕姆 01月12日

加这个环境变量是不是开启AVX-2指令集啊?

【 在 xiasite 的大作中提到: 】

: 确实有。用了著名的export MKL_DEBUG_CPU_TYPE=5后加速将近一倍。

Akyrum
人類に栄光あれ 01月12日

没翻过反汇编,不过我在3900x上用了这个环境变量后矩阵乘和矩阵逆耗时降为原来四分之一,估计是avx2才能有这么高的加速比

【 在 myspam (mys/梅艳珊/珊珊/Pam/帕姆) 的大作中提到: 】

: 加这个环境变量是不是开启AVX-2指令集啊?

tangke
坦克 01月12日

发个配置单上来看看啊

【 在 xiasite 的大作中提到: 】

: 刚装好两台3970x做蒙特卡罗计算集群,程序主要是矩阵运算。编译用的Intel的MKL

: 库。实测单核能力大约是以前用的Intel至强 E5 2650 V2 的三倍(同样蒙特卡罗步用时

: 为至强的1/3)。看CPUZ或者CPU benchmark上的打分,单核3970x不到 E5 2650的两

: ...................

myspam
mys/梅艳珊/珊珊/Pam/帕姆 01月12日

avx指令集是做哪些运算快很多啊,为什么用avx后会让CPU暴热

【 在 Akyrum 的大作中提到: 】

: 没翻过反汇编,不过我在3900x上用了这个环境变量后矩阵乘和矩阵逆耗时降为原来四分之一,估计是avx2才能有这么高的加速比

xiasite
01月13日

CPU: AMD threadripper 3970x

主板: 技嘉TRX40 AORUS PRO WIFI

内存:美商海盗船  DDR4 3200 64GB套装x2共128G

SSD:三星 500GB  970 EVO Plus

散热器: 安耐美(Enermax)锐龙TR4 360一体式水冷散热器

电源:  安钛克 )HCG850金牌全模组  850W

显卡: 技嘉 GeForce GTX 1050Ti

一共应该是2.9万块一台.

这个主板一开始硬是点不亮,装机的人搞了半天,最后才察觉是BIOS没更新,拿到总代

更新后才好的。

【 在 tangke (坦克) 的大作中提到: 】

: 发个配置单上来看看啊

tangke
坦克 01月13日

这配置好高级

【 在 xiasite 的大作中提到: 】

: CPU: AMD threadripper 3970x

: 主板: 技嘉TRX40 AORUS PRO WIFI

: 内存:美商海盗船  DDR4 3200 64GB套装x2共128G

: ...................

blackhill
01月13日

最近发现技嘉的主板真不行

如果能选还是微星和华硕的

【 在 xiasite 的大作中提到: 】

: CPU: AMD threadripper 3970x

: 主板: 技嘉TRX40 AORUS PRO WIFI

: 内存:美商海盗船  DDR4 3200 64GB套装x2共128G

: ...................

cassiopeia
thinker 01月13日

请问硬盘是m.2 nvme 的吗?插在主板的哪个位置啊?可否上图看看,配置真牛?

【 在 xiasite 的大作中提到: 】

: CPU: AMD threadripper 3970x

: 主板: 技嘉TRX40 AORUS PRO WIFI

: 内存:美商海盗船  DDR4 3200 64GB套装x2共128G

: ...................

xiasite
01月13日

诶,今天发现有台机器突然少认了一根内存,四通道变三通道,计算速度瞬间掉一半。

喊装机商来换主板了。主要是以前一直用技嘉的主板,据说技嘉对Linux支持最好?

【 在 blackhill (克) 的大作中提到: 】

: 最近发现技嘉的主板真不行

: 如果能选还是微星和华硕的

xiasite
01月13日

是的, m.2 nvme. 在pcie插槽附近吧。

【 在 cassiopeia (thinker) 的大作中提到: 】

: 请问硬盘是m.2 nvme 的吗?插在主板的哪个位置啊?可否上图看看,配置真牛?

cesr
cesr 01月13日

是的 俺研究过 不用这个的话是sse

发自「今日水木 on LYA-AL00」

【 在 myspam 的大作中提到: 】

: 加这个环境变量是不是开启AVX-2指令集啊?

: --

cesr
cesr 01月13日

矩阵运算就是avx啊 当然爆热

发自「今日水木 on LYA-AL00」

【 在 myspam 的大作中提到: 】

: avx指令集是做哪些运算快很多啊,为什么用avx后会让CPU暴热

: --

Akyrum
人類に栄光あれ 01月13日

我还遇到过x570+3900x上两条双面16G的内存windows只认24G,cpu-z里看两个spd都在。后来老老实实降频到2666用了

【 在 xiasite (夏) 的大作中提到: 】

: 诶,今天发现有台机器突然少认了一根内存,四通道变三通道,计算速度瞬间掉一半。

: 喊装机商来换主板了。主要是以前一直用技嘉的主板,据说技嘉对Linux支持最好?

XiaChuan
夏川 01月13日

这个运算是搞搞什么的?人工智能?

【 在 xiasite (夏) 的大作中提到: 】

: 刚装好两台3970x做蒙特卡罗计算集群,程序主要是矩阵运算。编译用的Intel的MKL

: 库。实测单核能力大约是以前用的Intel至强 E5 2650 V2 的三倍(同样蒙特卡罗步用时

: 为至强的1/3)。看CPUZ或者CPU benchmark上的打分,单核3970x不到 E5 2650的两

: ...................

iMx
围城 01月13日

mkl好像对amd负优化?

【 在 xiasite (夏) 的大作中提到: 】

: 刚装好两台3970x做蒙特卡罗计算集群,程序主要是矩阵运算。编译用的Intel的MKL

: 库。实测单核能力大约是以前用的Intel至强 E5 2650 V2 的三倍(同样蒙特卡罗步用时

: 为至强的1/3)。看CPUZ或者CPU benchmark上的打分,单核3970x不到 E5 2650的两

: ...................

tangke
坦克 01月13日

找的装机商装的?如何保证硬件都是新的?

【 在 xiasite 的大作中提到: 】

: 诶,今天发现有台机器突然少认了一根内存,四通道变三通道,计算速度瞬间掉一半。

: 喊装机商来换主板了。主要是以前一直用技嘉的主板,据说技嘉对Linux支持最好?

Acui
中关村老崔-要多读书多思考 01月13日

难道二手东可以保证是新的?

【 在 tangke (坦克) 的大作中提到: 】

: 标  题: Re: AMD 线程撕裂者3970x确实很猛

: 发信站: 水木社区 (Mon Jan 13 09:50:09 2020), 站内

: 【 在 xiasite 的大作中提到: 】

: : 诶,今天发现有台机器突然少认了一根内存,四通道变三通道,计算速度瞬间掉一半。

: : 喊装机商来换主板了。主要是以前一直用技嘉的主板,据说技嘉对Linux支持最好?

: 找的装机商装的?如何保证硬件都是新的?

: --