2020年12月14日月曜日

2020 China HPC Top100, Nov 15, 2020

スパコンポエム Advent Calendar 2020 https://qiita.com/advent-calendar/2020/sc_poem
への参加です (2020年12月15日)。
※12月14日のポエム:ロシア MCST Elbrusについてのまとめ
※連続ツイートを埋め込むと悲惨なので過去ツイートはリンク掲載としました。


SC20開催期間の 11月15日 (日) に北京で第二届中国超级算力大会 ChinaSC2020暨中国大数据与智能计算产业联盟理事会が開催され、China HPC TOP100が発表されました (理事会の公式サイトは見つかりません)。
※2019年は 11月8日の ChinaSC2019で発表で SC19: 11月17~22日より前でした。

概要

  • China HPC TOP100, 2000: 1 - 10
  • China HPC TOP100, 2000: 全体
  • China HPC TOP100, 2000: 実行効率 (EPYC, Xeon Gold)
  • Exascale Prototypes
  • しかしながら…
  • 過去のデータ (2003年~)
  • ※ページ内リンク設定が解らないのでスクロールして下さい。
  • +追記:2020年12月22日


China HPC TOP100, 2000: 1 - 10

China HPC TOP100サイト:HPC TOP100排行榜 http://www.hpc100.cn/ はまだ更新されてないので、以下の記事と過去ランクからまとめました。
"2020中国高性能计算机TOP100榜单正式发布", 

1: 神威太湖之光, 国家超级计算无锡中心 (注)
40960x Sunway SW26010 260C 1.45GHz
自主网络
Linpack Performance (Rmax) 93,015 TFlop/s
Theoretical Peak (Rpeak) 125.436.0 TFlop/s
74.2% 
注)http://www.nsccwx.cn/ サイトが無くなりました。
江苏省产业技术研究院 http://en.jitri.org/  英語ページに以下の紹介だけ
National Supercomputing Wuxi Center http://en.jitri.org/yanjiuyuan75.html 

2: 天河二号升级系统 (Tianhe-2A), 国家超级计算广州中心
TH-IVB-MTX Cluster
35584x Intel Xeon E5-2692v2 12C 2.2GHz +
35584x Matrix-2000
TH Express-2 
Linpack Performance (Rmax) 61,445 TFlop/s
Theoretical Peak (Rpeak) 100,679 TFlop/s
61.0% 

3 (NEW): 北京超级云计算中心 (A分区) 北京超级云计算中心
Dell
6,000x AMD EPYC 7452 32 Cores, 2.350 GHz
FDR
Linpack Performance (Rmax) 3,185 TFlop/s
Theoretical Peak (Rpeak) 5,345 TFlop/s
53.2%
"北京超级云计算中心荣获2020 HPC TOP100榜单中国超算TOP3!通用CPU算力第一!"
2020-12-11 http://www.cnic.cas.cn/xwdt/zhxw/202012/t20201211_5815097.html

4: (NEW): 内蒙古高性能计算公共服务平台 “青城之光”, 内蒙古自治区和林格尔新区的新超算
同方
3,200x Intel Xeon Gold 6254 18 Cores, 3.1 GHz
EDR
Linpack Performance (Rmax) 3,089 TFlop/s
Theoretical Peak (Rpeak) 6,080 TFlop/s
50.6%
"内蒙古高性能运算总能力和规模跃居全国超强行列", 2020-11-17
「自治区政府投资、自治区科技厅主管、清华大学设计、同方股份研制,内蒙古和林格尔新区承建。设备总投资3亿元,平台建设包括通用计算系统、人工智能加速计算系统、大数据存储支撑系统、节点互联网络、基础配套系统等系列工程项目」
清华大学が設計、同方社が開発、3億元

5 - 10: 网络公司 (ネットワーク系会社、会社名不明)
联想深腾 8800系列
Intel Xeon Gold 6xxx
25GbE / 10GbE
Linpack Performance (Rmax) 3,089 - 2,962 TFlop/s
Theoretical Peak (Rpeak) 6,080 - 5,824 TFlop/s
50.x%

1 - 10位の一覧 (冒頭の記事サイトにこれはないので別サイトから)
"2020中国高性能计算机TOP100榜单揭晓", 2020/11/15 http://news.sciencenet.cn/htmlnews/2020/11/448592.shtm

3、4位が新規で、1 - 10位のうち 联想が 6システム (どれが新規か不明)。
2位:天河二号 (Rmax: 61.445 PF) と 3位:北京超级云计算中心 (Rmax: 3.185 PF) の差が非常に大きいですが、2019年は 3位:网络公司 (联想、Rmax: 3.089 PF)、网络公司、联想が 3 - 8位 6システムでした。
9: 天河一号A (今年は該当システム見当たらず)
14336x Intel Hexa Core Xeon X5670 6C 2.93GHz, 私有高速网络 80Gb
Linpack Performance (Rmax) 2,566 TFlop/s
Theoretical Peak (Rpeak) 4,711 TFlop/s
54.6%
10: 神威E级原型原型系统 (後述)
1024x SW26010+ 260C 1.5GHz, SW-Net
Linpack Performance (Rmax) 2,556 TFlop/s
Theoretical Peak (Rpeak) 3,130 TFlop/s
81.5%

China HPC TOP100, 2000: 全体

システム数では
联想:35システム
浪潮:32システム
曙光:22システム
3社で 89% 
他の商業メーカは Dell (3位)、同方 (4位)、华为、联泰集群が各 1システム

4 PFLOPS以上は 2システム、4~2が 79、2~1.5が 19システム。
メーカー別性能分布グラフ http://www.mittrchina.com/news/5819


99%が国産 OSを採用。

China HPC TOP100, 2000: 実行効率 (EPYC, Xeon Gold)

3 (NEW): 北京超级云计算中心 (A分区)、Dell
6,000x AMD EPYC 7452 32 Cores, 2.350 GHz: FDR
3,185 TFlop/s, 5,345 TFlop/s
53.2%
と比較的近い AMD EPYCのみ構成のシステムを比べると
HAWK, Top500 No. 16, Nov 2020
APOLLO 9000, AMD EPYC 7742 64C 2.25GHZ, MELLANOX HDR INFINIBAND
19,334 TFlop/s, 25,159.7 TFlop/s
76.8%
実効効率に大きな差がある。
Xeon Gold系 (20位以内は 16位の浪潮:61.4%を除き联想は 50.x - 51.x% )
ROXY, Top500 No. 32, Nov 2020
APOLLO 2000, XEON GOLD 6248 20C 2.5GHZ, INFINIBAND EDR
8,124.48 TFlop/s, 13,977.6 TFlop/s
58.1%
でも差がある。联想は同じサイトへの導入かもしれないが、多くが同じような実行効率。


Exascale Prototypes

2018年の China HPC Top100で以下の 3システムが初登録
2018年中国高性能计算机性能TOP100排行榜 http://www.hpc100.cn/top100/17/
HPC China 2018で発表、2019年からは ChinaSCで発表 (2019年が第一回開催)。

4位:神威E级原型系统,SW26010+ 260C 1.5GHz,SW-Net
266240コア
Linpack Performance (Rmax) 2,556.0 TFlop/s
Theoretical Peak (Rpeak) 3,130 TFlop/s
81.5%
6位:国防科技大学E级高性能计算机原型系统
196608コア
Linpack Performance (Rmax) 2,469.0 TFlop/s
Theoretical Peak (Rpeak) 3,146.0 TFlop/s
78.5%
9位:曙光E级原型机
1024x Hygon 7185 / 512x Hygon DCU
200Gb 6D-Torus
65536コア
Linpack Performance (Rmax) 2,274.0 TFlop/s
Theoretical Peak (Rpeak) 3,198.0 TFlop/s
71.1%


Exascale Prototypesについては 钱德沛 (Depei Qian) 教授、北京航空航天大学计算机学院 (Beihang University) / 中山大学 (Sun Yat-sen University) の SC17併設ワークショップ:Workshop on International Next-Generation Computing Programs
"China's New HPC Key Project", Nov 13, 2017
が比較的詳しく解説されています。
※Sugonの DCU の "D"は Dataflowかもしれません…

"Tianhe-3 and the Exascale Road in China", NUDT, Invited, Riken-CCS International Symposium, Feb 19 2019
NUDTで進めている Prototype: Tianhe-3の紹介以外に、他のグループの Prototypeについての紹介があります。

全体的な講演
"China's effort on Supercomputing: progress and applications", 国家超级计算天津中心, Plenary, Lattice 2019,

CCF Transaction on HPC掲載論文、CCF: China Computer Federation
"Paving the way for China exascale computing", Yutong Lu (卢宇彤), 国家超级计算广州中心, , Aug 9 2019
曙光 (Sugon) E级原型机の 6-D Interconnectについては
"Wormhole optical network: a new architecture to solve long diameter problem in exascale computer", CAS, CCF Trans on HPC, May 6 2019

今までの NUDT Interconnect関連のスライドや学会発表
"Optimal Implementation of In-Band Network Management for High-Radix Switches", ACA 2020はもしかしたら Prototypeに関係するかもしれません。

比較的最近の钱德沛 (Depei Qian) 教授の ISC 2020での講演や論文
"Status Report from China", ISC 2020 と、次の 5ヶ年計画:“十四五” に向けての動き
"“十四五”高性能计算研究方向进入建议研究阶段"、新闻—科学网、2020/9/29

"E 级计算的几个问题 (Key issues in Exascale computing)", 钱德沛 (Depei QIAN)、王锐 (Rui WANG)、北京航空航天大学 (Beihang Univ)、中国科学:信息科学、2020年 第9期
 7个方面, 探讨了需要重点研究和解决的技术问题


Jack Dongarra教授の Russian Supercomputing Days, Sep 22 2020での Plenary講演:
"HPC: The Where We Are Today And A Look Into The Future"
China's Plans
2020-22: 1-2 Eflop/s
2021-25: 2x 10 Eflop/s (これは上記の “十四五” と思われます)



しかしながら…

公開されている HPC China Top100をよく見ると:
2018 => 2019 => 2020
4, 10, 30:神威E级原型原型系统
2018: 2,556.0, 3130.0, 81.5%
2019: 2,556.0, 3130.0, 81.5%
2020: 2,556.0, 3130.0, 81.5%
6, 12, 34:国防科技大学E级原型系统
2018: 2,469.0, 3146.0, 78.5%
2019: 2,469.0, 3146.0, 78.5%
2020: 2,469.0, 3146.0, 78.5%
9, 16, 50:曙光E级原型机
2018: 2,274.0, 3198.0, 71.1%
2019: 2,274.0, 3198.0, 71.1%
2020: 2,274.0, 3198.0, 71.1%
3システムすべてで 3年間の進展が全く見られません、何故?

しかも、あらなんと、
神威太湖之光, 国家超级计算无锡中心
93,015 TFlop/s, 125.436.0 TFlop/s, 74.2%
初登録の 2016年:1位から 2020年まで同じ値
天河二号升级系统 (Tianhe-2A), 国家超级计算广州中心
61,445 TFlop/s, 100,679 TFlop/s, 61.0% 
初登録の 2017年:2位から 2020年まで同じ値

今後の楽しみが増えましたね、で、今回はお仕舞いです。


+追記:2020年12月22日
"An efficient dataflow accelerator for scientific applications", Future Generation Computer Systems, Nov 2020 (Mar 10, 2020)
"we design SPU, an efficient dataflow architecture for scientific applications. "
"The experimental results show that the average energy efficiency of SPU achieves 25.97GFlops/W in 40 nm technology and the utilization of floating point function units in SPU is 2.82x that of typical dataflow architecture on average for typical scientific applications."
+追記:2020年12月22日ここまで


過去のデータ (2003年~)

2020年中国高性能计算机性能TOP100排行榜 http://www.hpc100.cn/top100/19/
※現時点では未だ更新されていません。
2019年中国高性能计算机性能TOP100排行榜 http://www.hpc100.cn/top100/18/
2018年中国高性能计算机性能TOP100排行榜 http://www.hpc100.cn/top100/17/
2017年中国高性能计算机性能TOP100排行榜 http://www.hpc100.cn/top100/16/
2002 ~ 2019年历史榜单 http://www.hpc100.cn/top100/list/ 
※何故か 2018年だけ PDFファイル?

0 件のコメント:

コメントを投稿

Tesla Memo [3/3] : Tesla AI Day, Aug 19, 2021

Teslaについて過去ツイートを纏めてみました (Memo from my past tweets)。 Tesla Memo [1/3] : Tesla Autonomy Investor Day, Apr 2019 - Sep 2020 https://this-may-int...