スパコンポエム Advent Calendar 2020 https://qiita.com/advent-calendar/2020/sc_poem
への参加です (2020年12月15日)。
※12月14日のポエム:ロシア MCST Elbrusについてのまとめ
※連続ツイートを埋め込むと悲惨なので過去ツイートはリンク掲載としました。
SC20開催期間の 11月15日 (日) に北京で第二届中国超级算力大会 ChinaSC2020暨中国大数据与智能计算产业联盟理事会が開催され、China HPC TOP100が発表されました (理事会の公式サイトは見つかりません)。
※2019年は 11月8日の ChinaSC2019で発表で SC19: 11月17~22日より前でした。
概要
- China HPC TOP100, 2000: 1 - 10
- China HPC TOP100, 2000: 全体
- China HPC TOP100, 2000: 実行効率 (EPYC, Xeon Gold)
- Exascale Prototypes
- しかしながら…
- 過去のデータ (2003年~)
- ※ページ内リンク設定が解らないのでスクロールして下さい。
- +追記:2020年12月22日
China HPC TOP100サイト:HPC TOP100排行榜 http://www.hpc100.cn/ はまだ更新されてないので、以下の記事と過去ランクからまとめました。
"2020中国高性能计算机TOP100榜单正式发布",2020-11-16 http://www.mittrchina.com/news/5819
1: 神威太湖之光, 国家超级计算无锡中心 (注)
40960x Sunway SW26010 260C 1.45GHz
自主网络Linpack Performance (Rmax) 93,015 TFlop/sTheoretical Peak (Rpeak) 125.436.0 TFlop/s74.2%
注)http://www.nsccwx.cn/ サイトが無くなりました。
江苏省产业技术研究院 http://en.jitri.org/ 英語ページに以下の紹介だけ
National Supercomputing Wuxi Center http://en.jitri.org/yanjiuyuan75.html
2: 天河二号升级系统 (Tianhe-2A), 国家超级计算广州中心
TH-IVB-MTX Cluster35584x Intel Xeon E5-2692v2 12C 2.2GHz +35584x Matrix-2000
TH Express-2
Linpack Performance (Rmax) 61,445 TFlop/sTheoretical Peak (Rpeak) 100,679 TFlop/s61.0%
3 (NEW): 北京超级云计算中心 (A分区) 北京超级云计算中心
Dell6,000x AMD EPYC 7452 32 Cores, 2.350 GHzFDRLinpack Performance (Rmax) 3,185 TFlop/sTheoretical Peak (Rpeak) 5,345 TFlop/s53.2%
"北京超级云计算中心荣获2020 HPC TOP100榜单中国超算TOP3!通用CPU算力第一!"
2020-12-11 http://www.cnic.cas.cn/xwdt/zhxw/202012/t20201211_5815097.html
4: (NEW): 内蒙古高性能计算公共服务平台 “青城之光”, 内蒙古自治区和林格尔新区的新超算
同方3,200x Intel Xeon Gold 6254 18 Cores, 3.1 GHzEDRLinpack Performance (Rmax) 3,089 TFlop/sTheoretical Peak (Rpeak) 6,080 TFlop/s50.6%"内蒙古高性能运算总能力和规模跃居全国超强行列", 2020-11-17「自治区政府投资、自治区科技厅主管、清华大学设计、同方股份研制,内蒙古和林格尔新区承建。设备总投资3亿元,平台建设包括通用计算系统、人工智能加速计算系统、大数据存储支撑系统、节点互联网络、基础配套系统等系列工程项目」清华大学が設計、同方社が開発、3億元
联想深腾 8800系列
Intel Xeon Gold 6xxx25GbE / 10GbELinpack Performance (Rmax) 3,089 - 2,962 TFlop/sTheoretical Peak (Rpeak) 6,080 - 5,824 TFlop/s50.x%
1 - 10位の一覧 (冒頭の記事サイトにこれはないので別サイトから)
"2020中国高性能计算机TOP100榜单揭晓", 2020/11/15 http://news.sciencenet.cn/htmlnews/2020/11/448592.shtm
3、4位が新規で、1 - 10位のうち 联想が 6システム (どれが新規か不明)。
2位:天河二号 (Rmax: 61.445 PF) と 3位:北京超级云计算中心 (Rmax: 3.185 PF) の差が非常に大きいですが、2019年は 3位:网络公司 (联想、Rmax: 3.089 PF)、网络公司、联想が 3 - 8位 6システムでした。
9: 天河一号A (今年は該当システム見当たらず)
14336x Intel Hexa Core Xeon X5670 6C 2.93GHz, 私有高速网络 80GbLinpack Performance (Rmax) 2,566 TFlop/sTheoretical Peak (Rpeak) 4,711 TFlop/s54.6%
10: 神威E级原型原型系统 (後述)
1024x SW26010+ 260C 1.5GHz, SW-NetLinpack Performance (Rmax) 2,556 TFlop/sTheoretical Peak (Rpeak) 3,130 TFlop/s81.5%
China HPC TOP100, 2000: 全体
システム数では
联想:35システム浪潮:32システム曙光:22システム3社で 89%
他の商業メーカは Dell (3位)、同方 (4位)、华为、联泰集群が各 1システム
4 PFLOPS以上は 2システム、4~2が 79、2~1.5が 19システム。
メーカー別性能分布グラフ http://www.mittrchina.com/news/5819
と比較的近い AMD EPYCのみ構成のシステムを比べると6,000x AMD EPYC 7452 32 Cores, 2.350 GHz: FDR3,185 TFlop/s, 5,345 TFlop/s53.2%
HAWK, Top500 No. 16, Nov 2020
APOLLO 9000, AMD EPYC 7742 64C 2.25GHZ, MELLANOX HDR INFINIBAND
19,334 TFlop/s, 25,159.7 TFlop/s76.8%
実効効率に大きな差がある。
Xeon Gold系 (20位以内は 16位の浪潮:61.4%を除き联想は 50.x - 51.x% )
ROXY, Top500 No. 32, Nov 2020APOLLO 2000, XEON GOLD 6248 20C 2.5GHZ, INFINIBAND EDR8,124.48 TFlop/s, 13,977.6 TFlop/s58.1%
でも差がある。联想は同じサイトへの導入かもしれないが、多くが同じような実行効率。
Exascale Prototypes
2018年の China HPC Top100で以下の 3システムが初登録
2018年中国高性能计算机性能TOP100排行榜 http://www.hpc100.cn/top100/17/
HPC China 2018で発表、2019年からは ChinaSCで発表 (2019年が第一回開催)。
4位:神威E级原型系统,SW26010+ 260C 1.5GHz,SW-Net
266240コアLinpack Performance (Rmax) 2,556.0 TFlop/sTheoretical Peak (Rpeak) 3,130 TFlop/s81.5%
6位:国防科技大学E级高性能计算机原型系统
196608コアLinpack Performance (Rmax) 2,469.0 TFlop/sTheoretical Peak (Rpeak) 3,146.0 TFlop/s78.5%
9位:曙光E级原型机
1024x Hygon 7185 / 512x Hygon DCU200Gb 6D-Torus65536コアLinpack Performance (Rmax) 2,274.0 TFlop/sTheoretical Peak (Rpeak) 3,198.0 TFlop/s71.1%
Exascale Prototypesについては 钱德沛 (Depei Qian) 教授、北京航空航天大学计算机学院 (Beihang University) / 中山大学 (Sun Yat-sen University) の SC17併設ワークショップ:Workshop on International Next-Generation Computing Programs
"China's New HPC Key Project", Nov 13, 2017
が比較的詳しく解説されています。
※Sugonの DCU の "D"は Dataflowかもしれません…
"Tianhe-3 and the Exascale Road in China", NUDT, Invited, Riken-CCS International Symposium, Feb 19 2019
NUDTで進めている Prototype: Tianhe-3の紹介以外に、他のグループの Prototypeについての紹介があります。
全体的な講演
"China's effort on Supercomputing: progress and applications", 国家超级计算天津中心, Plenary, Lattice 2019,
CCF Transaction on HPC掲載論文、CCF: China Computer Federation
"Paving the way for China exascale computing", Yutong Lu (卢宇彤), 国家超级计算广州中心, , Aug 9 2019
曙光 (Sugon) E级原型机の 6-D Interconnectについては
"Wormhole optical network: a new architecture to solve long diameter problem in exascale computer", CAS, CCF Trans on HPC, May 6 2019
今までの NUDT Interconnect関連のスライドや学会発表
"Optimal Implementation of In-Band Network Management for High-Radix Switches", ACA 2020はもしかしたら Prototypeに関係するかもしれません。
比較的最近の钱德沛 (Depei Qian) 教授の ISC 2020での講演や論文
"Status Report from China", ISC 2020 と、次の 5ヶ年計画:“十四五” に向けての動き
"“十四五”高性能计算研究方向进入建议研究阶段"、新闻—科学网、2020/9/29
"E 级计算的几个问题 (Key issues in Exascale computing)", 钱德沛 (Depei QIAN)、王锐 (Rui WANG)、北京航空航天大学 (Beihang Univ)、中国科学:信息科学、2020年 第9期
7个方面, 探讨了需要重点研究和解决的技术问题
Jack Dongarra教授の Russian Supercomputing Days, Sep 22 2020での Plenary講演:
"HPC: The Where We Are Today And A Look Into The Future"
China's Plans2020-22: 1-2 Eflop/s2021-25: 2x 10 Eflop/s (これは上記の “十四五” と思われます)
しかしながら…
公開されている HPC China Top100をよく見ると:
2018 => 2019 => 2020
4, 10, 30:神威E级原型原型系统
2018: 2,556.0, 3130.0, 81.5%2019: 2,556.0, 3130.0, 81.5%2020: 2,556.0, 3130.0, 81.5%
6, 12, 34:国防科技大学E级原型系统
2018: 2,469.0, 3146.0, 78.5%2019: 2,469.0, 3146.0, 78.5%2020: 2,469.0, 3146.0, 78.5%
9, 16, 50:曙光E级原型机
2018: 2,274.0, 3198.0, 71.1%2019: 2,274.0, 3198.0, 71.1%2020: 2,274.0, 3198.0, 71.1%
3システムすべてで 3年間の進展が全く見られません、何故?
しかも、あらなんと、
神威太湖之光, 国家超级计算无锡中心93,015 TFlop/s, 125.436.0 TFlop/s, 74.2%
初登録の 2016年:1位から 2020年まで同じ値
天河二号升级系统 (Tianhe-2A), 国家超级计算广州中心
61,445 TFlop/s, 100,679 TFlop/s, 61.0%
初登録の 2017年:2位から 2020年まで同じ値
今後の楽しみが増えましたね、で、今回はお仕舞いです。
+追記:2020年12月22日"An efficient dataflow accelerator for scientific applications", Future Generation Computer Systems, Nov 2020 (Mar 10, 2020)
"we design SPU, an efficient dataflow architecture for scientific applications. ""The experimental results show that the average energy efficiency of SPU achieves 25.97GFlops/W in 40 nm technology and the utilization of floating point function units in SPU is 2.82x that of typical dataflow architecture on average for typical scientific applications."
+追記:2020年12月22日ここまで
過去のデータ (2003年~)
2020年中国高性能计算机性能TOP100排行榜 http://www.hpc100.cn/top100/19/
※現時点では未だ更新されていません。
2019年中国高性能计算机性能TOP100排行榜 http://www.hpc100.cn/top100/18/
2018年中国高性能计算机性能TOP100排行榜 http://www.hpc100.cn/top100/17/
2017年中国高性能计算机性能TOP100排行榜 http://www.hpc100.cn/top100/16/
2002 ~ 2019年历史榜单 http://www.hpc100.cn/top100/list/
※何故か 2018年だけ PDFファイル?
0 件のコメント:
コメントを投稿