汉唐归来
惟有中华

李沛: 冷眼与嘲笑中,中国超算起步了 |2020-12-2

01

 

“我们想让自己的孩子们做什么,给日本电脑擦灰么?”

1982年6月22日,美国联邦调查局特工突袭了日立公司在加利福尼亚的办公室,逮捕了6名职员,并对另外12名在日本境内的嫌疑人发布通缉令。

FBI宣称,通过其与IBM公司将近一年的密切配合,钓鱼执法,已经掌握了两家日本公司(日立、三菱)窃取IBM先进计算机技术的证据,这起轰动一时的IBM商业间谍案由此拉开了美日半导体高科技产业之争的序幕。

(美日半导体之争的揭幕战—IBM商业间谍案)

三天后的6月25日,暑期档星期五,一部名叫《银翼杀手》的科幻电影在全美上映,导演雷德利·斯科特描绘的未来(2019年)超级都市洛杉矶,已经深深打上了日本资本、日本技术、日本文化,乃至日本移民的烙印,这部电影缔造了赛博朋克这一全新的科幻亚文化门类,也反映出美国主流社会对日本影响力日益增长的关注。

(日本文化冲击的早期印记)

如果说这种关注在80年代初期还有一些超然和好奇,呈现出一种文化交流互鉴的良性势头,那么随着日本威胁论的话语塑造,这种势头很快转为对日本的警惕和敌视。

以超级计算机为代表的日本高科技产业被视为关乎美国国运的巨大威胁,1984年的总统大选中,美日贸易成为焦点议题之一,民主党候选人蒙代尔大打”贸易战”牌,提出了著名的蒙代尔之问,“我们想让自己的孩子们做什么,给日本电脑擦灰么?”(“What do we want our kids to do? Sweep up around the Japanese computers?”)

(美国爱国青年以实际行动抵制日货,很有精神)

美国著名经济学家李·布兰斯泰特(Lee Branstetter)曾经一针见血地指出,美日贸易冲突的根源并非经济因素,而是科学技术与工业能力:“在1980年代,美国人真的担心美国不再是科技上的领导者……我们不再拥有最好的技术,这伤害了我们的民族自豪感。”

在汽车、钢铁等形形色色的美日贸易争端点中,为何计算机脱颖而出,成为“日本威胁论”的最具号召力、最能够调动美国公众共情的代表?这就要从当时的半导体产业生态说起了。

今天,人们已经习惯于把小小的中央处理器(CPU)芯片视为一国半导体产业能力的代表,然而在距今三分之一个世纪前,半导体产业的生态是极为不同的,集成电路的“集成”和互联网的发展还没有颠覆产品形态和商用大型机主导的终端需求,八十年代,只有不到10%的美国家庭拥有一台“电脑”,普及率甚至不及任天堂游戏主机,个人计算机仍然是一个媒体聚光灯之外的鸡肋(Niche)市场。

在那个时代,集成的终端设备计算性能而非单个关键部件,是衡量一国半导体产业能力的代表性指标,站在终端产品性能顶点的超级计算机,也就理所当然成为半导体高科技荣誉与声望的象征。

超级计算机,Supercomputer,是指通过采用特殊设计、工艺、部件与架构,实现运算性能显著超越同时期商用设备的计算机,通常产量稀少、体积庞大、需要专门的运营与维护,被用于执行各种普通计算机无法完成的工商业计算需求。

在八十年代之前,美国人在超级计算机领域处于独孤求败的领跑地位,日本厂商在中低端商用计算机领域逐步站稳脚跟后,开始发力冲击这一产业高端市场。

1983年4月,日本电气(NEC)公司正式发布了SX系列超级计算机,其中的高端型号SX-2成为世界上第一台每秒运算速度超过10亿次的超算,打破了超级计算机这一产品门类诞生二十年来美国人习以为常的“老子天下第一”认知,其后,SX-2更是成功出口美国,在祖师爷的地盘上打败了本土厂商,直到1985年Cray-2超算的上市,才使美国人重新拿回”最强计算机”的荣誉。

日本超算在80年代突飞猛进的发展,代表着日本半导体高科技产业的崛起,刺激着美国人最敏感的神经,那就是对自身超凡科技能力的信念。

经过两次世界大战的荣誉浸染和英语民族历史叙事的洗脑,普通美国人下意识地将美国的科技优势视为理所当然,是西方文明内在优越性的自发体现,也是不容下等民族玷污的英语民族荣誉象征,80年代日本在半导体领域的技术能力,强力冲击着普通美国公众的自豪感与自信心,也被视为对美国人的一种主动侵略和冒犯。

(打入美国市场的日本电气SX-2超级计算机)

面对高科技产业的东方竞争者,美国朝野一方面加强了对相关领域的投资,在新技术与新应用上确立领导地位,另一方面则使出令人眼熟的”盘外招”操作,利用话语权优势对日本高技术产业发展进行形象的涂抹和丑化,将其竞争力解构为商业间谍、政府保护与补贴倾销的组合,从而为美国的任何回应都镀上了一层“正义性”。

在联邦政府的”劝告”下,包括麻省理工在内的多家美国用户取消了对日本超算的购买意向,同时,通过连续十余年、前后三次美日半导体协议的签署,直接为日本规定了越来越苛刻的半导体市场指令性计划,日本厂商不得逾越划定的范围发展,并确保美国厂商享有指定的日本国内市场份额。

(历时十余年终于被“制服”的日本半导体产业)

通过这一系列“内外兼修”的操作,特别是得益于在美国率先实现的家用电脑和互联网技术产业化,最终成功瓦解了日本半导体产业的上升势头,重新获得了在这一领域的领导力。

随着产业基础的缩水,日本超算在全球范围内的超级计算机排行榜上,也出现了明显下滑,不再具有威胁性。

不过美国人的“安全感”并没有持续多久,另一个来自东方的挑战者很快出现了。

02

 

算力不足恐惧症

以中国原子弹研制为主题的电影《横空出世》中有这样一个片段,为了完成原子弹原理与数据验证,数百位知识分子齐聚一堂,一边啃着馒头咸菜,一边聚精会神拨打算盘,在霍斯特《行星组曲》的伴奏下,形成一幅隽永而又雄浑的历史画面。

(横空出世中算盘大会战的场景)

手工珠算突破原子弹是一种艺术表现,取材于1960年前后持续一年多的原子弹攻关“九次计算”阶段,不过在真实历史中,原子弹研制集中了当时全国最好的保障条件,除了手摇计算机、计算尺等更现代的辅助工具,电子计算机也已经开始发挥核心作用,中国电子计算机事业,在“以任务带学科”的战略思想指导下,从一开始就与原子弹工程有着密切联系。影片设置这一强烈的对比,更多用意在于表现中国人无惧困难的民族性格,但也确实体现出当时国内计算能力相比国外的巨大差距。

1959年,中国第一台大型电子计算机,仿制苏联БЭСМ-Ⅱ的104机试制成功,并立即应用于原子弹相关研制工作,这台计算机每秒可完成一万次浮点运算,作为对比,同期被公认的超级计算机鼻祖,IBM公司为美国原子弹研发机构—劳伦斯利弗莫尔国家实验室开发的7030机,浮点运算性能约为每秒60万次。

(IBM 7030,历史上最早的“超级计算机”,仅生产过9台)

对于IBM 7030这台横空出世的超级计算机,中国人也曾经进行过购买的尝试,在60年代中法正式建交后,中方曾经透过法国代理公司,寻求购置这台当时定价700多万美元的“国之重器”,但在巴统的限制下最终夭折。

超级计算机,对于此时的中国人而言,还是遥不可及的梦想。

原子弹的攻关不等人,怎么办,拼命硬干!

1965年9月,第九研究院理论部副主任于敏带领几十位研究人员赶赴上海,利用当时华东计算所刚刚研制成功的J501电子计算机开展突破氢弹原理的会战,这台设备运算速度约为每秒5万次,已经是当时国内性能最强的计算机。

(在突破氢弹原理中居功至伟的J501大型计算机)

于敏团队废寝忘食,日以继夜地开展工作,一边推敲氢弹理论模型,一边通过计算机同步试算验证,通过持续三个多月的高强度攻关,在华东计算所成功完成了氢弹“于敏构型”的理论方案,此即中国两弹研制中里程碑意义的“百日会战”。

得知氢弹原理突破的喜讯,理论部部长邓稼先第二天就飞到上海,自己掏钱请大家吃了一顿螃蟹宴。

氢弹原理突破17个月之后,1967年6月17日,中国成功进行了氢弹试验,标志着中国人完全掌握了第一代核武器技术,这个年轻的共和国为自己建立了基本的安全保障。

但是精神力量对物质条件的克服也已经发扬到了极限,进入70年代,核武器研究团队得出了严酷的结论:“没有运算速度达每秒一亿次以上的计算机系统,就搞不出第二代核武器”,中国人不缺少拼命硬干的精神,然而技术发展的新要求与现实保障条件的差距,已经到了非弥补不可的程度。

1976年末,即将卸任的美国总统福特意外签发了两台CDC公司的Cyber172型入门级超算对华出口许可,用于中国石油地质勘探部门的数据处理,以此作为对毛泽东之后的新一代中国领导人送上的善意礼物,中国也第一次获得了接近世界水平的高速计算设备,然而为了平衡五角大楼等机构的疑虑,防止中方将超算真的用于其他领域,美方对这两台设备的性能做了降级处理,并对使用设置了严苛的条件,机房钥匙由美方人员掌管,上机需要美方人员审核监督,这就是在中国超级计算机发展史上令人胸中酸楚的“玻璃房”故事。

(Cyber-172超算)

在引进Cyber172的尝试后,中方又趁热打铁,与日立公司达成协议,购入三台日立M系列大型计算机用于气象预报工作,1978年2月,卡特政府批准这一出口申请,但是仍然比照Cyber172的做法,要求日方在对华出口版本上大幅降低性能,在出口的前三年安排日方人员值守机房,中方的上机操作内容必须向日立公司总部提交汇总报告。

睁眼看世界为了不固步自封,冷眼与嘲笑是前进的动力,一而再的刺激下,中国人深刻意识到买现成的,一步到位是不切实际的幻想,自力更生是唯一出路,中国人自己的超算之路起步了。

(1987年,印度总理拉吉夫甘地试图向“好友”里根求购Cray X-MP超级计算机,被直截了当地以可被军用为由谢绝)

03

 

“中国要搞四个现代化,不能没有巨型机!”

1978年3月,中央军委主席邓小平亲自主持了巨型计算机研制工作会议,下定决心研制中国人自己的超算,以解决国防建设等领域紧迫的大型科学计算问题。他对参会人员表示:“中国要搞四个现代化,不能没有巨型机”,邓小平还直接点将时任国防科委主任张爱萍:“现在巨型机就断给你了,你要立军令状”。

1978年5月,国防科委在北京召开巨型机方案论证和协作会议,决定由脱胎自哈军工的国防科技大学承担巨型机研制任务,中国超级计算机的研发正式展开。

超级计算机(巨型机)规划性能为每秒1亿次浮点运算,比中国此前研制过的最先进计算机还要快一百倍,技术跨度如此之大的研制任务在计算机发展史上是极为罕见的。

要完成这样艰巨的任务,需要刻苦拼命,更需要高超的项目管理方法,在总指挥慈云桂教授的带领下,研发团队选择了当时世界第一超算,美国的Cray-1作为总体架构参考,确定顶层架构后,再自上而下拆解部件、材料和设备需求,国内有的就国内配套,国内目前无法配套的,也不盲目攻关拉长战线,而是果断利用零部件进口的较宽松条件直接引进。

(银河亿次机对同时期CRAY-1超算构型有明显借鉴)

据项目参与人员回忆:“以前的存储器是磁芯的,做起来很难,弄起来也很慢,国际上已经有半导体的东西了,做到集成电路里面一块,一块里面就很大的容量,我们采取引进的思路,用了半导体存储器,这是利用了改革开放的优势。”

这一首先聚焦总体,快速突破集成创新关口的风格,已经颇类似于新世纪以来大行其道的“跳起”“下蹲”中国式科研方法论。

得益于正确的战略和得力的执行,巨型机项目仅仅历时五年就完成研制任务,较原定规划提前了整整一年,性能则完全达到设计要求,研制费用也大大低于按照进口超算报价所估计的预算,不到原先预计的五分之一,为国家节省了大量经费。

1983年12月26日,中国第一台亿次超级计算机通过国家技术鉴定,张爱萍上将将其命名为“银河一号”,这标志着中国成为继美国、日本之后,第三个能独立设计和制造超级计算机的国家,张爱萍亲自为银河巨型机工程题诗:“亿万星辰汇银河,世人难知有几多。神机妙算巧安排,笑向繁星任高歌。”

1987年,银河一号超算获得国家科技进步特等奖,同时获奖的还有氢弹小型化工程。

中国人在巨型机项目中交出了完美的答卷,银河一号也成为八十年代科学的春天主要象征,在八十年代与两弹、人工合成胰岛素、杂交水稻、同步轨道卫星共同被列为新中国五大科技成就。

(IBM公司ASCI WHITE超级计算机,在2002年首次实现了完整的三维核爆炸数值仿真,单次仿真耗时122天)

在银河一号之后,国防科大又相继完成银河二号、三号、四号、五号超算的研制,实现了运算性能从每秒亿次到十亿次,百亿次、万亿次、十万亿次的突破,特别是鲜为人知的银河五号(银河-V),计算性能与当时美国最强的超级计算机,用于完整仿真核试验的ASCI White机组已经处于同一数量级,保障了中国核心国防科学计算任务的实现,银河系列超算的迭代和打磨,也为即将到来的“跳跃”积蓄了足够的力量。

2009年,国防科大正式对外公开了新一代千万亿次级超级计算机,由于引入了天津地方政府投资,将面向民用领域开放服务,这台原有规划中的第六代银河超算,在“天津”与“银河”中各取一字,演变为全新的“天河”系列主机。

新的天河超算甫一公布就令世界震动,天河一号的峰值性能达到每秒1206万亿次浮点运算,使中国成为美国之后,全球第二个能够制造千万亿次超算的国家,也是中国第一台进入世界超算排行榜TOP500前十位的平台。

一年之后,天河一号再次创造了历史,在天津国家超级计算中心完成安装的天河一号改进型天河-1A,或者说天河一号的“完全版”,以峰值性能每秒4700万亿次、持续性能每秒2507万亿次的数据超越美国橡树岭国家实验室的美洲豹(Jaguar)超级计算机,第一次登顶世界超算TOP500排行榜。

尽管天河一号很快被其后新发布的日本超算挤下榜首,世界第一的位置仅仅维持了半年,但已经打开了中国人的眼界与自信,2011年,在科技部的支持下,天河二号超算工程正式上马,国防科大团队这次还与商用服务器领域卓有建树的浪潮集团强强联合,将天河二号性能指标直接钉在了超算技术前沿的“无人区”。

巨大的算力往往伴随着巨大的能耗,天河二号的满负荷运转功率近24兆瓦,相当于一个两万人规模的大型居民小区高峰用电负荷,在研发天河二号的两年时间里,国防科技大学的师生们习惯了校园经常性的停电,哪怕在四大火炉之一长沙的盛夏,一旦天河二号开机高速运转,全校其他线路就会临时停电,保障天河二号供电安全,从校长到学生,都已经习惯了用电风扇代替空调。

2013年6月,天河二号超级计算机正式亮相,其峰值性能每秒5.49亿亿次、持续性能每秒3.38亿亿次的表现,甩开第二名,美国橡树岭国家实验室的“泰坦”超级计算机接近一倍,毫无争议地成为世界超算TOP500排行榜王者,由于性能太过领先,成为过去12年里,占据TOP500榜首位置时间最长的一台超级计算机。

天河二号的“破防”式表现,也吹响了中国超算产业大干快上的号角。

美国人的反应非常直接,非常的“本色”,2015年4月,就在天河二号“改进版”试图将计算性能再次翻番的前夕,美国商务部发布公告,决定禁止向中国4家超算机构(国家超级计算长沙中心、广州中心、天津中心和国防科技大学)出售英特尔芯片,这恰好是当时国内天河计算机的四个使用单位,在美国商务部公告中,这一禁运决定理由是国防科大超算被用在了模拟核试验领域,对美国国家安全构成威胁。

04

 

中国超算霸权

然而这次对天河超算研制力量看似周密的“定点清除”式打击,并没有起到美国人预想的作用,2016年6月,天河二号超算失去了超算排行榜王座,接替它的却仍然是一台来自中国的超算:神威·太湖之光。

这台新机的持续运算性能达到每秒9.3亿亿次,是天河二号的三倍,性能提升的同时,太湖之光的峰值功率较天河二号则低了将近10兆瓦,使这台超算的能效也进入全球前列。

更重要的是,神威·太湖之光没有使用美国CPU、GPU部件,而是使用自主知识产权的SW26010处理器,美国的制裁长臂已经“鞭长莫及”。

(神威·太湖之光的突破,国产CPU取代了英特尔芯片)

更有里程碑意义的是,中国超算产业化的大干快上,也改变了TOP500超算榜单的整体面貌,神威·太湖之光接力天河二号的同时,TOP500超算榜单上榜的中国超算一共达到了167台,超过了美国的165台,这是此前没有任何一个国家达到过的成就,即便在日本半导体产业的巅峰时期,超算版图上美国依然占据着绝对份额。

上榜的这167台中国超算,已经几乎是清一色的国产品牌,而仅仅在10年前,中国市售高性能计算机的大部分份额还属于惠普、IBM等国外厂商。

榜单上标注的中国超算还不是产业影响力的全部,在媒体聚光灯之外,中国厂商在国际超算市场上,也已经不经意间建立了绝对竞争力,以目前最新的2020年6月TOP500榜单为例,安装地在中国的超算达到226套,美国以114套的悬殊差距排名第二,如果进一步统计各国超算的生产地,则仅仅三家中国厂商(联想、浪潮、曙光)就制造了榜单上超过60%的超算设备,中国超算产业在全球市场已经建立起了统治性份额,这种产业版图翻天覆地的变化,比榜首位置的争夺影响更为深远。

中国人一旦突破了关键技术的制约,艰苦岁月形成的“算力不足恐惧症”就好像要在一代人里找补回来,不把超算“白菜化”不罢休。

(TOP500超算排行榜国别变化)

2020年11月23日,国家超级计算郑州中心通过验收,正式启用,成为继天津、长沙、深圳、济南、广州、无锡之后第7家国家超级计算中心,配备了峰值性能每秒10亿亿次的中科曙光超算。

超级计算中心为什么遍地开花,超算又有着什么样的实用价值?

高科技领域毫无疑问是超算发挥的理想舞台,传统工程发展流程里,试制与试验往往成为创新的“死亡之谷”,高风险、高难度、高成本的验证测试环节,往往一两次失败就会打断一个技术领域的发展步调,而通过在计算机数字环境中的大量模拟和仿真,可以极大压缩真实物理环境下的试验开发周期,美国在高超音速领域的虎头蛇尾和中国“东风快递”突飞猛进的发展,某种程度上可以归因于数字仿真等低成本实验手段的差异,超级计算机在其中默默发挥着关键作用。

(神威·太湖之光超算完成的高超音速飞行器流体力学算例)

如果说尖端武器离我们的日常生活还太远了,那么在柴米油盐的日常里,超算同样发挥着现代生活方式不可或缺的支撑作用。

在今年的新冠疫情中,“老药新用”成为研究热点,即在已经上市的药物里挖掘可对新冠肺炎产生疗效的品种,要实现这一目标,当然不是靠神农尝百草,而是在虚拟环境中进行药物化合物结构的仿真测试,模拟其针对病毒结构特定靶点的反应效果,如果使用普通电脑进行类似的药物筛查,可能需要数月乃至数年时间,而利用超级计算机,可能只需要短短几天。

再聊些不那么沉重的领域吧,中国动画电影在近年来异军突起,成为国产类型片中整体最为突出的一个板块,直追国际水平的动画特效质量居功至伟,而超级计算机在动画工业中同样发挥着巨大作用,是特效渲染的利器。

05

 

“亲爱的,这次真的到头了”(?)

在《三体》第二部《黑暗森林》中,大刘借面壁人希恩斯的剧情,推演了超级计算机的未来发展,他对当红的量子计算、生物计算概念表达了悲观看法,反而设想通过用一千亿个微处理器一对一模拟人类大脑的神经元,再将如此大规模的模拟神经元联网,实现不可思议的性能跨越,在智子锁死了基本物理知识,摩尔定律又接近失效的情况下,强行压榨出传统计算机的最后一些潜力,创造出一个可以模拟人类大脑宏观活动,性能超越现有超算一万倍的超级计算机。

在感慨这一奇迹的同时,希恩斯的伴侣兼破壁人山杉惠子一边感慨“能从摩尔定律这个柠檬里又榨出这么多汁来”,一边哀叹电子计算机已经发展到了进无可进的绝处,“亲爱的,这次真的到头了。”

未来真的会是这样一幅图景么?

今天,TOP500超算排行的榜首位置是日本制造的富岳(Fugaku),通过采用ARM架构处理器的低功耗优势,实现更高密度CPU布置,其运算性能达到了每秒浮点运算44亿亿次,超算竞赛的下一个目标是EFlops/E级机,即每秒百亿亿次运算性能的超算,目前中国同时有至少三台E级超算原型机进入测试,美国人同样想要争夺这一桂冠,在美国能源部主导下,目前也有三台E级超算处于不同研制阶段,TOP500榜首的争夺在2021年将进入白热化阶段。

(正在高速推进中的中国E级机项目之一)

向更远的未来展望,不能不说,尽管各种悲观的预期不绝于耳,例如硅基半导体是否发展到了物理极限,可怜的摩尔定律年关难过年年过……但作为集成平台的超级计算机,仍然还有着巨大的性能增长空间,刘慈欣所设想的“一万倍”性能增长完全有可能实现,除了CPU本身的制程和架构进步,并行计算的算法、电源与制冷技术,乃至低延时网络的发展,都会为超算总体性能释放出新的增长余地。

在这个新的渐进创新竞赛中,中国企业已经展现出了令人眼前一亮的创新能力,例如阿里云计算提出的所谓超算服务器(HaaS)概念,利用低时延宽带网络使用户远程实现算力的组网,大刘的千亿CPU互联已经并非纯然的科学幻想。

 

赞(0)
请您分享转发:汉风1918-汉唐归来-惟有中华 » 李沛: 冷眼与嘲笑中,中国超算起步了 |2020-12-2
分享到

评论 抢沙发