导读
“中国人要搞四个现代化,不能没有巨型机。”自1978年邓小平同志在全国科技大会上批准搞中国人自己的超级计算机,40年过去了。这40年间,中国从研制出第一台每秒亿次计算的“银河-Ⅰ”巨型机实现“零”的突破,到“天河一号”超级计算机问鼎首个世界第一,再到“天河二号”连摘TOP500六次桂冠,中国超级计算走过了从“跟跑”到逐步迈上“领跑”的漫漫征途,这是改革开放以来,我国科技发展从艰辛到辉煌的一个缩影。
“银河”、“天河”系列超级计算机是中国数十年持续创新突破的代表。在国防科大与合作团队几十年的持续攻关过程中,我国全面掌握了超级计算机研制的“五大”自主核心技术,具备了自主芯片、自主操作系统、互联通信系统等核心产品的研制能力和产业化应用能力,并且催生了高性能计算为龙头,高性能微处理器与微电子、网络与通信、自主基础软件和信息安全等优势方向共同发展的创新体系,引领中国超算事业稳步向前。伴随着超级计算机的研制,我国超级计算应用同步发展,超级计算不仅带动着国家信息产业发展,并与大数据、人工智能等新兴领域息息相关,推动国家创新驱动发展,在我国建设创新型国家的战略与实践中占据了重要地位。
奋斗篇--从“零”到“夺冠”
可以说,“银河”系列巨型机的诞生是中国人面对国际封锁、打压自强不息的结果。
改革开放初期,我国计算机专业技术人才奇缺、国产元器件落后,信息技术发展缓慢,“落后就要挨打”,在中国还没有自己的巨型机的岁月,外国提出,即使将巨型机卖给中国,也要把机器放在独立的机房里面,由他们管理和监控,中国科研人员不准进入,只能在玻璃窗户外面看着,这相当于外国人在新中国的土地上建立起了一块“技术殖民地”。
1978年,邓小平高瞻远瞩,决定立即上马巨型计算机研制工程,并把任务交给国防科大。时任国防科大计算机研究所所长的慈云桂时下已60岁高龄,他立下军令状:“就是豁出我这条老命,也一定要把我们自己的巨型机搞出来!”由于当时我们的技术基础、生产工艺等都与先进国家存在巨大差距,甚至空白,要把当时中国计算机每秒速度提升到一亿次,困难重重。而五年后,研发团队突破关键技术、完成整体设计,把整机系统的250万个焊点一个个焊起来,“银河-Ⅰ”巨型计算机最终研制成功,这宣告着中国成为了继美、日之后,世界上仅有的独立设计和制造亿次巨型机的国家。
为了紧跟飞速增长的现代化建设需求,上世纪九十年代,国防科大又接连成功研制“银河-Ⅱ”、“银河-Ⅲ”巨型机,性能持续得到大幅提升,而老一代的“银河”团队元勋,却一位位倒在了科研一线。这是一种“银河精神”,一种“胸怀祖国、团结协作、志在高峰、奋勇拼搏”的品质境界。在强烈的民族使命感中,“银河”团队打破了外国的垄断,奠定了我国在巨型机研制领域的国际地位。
追赶不易,引领更难,但中国人不可能永远跟在西方发达国家后面亦步亦趋。2008年6月,IBM“走鹃”亮相,把世界超级计算机的速度从百万亿次带入了千万亿次。仅一年半以后,2010年11月,“天河一号”以每秒4700万亿次的峰值速度和每秒2566万亿次的Linpack实测性能夺得世界TOP500排名的榜首,取得了我国自主研制超级计算机综合技术水平进入世界领先行列的历史性突破。
“银河·天河”发展征程
但是“第一”的光环还没闪亮,国内外质疑“天河”中看不中用,就是只为排世界第一的声音却接踵而至。为了让“天河一号”成为实实在在的“国之重器”,“天河”人坚持“5+2”“白+黑”、“把板凳坐穿,把鞋底磨穿”的奋斗传统,把“天河一号”的应用做到“顶天”支撑国家前沿基础创新、“立地”服务传统产业升级和培育新兴产业发展,做到世界认可。当天津“8.12”事故发生,人们纷纷撤离的时候,天河团队却逆向行驶,回到处于核心爆炸区的工作岗位,重新开启“天河一号”系统,经历新时代血与火的考验,凝聚新时代“天河”精神。
就在外界认为中国的成功不过是昙花一现时,“天河二号”再次以大幅进步摘夺了TOP500“六连冠”,峰值性能54.9Pflops,实测性能33.9Pflops,实现了从千万亿次到亿亿次的技术跨越。
现在,我国在“天河”系列超级计算机上获得的成功不是偶然,也不是一朝一夕的结果,而是来自一个具有“银河精神”的团队,历经漫长的摸索与发现、试错和重新出发,突破数不清的困难换来的。这样的努力与付出并不是单单为了夺冠,而是为了走出我国自主创新的科研之路,为了我国的超级计算技术不再受制于人。
创新篇--勇攀科研高峰
超级计算领域激烈的竞争背后是国家综合实力的较量,“天河”系列超级计算机之所以能够在世界舞台上发光,源自于一代代“银河”工程中对中国的技术与人才的磨砺,是我们在大规模集成电路芯片、结点机、操作系统、编译系统、通讯网络等超级计算机核心技术上进行的长期探索与创新积累的结果。
CPU+GPU异构融合体系创新思路是我国超级计算机研制团队做出的大胆尝试。早在2005年研制30万亿次机时,研制团队就意识到,世界超级计算机研制的CPU并行处理主流技术已面临障碍,必须探索新的体系结构。CPU并行处理体系结构的最大局限在于CPU造价高、能耗高、系统规模大,于是他们把目光转向流处理器和新的体系结构。沿着这一崭新的思路,团队创造新的提出了“CPU+GPU”的异构融合系统结构理论。异构体系结构设计的难点在于如何实现预想的运行速度、效率和节能水平。当使用了“CPU+GPU”异构融合系统的“天河一号”走上世界舞台上时,证明这条路选对了,异构融合体系这一中国人独创的结构很快走向了世界,为千万亿次、亿亿次等超级计算机体系结构设计带来了新的思路,引领世界超级计算体系结构发展新的技术潮流。
“天河一号”与世界第一证书
让中国的超级计算拥有一颗“中国芯”,是中国超算人多年的梦想。作为计算机的“大脑”,CPU等高端处理芯片是超级计算机攻关的核心关键技术,也是西方发达国家严密封锁的高端微处理器。随着国防科大自主研发的“飞腾1000”芯片安装到“天河一号”上,从而取代部分进口芯片时,这一梦想变成了现实。在“天河二号”上,国产计算芯片更是为系统提供了系统绝大部分计算性能。这表明,我国国产自主芯片的研制与应用取得了创新突破,为今后“天河”的全部国产化奠定了基础。
而“银河”“天河”的核心技术不仅局限于此,“天河一号”夺冠后,一些外媒认为其主要计算性能还是美国芯片提供的,但是他们也不能不承认的,是“天河一号”背后的秘密武器——完全由中国设计制造的互联通信技术,该技术能够使数据以惊人的速度在所有的处理器之间来回传输。可以说,在系统越来越复杂、规模越来越庞大的现代超级计算机中,互联作为关键核心技术,其地位丝毫不亚于CPU。“天河一号”上使用的互联架构处理数据的速度比许多超级计算机普遍采用的InfiniBand互联架构大约快了一倍。
“天河一号”的另一大特色,是国防科大自主开发的高安全性软件操作系统。只有拥有了自主可控的系统,才能不受制于人,才能确保信息安全。
而现在,“天河三号E级原型机”已经研制成功,系统创新设计了“迈创”众核处理器、互连接口芯片和路由器芯片3大芯片,4类计算、存储、服务结点,10余种PCB电路板,实现各关键技术领域整体自主创新。经过几十年努力,“银河”与“天河”掌握了全面自主核心技术,所有核心技术和产品不再被国外卡脖子,打破了2015年美国对国防科大和“天河”系超算中心的高端芯片、高技术禁运封锁。
可以看到,超级计算机的意义并非只限于研制出大型计算机这一工具,由于超级计算机是最尖端电子信息技术的集合体,研制出超级计算机就意味着掌握电子信息领域的最尖端关键技术。而在“银河”“天河”系列超级计算机研制过程中的所有技术创新,全部指向了中国超级计算机发展从起步时就清晰的一个目标——自主可控。中国只有走自主创新的路,才能真正在科技领域登顶世界鳌头。
//驱动篇--国之重器//
拿“第一”固然鼓舞人心,但是把机器用好才是根本目的。自2010年“天河一号”研制并启用以来,中国超级计算需求以每年20%-30%的速度增长,超级计算在加速战略性新兴产业发展、支撑传统支柱产业升级、推动科技招商、实现产业聚集等方面发挥了巨大作用,推动了国家科技创新体系的建设,带动基础研究创新、产业转型升级创新,提升了国家的各个领域的科技发展能力,真正成为“算天”“算地”“算人”的“国之重器”。
我国超级计算机的研制,总是以现代化建设需求为驱动。以“银河-Ⅰ”为主机系统,当时的石油部门建立了自己的石油地震数据处理系统;为了建立我国独立自主的中期天气预报数字系统,研制了“银河-Ⅱ”巨型机,构建了中期数字天气预报系统,使我国成为当时世界上少数几个能进行5到7天中长期天气预报的国家之一;随后,“银河-Ⅲ”等系列巨型机相继研制成功,在航空航天飞行器设计、天气预报和气候模拟、新型能源的开发等多个领域发挥了支撑作用,并为以后超级计算机的应用铺垫了广泛的发展前景。
2015年开始,“天河一号”超级计算机就已经实现了满负荷运行,每天并发在线计算任务数超过1400项、每天完成近万项,做到了真正的“中看又中用”,在各个重大前沿科技和产业创新领域发挥重要作用。在油气勘探领域,服务能源发展,保障国家能源安全,研发自主核心软件,打破欧美垄断;在高端装备领域,支撑海洋装备、电力装备、环保装备、无人机、内燃机、汽车等进行数值模拟,实现相关行业企业的创新能力提升和转型升级;在生物医药领域,支撑艾滋病、癫痫、胰岛素等自主知识产权新药的研发并获得重大突破,助推我国脑科学研究,为改善民生做出贡献;在新材料研发领域,支撑前沿创新与先进制造,支持200多个从事金属、纳米、先进复合、储能、超导、磁性等新材料的科研团队开展新材料计算模拟研究,取得世界先进水平的科研成果,在Nature、PRL、JACS等国际顶尖期刊发表了数百篇论文。支撑科技创新方面,累计支持国家科技重大专项、国家重点研发计划等重大项目超过1600项,支持项目所涉及经费超过20亿,取得国家级、省部级奖励成果和包括Nature、Science在内学术成果超过2000项。支撑产业发展方面,依托“天河一号”构建了油气勘探、基因健康、工业设计与仿真、建筑与智慧城市等十余个专业化平台,聚集行业企业超过三千家,为近200家规模以上企业提供了高质量创新服务,节省研发投入数亿元,为企业带来相关经济效益近百亿元。部署“天河一号”超级计算机的国家超级计算天津中心已经成为我国目前应用范围最广、研发能力最强的超级计算中心。
“天河二号”不仅在新材料、新能源、高端装备制造、航空航天飞行器设计等领域发挥重要作用,同时与日常生活也息息相关,比如在PM2.5的预测预报、新型药物的设计、动漫渲染等领域都有着“天河二号”的身影。
“天河”广泛支撑国家科技与产业创新
总之,“天河”系列超级计算机已经融入国家创新驱动发展、国家信息安全、“互联网+”、“中国制造2025”等重大国家战略和发展计划,并在支撑智能制造、智慧港口、智慧交通、智慧城市等产业发展、社会公共服务能力等方面发挥重大作用。同时,“天河”超级计算机的应用与示范,引领了服务重大前沿基础科学研究与深度融入产业发展的“顶天”“立地”的综合应用模式,实现了提升国家公共资源利用效率和创造国家更加公平高效的创新创业环境,并将中国高性能服务器、计算集群产业化带入到世界第一梯度的新高度。
后记
今年11月,新一期全球超级计算机500强榜单发布,美国超级计算机“Summit”以峰值速度每秒20亿亿次占据榜首。在上榜的超算总数上,中国以227台位居第一,美国为109台。从“天河一号”夺冠到美国的“顶点”居首,期间经历了日本的“京”、美国的“红杉”和“泰坦”、中国的“天河二号”和“神威·太湖之光”,可以看出,美国、中国、日本同处于世界超级计算机研制的领先行列,形成了在具体系统上交替领先的格局。我国超级计算机在四十年的发展历程中得到锤炼,逐渐具备了从自主微处理器、自主互联、自主软件系统到自主应用的全方位自主创新研制能力。在这个过程中,“银河”与“天河”正成为中国迈向世界超级计算强国的核心动力。
“天河三号”E级原型机
国际超级计算机界的下一个目标是被称作“E级超算”的百亿亿次超级计算机,美国、日本、欧洲都部署了“E级超算”研发计划。今年5月在天津召开的第二届世界智能大会上,国防科大的“E级”的验证系统发布,目前已完成了大规模计算应用测试并逐步开放应用,测试涉及国家12个重大创新专项领域,数十个国家重点研发计划,已取得了一些突破性结果,将为我国科研及产业创新提供新的动力。“E级”验证系统是我国下一代百亿亿次超级计算机技术路线的一次探索和实践,我们有理由相信,新一代百亿亿次超级计算机系统将在我国大科学、大工程、大数据和人工智能等更加广泛和深入地应用中发挥不可替代的作用。
就让我们一起,在改革开放40周年之际,致敬“银河”40年奋进历程,致敬“天河”10年创新发展!