
1.2.2
算力的供应来源与分类
算力涉及很多领域,比如智能手机、个人计算机、可穿戴设备等,都有算力的参与。同时,随着经济与技术的发展,计算能力建设也不断演进,算力的来源渠道正在增加,这里主要介绍比较核心的算力中心,包括超级计算中心、智算中心、数据中心等。
1.超级算力:超级算力由超级计算中心输出,而超级计算中心由超级计算机组成,运算速度比常规计算机快许多倍,比如十亿亿次的超级计算机工作1天,相当于普通计算机工作1万多年;超级计算机1分钟的计算能力,相当于200多万台普通计算机同时运行。
在技术上,超级算力由高性能CPU提供,注重双精度通用计算能力,追求精确的数值计算。从应用方面来说,超级计算中心主要应用于重大工程或科学计算领域的通用和大规模科学计算,如天气预报、分子模型、天体物理模拟、汽车设计模拟、新材料、新能源、新药设计、高端装备制造、航空航天飞行器设计等。
值得注意的是,近年来,超级算力正与互联网技术融合,许多互联网公司开始申报超级计算机,在超级计算机TOP100强中,有30%的系统都来自互联网行业,主要包括云计算、机器学习、人工智能、大数据分析以及短视频领域。这些领域提出了越来越高的计算需求,有些项目需要借助超级计算机的力量加以完成。
超级计算机需要多个芯片同时运行,首先要给芯片分配任务,开始计算后,芯片除了自己要运算外,芯片之间还要交换数据,这些都需要消耗时间。因此,计算速度的增长,总是低于芯片数的增长。
这里面涉及一个算力概念,就是超算的速度与单个芯片速度的比值,称为加速比。加速比总是低于芯片数的。当芯片比较少的时候,加速比上升得比较快。随着芯片数的增加,加速比上升得越来越慢。当芯片非常多的时候,任务划分和数据通信会变成瓶颈,在一定程度上抵销芯片增加带来的好处。
我国在超级计算机方面投入了比较多的资源,获得了相当不错的成果。2012年,千万亿次超级计算机“神威蓝光”每秒峰值运算达1.07千万亿次,存储容量高达2PB(1PB约等于100万GB),拥有14.3万枚16核CPU。到2017年,中国“神威·太湖之光”入选全球超级计算机500强榜首,这种超级计算机安装了40960个中国自主研发的申威26010众核处理器,峰值计算性能超过100 PFlops,峰值运算速度可以达到每秒12.5亿亿次,主要应用于地球气候模拟、非线性地震模拟、基于卫星遥感数据的地表建模与预测等。
对于不同的区域而言,如果希望建设成为科学创新高地,支撑多产业发展,那么超级计算中心的算力是首选。超级算力既可以广泛地应用于科学计算、能源、气象、工程仿真等传统领域,也可以用于生物基因、智慧城市、人工智能等新兴领域,全力支撑基础科学领域及新兴产业发展。例如,在医疗领域,科学家使用分子对接技术,针对与埃博拉病毒蛋白V35的对接,一天可以完成4000万分子化合物的抗埃博拉病毒药物筛选,这其中就有超级算力的功劳。
2.智能计算中心的算力:它是基于人工智能理论与计算架构,提供人工智能应用所需要的算力、数据与算法服务,通过算力的生产、聚合、调度和释放,支撑数据的开放共享、智能生态建设,促进AI产业化、产业AI化和政府治理的智能化。它要基于AI芯片、AI服务器、高速互联、深度学习框架等资源调度,构建智能计算中心的作业模式,进而输出算力。在AI快速发展的大环境下,如果只是希望用于支持专一的人工智能应用场景,不妨选择相对造价低、专用性强的人工智能算力设施。
在人工智能领域,有计算机视觉、自然语言处理、机器学习、语音识别等技术。其中,计算机视觉包括静动态图像识别与处理等,对目标进行识别、测量及计算,应用于智能家居、AR(增强现实)与VR(虚拟现实)、标签分类检索、美颜特效、智能安防、直播监管等。自然语言处理是研究语言的收集、识别、理解、处理等,应用于知识图谱、深度问答、推荐引导、机器翻译、模型处理等。机器学习以深度学习、增强学习等算法研究为主,赋予机器自主学习并提高性能的能力,应用于安防、数据中心、智能家居、公共安全等领域。语音识别是通过信号处理和识别技术,让机器自动识别和理解人类口述的语言,并转换成文本和命令,应用于智能电视、智能车载、电话呼叫中心、语音助手、智能移动终端、智能家电等场景。
不同的应用场景,对算力的要求也不同,一般推理需要半精度或整型计算能力即可,而涉及人工智能更关键的训练场景,则需要单精度及以上的算力。
人工智能计算中心是支撑数字经济的基础设施,支持人工智能与传统行业的融合创新与应用,重点在自动驾驶、医疗辅助诊断、智能制造等领域大显身手。人工智能的核心计算能力由训练、推理等专用计算芯片提供,注重单精度、半精度等多样化计算能力。
人工智能计算中心的建设,借鉴了超级计算中心大规模并行和数据处理的技术架构,以图形芯片作为计算支持,同时AI服务器是这种人工智能算力的核心支撑。《2019年中国AI基础架构市场调查报告》显示,2019年中国AI服务器出货量为79318台,同比增长46.7%。2019年,中国整体通用服务器市场出货量同比下降3.8%。通过对比可以发现,AI计算已成主流的计算形态。IDC同时分析认为,中国AI服务器市场在2018—2023年的复合年均增长率为37.9%,也就是到2023年,AI服务器市场规模将达到2019年的3.6倍。整体通用服务器市场到2023年,仅能增长34.5%,仅以此估算,到2023年,AI算力占比至少可以提高到72%。
目前,一大批人工智能计算中心正在建设,比如武汉投运了全国首个人工智能计算中心;西安、成都、上海、南京、杭州、广州、大连、青岛、长沙、太原、南宁等多个城市都在布局人工智能计算中心。
3.数据中心里的云算力:互联网、大数据和云计算技术的成熟,带动了云计算数据中心的建设。数据中心是云计算的核心基础设施,输出强大的算力,应用于众多领域。数据中心由两部分构成:一是围绕建筑的土地、配电、制冷和安防等基础设施,二是机架、服务器、交换机和防火墙等IT设备。
现代化的云数据中心里配置了超大规模的服务器,甚至将数十个传统的数据中心整合,进行集中化数据备份、计算和管理,提供云业务所需的计算能力。而云计算是互联网信息服务的基础架构,解决高并发访问和算力按需调度的问题。
云计算的快速成长,及其在各个行业里的普遍应用,倒逼数据中心的增长。中国电子信息产业发展研究院统计数据显示,2019年中国数据中心约为7.4万个,约占全球数据中心总量的23%,已建成的超大型、大型数据中心数量占比达12.7%;在用数据中心机架规模达到265.8万架,同比增长28.7%;在建数据中心机架约185万架,同比增加约43万架。另外,2021中国国际大数据产业博览会上发布的数据显示,“十三五”时期,我国数据中心规模从2015年的124万家增长到2020年的500万家。国内数据中心建设掀起第二波高潮,2020年我国数据中心市场增速超过40%,同时展开了新一轮技术升级。
自2020年国家大力支持“新基建”建设以来,数据中心作为“新基建”的重要内容,京津冀、长三角和珠三角等算力需求地区,以及中西部能源资源集中的区域,如内蒙古、山西等,均在推进新的大中型数据中心的建设。到了2021年,工业和信息化部印发《新型数据中心发展三年行动计划(2021—2023年)》,其中提出:到2021年底,全国数据中心平均利用率力争提升到55%以上,总算力超过120 EFlops,新建大型及以上数据中心PUE降低到1.35以下。到2023年底,全国数据中心机架规模年均增速保持在20%左右,平均利用率力争提升到60%以上,总算力超过200 EFlops,高性能算力占比达到10%。国家枢纽节点算力规模占比超过70%。
就具体企业来讲,早在2006年,Google就建造了能容纳超过46万台服务器的分布式数据中心。到2020年7月,阿里巴巴已建设5座超级数据中心,阿里云在全球22个地域部署了上百个云数据中心,阿里云服务器规模已经接近200万台,未来还将在全国建立10座以上的超级数据中心。数据中心有不同的规模,形成不同量级的算力,按标准机架数量,可分为小型、大型、超大型等,其中,超大型数据中心要求不少于1万台机架数量。
围绕云计算,已形成了完整的产业链,上游包括芯片、内存等,中游则是各类服务器、交换机、存储、安全等设备,下游则是云计算服务商,面向各类客户提供算力服务。
而且在国家宣布大力支持“新基建”之后,腾讯宣布未来5年将投资5000亿元用于云计算、数据中心等新基建项目的进一步布局;阿里云宣布未来3年将投资2000亿元用于面向未来的数据中心建设及重大核心技术研发攻坚;百度宣布,预计到2030年,百度智能云服务器台数将超过500万台。各大云厂商仍在继续加大算力投入,公有云算力供应将会更加充裕。
4.自建数据中心的算力:自建算力因其安全性和自主性等特点,成为政府、大企业及其他关注安全的组织的首选算力方式。政府、银行及高校和央企等,通常通过自建或租赁数据中心的方式自建算力,满足自身各项业务的算力需求。许多互联网公司在刚开始时选择使用公有云服务,但规模发展到一定程度后,通常都会开始以自建或租赁数据中心的方式自建算力。
有部分企业出于安全、商业机密和隐私等方面的考虑,不愿意把数据和业务等放到阿里云等公有云上,往往选择以托管服务器的方式自建算力,规模更小的企业直接在本地使用。
2020年6月,快手宣布投资100亿元自建数据中心,计划部署30万台服务器。字节跳动等大型互联网公司也在不断加大数据中心的建设。
5.区块链里的算力:受比特币等影响力较大的加密币驱动,算力因为“挖矿”的行为浮出水面,在比特币领域中,算力也称哈希率,是区块链网络处理能力的度量单位,相当于计算机(CPU)计算哈希函数输出的速度。它是衡量在一定的网络消耗下生成新块的单位的总计算能力。处理的数据量越大,也就意味着算力更大。
Filscan数据显示,2021年1月29日,Filecoin的全网有效算力已达到2.17EiB(1EiB算力对应的是1EiB体量的存储数据,1EiB=1024PiB,1PiB=1024TiB,1TiB=1024GiB)。
在这个领域,矿机是比较典型的算力应用案例。算力被视为矿机的生产力指标,比如人们通过矿机去“挖矿”,争夺记账权,获得网络给予的比特币激励。在比特币出现的早期,人们主要借助CPU挖掘,后来转向算力更高的GPU。2011年,还在北京航空航天大学读博的张楠赓推出了他发明的FPGA(Field Programmable Gate Array,即现场可编辑逻辑门阵列,一种半定制电路)矿机,比GPU的算力更高;2012年,美国蝴蝶实验室(Butterfly Labs)宣布将制造ASIC(专用集成电路)矿机,专门针对比特币SHA256算法而生产,算力更高。2013年,张楠赓成功推出了全球第一台ASIC矿机“阿瓦隆”一代,采用110nm工艺制程技术,一天的算力能挖出357枚比特币。2014年,比特大陆投产了基于28nm工艺制程的蚂蚁S1384芯片和S5矿机,算力不断升级。