下一代算力出现前,东数西算如何站好岗?|讲堂163-4③ | |
2023-10-26 18:09:15 作者:沈巍 林镇阳 张继红 |
今天(10月26日),文汇报以两个整版报道了163-4内容,算力占据一个版
【导读】10月15日,文汇讲堂数字强国系列第四期暨163-4期《数据:高质量发展的新生产要素》在上报大厦43楼成功举办。上海数据交易所副总经理、上海市数商协会秘书长卢勇担任主讲,上海政法学院教授张继红、上海市算力网络协会专家沈巍、武汉东湖大数据科技股份有限公司总经理杜乐、北京易华录数据要素科技创新研究院院长林镇阳、Covertlab联合创始人兼CEO高鹏应邀展开圆桌对话,张继红担任圆桌主持。50位听友代表获得NFT数字徽章。
本次讲座由文汇报社、Covertlab、上海树图区块链研究院联合主办。SUMG融媒创新空间运营团队给予技术支持。喜马拉雅·听、文汇报视频号、Covertlab视频号、双百小助手视频号四个平台进行了直播。
经整理,现分主讲、圆桌上、圆桌下、提问四篇刊发。此为圆桌下。
张继红主持,重点与沈巍、林镇阳两城专家就算力等话题展开详尽的讨论
张继红(对话主持):今天请到了两位算力方面的专家。算力对算法和数据提供了基础性的制度支撑。中国的算力规模位居全球第二,每年的增长量是30%。请介绍一下,在我国 “双碳”政策目标之下,算力的基础性布局和规划?
最新代计算机相对于第一代,算力性能有300万亿倍的提升
沈巍:我长期从事数据中心和最新的算力中心的规划设计,以及节能减排方面的工作。这几十年的变化确实翻天覆地,曾对我们非常重要的那些设备都已慢慢消失了。比如我小时候学英语、听音乐要用到Walkman,它的下一代是CD机,后面又有Mp3,现在都没人用了。伴随这些随身音乐数据存储设备的消失,背后是算力设施的一代又一代建设和升级演进。现在没人担心数据会突然消失,这也是因为以前叫做数据中心,现在叫算力中心的这些基础设施在迅猛发展,辅天盖地的建设。最新一代计算机的算力相对于第一代计算机,算力性能有300万亿倍的提升,人类没有任何一个生产工具能够发生这么大的变化。
全国数据中心算力消耗等于京沪两地用电之和
沈巍为上海市信产通信服务有限公司下属邮电设计院数字基建院副院长、高工
过去5年,我们数据中心的建设规模都是以超过30%的增速在发展。截至2022年,全国的数据中心的规模已经达到了650架标准机柜。2022年一年消耗的电量约2700亿度,正好是该年北京和上海用电的总量。如把这些数据中心集中建在京沪两地,约占10万亩土地,约等于京沪土地总量的3%。相当于全国数据中心占用了3%的京沪土地资源,消耗了100%的京沪用电资源,是很大的一个比例。
所以国家推出了东数西算战略,把东部一部分对时延要求比较低的或者灾备性质的数据中心部署到西部去。性质与“南水北调”、“西电东输”相同。以内蒙古和贵州来做对比,我们发现数据中心2022年的耗电量,等于贵州加上内蒙古这两个省发电量的30%。这两个省加起来一年发了8800亿度电,实际只消耗了5900亿度电,中间缺口的2900亿度电正好是全国数据中心需要消耗的电量。这其实就是国家选择做东数西算大战略背后的逻辑。其实规模庞大的算力基础设施需要消耗巨大的资源。
使用算力要如用水用电般便利,还有待下一代发展
张继红:很精炼的概括。通用语言模型也是需要特别大的能量消耗的。我们通过把它放置在国际的大背景下,中美在技术方面发生了多次的冲突和摩擦。我们在算力方面也会面临一些技术性的难题,上海算力网络协会会发挥怎么样的作用呢?
9月刚成立的上海市算力网络协会的宗旨和目标
沈巍:上海市算力网络协会在9月13号召开了第一次全体会员大会和监事会、理事会。经信委是我们的主管单位,协会现在一共有95家会员单位和9个个人单位。理事长单位是上海超算中心,理事单位有9家,主要是上海的三大运营商,还有我本人所在的上海信产通服公司,商汤科技、悦科、云赛科技等等一系列的数据服务商和技术商。算力网络协会主要的宗旨,是面对现在算力发展的挑战和今后发展的趋势做一些横向拉通的工作。定位有四:成为政府重大决策的参谋,成为整个算力网络体系里面供方和需方之间的桥梁,成为政府和企业之间的纽带,成为算力网络高质量发展的齿轮。
传统狭义理解的算力,就是计算的能力,从算盘开始到计算机,到现在各个智能设备都具有计算的能力。如今算力网络,已经把概念扩大化,指算力资源。目前的各种计算资源,包括各种各样的云,都是比较分散的。怎么样把计算资源进一步综合化?现在我们新的一个提法,把算力分解为三个力,一叫信息的计算力,二叫网络的运载力,三叫做数据的存储力。
目前的算力把三种都包含了。对我们的企业或者用户来讲,希望能成为更加能够直接使用的能力,这可能还有一段道路要走。这里面需要发挥网络的作用。我们希望能把分散的数据中心、算力中心里每一台计算设备、存储设备、网络设备的能力能够综合起来,给到大家像用电用水一样很方便的综合的算力,或者我们称之为下一代数据能力或者算力,这是我们发展的愿景和目标。
2022年是东数西算大战略落地,布局则起于10年前
东数西算的全国布局及实施
张继红:我们理解了何为下一代算力。您多次提到“东数西算”工程,上海在其中的角色?
沈巍:关于东数西算,四部委包括工信部、发改委、网信办和能源局分了两批发了文件。第一批是在2021年年底,批复的是西部的内蒙、贵州、甘肃和宁夏四个枢纽节点的建设。
第二批是在2022年的2月份,批复的是东部地区和中部地区8大枢纽地区,京津冀、长三角、粤港澳大湾区,还有成渝等。这八大枢纽的成型,相当于正式宣告了国家东数西算大战略规划的落地。
其实这些西部节点的布局往前推个10年,早在2012年就开始建设,最早做“东数西算”的企业是三大运营商和一些互联网企业,他们对成本非常敏感,一度电在上海接近一块钱,但在西部地区可能就是两毛和三毛。所以,像中国电信2012年到2014年时,启动了内蒙和贵安数据中心园区的建设。三大运营商都是同步跟进,接着是国家队,包括金融行业、政府。现在几大国有银行的灾备中心或者大数据中心,也都放在了西部地区。未来,我相信在国家东数西算战略引导下,会有更多的企业把数据放到西部去。当然还有很多实时性的业务,类似于人工智能这些计算中心还是会在东部进行计算。
上海是全国第一个制定PUE标准的城市
圆桌对话的下半段,围绕着算力和东数西算展开
上海一直是数据中心的国家重镇。最早的数据中心,都是放在通信的枢纽楼里面,开设一个小的房间放一些服务器,提供一些数据应用的服务,因为它离不开网络。随着数据中心的规模越来越大,上海市政府对于数据中心产生的能耗、GDP要细算了一笔账。数据中心对于效率有一个专用名词PUE,叫电能利用效率。简单来讲,数据中心除了给服务器用的电以外,还有要给到它的配套设备。配套设备的用电占比越小,说明我们数据中心的绿色程度越高。一般数据中心PUE指标大概在1.5到1.8,实际可能做到2左右,相当于一半的电是给服务器使用,一半的电是给配套的设施使用。
上海是全国第一个通过政府发文的形式,把这个指标降到了1.3,可以说打响了全国数据中心节能竞赛的第一枪。随后,包括北京、广州、深圳等各个地区都开始了制定本地数据中心的PUE准入策略,现在最低的像北京到1.15以下,实际上在技术上是非常大的挑战,因为数据中心还要实现安全、稳定运行的要求。
一方面,像东数西算,我们要看哪些地方的资源禀赋更好,气候更低更有条件利用自然冷源进行制冷。另一方面,我们也要通过制定标准的方式,更多地从宏观的角度,形成算力的随时可调度、可分配,来保障数据中心和数据中心之间互相的备份,这样才能够一步一步实现整个国家的数字强国的这么大战略。
从瓦特经济到比特经济的存力算力用力
张继红:介绍非常详细了,刚才也提到北京的算力建设情况,我们特别荣幸邀请到了来自算力领域的龙头企业北京易华录公司的林镇阳院长,能否了解一下易华录的存力、算力,包括数据运营方面怎么助力东数西算的工程?
林镇阳
林镇阳:简要介绍一下北京易华录,我们的母公司是中国华录集团,是国资委下的一个央企。1990年代为了抵御国外文化入侵而成立,强调中国要制造自己的录像机,录像机是传播文化的基础设施,而录像机要存储数据,所以有了中华第一录即中国易华录公司。2001年成立了北京易华录,前面加了Internet。2011年上市,在智慧城市领域以央企国家队身份上市。
怎么理解东数西算?工业经济时代的核心在于瓦特,数字经济的核心是比特。从瓦特经济到比特经济,结合过程中就包含了三个力。
第一是存力,实际要实现数据的存量存储。之前提到数据中心是一个资源资产,对这些数据资产全量地存储,安全可靠长期地保存。
第二是算力,数据本身没有直接价值,要赋能实体行业才能产生价值。所以它需要有相应的算力模型,是来进行挖掘它的价值。
第三是用力,用力的核心就是模型。大家能感受到我们通过算力、算法、加模型的三维整合,实现了数字经济发展的高峰。我们的核心如何用好这样一个新的要素。
以冷存储布局城市数据湖,实现数据应存尽存
一个光盘能存录500G,避免了数据考古的发生,也会留下听友参与的珍贵时光
北京易华录在“东数西算”怎么样做工作?
第一个回到基础设施这个层面,大家以前听英语用磁带,有磁盘存储和磁带存储,还有一个是光盘存储,那是冷存储。目前中国易华录拥有国际领先的能力,一张光盘能存储500G,已经达到商用了。光盘存储,一不需要耗电,一个机柜能够存储2.7个PB,一个TB等于1024G,一个PB等于1024TB。我们现在存储的热磁机柜大约6千瓦,相当于三个微波炉。而我们的最新光存储为可信的存储机柜待机时只用60瓦,工作时只有100多瓦。在东数西算国家战略布局层面,一方面我们要用好地域资源的配置,另一方面从根源上直接把耗电量降下来,降了两个数量级。
从2015年开始,我们推出改革城市数据湖战略,目前布局了三十多个城市数据湖,其中有八个在国家东数西算的节点上。这样的城市去发展数字经济的基础设施,解决了三个力,即存力、算力、用力。我们帮助各个地方新建数据中心,帮助它做原有的数据中心的低碳化改造。就解决了数据资源的全量存储,实现数据的应存尽存,而不是覆盖存储。这称为一湖基础。
很多地方的安防,摄像头都是三个月覆盖式存储,代表一个城市的记忆只有三个月。如果三个月之前发生一起刑事案件或者交通事故,你是无迹可寻的。对一些关键的数据资源,我们就是要让它全量存储。百年之后,我们的后人能从100年前存储的数据资源,看到上海发生的事。我们提出数据考古的概念,它就是需要通过这样的基础设施去完成。这是我们解决的收储的层面,也是实现国有自主可控的在数据要素发展的最重要的基础。
东数西算:瓦特经济的平衡,比特经济的协调
易华录的“收存治用易”闭环留下深刻印象,成为与会嘉宾的一个口头禅
数据湖的建设相当于给一个地方建立称之为数据的中央厨房的基础设施,下一步有了这些数据存进来,我们进一步对它进行价值化。我们提出来叫做数据的“收集、存储、治理、使用、交易”五部曲。
收和存解决之后,就要对数据进行治理。这时候就需要搭建围绕数据相关的基础设施,像刚刚东湖大数据的杜总说到的,围绕数据的技术的能力,以及我们像上海数交所有了大量的上海的数商,相当于到中央厨房的厨子,这些厨师带着菜谱,带着秘籍加工这些食材,用我们的存力、算力,把数据的价值化挖掘出来。它就支撑大量的应用场景,用的再往下一步,除了政府自己用,这是数据的内循环,还有数据的外循环,像“数据二十条”里所提到,我们自己不具备开发能力,邀请具备开发能力的数商帮我一起开发,我在存储上有授权的过程。未来的导向是数据交易,全国接近快60家的数据交易所,解决数据入场的问题,实现场内、场外互补。
所以“东数西算”工程,它本质上是从追求瓦特经济的一个平衡,更深层的逻辑是在于数字经济的比特经济上的协调,形成全国一体化的数据要素市场。按照这样的逻辑,我们围绕着数据要素的“收、存、治、用”的闭环,称之为数据要素的多层次、多主体的数据要素市场的建设。
助建四大抓手:定价中心或是打开10万亿的金钥匙
易华录所做的多层次、多主体的数据要素市场的建设
这里跟大家分享一下围绕着数据要素市场建设做的一些探索性的经验。
刚刚提到先是帮各个地方做了大量数据资源的收集跟存储的工作,下一步是如何去开发?开发就是要发展,“数据二十条”重点也在发展,因此提出“三权分置”。在发展的角度之下,多层次、多层级的数据要素市场的核心要有四个抓手。
第一个抓手就是数据的登记确权中心或机构,要明晰权力主体和合规建设,为未来的发展提供了有力的法律保障。
第二个是数据资产的评估定价的中心。从数据的资源化到资产化,再到未来数据的价值化这样的过程,数据作为一个资产已经板上钉钉了。刚才已经提到8月21日财政部发布了将企业数据作为资产这样的政策。这是财政部从财务的角度,表明数据未来作为资产,就像专利这样一个无形资产,它可以进你的财务报表,对于有数据资源的公司以及能开发产品的数据公司都是巨大的利好。评估定价中心,是从数据要素的一级市场过程中,完成对它的评估定价,才有可能进行有效的流通。我们也跟国家发改委一些领导讨论,我们认为数据要素的定价,可能是开启10万亿市场的一个金钥匙。
友情主持东华大学青年教师徐敏介绍有四家直播平台
第三个是数据的运营服务中心。包括两个层面。第一是自身具备能力对它进行运营加工,形成产品。第二就是授权运营,我把这些数据产品授权给相应的主体,请他来帮我加工和运营。
第四个数据流通交易中心。数据流通起来才有价值,未来评估定价的时候可能不仅仅是一个价值,而是有资本价值的可证券化,可进入二级市场进行进一步流通。这才是开启十万亿市场的更为有价值的地方。
我们交易所的同仁们帮助各个地方建设四个中心,也是我们称之为数据要素市场建设的四梁八柱的四个基础设施。我们北京易华录,作为央企里为数据要素市场发展的一级服务商,来贡献我们的能力。
张继红:非常感谢!我第一次听到了“数据考古”的概念。因为算力的问题,我们在未来的世界里都没有痕迹,这确实是一个新的问题。作为国家的战略工程,确实需要建构统一的算力资源市场。 整理:李念
文末链接:
数据银行、数商,数据要素时代有新收入?学者解读|讲堂163-4④
从“数据二十条”到国家数据局:数据要素又走了几步|163-4②
卢勇:作为新生产要素,数据抛给人人转型机遇|讲堂163-4①
作者:沈巍 林镇阳 张继红
图照:现场周文强 PPT来源于嘉宾授权
编辑:李念
责任编辑:李念
*文汇独家稿件,转载请注明出处。