智库视角|中国数据安全如何保障?创新存储技术是解题之道

2022-03-03 22:06:00BY:lyw
【字体: 打印

文|周健奇 王明辉  高太山 单衍菲 刘帅

数据安全存储是数字经济核心竞争力的重要组成。数据之所以成为国家基础性战略资源,一个重要原因在于大数据化。大数据风险点众多,存储很关键。很多数据安全问题的本质是存储不安全,大数据是在存储过程中泄露,或遗失的。存储于不同主体和介质中的大数据经过大规模集成后能够清晰展现产业内涵、经济活动、政府治理、健康基因等诸多情况。因此保障存储的数据安全不仅仅是主体隐私问题,更是上升至国家安全层面的战略问题。

 一、数据存储安全是数据安全的底层保障

全球数据量爆发式增长的“量变”引起数据价值发生“质变”。数据价值在于大数据化的应用,沿采集、存储、分析、挖掘与管理等环节而逐步提升。其中数据存储是针对数据流动全过程中形成或调用的静态数据汇总,处于产业链中游。大数据应用需要大量、反复、多次调用存储的数据,因此存储是基础服务环节,是数据安全的底层保障。 技术自主可控是数据存储安全的根本。

保障数据存储安全,主要通过以下四方面实现:一是执行2007年公安部等部门发布的《信息安全等级保护管理办法》,对存储的信息系统分等级实行安全保护;二是遵守《网络安全法》《数据安全法》等相关法律法规,建立健全数据安全治理体系,提高数据安全保障能力;三是完善单位运营保障,如政府部门、大型企业等均设有灾备中心,通过异地备份恢复等技术措施保障信息安全;四是加速实现存储技术的自主可控,推进与数据存储相关的技术创新。其中,前三项属于软约束,技术自主可控是根本。

以数据中心为代表的新型数据存储设施将成为关键性基础设施。不同类别数据交叉,导致存储量急剧攀升,具有海量化、多元化和非结构化三大特征,对空间扩容、类别区分、精细管理提出新的挑战。传统意义的存储已不能满足需要,国家战略性资源需要与之配套的新型数据存储设施。近年来在全国各地快速发展起来的数据中心是典型代表。 

二、数据存储专业化发展,中国竞争力日渐增强

数据存储量攀升促进数据存储从大数据产业的基础服务环节逐渐演变成细分行业。依托国内数据量的优势,中国数据存储行业水平提升,国内企业存储技术也取得了新突破。

(一)中国数据存储呈现专业化发展态势

数据存储从大数据产业链关键细分环节逐渐演变成专业化的数据存储服务业。目前,中国数据存储设施的运营主体主要分为两类, 一是数据资源的产生单位和专职管理单位,拥有不同程度的数据使用权。数据资源产生单位中,既有企业,如平台企业、北斗和遥感卫星应用企业等;也有政府和事业单位,如交通部门、气象部门、 医疗单位等。数据资源专职管理单位,主要是政府和事业单位,如国家基础学科公共科学数据中心、档案管理单位等。二是以云计算中心为重要组成的商业数据中心,专业提供数据存储设施建设、运营及存储服务,不具备数据使用权。如易华录与政府部门合作建设 “数据湖”,并提供运营管理服务,以及阿里云、百度云等。阿里云、百度云则是从平台企业的数据中心发展而成的商业数据中心。商业数据中心快速增长,是中国数据安全存储的一类重要主体。目前, 存储数据量最高的即是云计算中心。全国数据中心机架数400多万个,阿里云、百度云、华为云、浪潮云、电信云等的机架数少则几十万个,多则百万个。

(二)中国数据存储行业竞争优势日渐增强

存储介质逐渐丰富,实现光存储技术突破。存储介质分为光、磁、电三种,与之对应的产品为蓝光存储介质、磁带、机械硬盘、固态硬盘。与传统磁、电存储相比,光存储具有使用寿命长、数据稳定不易丢失以及更环保等特点。中国已应用的存储介质涉及以上各类,并在蓝光存储技术上有重大突破,具备光存储产业化的实力。

存储方式多元化,开始了分布式存储的有益探索。存储方式主要包括直连式存储、集中式存储、分布式存储等。直连式存储属于 计算机存储,集中式存储是指存储介质集中布放,分布式存储则是后起之秀。现阶段,中国数据存储以集中式存储为主。同时,中国对分布式存储也有了较为成熟的实践探索。分布式存储不需要集中布放服务器,因此并非将一个存储内容的所有数据全部输送进同一个端口,而是分散存入若干不同的服务器节点,实现了数据存储的去中心化。需要提取时,主服务器会发出指令从不同节点的服务器同时调出数据,再对数据进行组合排列,最后呈现出完整的文件。优势在于单机压力小,带宽要求低,解决了本地文件系统的容量限制难题。更为重要的,分散存储降低了数据泄露和遗失的概率。集中式存储与分布式存储技术相互融合,互为补充,更有利于安全存储。中国以分布式存储为主要方式提供专业云计算服务的企业也已开始运营,例如优网云。

数据存储技术逐步向高端领域渗透。易华录的蓝光存储技术开始迈向产业化关键阶段。华为、曙光、北京神州数码云、宏杉等国产存储设备厂商也早就实现“0”突破,率先抢占全球存储设备中低端市场,正在逐步向高端市场渗透。

三、中国数据存储安全面临的问题与挑战

数据存储安全是做大做强数字经济的先决条件。过去一段时间 中国数据存储安全取得长足进步,但从提升产业竞争力、增强数据 存储安全性等方面还存在以下短板。

(一)数据中心建设亟待加强统筹协调

近年来,各地方、各部门高度重视数据中心建设,出台了一系列政策文件。一些地方政府、机构和企业也将数据中心建设作为发展数字经济的重要抓手,希望为大数据应用提供新型基础设施。然而,实践中各地数据中心的建设仍然存在不少问题,不利于数据存储安全的技术创新。调研发现,有些地方在推进数据中心建设过程中,存在前期调研不充分,对数据存储、管理、利用的特点、规律了解不够,使得数据中心建设出现了规划设计不尽科学、盲目确定 建设规模,甚至存在一哄而上、投资浪费、产能过剩等现象。还有一些地方存在应用需求不明、重建设轻运维、建设成效难以发挥等问题。

(二)数据量爆发式增长对存储技术提出新要求

数据存储需求的爆发式增长要求存储技术在介质、架构、协议、 应用与运维管理等方面不断创新演进。当前,在有限体积下对更大容量存储的需求越来越大,虚拟现实、人工智能、自动驾驶等高性能计算应用场景需要更快的数据读写速度,对数据高安全性防护提出新要求。此外,中国数据存储还面临冷数据存储需求快速增长的挑战。按照访问频次,数据分为热数据、温数据和冷数据。其中,访问频率较低的冷数据占比高达80%,其存储空间需求增长非常快,对设备寿命、基础液冷存储技术提出了新要求。

相比上述需求,中国存储技术还存在明显短板。一是先进存储技术受制于人。企业反映,当前全球数据存储核心技术掌握在美国西部数据、希捷公司、 日本松下等企业手中,中国在数据存储芯片、存储介质、磁头等硬件设备,以及新型计算平台、分布式计算架构、数据处理、分析和呈现等软实力上,与国外仍存在较大差距,对开源技术和相关产业生态的影响力较弱,还需进一步突破。二是已有突破的技术难以普及。据了解目前主流存储介质在保存时间方面是短板,硬盘、固态盘平均寿命是5年,磁带约10年,蓝光存储光盘大概50年左右, 而个人信息的保存要涵盖生老病死全生命周期,远远超过存储介质的寿命。目前,中国拥有自主研发的蓝光存储技术,蓝光介质更适用于海量冷数据的长期存储,可以对其他介质在该领域形成替代,但受品牌、消费惯性等因素影响推广进程缓慢。

(三)数据存储需求对能耗约束提出新挑战

数据存储基础设施是高能耗的基础设施,因此在“双碳”背景下能耗技术也是存储技术的重要组成。据中国数据中心节能技术委员会测算,2016年中国大数据中心总耗电量已超过1200亿千瓦时,超过了三峡电站全年总发电量;到2017年,大数据中心总耗电量已经超过三峡大坝和葛洲坝电厂发电量之和;2018年中国大数据中心总用电量约 160TWh(1609亿kWh),比上海市当年全社会用电量还多。截至 2019 年底,全国超大型数据中心平均PUE(数据中心电能利用效率)为1.46,大型数据中心平均PUE为1.55;规划在建数据中心平均设计PUE为 1.41左右,超大型、大型数据中心平均设计PUE分别为1.36、1.39。按照工信部发布的规划目标,到2021年底,全国新建大型及以上数据中心PUE降低到1.35以下,到2023年底,PUE降低到1.3以下, 严寒和寒冷地区力争降低到1.25以下。虽然新建大型及以上数据中 心的平均利用率、总算力在快速提升,PUE也在稳步下降,但数据中心的能耗总量在不断增长。据《科学》杂志预计,到2030年,数据中心耗电量占全球电力使用总量的1.5%左右。从国内发展实践看, 考虑到能源消耗硬约束,还需进一步推动绿色数据中心创建、运维和改造,引导数据中心走高效、清洁、集约、循环的绿色发展道路,平衡好数据中心建设与低碳发展的关系。

四、数据安全存储政策建议

存储与其他数据服务密不可分,是数据安全的底层保障。以数据中心为载体的数据存储设施正在成为中国重要的一类新型基础设施。强化数据安全存储能力,需要从顶层设计、技术创新和低碳发展三个方面推进,可考虑开展有利于安全存储的创新试点示范工作。

(一)完善数据安全存储顶层设计

推动有关部门尽快完善数据安全存储顶层设计,为数据安全提供有力保障。立足推动数字经济健康发展大局,充分认识数据安全存储的重要性,深挖数据存储行业发展规律,坚持问题导向,明确数据安全存储的基础保障地位,优化资源配置、培育产业生态,加强人才培养,将数据存储设施作为数字经济基础设施统筹规划,促进数据存储安全产业快速发展。同时,加快《数据安全法》的落地工作,从建立完善的数据安全技术体系、落实各方数据安全保护责任、推动政务数据开放共享等出发,持续提升数据存储安全保障能力,从国家层面、地方层面、行业层面等多个层面来完善数据存储 安全保护的制度体系。

(二)加强数据存储领域基础研究,突破关键核心技术“卡脖子” 问题

支持高校、科研院所和龙头企业在新型玻璃存储、量子存储(量 子计算)、下一代蓝光存储技术等数据存储前沿技术领域加大基础研 究力度,解决数据量爆发式增长和能耗约束对存储带来的新挑战, 为突破关键核心技术“卡脖子”问题夯实基础。国家层面增设专门面向数据存储技术的应用基础研究项目,鼓励企业申请。支持行业 龙头企业申请数据存储领域国家重点实验室。

(三)充分发挥国内超大规模市场优势,加速技术迭代,有序推进

中国品牌数据存储设备市场应用 支持存储行业龙头企业在具备竞争优势的领域,如蓝光存储技 术、电存储、分布式动态点化云存储等方面率先引导国产化。鼓励国有企事业单位优先采购中国品牌的数据存储设备,发挥其对市场 的示范引领作用。充分发挥国内超大规模市场优势,加速数据存储 技术迭代升级。

(四)开展大数据安全存储试点城市建设,布局一批数据存储安全、低碳示范项目

从数据安全的战略高度,在集中式存储和分布式存储应用较为成熟的地区开展创新试点城市建设,例如长三角地区。试点技术创新,重点鼓励集中式存储和分布式存储相互融合的新型存储方式、 支持应用自主品牌存储硬件、支持开展低碳建筑技术创新。配套制度创新,进一步打通地区间数据存储壁垒,突破数据碎片化地域化导致的存储瓶颈。推动试点城市政府研究制定数字存储产业发展规 划,充分发挥企业特别是龙头企业作为市场主体的资源配置作用, 选择布局一批高质量数据安全存储基础设施项目,中央政府加大政策和资金支持力度,在用地、耗能方面出台支持政策,力争在试点过程中总结经验、发现问题。

作者周健奇系国务院发展研究中心企业研究所研究员,王明辉系国务院发展研究中心办公厅副处长、副研究员,高太山系国务院发展研究中心企业研究所副研究员,单衍菲系国务院发展研究中心企业研究所助理研究员,刘帅系中国财政科学研究院助理研究员

文章来源:澎湃新闻