《数据归人》|数据分类解读分析
党的二十届三中全会提出“要健全因地制宜发展新质生产力体制机制,健全促进实体经济和数字经济深度融合制度”,并作出了全面和有针对性的部署。截至2023年底,我国数据生产总量达32.85ZB,同比增长22.4%;算力总规模达到230EFLOPS,居全球第二位,近5年算力总规模年均增速接近30%。数字经济作为一种新型经济形态,核心特征与新质生产力高度契合,通过其进行技术创新和模式创新,为新质生产力的发展提供源源不断的动力。本文摘取《数据归人:个体数据交换价值分析》一书中对数据分类解读分析,供读者参考。
数字社会和数字经济的蓬勃发展已历经二十余年,这期间,线上服务平台的分工日益精细化,涵盖了从政务登记管理服务系统到生产经营活动内部的管理、财务、供应链等各个业务体系,乃至个人衣、食、住、行的方方面面。根据不同的维度,可以将数据归为不同的类别。每种类别的数据都体现了其独特的特点,而同一数据也可以从不同角度和分类进行观察和分析,发挥其不同的使用价值。随着技术的不断演进和数据活动的持续积累,每种类别中的数据数量都在不断增加,同时各类数据的相对比例也在发生变化。
(一)根据数据的产生主体,可分为政府数据、企业数据和个人数据
政府数据是指政府机构在履行其管理服务职能的过程中产生或持有的数据。这些数据因其承载的公共服务属性而具备独特的地位。企业数据是指由企业产生或持有的数据资源。个人数据,即由个人产生或持有的数据,通常与个体的身份和隐私紧密相连,因此具有高度的保密性,仅供个人使用或经授权后供他人使用。
(二)根据数据产生的特点,可分为身份特征数据、行为轨迹数据和成果数据
身份特征数据是用于描述和确认个体身份的关键信息,与个人特征紧密相关,是线上、线下各类账户开立、注册的基础需求,也是核验身份和意愿的主要手段。行为轨迹数据主要分为线上活动轨迹数据和线下活动轨迹数据。成果数据是以数字化形式展现主体在时间成本、资源投入等方面的最终产出,能够有效衡量个体在特定领域或方向上的表现和成就。
(三)根据数据内容的产生方式,可以分为原生数据和衍生数据
原生数据是指未经任何形式加工、转换或处理的数据,保持着原始的业务完整性和真实性。衍生数据是对原生数据通过算法加工、计算与聚合所生成的系统化、可读取且具有实际使用价值的数据。
(四)根据数据的质量,可分为可信数据和普通数据
可信数据是实现高效、安全的数据利用的关键,从根本上说,数据是否可信直接决定了数据的价值和可用性。从相对数量来看,当前普通数据占绝大多数,可信数据的比例相对较低。
(五)根据数据产生的地点,可分为境内数据和境外数据
境内数据是指在一国境内生成、搜集、存储、处理、使用的数据,此外的数据属于境外数据。
(整理/庄希颉)