1 数据的内涵界定
毫无疑问,要理解事物的本质首要是了解内容和内涵。数据的含义可以从多个角度和领域理解。在计算机科学中,数据是指计算机输入、处理和输出过程中的一系列数字、文字和其他介质。实际上,它是由二进制0和1的数值单位表示的客观形式。也观点认为数据是被记录的事实,这是数值和单词等形式的客观实体属性值 。数据的概念在国家和地方的相关法律中也有明确规定。例如,《数据安全法》第3条第1款规定:“本法中的数据是指电子或其他手段的信息记录”。《国务院关于印发促进数据发展行动纲要的通知》中对数据的定义采用概括特征的方式,即“4V”标准[ 4V:数量(Volume),即数据巨大,从TB级别跃升到PB级别;多样性(Variety),即数据类型繁多,不仅包括传统的格式化数据,还包括来自互联网的网络日志、视频、图片、地理位置信息等;速度(Velocity),即处理速度快;真实性(Veracity),即追求高质量的数据。],明确数据是以容量大、类型多、存取速度快、应用价值高为主要特征的数据集合。虽然学术界对数据内涵有不同的认知,如“技术本体论”、“数据本体论”、“工具论”、“社会关系论”、“信息资产论”等,但数据容量“大”的特点,其旨在依托新技术的发展,发现新知识、新技术、新事实、新联系的特征,已是共识。
上述“信息”也是与数据问题相关的重要概念。在规范的意义上,信息可以被定义为客观事物发展、变化和运动状态的本质内容。就数据与信息的关系而言,数据是信息的物质载体,信息是数据的一部分[4]。在信息网络和数字化时代,大量的数据以电子数据的形式存在,而电子数据本身就是存储在电子媒介中的信息形式。数据作为客观记录的原始记录是客观的。信息被认为是经过处理的数据,是有意识形态的。当然,数据和信息在一定条件下是可以相互转换的。基于同一数据的不同的数据处理、交易、使用模式目的,相关信息的使用价值可能会有很大差异。此外,数据本身的无形性和不可消费性可以转化为巨大的信息资源,为数据的开发和利用发挥独特的作用。
综上所述,数据是区别于信息、数据等的各种信息和大量经过技术处理的数据集合。换句话说,数据是由信息组成的数据集合,但数据的法律属性不能简化为一定的信息和数据。这是因为信息的类型各不相同,如国家安全信息、公司信息和个人信息,并且对其的保护因信息类型而异。简单来说,仅仅针对数据解读表面上的语义文本并不是目的,而是要进入数据深层次的法律特征分析。
2 数据的分类探讨
研究数据类型,有助于根据数据的特征确定保护数据所有权的模式。数据类型可以根据不同的标准进行分类。
通常,以数据主体可以分为个人数据、企业数据、公共数据等。个人数据,《民法典》在总则部分第 111 条规定: “自然人的个人信息受法律保护”。同时,在其第六章“隐私权和个人信息保护”中则专门针对个人信息保护做了规定。此外,《中华人民共和国个人信息保护法》规定的个人信息是以电子或者其他方式记录的与已识别或者可识别的自然人有关的各种信息,不包括匿名化处理后的信息。简单说,个人信息是基于个人隐私和人格权意义进行保护的,个人数据则属于财产权范畴。但是,个人信息与个人数据之间也具有密切联系,尤其是个人信息进入商业化平台,如通过各种 APP 平台注册用户的使用,个人信息就转化成个人数据。企业数据,是企业等商业主体在其生产经营活动中积累的以电子或者非电子形式存在的信息、资料,如企业生产经营业绩数据、企业财务业绩数据、企业战略、产品、客户关系数据等。在互联网环境下,企业数据与个人数据之间存在一定的交叠,如企业用户授权其使用的数据在一定条件下也可以纳入企业数据范畴。在处理企业数据与个人(用户)数据的法律关系时,应当在确保用户利益基础上,以促进数据商业价值的开发和利用为原则。公共数据,是指政府在承担公共管理和公共服务职能过程中产生的各类信息、资料等数据,如财政税收、文化、教育、卫生行政部门的政务数据。与前述个人数据和商业数据不同,公共数据的具有很强的公共性,其中部分还涉及国家机密和商业机密,或者个人隐私保。