1、大数据的内涵
自大数据概念提出至今,学术领域和实践领域的研究者们从不同的视角阐释了对大数据的认识和理解,但是目前尚未形成一个公认的定义。通过对现有关于大数据的定义的梳理,对于大数据的认知可归纳为两种研究视角。一种是数据集视角,即认为大数据是一种数据集,如美国咨询公司麦肯锡的报告的定义是:“大数据指的是那些大小超过标准数据库工具软件能够收集、存储、管理和分析的数据集;研究机构Gartner将大数据归纳为需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。另一种是特征论视角,即对大数据的阐释和理解从其“3V”或“4V”特征的来定义。但不管是数据集视角中的大数据还是特征论视角中的大数据,数据之大始终是其核心,这个“大”已经超出了传统数据处理能力和技术。因此,可将大数据定义为:超出了传统数据处理软件的抓取、管理和处理能力需要借助新的数据处理模式的具有海量的数据规模、高速的数据流转、多样的数据类型和价值密度低四大特征的数据集合。
2.档案数据资源开发的内涵
档案数据资源开发是一个主谓结构的合成词,要想厘清档案数据资源开发的内涵,对其进行科学合理的界定和阐释,明晰“档案数据资源”这个主语和“开发”这个谓语的内涵是基础。何为档案数据资源?根据种概念+属概念的概念界定规则,档案数据资源有两种分解方法:即档案数据资源=档案+数据资源或档案数据资源=档案数据+资源。第一种分解方法是将档案都纳入数据资源的范畴,换句话说档案是数据资源,其对象是所有形式档案,是一种广义的概念;第二种分解方法是将档案数据作为资源的一种,即档案数据是资源,其对象是以数据形式存在的档案,是一种狭义的概念。以上两种分解方法不管是广义范畴的档案数据资源还是狭义范畴的档案数据资源,档案和数据都有着密不可分的关系。因此,综合两种分解方式,本文将档案数据资源分解为:档案数据资源=档案数据+数据资源,即档案中以数据形式存在的档案资源,这种档案资源是数据资源的重要组成部分。何为开发?开发是开发主体为实现特有目的运用相应的手段、方法挖掘开发客体价值过程。档案学理论一般认为开发指的是发掘档案中蕴藏的有利用价值的档案信息资源,其任务主要是在于寻找和获取较为集中、系统或有特定价值的档案信息。综合档案数据资源和开发的内涵,可将档案数据资源开发定义为:档案开发主体运用一定的手段、技术和方法挖掘档案中以数据形式存在的档案资源中所蕴藏的有用价值的过程。