1 元数据生成与增加
下面以文书类电子文件元数据为例来分析。文书类电子文件元数据分为文件实体、机构人员实体、业务实体、实体关系四个域,每个域又包含若干元数据元素。[2]6
1.1 文件实体元数据元素的生成与增加 该元数据域中,一些元数据是在电子文件管理阶段生成的,如标准中的M2-M20编号元数据:全宗号、目录号等;一些元数据在文件生成阶段生成,归档后还可以著录增加,如标准中M21-M39元数据:题名、并列题名、主题词等;这两类元数据在纸质档案管理中已有了成熟的获取与管理经验。还有一些元数据,在纸质档案管理中没有涉及,如果在文件生成阶段没有捕获、保存,在归档后则很难弥补进行二次获取,这类元数据是文件生成系统改造中必须重点关注的。
① 元数据“电子属性”
标准中编号M46元数据“电子属性”包含M47-M51共5个元数据,其约束性为条件选,即当聚合层次值为“文件”时,必选,也就是说对电子文件进行元数据捕获时,该元数据必须被捕获。然而目前绝大部分文件生成系统都没有捕获这类元数据的功能。
M47“格式信息”描述电子文件的格式信息,以利于分类管理、格式转换与提供利用。标准虽在信息来源一栏中标注“由形成、处理、管理电子文件的系统捕获或手工著录”,实际上在文件归档后很难再进行捕获或手工著录,或出现著录不全的问题。如郑州市电子政务选用的是书生公司格式,该格式需要应用书生公司的SEP阅读器打开,如果归档后档案部门没有安装该阅读器,根本识别不出是什么类型文件,更别谈相应元数据著录了。
M48“计算机文件名”、M49“计算机文件大小”虽可以在归档后由系统自动捕获或手工著录,但现有档案管理系统实际上也没有自动捕获类似元数据功能,手工著录则很繁琐,还容易出错。这两个元数据同M46一样也是当聚合层次值为“文件”时必选,应该趁生成系统改造之际增加自动捕获的功能。
M50“文档创建程序”指形成和处理文档的程序名称和版本,以此描述电子文件创建环境;M51“信息系统描述”描述生成或管理电子文件的信息系统的描述信息,著录信息系统的名称、版本、功能、开发商名称,以此描述电子文件创建和管理背景。这两个元数据一定要在生成阶段捕获或著录,一定归档后则很难再进行补著。
② 元数据“电子签名”
编号M57的“电子签名”是提供电子文件真实性、完整性依据的重要元数据,含子元素M58-M64共7个。M58“签名规则”是对电子签名方法、手段等相关信息的描述,在形成、处理、管理的系统中通过预定义文本著录;M59“签名时间”进行签名时系统自动生成;M60“签名人”由系统捕获;M61“签名结果”指电子文件中以电子形式所含、所附用于识别签名人身份并表明签名人认可其中内容的数据,由系统捕获;M62“证书”由系统捕获;M63“证书引证”可由系统捕获或手工著录;M64“签名算法标识”由系统捕获。
该类元数据虽说是可选,却是电子文件真实性的重要保障,基本全由系统自动捕获。如果生成阶段需要该类元数据,但该阶段如果没有获取,过后基本不可能再进行补著。
③ 元数据“当前位置”
该元数据标识文件在文档管理系统中存储位置,可以用URL或计算机名(服务器名)+ 盘符 + 路径等方法来标识,这两种方法均需要在生成阶段著录,在捕获阶段将该位置提交给ERMS实现在线归档,ERMS或逻辑归档或实体归档。如果逻辑归档,则该元数据值不变,只需对该标识的文件进行控制,如果是实体归档,该元数据值将改为归档后档案部门服务器的位置。
④ 元数据“权限管理”
M70“权限管理”是对电子文件内容涉及或具有的权益以及被赋予权限进行描述,以利于安全管理、控制和利用,含M71-M74这4各子元素。M71知识产权说明,M72“授权对象”描述被授权对象、利用电子文件的组织和个人,M73“授权行为”描述授权对象被授予的对电子文件操作和利用的行为类型,如公布、浏览、复制、解密等,M74“控制标识”描述电子文件是否公开、开放或控制使用。这些元数据应由生成者或处理者来著录最为准确,应在生成或处理阶段著录。当然归档后,档案馆也可以重新为这些元数据赋值,但前后所赋予的值可能是不同的。
1.2 机构人员实体元数据的生成与增加
该域包含M76-M79共四个元数据。M76“机构人员类型”描述形成、处理和管理电子文件的机构/人员的类别,值域为单位、内设机构、个人;M77“机构人员名称”描述形成、处理和管理电子文件的机构/人员称谓,著录时分别与M76对应;M78“组织机构代码”提供组织机构的唯一标识;M79“个人职位”描述履行电子文件形成、处理、管理等具体业务行为的个人的职务。该类元数据也应在形成阶段即进行捕获或著录。
1.3 业务实体元数据的生成与增加
该域包含M80-M83共四个元数据。M80“业务状态”描述电子文件形成、处理与管理等业务行为的时态类型,M81“业务行为”描述履行文件形成、处理、管理等业务的具体行为;M82“行为时间”描述实施具体业务行为的时间或时间段;M83“行为依据”描述实施具体业务行为的依据、授权或原因;M84“行为描述”进行业务行为相关信息的描述。这五个元数据用于记录背景信息,以维护合法性、真实性,前三个都是必选项,其信息来源之一就是由形成、处理、管理的系统捕获。如果在文件生成阶段没有生成相应元数据,就谈不上系统捕获,后期也难以弥补,电子文件背景信息缺失,难以保证文件的合法性与真实性。
1.4 实体关系元数据的生成与增加
该域包含M85-M88共四个元数据。M85“实体标识符”描述实体的惟一标识编码;M86“关系类型”描述电子文件之间、电子文件不同实体之间以及电子文件实体内部对象之间关系的种类;M87“关系”描述电子文件之间、电子文件不同实体之间以及电子文件实体内部对象之间的相互关系;M88“关系描述”是对关系类型和关系的进一步说明。这四个元数据在形成系统捕获或形成时手工著录,如果没有获取到相应元数据,电子文件在移交、归档时就会出现元数据缺失,归档后不能再补充。
上述分析的元数据在目前的文件生成系统(如OA)几乎都不会有专门功能来生成,必须要进行改造使系统具有该功能,生成并保存这些元数据。