摘要 [目的/意义]通过研究大学机构知识库可持续发展策略探索把大学机构知识库从为大学存储本机构成果的工具发展成为重要的大学知识管理和传播平台的方法。[方法]本文从政策建设、内容建设、检索服务、数据维护和扩展服务几个方面分析目前我国大学机构知识库在建设过程中面对的困难和存在的问题。[结果/结论]从解决问题出发,有针对的对大学机构知识库发展提供一些积极的建设策略探索,同时对图书馆在大学机构知识库建设中的角色也进行了思考。
1引言
为了更好地推动全球学术成果的快速传播和利用,国际科技界、学术界、出版界和信息传播界利用互联网自由传播的特性一并发起了全球开放获取运动(Open Access,简称OA)[1]。目前,开放获取的快速发展已经引起了世界范围的普遍关注 [2]。随着开放获取运动的兴起,传统的科学交流正趋向开放的科学交流。开放的科学交流主要采用的载体是开放存取期刊、开放机构知识库、学术社交网络。其中机构知识库作为开放获取运动的产物,也发挥着日益重要的作用。在国内,机构知识库的建设获得了科研机构和大学图书馆的重视。本文跟踪现阶段国内大学机构知识库(之后简称大学IR)的发展状况和建设进展,对机构知识库建设的最新发展趋势及热点进行分析和思考,为图书馆积极开展大学IR建设提出可持续发展的建议。
2机构知识库服务现状及大学IR建设存在问题
根据开放存取知识库目录(OpenDOAR)的实时统计,截至2017年1月25日,在OpenDOAR网站注册的知识库已达3291个[3]。其中欧美国家发展速度更快,北美在OpenDOAR中注册的机构知识库达 602个,占总数的18%;欧洲总共有1489个,占总数的45%;亚洲总共有662个,占总数的20%。截至 2017年1月25日,国内在OpenDOAR中注册的机构知识库,包括香港、澳门在内有43个(其中中科院占25家)。
目前,我国大陆地区注册的IR绝大部分为中国科学院各研究所所建,并已经发挥了支撑教育科研服务的应用作用,大学建立的IR主要是北京大学、北京理工大学、重庆大学、清华大学、厦门大学5个示范馆联合推进的 CALIS 机构知识库项目[4]。但随着大学IR建设的深入,困难和问题也逐渐显现出来,主要表现在以下几个方面:
(1)政策方面
根据开放存取知识库目录(OpenDOAR)2017年1月的数据显示,成功链接的机构知识库页面中有75%没有定义相关内容政策。虽然国外已经有一些研究机构、基金以及大学都开始实施了强制性的开放获取政策,要求开放论文存储到对应的知识库IR中,但从这个数据可知,在全球范围内,机构知识库建设过程中没有对政策给予足够重视。机构知识库的建设离不开相关政策的支持,特别是强制开放获取政策的支持,国内虽然从2015年5月开始,基金委正式发布“国家自然科学基金委员会基础研究知识库”,采集国家自然科学基金资助项目成果的研究论文,并向社会公众提供开放获取 [5]。目前国内实施强制性开放获取政策的机构只有6家(见表1),其中香港的大学IR占其中的4家。对于大学IR长期建设而言,实施强制性开放获取政策有利于大学研究成果的共享和传播,国内在建设一流大学的目标过程中也应该逐步考虑科研成果的开放获取,思考提供学术成果免费下载的可行性方案,在促进全球的学术交流的同时,提高国内科研成果的全球影响力。
(3)资源检索、揭示和软件平台方面
大部分大学IR设置有针对不同文献类型的分类导航,也有对作者所在分属学院机构的导航。但大部分大学IR不具有站外链接功能,只能在站内检索资源,很难通过与其他知识库或外部发现服务集成,达到提供深层次的文献揭示服务的目的[7],大学IR资源的整体揭示程度还有待提高。
另外,通过调研情况发现国内很多大学IR采用开放源码的DSPACE软件系统,该系统更专注于在机构范围内收集、保存、索引、散布学术出版物[8],而没有考虑用户与用户之间的关联互动。一项对美国40个使用DSPACE平台作为他们的机构知识库的机构调查发现教师对单个IR存档文件的参与度仅为4.6%,这表明IR吸引用户参与方面存在问题[9]。另外一项关于美国康奈尔大学机构知识库研究这样描述用户对IR系统的参与度,其用户尤其是教师对机构知识库的使用态度是在使用频率低和不使用之间变化[10]。国内高校的很多IR系统平台也同样没有考虑通过具有创造力和智慧的个体学术成果产出把IR的用户联系起来,多数平台缺少用户的推荐、收藏、评论等功能,界面的友好性、操作性、互动性不强。
(4)数据方面
大学IR存在数据更新不及时,IR被闲置问题。数据更新的主要困难是由于数据来自的平台和数据的组织格式不一样,采用人工手段很难进行处理。即便采用人工处理方式,处理后的数据质量也难以控制。另外,人工判断文献与真实唯一的机构,学者,学科,主题等实体之间的精准关联关系也需要耗费大量的时间和精力。如果采用利用出版商将数据直接推送到大学IR的方式,则需要了解复杂的多个出版商和大学IR之间的对应关系,这些困难不解决就很难获得数据商的技术支持。
(5)扩展服务方面
虽然大学IR在建设发展过程中也在积极探索扩展其服务功能的方向,以获得更多学校层面的发展支持,但在国内高校的科研人员对IR的认知度不高,大学IR与校园网其他服务平台尤其是科研管理平台缺乏融合贯通的背景下,给大学IR的可持续发展带来困难和挑战。随着大数据时代的到来,人们越来越多的认识到科研数据管理的重要性,为了将来科研数据的重复利用,及对科研数据开展深层次的分析服务,需要考虑将科研数据纳入大学IR的存缴范围,并制定灵活且严谨的政策,以便更好的满足科研用户的信息需求。
大学IR建设过程中,遇到的其他困难还包括:人力不足;开发能力有限;经费问题等。
3大学IR建设的可持续发展对策
为了促进大学IR的快速发展,推广大学IR的应用,扩大其在科研活动中的影响力,需要探索和思考解决当前大学IR建设中实际问题的方法,找到突破建设瓶颈的可持续发展路径。
3.1探索建设大学学者中心,扩大大学IR的声望,提高大学IR的学术影响力
在大学IR中建立学者的档案,成立学者中心,以加强大学学者及其研究的可见度,开发培养潜在的跨机构跨地域的研究合作的机会,是发展大学IR的有效策略之一。学者中心的建立与良好发展也将提升大学管理者及机构内成员对大学IR建设的信心,同时有效改善大学IR的持续化发展问题。通过对资深学者的个人成果展示,在管理学者声望的同时扩大其学术影响力,也扩大了大学IR的影响力。学者中心的建设也符合从以文献为中心转变为以人为中心的新型知识组织模式建设需求。如香港大学通过建立学者中心(The HKU Scholars Hub)提高机构学者论文在Google学术、WorldCat、OATD、NDLTD、BASE上的可见度[11]上所做的尝试。国内的大学如清华大学、西安交通大学、厦门大学等也陆续建立学者中心作为机构学者成果展示的窗口,通过建立学者中心起到IR建设的示范作用,在宣传推广大学学者核心学术成果的同时,也保证了大学IR内容建设的质量。学者中心除了对出版的成果的展示外,还可以考虑展示个人的信息、专利、项目、奖励、部门组织、仪器、资助人等信息。通过建设研究者唯一标识符并设计集成于系统中,便可以利用大数据手段自动将数据推送到关联的学者唯一识别ID,提高学者的成果自缴能力,在精准获取学者成果的数据同时进而通过设计跟踪论文的交叉引用等相关统计来对其学术影响力评价做出贡献。
3.2 争取大学层面的支持,建立长效的激励和保障政策
机构知识库资源内容的存缴率对IR资源内容的数量和质量起重要作用,也是IR生存和发展的最基本条件。根据国外学者对自愿自存储和强制性自存储的存储率的比较分析,机构知识库自愿呈交的存储率为15%,而实行强制性呈交后的存储率可达到100%[12]。我国处于大学IR建设初期,要保障大学IR资源内容的存储率,达到为教学、科研提供信息服务的目标,可以积极争取在大学层面制定强制存缴政策。探索制定将大学科研人员在接受公共资助的科研活动中的成果产出通过学校层面的强制方式储存到大学IR中的政策。对那些没有接受公共资助,科研人员的科研产出,由科研人员自愿提交。为了激励大学科研人员提交个人成果产出,制定相关奖励机制将大学科研人员的科研工作绩效或其职称评定与大学IR中存缴的科研成果直接关联。在科研项目管理方面,可以利用大学IR中的科研成果信息及项目信息为该项目的评估、验收和资金拨放提供数据支持和根据。如比利时的机构仓储的倡导者就向国会议员建议让机构知识库成为权威机构决定给大学不同投资的唯一参考标准[13]。
另一方面,IR自存储率不高,可能是由于教师对开放获取政策持怀疑态度,他们对版权和版权政策不了解甚至感到困惑,导致他们对在大学IR中存储自己的学术作品非常的犹豫。早前James Allen的研究指出版权的不确定是妨碍学术作者参与IR的障碍[14]。要克服这一问题的关键是要保证告之他们所要遵守的关于版权的所有国际和国家的规章制度,并小心处理不要侵犯出版商的权利。需要制定尊重学校师生的意愿,保证在研究和教育领域促进开放获取效益的同时制定符合实际需要的保护个人隐私和知识产权的平衡政策。维护大学科研人员创作积极性并保障其学术资源最大程度在大学IR这一平台上的共享交流。通过其与大学IR签署知识产权保护协议,授权大学IR对其作品的合法管理和使用是维护双方利益的做法。其中知识产权保护协议中一般需要制定关于时滞期、著作权等权益政策、知识保存与传播利用政策、元数据与全文使用政策、存缴审查政策以及特定情况下的撤销政策。事实证明通过提供个性化的个人出版作品清单和清晰的版权许可说明服务是赢得大学师生信任和提高他们对大学IR参与度的保证[15]。
作者:任利