由于每所学校所开设的科学数据课程的名称有些许不同,故笔者并为对此进行硬性划分。而是根据各个课程名中专业名词所出现的频次进行简单的归类,包括分为数据管理、信息组织、数据挖掘、信息可视化和数据监护以及其他课程。其中,在所调查的院校中,有两所学校专门开设了数据科学硕士,分别为加州大学伯克利分校信息学院的信息与数据科学的硕士(MIDS),和德雷塞尔大学计算与信息学院开设的数据科学硕士(MSDS)。下面将从这些课程的名称、内容方面来进行分析。
数据管理。科学数据管理是指在科学数据生命周期内对科学数据持续进行的组织和管理活动。它是e-science时代科学数据浪潮兴起的产物。其目标是通过科学数据的共享、长期保存与增值、促进科学研究,加快科研成果的创造,提高科学数据价值,增强数据再利用效益。例如加利福尼亚大学洛杉矶分校教育与信息研究学院所开设的数据管理和实践、数据管理与策略,内容包括对数据密集型的产生所采取的研究方法,数据共享和重用,和介绍不同国家和国际上数据管理的政策,以及如何撰写数据管理计划。还有德雷塞尔大学计算与信息学院开设的数据和数据管理课程,授课内容包括在各种信息组织(包括图书馆、档案馆、博物馆、数据中心、软件行业等)中开展数据管理和数据服务的方法,例如对涉及数据在数据生命周期中的管理活动,讨论使用和管理数据的可获得性、安全性、隐私性的方法。
信息组织。信息组织是指按照一定的方式和规则对数据进行归并、存储和处理的过程,也就是利用一定的科学规则和方法,通过对信息外在特征和内容特征的表征和排序,实现无序信息流向有序信息流的转换,从而使信息集合达到科学组合实现有效流通,促进用户对信息的有效利用和获取。这类课程一般都涉及了对科学数据的分析与处理。例如加州大学伯克利分校信息学院开设的信息组织与检索。德雷塞尔大学计算与信息学院开设的数据和信息组织课程,该课程的内容是介绍有关组织数据的原则和技巧。伊利诺伊大学[[[] 伊利诺伊大学信息科学学院官网开设的信息组织与获取,信息组织与获取这门课程在伊利诺伊大学的LIS教育体系中一直属于研究生的核心课程之一,主要开设在秋季,其次是夏季,春季最少,且授课的内容不同,在春季主要课程包括课程概述、课程帮助与提示、文献与收藏、信息组织方法、信息搜寻、信息检索、数据库设计等理论课程,随着课程内容的不断完善,还增加了实验课,实现了理论课与实验课的交叉进行,这样不仅丰富了学生理论知识,还提升了学生的动手能力,深化了对理论知识的认识。
数据挖掘。数据挖掘是一门结合数据库技术、统计学、机器学习、神经网络、知识系统、信息检索、高性能计算和可视化等多门学科知识的交叉学科。该课程既包括各种理论知识,又离不开相关的实践技术, 整个教学过程是培养和提高学生的创新能力和综合解决问题能力的重要途径。因此在国内外大部分高校的 LIS教育体系中开设了数据挖掘课程,例如在笔者所调查的样本中,唯一的一所国内高校武汉大学开设了数据组织与数据挖掘、数据挖掘的原理和方法、数据挖掘与商务智能等多门与数据挖掘相关的课程,其中在数据挖掘与商务智能课程中,将数据挖掘与商业领域进行紧密的结合,来研究商业领域中的数据处理过程。在调查样本中,国外高校中开设数据挖掘课程的有7所,例如美国加州大学伯克利分校信息学院、德雷塞尔大学计算与信息学院、伊利诺伊大学信息科学学院、密歇根大学、谢菲尔德大学信息学院等。笔者通过对课程大纲的浏览,发现国外高校在数据挖掘课程中的一个显著特点是突出数据挖掘的实际应用,而不只是讲授有关的机器学习和统计计算的理论基础,国外更注重的是对实践的探讨,例如介绍如何将不同的信息表示为特定的类型或数据格式,以及如何使用先进的技术来完成各种数据类型的基本挖掘任务。并且在国外课程内容设置中,该类课程往往会加上实验课进行辅助教学。