1. 基本模式
1989年,斯图尔特·卡德(Stuart K.Card)、约克·麦金利(Jock D.Mackinlay)和乔治·罗伯逊(George G.Robertson)提出了信息可视化的概念。根据卡德等人于1999年提出的信息可视化模型[],信息可视化过程分为三个阶段:数据预处理、绘制及显示与交互。
(1)数据预处理,将信息进行过滤和加工,使其易于被可视化模块输入。预处理包括格式及标准化处理、异常值检出、数据压缩等。
(2)绘制,是将数据转换为几何图形的过程,是按照用户需求,应用多种可视化技术绘制图表。
(3)显示和交互,是将几何图像数据,按照用户指定条件,渲染输出。除了将图像信息输出外,还需把用户的反馈信息回传,实现良好的人机交互。
2. 可视化工具
在可视化工具选择上,主要考虑因素有:
第一,兼容性好。由于教务系统启用较早,所用的相关工具须与教务数据管理系统高度集成、流畅运行。
第二,稳定性高。所选用的软件应是大型软件公司开发的成熟度较高的正式版本,并考虑其技术团队仍然在持续更新升级,版本控制、产品升级及软件稳定性具有保障。
第三,契合学籍可视化需求。学籍可视化具有数据量大、图表呈现需精确等特点,可视化工具的选择需考虑学籍信息可视化的特点,在满足需求的前提下,选择资源占用低、性能高的可视化工具。
综合上述因素,本研究选用SQL SERVER和ECharts作为学籍可视化的实现工具。
SQL Server(Structured Query Language Server)是微软公司推出的关系型数据库管理系统,具有良好的兼容性,可跨越从运行Microsoft Windows 98 的电脑到运行Microsoft Windows 2012 的大型多处理器,为数据提供更可靠的存储。
ECharts是一个运行于浏览器的纯Javascript图表库,可以流畅运行于PC和移动设别,兼容当前绝大部分浏览器,底层依赖轻量级的Canvas类库ZRender,提供直观,生动,可交互,可高度个性化定制的数据可视化图表。具有以下特性:
(1)丰富的图表类型。Echarts不仅有常规的折线图,柱状图,散点图等,也包含用于统计的盒形图,用于地理数据可视化的地图,热力图等,用于关系数据可视化的关系图等,用于多维数据可视化的平行坐标,还有用于BI的漏斗图等。
(2)多个坐标系的支持。支持了直角坐标系、极坐标系、地理坐标系等。图表可以跨坐标系存在。
(3)深度的交互式数据探索。交互式从数据中发掘信息的重要手段。“总览为先,缩放过滤按需查看细节”是数据可视化交互的基本需求。
(4)大数据量的展现。ECharts在散点图中能够轻松展现上万甚至上十万的数据。
(5)动态数据。ECharts由数据驱动,数据的改变驱动图表展现的改变。ECharts还会为这种改变添加渐变特效。
3. 学籍信息可视化的实现路径
依据卡德信息可视化模型,结合可视化的工具特性,将学籍信息可视化的实现路径分为三个阶段:
(1)学籍数据预处理。将学籍数据进行检测、筛选和加工。学籍数据中发现部分异常值需予以剔除,并将数据转化成符合ECharts可视化模块可输入的标准格式。
(2)绘制可视化图表。按照可视化的需求,设立筛选条件,通过SQL SERVER获得满足条件的数据,并将学籍数据输入ECharts可视化模块,应用多种可视化技术绘制图表。
(3)显示与交互学籍可视化图表。按照指定条件渲染输出图表,按照用户反馈信息,做出显示的相应调整。例如,用户可根据需要,选择特定区域显示特定记录的单项数据或特定集合的细节数据。