首页 » 论文导航 » 教育 » 正文
基于范式理论的数据分析模式演变和构建
 
更新日期:2020-03-18   来源:江汉论坛   浏览次数:170   在线投稿
 
 

核心提示:在2007年的NRC-CSTB大会上,图灵奖获得者JamesGray发表了题为e-Science:一种科研模式的变革的演讲,提出四种研究范式包括实验科学、理论科学、仿真科

 
 在2007年的NRC-CSTB大会上,图灵奖获得者James Gray发表了题为“e-Science:一种科研模式的变革”的演讲,提出四种研究范式包括实验科学、理论科学、仿真科学和大数据计算科学。

(一)传统阶段的范式理论下数据分析模式的演变

1.实验归纳型范式——1NF模式。1NF模式又称实验归纳型经验(试验)科学。在人类社会发展早期直至20 世纪之前,由于人类获取、分析数据的能力有限,人类的科学研究主要是以记录和描述自然现象为主,大多数的发现是基于对自然现象的反复试验而取得的成果型结论,通过科学体系和系统性理论归纳推演的成果较少。实验科学是最早出现的科研范式,大多是对自然现象进行重复实验而得到成果,少有系统的理论归纳。

2.模型推演型范式——2NF模式。2NF模式又称模型推演型理论科学。2NF模式是在1NF模式的基础上发展而来,是对现象的理论总结和概括,先由重复发生的现象提出假设理论,然后设计不同变量下的多次实验并使用假设理论对实验结果进行预测,实验 结果是否和预测结果一致以及在实验过程中产生的新现象将会检验和修正假设理论,假设理论在经过无数的实验和修正后才会上升至定理和真理。

3.仿真模拟型范式——3NF模式。3NF模式又称仿真模拟型计算科学。主要是通过实地调研以获得的科学知识来代替个人的经验判断,从经验决策向科学决策转变,科学决策以信息处理系统为主体并融入了专家智能化,运用数理统计、检索查询等现代科学技术处理手段克服了经验决策对信息处理的限制,但是由于获取的数据以描述性统计以及报表为主,并带有少量预测性分析数据,由这些数据构成的小规模数据样本在单个决策的效能问题上发挥了重要作用,但是很难从整体上解决决策效能问题。
(二) 4NF理论下数据分析模式的发展

20世纪计算机的发明使得计算能力不断增强,科学从理论推理转向计算仿真,计算科学被认为是实验科学和理论科学的扩展,即数据密集型计算科学(4NF模式)。相对于传统科研范式对精确的原始数据和严密的假设检验过程的要求,数据密集型科研范式下的数据分析和知识发现不再追求绝对精确的原始数据,更多复杂无序的相关关系的发现以及学科问更为密切的交流合作产生了科学研究新方法 。

为了克服“信息有限”在对于数据密集型计算科学的约束,采用4NF理论对大规模数据进行分析,从大数据中发现隐含的规律或价值,赋予分析结果智能化。从2008年大数据(Big Data)的概念在《Nature》专刊上被提出以来,关于大数据研究的热度就一直未曾消减,涉及4NF理论的数据分析模式主要集中在三个层次: 一是决策思维的转变,研究认为从传统的基于直觉、经验、行为决策范式转变为基于数据决策的演进趋势,并揭示了大数据驱动管理与决策的重要性与必要性。二是能力的提升。在涉及4NF理论的数据分析模式中,数据挖掘、智能分析以及预测能力与管理学的动态能力相结合形成大数据为中心的动态能力。三是实践应用的丰富。涉及4NF理论的数据分析模式正在从“弱”应用转变为“强”应用,正在商业、金融、医疗、教育、社交、科研等领域被广泛应用,并产生了创新性的产业空间和一定的社会价值。
点击在线投稿
 

上一篇: 基于范式理论的数据分析模式演变和构建

下一篇: 基于范式理论的数据分析模式演变和构建

 
相关论文导航
 
 
 
 
 
 
 
相关评论
 
分类浏览
 
 
展开
 
 
 

京ICP备2022013646号-1

(c)2008-2013 聚期刊 All Rights Reserved

 

免责声明:本站仅限于整理分享学术资源信息及投稿咨询参考;如需直投稿件请联系杂志社;另涉及版权问题,请及时告知!