3.大数据做调查研究的流程 #数据分析

大数据
后台-插件-广告管理-内容页头部广告(手机)

大数据做调查研究的流程。

第三章来学习大数据调查研究的流程。利用大数据做调查研究可以分为六个步骤:问题工程、信源工程、数据工程、特征工程、模型工程和展示工程。简单的说是问成问题工程就是确定教研目标,明确解决什么问题。

·信源工程做的事情是获取到数据,解决的是数据从哪里来,数据工程干的事就是做数据的处理和清洗,确认哪些数据有用。特征工程是构建数据的分析维度,收集关键特征知识,构建知识图谱和知识库。目的是对数据按照你的分析维度进行分类,打上对应的分类标签。这个标签就是分析维度、模型工程。

 

·初级的数据分析工程师可能是做一些标签的统计,通过统计结果来动态问题。高级的数据分析师会基于标签体系及统计结果构建挖掘模型,建立标签之间的关联关系、熟悉数据的奥秘。

·最后的展示工程做的是数据的可视化以及分析成果的应用,撰写研究报告或论文。

 

这六个步骤也是一个通用的数据分析流程,但是不是顺着做一次就完成了。在每一步都可能发现新的问题,从而开始补充新的分析流程。这个就是ooda循环。

o o a是观察、调整、决策以及行动的英文缩写,它是信息占领的概念。ooa循环的发明人是美国陆军上校约翰包易得,因而也被称为包易得循环。有兴趣的同学可以对ooda循环去深入了解。大数据分析流程其实是多个oda的分析过程。

后台-插件-广告管理-内容页尾部广告(手机)
标签:

评论留言

我要留言

◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。