5.3 数据分析的目标
到目前为止,我通常把分析的目的称为“解决问题”的一种方式。事实上,数据分析可以用来达成以下一个或多个目标:
·解决问题。应用分析主要涉及发现解决实际问题的方案,并且用解决方案产生的直接效用或应用情况来衡量是否成功。在数据分析生命周期中,关注的重点通常是解决问题的速度和可解释的价值。
·支持论断。分析专业人士经常使用一些分析技术来为一个论断的有效性提供支持,比如确认一个假设或通过可视化手段来展现关联关系。其重点在于通过分析加强论断的准确性和可靠性,并不一定强调流程的可重复性。
·理解现象。我们经常为了从广义上和狭义上更充分地理解一个现象而着手启动分析项目。可视化分析或探索性数据分析等技术可以帮助发现这些关系。
·发现新事物。分析可以用来告诉我们一些我们还不知道的事情。我们可以将这一目标追溯到数据挖掘的发展历史,它经常利用新的分析方法或非结构化、无组织的数据,而且常常集中在创新型的焦点上。好奇心和求知欲激发了对这些关系和关联的探索与发现。
在每一种情况下,根据结果使用方式的不同,关注点是不同的。然而,虽然不同的目的下使用的分析方法可能会不同,但数据分析生命周期作为一种通用的方法论或框架是一致的(见图5-2)。
应该指出的是,这里有意省略了一些其他主题,例如监测一个流程、有指导的数据探索或查找一个数值。如果希望更全面、深入地讨论数据分析的应用,尤其是关于数据可视化用途的详尽介绍,我建议阅读Stephen Few关于这一主题的观点(Few,2012)。
当然,这些目标通常与商业智能和数据可视化相关,并不一定被视为属于数据分析的范畴。
评论留言