《为数据而生——大数据创新实践》读书摘抄

大数据
后台-插件-广告管理-内容页头部广告(手机)
 

有大数据的理念,能够掌握数据和运用数据的人就是下一个时代的魔法师,反之你就成了麻瓜。

一个“一切都被记录,一切都被分析”的数据化时代的到来,是不可抗拒的。

计算机也会挑食,他最喜欢吃的数据叫做结构化数据(二维表表示的数据)。未来的趋势则是非结构化数据,主要包括6种类型的数据:文本数据(分析了解兴趣、评价、情绪、关联、趋势),图像和语音,网络,空间轨迹,时间序列。

再大的数据集,再丰富的数据形态,如果以孤岛的形式存在闭关自守,不和外面的世界沟通,那都不能叫做大数据。

数据是第3次工业革命的新材料。

机器学习的通用流程:确定问题和指标-数据清洗-特征提取和特征选择-模型训练-模型融合

数据的外部性:就是要充分利用与本业务看起来无关的数据,来解决业务中遇到的问题,并且把自身业务产生的数据拿出去,解决外面的各种各样的问题。

麻省理工学院的阿莱克斯彭特兰教授:思想的流动模式与生产力的增长和创造性输出有着直接关系,甚至可以说沟通本身就是一种生产力。无论工作组成员的个性如何,工作组成员之间交流比例越高,生产力也就越高,同时还能减轻压力,举个例子来说,在了解到美国银行呼叫中心通常会安排茶歇,工作的时间只允许一个人休息,彭德兰说服美国银行呼叫中心的经理,安排让更多员工能够同时茶歇,从而可以在茶歇时候交流,单单就这一种变化就是美国银行呼叫中心每年的产出提高了1500万美元。

真正厉害的大数据应用,可不只是基本统计,而是绝大部分都和机器学习有关。机器学习三板斧:特征,模型,融合。

后台-插件-广告管理-内容页尾部广告(手机)
标签:

评论留言

我要留言

◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。