有大数据的理念,能够掌握数据和运用数据的人就是下一个时代的魔法师,反之你就成了麻瓜。
一个“一切都被记录,一切都被分析”的数据化时代的到来,是不可抗拒的。
计算机也会挑食,他最喜欢吃的数据叫做结构化数据(二维表表示的数据)。未来的趋势则是非结构化数据,主要包括6种类型的数据:文本数据(分析了解兴趣、评价、情绪、关联、趋势),图像和语音,网络,空间轨迹,时间序列。
再大的数据集,再丰富的数据形态,如果以孤岛的形式存在闭关自守,不和外面的世界沟通,那都不能叫做大数据。
数据是第3次工业革命的新材料。
机器学习的通用流程:确定问题和指标-数据清洗-特征提取和特征选择-模型训练-模型融合
数据的外部性:就是要充分利用与本业务看起来无关的数据,来解决业务中遇到的问题,并且把自身业务产生的数据拿出去,解决外面的各种各样的问题。
麻省理工学院的阿莱克斯彭特兰教授:思想的流动模式与生产力的增长和创造性输出有着直接关系,甚至可以说沟通本身就是一种生产力。无论工作组成员的个性如何,工作组成员之间交流比例越高,生产力也就越高,同时还能减轻压力,举个例子来说,在了解到美国银行呼叫中心通常会安排茶歇,工作的时间只允许一个人休息,彭德兰说服美国银行呼叫中心的经理,安排让更多员工能够同时茶歇,从而可以在茶歇时候交流,单单就这一种变化就是美国银行呼叫中心每年的产出提高了1500万美元。
真正厉害的大数据应用,可不只是基本统计,而是绝大部分都和机器学习有关。机器学习三板斧:特征,模型,融合。
评论留言