- 相关推荐
维克托迈尔舍恩伯格《大数据时代》读后感范文(精选14篇)
当仔细品读一部作品后,大家一定都收获不少,是时候写一篇读后感好好记录一下了。千万不能认为读后感随便应付就可以,以下是小编帮大家整理的维克托迈尔舍恩伯格《大数据时代》读后感范文,仅供参考,希望能够帮助到大家。

维克托迈尔舍恩伯格《大数据时代》读后感 1
对于畅销书刊、热点话题、时尚科技,始终不太感兴趣。书刊,喜欢有一定年份的。话题,钟情于务虚的观点。新奇的产品于我无缘,习惯使用成熟的科技产品。既不清高,也非冷漠,就是要与现实保持一定的距离,给自己留一点思考的空间。这一习惯最近破了例。由于工作的原因,耳濡目染,“大数据”这个新兴概念开始频繁步入我的视野。按捺不住内心的好奇,网购《大数据时代》,手不释卷,三天读完,颇有收获,此书有如下特点。
首先,作者站在理论的制高点上,条理清楚地阐述了大数据对人类的工作、生活、思维带来的革新,大数据时代的三种典型的商业模式,以及大数据时代对于个人隐私保护、公共安全提出的挑战。其次,文中的事例贴近现实生活,贴近时代,令读者既印象深刻,又感同身受。此外,作者没有使用大量的专业术语,没有假装一副专业的面孔。纵观全书,遣词造句,均通俗易懂。
作者认为大数据时代具有三个显著特点。
一、人们研究与分析某个现象时,将使用全部数据而非抽样数据。
二、在大数据时代,不能一味地追求数据的精确性,而要适应数据的多样性、丰富性、甚至要接受错误的数据。
三、了解数据之间的`相关性,胜于对因果关系的探索。“是什么”比“为什么”重要。
作者指出,随着技术的发展,数据的存储与处理成本显著降低,人们现在有能力从支离破碎的、看似毫不相干的数据矿渣中抽炼出真知烁见。在大数据时代,三类公司将成为时代的宠儿。一是拥有大数据的公司与组织。如政府、银行、电信公司、全球性互联网公司(阿里巴巴、淘宝网)。二是拥有数据分析与处理技术的专业公司,如亚马逊、谷歌。三是拥有创新思维的公司,他们可能既不掌握大数据,也没有专业技术,但却擅长使用大数据,从大数据中找到自己的理想天地。
面对即将来临的大数据时代,个人将如何应对自如?这是个严肃的问题。
维克托迈尔舍恩伯格《大数据时代》读后感 2
如今说起新媒体和互联网,必提大数据,似乎不这样说就OUT了。而且人云亦云的居多,不少谈论者甚至还没有认真读过这方面的经典著作——舍恩佰格的《大数据时代》。维克托·迈尔舍恩伯格何许人也?他现任牛津大学网络学院互联网研究所治理与监管专业教授,曾任哈佛大学肯尼迪学院信息监管科研项目负责人。
他的咨询客户包括微软、惠普和IBM等全球企业,他是欧盟互联网官方政策背后真正的制定者和参与者,他还先后担任多国政府高层的智囊。这位被誉为:大数据时代的预言家“的牛津教授真牛!那么,这位大师说的都是金科玉律吗?并不一定,读大师的作品一定要做些功课才好读懂,才能能与之进行一场思想上的对话。
舍恩伯格分三部分来讨论大数据,即思维变革、商业变革和管理变革。在第一部分”大数据时代的思维变革“中,舍恩伯格旗帜鲜明的亮出他的三个观点:
一、更多:不是随机样本,而是全体数据。
二、更杂:不是精确性,而是混杂性。
三、更好:不是因果关系,而是相关关系。
对于第一个观点,我不敢苟同。
一方面是对全体数据进行处理,在技术和设备上有相当高的难度。另一方面是不是都有此必要,对于简单事实进行判断的数据分析难道也要采集全体数据吗?
我曾与香港城市大学的祝建华教授讨论过。祝教授是传播学研究方法和数据分析的专家,他认为一定可以找到一种数理统计方法来进行分析,并不一定需要全部数据。联系到舍恩伯格第二个观点中所说的相关关系,我理解他说的全体数据不是指数量而是指范围,即大数据的.随机样本不限于目标数据,还包括目标以外的所有数据。我认为大数据分析不能排除随机抽样,只是抽样的方法和范围要加以拓展。
我同意舍恩伯格的第二观点,我认为这是对他第一个观点很好的补充,这也是对精准传播和精准营销的一种反思。”大数据的简单算法比小数据的复杂算法更有效。“更具有宏观视野和东方哲学思维。对于舍恩伯格的第三个观点,我也不能完全赞同。”不是因果关系,而是相关关系。“不需要知道”为什么“,只需要知道”是什么“。传播即数据,数据即关系。在小数据时代人们只关心因果关系,对相关关系认识不足,大数据时代相关关系举足轻重,如何强调都不为过,但不应该完全排斥它。大数据从何而来?为何而用?如果我们完全忽略因果关系,不知道大数据产生的前因后果,也就消解了大数据的人文价值。如今不少学者为了阐述和传播其观点往往语出惊人,对旧有观念进行彻底的否定。
维克托迈尔舍恩伯格《大数据时代》读后感 3
读完《大数据时代》这本书后,我意识到:我们即将或正在迎接由书面到电子的跳跃之后的又一重大变革。
这本书介绍了大数据时代来临后,接踵而至的三项变革——商业变革、管理变革和思维变革。
其实,这场变革已经打响。商业领域由于大数据时代的到来而推陈出新。前几年,一家名为Farecast的公司,让预订到更优惠的机票价格不再是梦想。公司利用航班售票的数据来预测未来机票价格的走势。现在,使用这种工具的乘客,平均每张机票可以省大约50美元,这就是大数据给人们带来的便利。
大家应该都知道2009年出现的H1N1型流感,就拿美国为例,疾控中心每周只进行一次数据统计,而病人一般都是难以忍受病痛的折磨才会去医院就诊,因此也导致了信息的滞后。然而,对于飞速传播的疾病,Google公司却能及时地作出判断,确定流感爆发的'地点,这便是基于庞大的数据资源,可见大数据时代对公共卫生也产生了重大的影响!
在我看来,如果想在在大数据时代里畅游,不仅要学会分析,而且还要能够大胆地决断。
在美国,每到七、八月份时,正是台风肆虐之时,防涝用品也摆上了商品货架。沃尔玛公司注意到,每到这时,一种蛋挞的销售量较其他月份明显增加。于是,商家作了大胆的推测,出现这样的结果源于两种物品的相关性,便将这种蛋挞摆在了防涝用品的旁边。这样的举措大大增加了利润,这就是属于世界头号零售商的大数据头脑!
大数据时代的到来,可以让我们的生活更加便利。但是,如果让大数据主宰一切,也存在一定的风险。
大家应该都知道电子地图,它可以为人们指引方向。但大家应该还不知道,它会默默地积累人们的行程数据,通过智能分析可以推断出哪里是自己的家,哪里是工作单位。我们的隐私就这样被不为人知地收集着。
大数据时代的到来,让我们的生活更安全,更方便,但与此同时,我们的隐私不再是隐私,数据的收集变得无所不包、无孔不入。世界已经向大数据时代迈进了一小步,一个崭新的时代正向我们走来。让我们用知识武装大脑,做好准备,迎接新时代的到来!
维克托迈尔舍恩伯格《大数据时代》读后感 4
去年的“云计算”炒得热火朝天的,今年的“大数据”又突袭而来,读大数据时代有感。仿佛一夜间,各厂商都纷纷改旗换帜,推起“大数据”来了。于是乎,各企业的CIO也将热度纷纷转向关注“大数据”来了。有一张来自《程序员》微博的漫画很形象。我觉得这张图,很真实地反映了现实中小企业云计算,大数据的现状。
不过话又还得说回来,《大数据时代》是本好书。
当然,很多IT知名人士也大力推荐,写了好多读后感来表述对这本书的喜欢没看此书之前,对所谓大数据的概念基本上是一头雾水,虽则有了解关注过现在也比较火热的BI,觉得也差不多,可能就是更多的数据,更细致的数据分析与数据挖掘。看过此书后,感觉到之前的想法,只能算是中了一小半吧---巨量的数据,而另一前:着眼于数据关联性,而非数据精确性,或许才是大数据与现时BI最大的不同,不仅仅是方法,更多的时思想方法。不过坦白讲,到底是数据的关联性重佳,还是数据的精确性更好,还真的需要时间来检验一下,至少从现在的数据分析方法来论,更多的倾向于数据的精确性。看完此书,我心中的一些问题:
1.什么是大数据
查了查百度百科,是这样定义的:大数据(bigdata),或称巨量资料,指的是所涉及的资料量规模巨大到无法透过目前主流软件工具,在合理时间内达到撷娶管理、处理、并整理成为帮助企业经营决策更积极目的的资讯。大数据的4V特点:Volume、Velocity、Variety、Veracity--这个好像是IBM的定义吧,读后感《读大数据时代有感》。
以个人的观点来看:数据海量,存储海量都是大数据的基本原型吧。
2.大数据适合什么样的企业
诚然,大数据的前提是海量的数据,只有拥有巨量的数据资源,方能从中查找出数据的关联性,才可以让通过
专业化的处理,让其为企业产生价值。针对电信运营,互联网应用这样海量用户的数据的大企业,也是在应用大数据的道路上拥有得天独厚的条件,但是针对中小企业呢?销售订单数据?若非百年老店,估计数据也是少得可怜,5,能用的可能只有消费者数据了吧。貌似大多数厂商,用来举例的也就是消费都购买行为分析为最多。同样,在公共事业类的政府机构,大数据的作用也许也能很好的发挥。反而感觉在大多数中小型企业应用大数据,似乎有点大题小作。书中说:大数据是企业竞争力。诚然,数据是一个企业的.核心无形资源(利用得好的话),但是否所有的数据,或都换则方式说:所有的企业都以大数据为竞争力,是否真的合适么?是否在中小企业中,会显示得小题大做呢?
3.大数据带来的影响
当一波又一波的IT技术热潮源源不断地向我们铺面而来的时候,你甚至都没有做好准备,你都要开始迎接它所给你带来的影响了。经过物联网,云计算的推波助澜下,大数据开始登场了。但它到底给我们带来了什么呢?
1)预测未来书中以Google成功预测了未来可能发生流感的案例来开篇,表明通过大数据的应用,可以为我们的生活起一个保驾护航的指向标。实质很简单,技术改变世界。
2)变革商业大数据所带来的商机,同时会衍生出一系列与大数据相关的商业机遇与商业模式,数据的潜在价值会源源不断地发挥作用可以容易想到的是未来有专门的数据收集,数据分析,数据生成的一条数据产业链产生。影响最大的,当然是IT公司
3)变革思维书中所说:因为有海量的数据作基础,未来,我们可能更关注数据的相关,而非精细度。对这条,本人还是持保留意见的。
维克托迈尔舍恩伯格《大数据时代》读后感 5
这么多年来,看了很多东西,如今回过头来发现,好像什么都忘了,真是悲剧,所谓读书破万卷,下笔如有神或许是不对的,还是需要下笔勤快,所以决定从这里开始。
这些年对于技术的发展,我是没有跟上,如今发现即便是对于投资,技术对于我们生活的改变太大,而自己身在这个技术浪潮的前沿,还是需要跟上步伐。——前言
大数据这个概念已经提了很久,我也一直疏忽了对于它的理解。看完《大数据时代》,再结合如果工作上对于大数据的理解,顿时发现数据的重要性,以前在这方面的确没有足够的思想意识。
整本书来说,我觉得最关键的三个点是前面几个章节:
1、要总体,不要随机样本:从小对于统计学相关的学习,基本都是从样本出发,理论的基础在于如何随机的足够分散的选取样本,这可是技术活加直觉。而对于大数据来说,要的就是总体,本质上来说,总体样本的确更能准确找到结果。但是对于统计来说,总体的分析增加了数据分析的难度,不仅数据核对不好进行,一旦出现数据污染,准确度就会大打折扣,而且进行数据回溯的时候,也无法准确确认问题,而这一点也是后面相关性上问题;
2、要混乱,而不是精确:这里主要想说明的是希望数据的多样性,尽量将相关数据都收集起来,不管是结构化的还是非结构化的。这样就不可避免的最终结果的不准确性。大数据更多的是从一个总体数据中说明以后概率事件,既然是概率,也就可以理解无法精确。这里有个点的说明,我觉得需要提一下,大数据算法更倾向于“简单”,而不是复杂,这个倒是出乎我的意外。
3、要相关性,而不是因果:从我对于知识获取的过程来说,我是不同意这个观点,从人体对于知识的理解,还是要从因果论出发,没有因果论,就会变成瞎子。而作者的观点上来说,原因可能还是从大数据本身的非准确性,一旦找到合适的算法,找到相关性,向上追述原因本身就很难。但是从举的示例上看,相关性的确认是一个非常大的工程,基本就是使用排举法,一个一个试。
所以,对于大数据来说,最重要的.三点是:1、数据——得到更多数据;2、算法——建立更快的算法体系;3、思维——寻找数据间更多的相关性。
对于数据最终的走向,我同意书中所提到的政府管理的观点,既然都是以“石油”的标准来看待数据,政府统一管理也就是必然的了。而且对于政府来说,掌握更多数据也有利于其管理及维护社会的稳定性。而对于社会道德方面的论述,我不想多说什么,时代发展是不会被道德绑架的。
所以最后,想要建立对于大数据的思维,《大数据时代》还是值得一读,里面的很多示例也非常不错。如人际关系这一块,也是出乎我的意料。
维克托迈尔舍恩伯格《大数据时代》读后感 6
知道"是什么"就够了,没必要知道"为什么"。在大数据时代,我们不必非得知道现象背后的原因,而是让数据自己"发声"。这个命题是我读这本书最大的感触。
对于大多数人来说,这的确是一场思维变革。对于理科学生来说,会认为这是一个错误的观点,因为这无异于否定了他们对世界客观物理化学规律探索的重要性;对于一名工科学生,其实这并不是一个多么新颖的观点,因为工科是讲求时用性的,如何能更好地利用基本自然科学规律创造社会财富比探索自然科学知识显得更重要。
这些天来,在读大数据这本书的同时,也稍微重温了一下自动控制原理,认识到控制系统中存在明显的大数据时代思维方式,借读书交流会之际,与大家分享。
对系统的有效控制需要对系统理解与建模。以一个日常生活中的例子说明。开车的时候一脚油门下去车就飞出去了,但并不知道这一脚油门下去能给多大车速,这就需要驾驶人员的熟练的驾驶技能了,不然超速被开罚单是很正常的。那么,问题就来了:如何能实现速度的自动控制而不用驾驶人员踩油门?这就是控制系统最关键的环节——建立系统数学模型。大白话就是知道车速与燃油量的数学关系式。若是以探索为什么的思维模式,不可避免的要列一大堆能量方程、动量方程等物理化学式子,经过繁杂的计算,还是能得到车速和燃油量的数学关系式的。很明显这是一个繁琐的过程,因为得知道现象背后的原因。这仅是对于这种简单的系统,若是对于航空发动机这种复杂的.系统,结构工艺过于复杂,分析各部分的物理化学过程是十分困难的,这时候可以通过实验法得到数学模型。
实验法主要有时域测定法、频域测定法和统计相关法。与大数据时代思维最接近的是统计相关法,主要过程是对被研究对象施加某种随机信号,根据被测对象各参数的变化,采用统计相关法确定被测系统或对象的动态特性。这种方法可以在被测系统或生产过程正常运行状态下进行在线辨识,测试结果精度较高,但要求采集大量测试数据,并需要相关仪和计算机进行数据计算和处理。
若用开车实例来解释,此时的系统为汽车动力系统,施加的随机信号为燃油量,被测对象指车转速,得到的动态特性就是指车速与燃油量函数关系式,从而不用探求背后的物理化学规律就得到了数学模型。
在沈阳黎明航空公司实习时去过试车间,除了发动机点火后震撼的场景动人心魄,控制室屏幕上海量的数据也同样引人注目,我想这么多数据无非就是验证数学模型或直接实验法得到数学模型,结合航空发动机这种复杂的系统,对于搞控制的人来说,得到数学模型就够了,现象背后的原因交给研发的人来探索更好。
维克托迈尔舍恩伯格《大数据时代》读后感 7
乍一看题目,最初的想法是数据只不过是人们在日常工作过程中产生的那些数据,而大数据无非就是数据量庞大,在我们日常处理的数据类的基础上上一个台阶,仅此而已。
我的这个想法无疑是天真的,简单的就像一个孩童刚刚学会咿呀学语,完全不知道语言的广博和意义的深刻。读罢此书,虽说谈不上能跟上作者那天马行空的思想境界,但也简单地总结一些读书的心得,以求得一定的学习成果,便于打开自己的眼界,拓展自己的思维方式。
大数据开启了一次重大的时代转型。它和望远镜、显微镜一样,能客观上改变我们对世界的认知,并从其他多种角度让我们了解精彩纷程的世界。在过去十几二十几年的时间里,大数据不仅改变着公共卫生、商业,更重要的是正改变着我们的思维,使我们能从全新的思维出发去感知、去洞见未来,这无疑是大数据最有价值所在。
大数据时代的到来,正在改变着我们的思维模式。以下三个部分的应用证据,说明我们正在经历着这样的与以往不一样的变革,这种变革将打破传统思维的束缚,向着更高更复杂的层面演进。
第一,大数据强调认为,不是随机样本,而是全体数据。我们知道,对历史数据进行研究的初衷,是我们想得出历史数据之间的运行变化规律,进而能更精确地推测数据未来的走向,以求对未来发展的事项进行能动的控制。那这里所认为的全体数据,到底什么才是全体数据呢?究竟是“我们需要的全体数据”,还是“我们能收集到的全体数据”,亦或是“我们认为的全体数据”,每个人对数据集合的范围可能存在不同,在某种情况下,个别选定的“全体数据”可能也是局部数据,甚至可能是随机数据。只是数据的广度范围、精细程度可能存在不同而已。因此,大数据选认定的全体数据仍然是一个相对的概念,是相对于传统的随机样本而提出的,但是,其数据量、质都与传统随机样本具有本质区别,这将导致得出与随机样本完全不同的结论。现代计算机技术的发展解决了巨大数据运算的各种问题,使我们得出问题的`结论更贴进于事物的本像。
第二,大数据强调认为,不是精确性,而是混杂性。书上讲,执迷于精确性是信息缺乏时代和模拟时代的产物。需要加工的数据可能只5%是结构化式的,其他95%部分需要通过加工,或组合、或移动、或裁剪等加工方式,加工成适合我们利用的方向,最终将在加工的数据之上进行分析,得出结论。由此得出待加工的原始数据具有混杂性,而非精确性,以前传统分析是这样,现在大数据下更亦如此。另一个层面,指的是加工出来的数据的精确性,这个就需要人为定义了。提出“精确”这个概念,是基于有相对容差数据的,即大数据如何控制或者说评定“输出品质”。一个东西要出故障,不会是瞬间的,而是慢慢地出问题,通常,我们需要找到问题的几个关键点,进行监控,我们才可能可以预测未来。在这过程之中,设定监控问题越精密,监控的效果越好。如果我们容忍混杂性程度越高,可能效果越不尽理想。
第三,大数据强调认为,不是因果关系,而是相关关系。在大数据时代,知道“是什么”就够了,没必要知道“为什么”。我们不必非得知道现象背后的原因,而是要让数据自己“发声”。这是区别于以往思维方式的最重要的事项之一,想想过去,言必出,行必果,感觉这个言行必须要因果结果,没有因,就没有果,同样,没有果,原因也没有存在的必要和意义。大数据时代拓宽了看待事物的层面,从各个角度去看问题,之前的因果关系被弱化,甚至无关紧要,从相关的角度去度量、预测事物的发展、内源等取向,则会得到无数条通往事物发展方向的道路,势必将使事物呈现更加立体、更加多源的格局,使我们更清楚地认识事物或现象的本质。那么如何在大数据时代运用相关关系“开发”事物或现象更多层面的发展或内源供人们利用呢?找到关联物,是运用大数据进行有效预测的关键。相关关系的核心是量化两个数据值之间的数理关系,相关关系强是指当一个数据值增加时,另一个数据值很有可能也会随之增加,而相关关系弱是指当一个数据值增加时,另一个数据值几乎不会发生变化。当然,严格地讲,即使没有相关性,另一个数据值也可以大幅变化,只是没有趋势可循罢了。相关关系是通过识别有用的关联物来帮助我们分析一个现象,而不是通过揭示内部的动作机制。通过给我们找到一个现象的良好的关联物,通过计算机的大量运算,相关关系可以帮助我们捕捉现在和预测未来,而且分析数据更加准确、更快,不易受偏见的影响,这点非常重要。因此,建立在相关关系分析法基础上的预测是大数据的核心。
以上三人方面的“应用证据”在商业变革、管理变革方面普遍运用,百且取得了意想不到的效果,开拓了想象的“蓝海”、管理更趋多元,手段更加精准和独到。
但是大数据并不是一个充斥着算法和机器的冰冷世界,人类的作用依然是无法被完全取代的。大数据为我们提供的不是最终答案,只是参考答案,人类在众多参考答案的基础上,运用自己对现象的“职业判断”,得出更靠谱的方法和答案,并在实践的检验下,越趋完善的方法和答案反过来又作为充斥大数据成员的一部分,使大数据构架基础更加科学并充分展示事物的性质,以方便我们随时获取。这是一个没有终点,循环往复的不断进化的过程。
维克托迈尔舍恩伯格《大数据时代》读后感 8
未来的十年,将是大数据引领下的智慧科技时代。不管你是否意识到它的存在,大数据都将越来越快地改变我们这个时代,包括我们的生活方式。
维克托·迈尔-舍恩伯格是最早洞见大数据时代发展趋势的数据科学家之一。他通过一个大家熟知的事例,来帮助我们理解“大数据”的潜在影响力,那就是四个世纪之前望远镜和显微镜的发明。望远镜能够让我们感受宇宙,显微镜能够让我们观测微生物,它们都是收集海量数据的新工具,因为这种工具的发明,人们同步更新了分析数据的技术和方法,促进了人们对世界更好的理解。如果说望远镜和显微镜是测量领域中的一场革命,那么今天的数据测量就相当于是现代版的望远镜、显微镜。随着社交网络的逐渐成熟,移动带宽迅速提升,云计算、物联网应用更加丰富,以及更多的传感设备、移动终端接入到网络,由此产生的数据及数据的增长速度比历史上的任何时期都要多、都要快。一个大数据的时代,不经意间顺理成章地翩然而至。
一、什么是大数据?
大数据是当前最热门的话题之一。但什么是大数据,人们尚未给出确切的定义。首先,“大数据”是相对过去小的、局部性的数据而言的;其次,利用大数据进行分析和工作时,所依据的关于此事尽可能完整的数据,从而“一览众山小”,而不是采用局部的小数据,从局部推断整体。
维克托也并未直接给出大数据的定义。不过,他用三大转变描述了大数据的特性:
转变之一:在大数据时代,我们可以分析更多的数据,有时候甚至可以处理和某个特别现象相关的所有数据,而不再依赖于随机采样。例如一项针对相扑比赛中非法操纵比赛结果的研究对64000场比赛进行了分析,这算不上一个很大的数字,但由于这是过去十年所有的比赛,所以它是大数据。
转变之二:由于有了更多的数据,我们可以接受更多的混杂、更多数据上的不精确。如果我们对于一个事物只有50个数据点,那么每一个数据点都必须非常精确,因为每个数据点都是有用的;但是如果我们有5000万个,去掉10个,甚至去掉1000个都没有太大的问题。
转变之三:不再探求难以捉摸的因果关系,转而关注事物的相关关系。分析大数据主要为了预测未来“是什么”,而不是“为什么”。因为很多时候我们以为我们找到了事情背后的原因,实际上却没有找到。更多时候知道了“是什么”就足够了。例如知道流感将会扩散到哪里就足够了,我不需要知道为什么;知道什么时候在网上购买机票能够获得最优惠的价格就足够了,我不需要知道为什么此时价格最低。
二、大数据带来的变化
大数据从根本上改变我们认识世界和改变世界的方式。很多传统的习惯将被颠覆,很多旧的制度将面临挑战。举例来说:
第一,科学探究的思路和方式受到挑战
探究是新课程改革中的一个热词,是促进学校教学与科学研究相融合的实践举措。科学探究的基本路径是:发现问题,提出假设,制定方案,实践探究,分析数据,得出结论。之所以会梳理出这样一个探究的路径,与我们对问题知晓的信息过少有关。换句话说,对所要研究的事物,我们知道的数据很少,需要从这些很小的数据出发,通过猜想和假设,进行试探性的研究,如果研究得出的结果和自己的假想是一致的,则说明我们的假说是正确的,这些假说会上升为对该事物描述的知识,我们掌握该事物的数据也随之增加。
利用测量所获得的点滴数据,从一个局部来推测世界是怎样的,这是科学探究的基本思路和方式。长期以来,我们总是通过这样的方式来认识世界,对其有宗教般的信仰。尽管我们知道,决策者总是先有了想法,才会提出假设。如果决策者自身对所研究的事情存在着偏见,所提出的假设就很难得到实证的支持,这往往会导致探究花费了很长的时间、很大的物力和财力,也常常劳而无功。但科学研究者还是坚定不移地沿着这条道路前行,学校在教学中也将其作为科学研究的基本规范来传授。
在大数据时代,这样的研究方式收到了极大的挑战。先举个事例来说吧。手机辐射是否能够致癌?关于这个问题,无论我们的假设如何,实验的设计都很难进行。首先,样本选择过少,没有统计学上的意义;其次,不能拿人做研究对象;第三,短时间的研究很难观察到变化。有了大数据之后,这样的难题就可以迎刃而解了。前段时间,丹麦就进行了这样的研究。丹麦拥有1985年手机推出以来所有手机用户的数据库。他们从这个数据库中分析了1990年至2007年拥有手机的所用用户的数据,同时,他们还收集了这一期间医院收集的所有癌症患者的数据,然后分析手机用户是否比非手机用户有更高的癌症发病率。这两个数据库本身是完全独立的,在作分析之前从来没有想过可以做这样的研究。结果表明,使用移动用户和癌症风险增加之间不存在任何关系。2011年10月,这一研究的`结果发表在《英国医学杂志》上。
上述的案例告诉我们,在获得了大量的数据,能够对事物的整体进行全面的认识之后,假想就没有意义了,我们可以直接根据全面的数据做出结论。
第二,传统的思维习惯受到挑战
因果关系思维,是人们生活中最为普遍的一种思维方式。既是看上去没有关系的事情,人们也总是从因果的角度去理解他。比如说,1885年7月6日,巴斯德接诊了一个被带有狂犬病毒的狗咬伤的孩子,他把自己刚研制出来的狂犬疫苗给孩子注射,结果孩子活下来了。巴斯德的这一举措,使得狂犬疫苗和孩子的生存之间建立起了一个因果关系。但事实上,人被狂犬病狗咬伤后换上狂犬病的概率是只有七分之一,就算没有狂犬疫苗,这个孩子活下来的几率还是有85%。
在哲学界,关于因果关系的争论已经持续了几个世纪。争论的焦点在于:如果因果关系是普遍存在的,每一个果都有一个因和他相对应,世界上的所有事情都有因果的话,我们就没有决定任何事情的自由了。尽管哲学领域的争论很热烈,但并不耽误人们在日常生活中通过因果关系来思考问题。不仅如此,由于掌握的数据过少,人们还容易从线性关系的角度找寻事物之间的因果关系。在物理学中,有一种处理数据的方式之一就是“化曲为直”,设法找到两个变量之间的线性因果关系,从而进行定量的描述。事实上,由于很多事情之间的关系是很复杂的,简单的线性处理容易导致人们对事物本质属性的误解。
在大数据时代,相关关系比因果关系重要。2009年甲型H1N1流感发生之后,美国的卫生系统极力想从因果关系上来找到流感的源头,但信息反馈的速度太慢,让专家们束手无策。谷歌公司做出了快速反应,把5000万条美国人最频繁检索的词条和美国疾控中心在2003年至2008年间季节性流感传播时期的数据进行比较,研究特定检索词条的频繁使用与流感在时间和空间上的传播之间的联系,很快就确定了流感是从哪个地方传播出来的。谷歌采取的就是相关关系分析的方法,而不是因果关系分析的方法。这是大数据时代,对数据进行处理的一种典型方法。
第三,数据化比数字化更加重要
数字化是将模拟数据转化成0和1的二进制码,以便电脑进行数据处理的过程。过去的很长时间,我们所做的事情,就是对文本进行数字化。很多书籍包括教材,通过PDF等格式,变成了数字形态的资料,存入了电脑或者网路之中。
但是,这些数字化的资料要查询起来并不方便。首先你要知道所需的资料在那本书中,其次你还要仔细地去翻阅这些数字化的资源,以便找到你所需要的信息。这和到书本里去找没有本质的区别。
如果这些数字文本能够被数据化,文本中的字、词和段落能够一一被识别,利用搜索殷勤加以检索就会方便很多。所谓数据化就是将一种现象转化为可以制表分析的可量化的过程,量化,是数据化的核心。信息只能被数据化,其巨大的潜在价值才有可能被释放出来。
数字化带来了数据化,但数字化不能替代数据化。今天,很多学校都在进行“电子书包”的课程教学实践,但有不少实践者认为,所为电子书包,就是将纸质的课本和教辅资料数字化,装入电脑中让学生上课中使用,这其实是对电子书包最大的误解。电子书包的核心在于数据化,要通过对学生学习过程所记录的大数据分析,把握学生的个性化学习特征,以便给予更有针对性的指导。
三、需要关注的一些问题
从教育的角度看,大数据时代的来临,对教育的变革将带来巨大的影响。
首先是教育内容要进行革新。大数据使得传统的因果思维方式、科学研究方式不再是生活、工作起主导地位的方式,这必然要求我们在教学中要将这些变化和学生讲清楚,以便他们能够在今后走上社会的时候有足够的能力迎接挑战。
其次是教学方式要进行革新。过去的教学,因为没有大量数据的支撑,该教什么全凭教师自己跟着感觉走。今天,我们可以将教师的教学视频挂在晚上,通过深度分析学生在观看视频的过程中在哪些地方停顿或者重放的频次比较高,来找出学生不明确或者课程吸引人的地方,帮助教师改进教学、确定教学重点。这必然导致教师教学方式的变革。
第三是学习路径会发生变化。在过去,如果你想成为一个优秀的生物学家,一定要认识很多生物学家。今天,要解决一个生物难题,可能与天体物理学家或者数据视图设计师联系就可以实现。
第四是要防止对数据的痴迷。一方面,我们要研究学校长期以来储存下来的大量数据,同时积累学校每天的教育数据,为进入大数据时代做好充分的思想准备;另一方面,要唤醒学校里沉睡的数据,让其在学校管理和教师教学中发挥更大的作用;再一方面,也要防止出现另一个极端,那就是对数据的痴迷。能仅仅为了收集数据而收集数据,要让数据在如何全面反映一个学生的能力、全面反映教师的教育质量等方面做出实践和探索。
维克托迈尔舍恩伯格《大数据时代》读后感 9
舍恩伯格的《大数据时代》,让我重新审视了"大数据"这个在信息时代异军突起的热点词汇,作为信息安全专业的我,对大数据这个词本身有着更多的热忱。
在百度上搜索到的解释是:"大数据",或称巨量资料,指的是所涉及的资料量规模巨大到无法透过目前主流软件工具工具,在合理时间内达到撷取、管理、处理、并整理成为帮助企业经营决策更积极目的的资讯。特点:数量、速度、品种、真实性。
而舍恩伯格认为,大数据并不能定义一个确切的概念。他提到"大数据是人们获得新的认知,创造新的价值的源泉;大数据还是改变市场、组织机构,以及政府和公民关系的方法。"这是一种更具有人文色彩和社会意义的诠释。
本书中,主要从三个方面论述,即思维变革、商业变革和管理变革。而舍恩伯格更是着重阐明三大观点:
一、更多:不是随机样本,而是全体数据。
二、更杂:不是精确性,而是混杂性。
三、更好:不是因果关系,而是相关关系。
对于观点一,我不敢苟同,毕竟大数据的实现需要一定的技术支持,而显然,现在这种技术还不够成熟,同时一些简单的事情运用大数据反倒是问题更加复杂化,因此这种大叔据的繁杂处理方式更适用于一些特定的情况,比如商业预测,人类dna的研究等。
而对第二种观点,我是十分赞同舍恩伯格所说的"大数据的简单算法比小数据的简单算法有效"。在计算机行业迅速发展中,一种新的简单可行的算法的出现,远没有计算机在运算速度和存储容量的发展快,而大数据算法似乎更能迎合这种大趋势。
观点三中提到的相关关系在大数据中可是重量级的,它能较快找到事物规律和对应的解决措施,当然,也不能完全忽视因果关系,毕竟人们在思维上更能够接受因果关系分析出的结果,而大数据预测的需要人们慢慢的适应才能接受。当我们完成相关关系的分析而又不满足于只知道"是什么"的时候,我们就可以转而研究"为什么"了,毕竟问题的根本在于因果。而舍恩伯格的全体数据和相关关系是大数据时代下的一种捷径。
但是在信息时代,信息安全问题的日趋凸显,数据独裁与隐私保护之间的矛盾更是立于风口浪尖,成为众矢之的,舍恩伯格在本书的最后章节曾试图寻找一种解决方式来摆脱这一种困境,但最终没能做到,但是他提出"大数据并不是一个充斥着算法的'和机器的冰冷世界,人类的作用仍无法被完全代替。"这里表明人在数据时代同样的重要,数据是为人类服务的,也就该人类驱使下完成相应的目的。
在这样的大环境下,常引起我更多的思考和担忧。
大数据时代对于我们同是机遇与挑战,一些国家已开始步入大数据时代的行列,并在各个领域开始研究和使用。而对于我国庞大的人口,以及较大的领土面积,都可以在大数据时代为我们提供数据的保障,而能否面临挑战,在大国之间的新一轮角色角逐间崭露头角,我们更需要解决技术等方面的问题,更应在政策上逐步开放各领域的数据,保证数据来源、权限等问题得到解决,不断学习先进的计算机技术,缩小与其他国家的差距。
工业化、信息化,我们都向世界交出了一份让世界不能小觑的答案;
大数据时代的数据化我们又将怎样在新的风暴中所向披靡,如果大数据时代是一种必然趋势,那这就是我们这一代人的责任,是我们新的战场!
维克托迈尔舍恩伯格《大数据时代》读后感 10
“大数据”一词不知何时在我们的生活悄然出现,为了一探究竟,我便选择了《大数据时代》一书。
作者先从全局简单地描述大数据对我们的生活、工作与思维的影响,再从三方面具体地用上百个学术和商业的实例展开写作。样本=总体、追求精确性和相关关系等大数据时代具体特点一一现出。在同时,作者也从个人、企业等多角度分析大数据中的隐忧。
书中内容繁多,在此不能各方面概括。此书中虽有许多专有名词,但作者以其通俗的语言以及许多实例让我嗅到大数据时代中一抹清新之气。
为什么是清新的呢?因为书中的内容仿佛向我打开了一个既有点熟悉又有点陌生的世界。我们现在已处于网络时代,在我们日常简单的操作中大量数据产生,然而起初我们仅用众多技术在解决手头上的问题,那些大数据像沙子中的金子,价值不被发现。到目前,每当我们网上购书时总会看到“猜你喜欢”的栏目、出现谷歌搜索与流感预测、Farecast与飞机票价预测系统等,这些事情的达成全来自于那些曾被忽略的大数据同时也在证明“预测,大数据的核心”这句话,为我们的生活创造了前所未有的可量化的维度。看到书中这部分内容时,我不禁感受到自己的生活已在享大数据带来的福利,就像“猜你喜欢”栏目让我触到更多合我口味的书,让我看到了以前无法发现的细节。拥有大量数据的公司巨头如谷歌、亚马逊大力开发有关大数据的新型产业和研究相关项目。借网络时代的便利大数据成为了如今最有商业价值的事物,使一切可量化的趋势也开始出现。“本质上世界是由信息构成的”,面对这句话时,大数据时代仿佛就在眼前。
在感受惊叹着大数据能为我们做到以往无法想象的事和它巨大的价值时,我认同大数据能极大优化我们的生活,但又不禁为这时代感到担忧。一旦大数据时代来临,不仅我们的隐私可能不再是隐私,就如书中所言“我们时刻暴露在‘第三只眼’下:亚马逊监视着我们的购物习惯,谷歌监视着我们的`购物习惯,而微博似乎什么都知道”,而且利用大数据我们可以预测许多事情并且十分高效,一旦人们依赖大数据极少运用人类自身的创新等能力被数据束缚住,世界只会沦落为一个极少活力的机械环境。而我认为最大的忧患,是大数据时代对人类自身思维、思想、信仰等精神领域的冲击。如今我们都生活在数据中,大数据时代说不定在几年后就会逐步来临,这使我不禁发问:我们一直坚信着信仰着的究竟是什么?我觉得世界说变就变实在令我想不通这个问题。事情都有好坏,我也不知道自己是否杞人忧天。
于是我继续去探索作者对这问题的思考。“更大的数据在于人本身”,作者还说“我们是在创造更好的未来”,也说“在一个预测的时代里,人类的自由意志不可侵犯,这一点不可轻视。我们在使用大数据时,应当怀有谦恭之心,铭记人性之本”。人类学家克利福德吉尔兹曾说:“努力在可以应用、可以拓展的地方,应用它、拓展它;在不能应用、不能拓展的地方,就停下来。”这些话语仿佛是阳光,驱散我心中对大数据时代的担忧以及内心对其的恐惧。我认为,在坚守我们内心和自由意志下,大数据才会造福我们人类世界,发挥出它背后对人温暖的光芒。
面对时代的变革,我会为坚守内心深处的自由意志而努力并“拥抱大数据”。
维克托迈尔舍恩伯格《大数据时代》读后感 11
我主要读了第一部分和第三部分。
第一部分是大数据的思维变革,作者舍恩伯格提出了三个观点,一是"不是随机样本,而是全体数据",二是"不是精确性,而是混杂性",三是"不是因果关系,而是相关关系",作者被誉为"大数据时代的预言家",抛出的观点是掷地有声的,下面我将谈谈我对这三点的理解。
对于一,我们必须承认我们以往做的处理抽样数据得到结果的方法,是省时省力省钱的,而且判断结果是相对高精准的,如人口普查这一案例,如果采用全体数据进行统计分析的话,工作难度是相当大的,最后的结果也不会很满意,这是得不偿失的。但是随着数据处理技术的飞速发展,我们已经具备了处理大量数据的能力,如果在数据分析过程中采用全体数据,就能避免抽样数据可能由于选取偏见带来的非随机性,处理全体数据也必将成为一种趋势。用在国防生管理工作中,就是管理层要对每个个体都给予充分的关心与互动,对于优秀的固然要偏爱,但是对于较差的也要保持"不抛弃不放弃"的态度,让每一个个体都找到自己的定位与价值。
对于二,作者强调通过掌握更多的数据,暂时牺牲精确性,关注更多容易被忽略的细节,来做更多的事,得到更多的结果,也就是说我们要有一定的.包容错误的能力。我们在收集数据时,要主动获取更多的数据,少加一些限制性条件,然后应用我们处理大数据的能力,或许会获得意想不到的结果。作者举了一个谷歌翻译系统的例子,通过英语作为中转,进行各语言之间的转换。此处的启发就是用我们最擅长的途径,不拘泥于特定规则,来达到我们的目的,也就是说我们要先认清自己,不去刻意的模仿,找出最适合自己的一套方法。
对于三,作者指出知道"是什么"就够了,没必要知道"为什么",乍一看这个观点觉得有点无脑,但是结合第二点就合理了,降低对精确性及原因结果的要求,通过对相关数据的广泛分析,进而得到更丰富更多元的结果。如购物时,系统的购物推荐,并不是肯定你会购买,仅仅是你感兴趣进而可能会买就足够了。其实作者对"相关关系"的强调,主要是大数据强大的预测能力,而且这种预测性能还是相当精确的。以上只是我用作者的观点佐证他自己的观点,证明其一定的合理性,但是我是不完全认同的,在航天领域,我们对成功率的要求是极高的,尤其是载人航天领域,我们必须做到万无一失,我们对每一个结果都会深究其根,找出原因。对于国防生体能成绩的分析也是如此,结果只是我们的一个评价机制,而最重要的还是产生这一结果的原因及过程。
第三部分是大数据的管理变革,本来以为作者会讲点如何通过大数据来改革管理机制和提高管理效率,没想到作者只是讲了大数据其实就是我们的隐私的暴露,提出了要让数据采集管理公司对数据的使用负起责任的解决途径。个人感觉,一是我们在平时要意识到个人隐私的保护,而是相关法律政策的完善,真正的让大数据服务我们的工作生活,而不是一种变相的威胁。
维克托迈尔舍恩伯格《大数据时代》读后感 12
信息时代的到来,我们感受到的是技术变化日新月异,随之而来的是生活方式的转变我们这样评论着的信息时代已经变为曾经。如今,大数据时代成为炙手可热的话题。笔者在这说明信息和数据,只是试图首先说明信息、数据的关系和不同,也试图说明,为什么信息时代转变为了大数据时代?大数据时代带给了我们什么?
信息和数据的定义。维基百科解释:信息,又称资讯,是一个高度概括抽象概念,是一个发展中的动态范畴,是进行互相交换的内容和名称,信息的界定没有统一的定义,但是信息具备客观、动态、传递、共享、经济等特性却是大家的共识。数据:或称资料,指描述事物的符号记录,是可定义为意义的实体,它涉及到事物的存在形式。它是关于事件之一组离散且客观的事实描述,是构成信息和知识的原始材料。数据可分为模拟数据和数字数据两大类。数据指计算机加工的“原料”,如图形、声音、文字、数、字符和符号等。从定义看来,数据是原始的`处女地,需要耕耘。信息则是已经处理过的可以传播的资讯。信息时代依赖于数据的爆发,只是当数据爆发到无法驾驭的状态,大数据时代应运而生。这是否是《大数据时代》一书所未曾阐述的背景材料?
在《大数据时代》一书中,大数据时代与小数据时代的区别:
1、思维惯例。大数据时代区别与转变就是,放弃对因果关系的渴求,而取而代之关注相关关系。也就是说只要知道“是什么”,而不需要知道“为什么”。作者语言绝对,却反思其本质区别。数据的更多、更杂,导致应用主意只能尽量观察,而不是倾其所有进行推理?这也是明智之举。
2、使用用途。小数据停留在说明过去,大数据用驱动过去来预测未来。笔者认为数据的用途意在何为,与数据本身无关,而与数据的解读者有关,而相关关系更有利于预测未来。
3、结构。大数据更多的体现在海量非结构化数据本身与处理方法的整合。大数据更像是理论与现实齐头并进,理论来创立处理非结构化数据的方法,处理结果与未来进行验证。
4、分析基础。大数据是在互联网背景下数据从量变到质变的过程。笔者认为,小数据时代也即是信息时代,是大数据时代的前提,大数据时代是升华和进化,本质是相辅相成,而并非相离互斥。
数据未来的故事。数据的发展,给我们带来什么预期和启示?银行业天然有大数据的潜质。客户数据、交易数据、管理数据等海量数据不断增长,海量机遇和挑战也随之而来,适应变革,适者生存。我们可以有更广阔的业务发展空间、可以有更精准的决策判断能力、可以有更优秀的经营管理能力可以这些都基于数据的收集、整理、驾驭、分析能力,基于脱颖而出的创新思维和执行。因此,建设“数据仓库”,培养“数据思维”,养成“数据治理”,创造“数据融合”,实现“数据应用”才能拥抱“大数据”时代,从数据中攫取价值,笑看风云变换,稳健赢取未来。
维克托迈尔舍恩伯格《大数据时代》读后感 13
读了涂子沛先生的《大数据时代》(这是一本社科类书籍,想深入研究大数据原理的可以选择其他技术类专业书籍)。作者以美国为例,讲述了“数据不仅可以治国,还可以强国”的观点,对中国今后的大数据发展战略提出了建议。读完之后,主要有一下几点感想。
一、美国社会之所以发达高效,引领世界科技的发展,与其尊重数据,收集数据的传统是分不开的。数据被视为科学的度量、知识的来源。没有数据,无论是学术研究,还是政策制定,都寸步难行。“数据驱动决策方法”使得政府更有效率、更加开放、更加负责。
数据的积累需要时间,不能一蹴而就,美国在数据的收集方面历史悠久。美国联邦政府的取得数据主要有三个来源:业务管理的数据,民意社情数据,物理环境数据。例如1940年罗斯福引进的民意调查、1962年启动的海浪监测计划和1973年诞生的最小数据集。而中国取得类似的进步,是进入21世纪之后才发生的事情。2003年,中国开始着手制定医疗系统的最小数据集,创立了第一个全国性的大型社会调查项目,开始对社会的发展和变迁进行全方位、综合性、纵贯性的问卷访谈调查。2006年中国卫生部才出台了最小数据集的标准。几经周折,国家统计局才在2006年9月成立了社情民意调查中心。
中国的落后,根源之一是缺乏以数据为基础的精确管理,未来中国的进步,需要面对收集数据、使用数据、开放数据的挑战。
二、大数据是一柄双刃剑,数据虽然可以造福于民,但是也可能成为控制人民的工具。2013年的“棱镜门”事件揭露了政府对于人民的监控,引起轩然大波。在未来,每个人都可能存在一份数据档案,包括一个人的教育、医疗、福利、犯罪和纳税等等一切从摇篮到坟墓的数据记录,甚至包括电话、邮件等都可能被监听和记录。通过数据整合和信息加总,就可以再现一个人生活的轨迹和全景,各个系统之间的数据可以彼此印证、互相解释,个人隐私就无所遁形。英国作家乔治。奥威尔在其讽刺小说《一九八四》中描述了时刻被“老大哥”监视的零隐私的可怕情形:不论是睡着还是醒着,在工作还是在吃饭,在室内还是在户外,早浴盆里还是在床上,没有躲避的地方。除了你脑壳里几个立方厘米以外,没有东西是属于你自己的。
随着大数据科技的发展,我们的一举一动,每一通话,每一次上网记录都被监控、记录,分析,当这些数据被某一个人或组织掌握,将会是对我们隐私的莫大威胁,因此,对于数据使用的监管需要进一步的立法进行规范,我国目前对于数据的收集、利用处于野蛮生长阶段,任何商业组织都可以收集和分析用户的信息。政府需要立法对技术的'使用进行监管,保障公民的安全。
三、数据是一种公共资源,政府使用纳税人的钱收集了数据信息之后,需要将数据进行公开,这样既可以集中大众的智慧,利用数据科学地治理社会;也可以让大众对政府的行为进行监督,避免政府的腐败。因为缺乏竞争,官僚体制与生俱来有一种僵化保守的本性,政府机关也往往固守不前。很多数据都被以机密为借口封存起来,人民就无从得知政府的各项举措是否合理,因此在黑暗中就滋生了腐败。
而且,现代社会中,掌握信息多的人,在社会竞争中处于有利的地位,而信息贫乏的人,则处于不利地位,数据不应该被少数人垄断,应该作为一种公共资源被普通百姓获取。
四、技术的进步离不开科学技术人员的不懈努力,知识分子应该承担促进社会进步的责任和使命。正如Linux的开发者所说的:“一个人做事的动机,可以分为三类:一是求生,二是社会生活,三是娱乐。当我们的动机上升到一个更高阶段时,我们才会取得进步:不是仅仅为了求生,更是为了改变社会,更理想的是——为了兴趣和快乐。
维克托迈尔舍恩伯格《大数据时代》读后感 14
维基百科说大数据由巨型数据集组成,这些数据集大小常超出常用软件在可接受时间下的收集、利用、管理和处理能力,或称巨量数据、海量数据、大资料,大数据的常见特点是3V:Volume、Velocity、Variety。
规模巨大的数据未必是大数据,需满足她的三个特点。以研究掷硬币概率的实验为例,当传统实验次数达到一定规模后就能帮助实验者分析正反面出现的概率,随着实验次数的增加,数据大量积累可能越来越支持这一结论,数据达到一定量,它的边际效应就出现了,数据继续增加对分析概率还有多少意义呢?按照现代概率学伯努利试验去带入函数计算就好了,这仅算是概率学或者是统计学吧。故大数据不是因为单纯体积大而大,是因为杂而大,研究硬币正反面的概率如引入天文学、心理学、材料学、物理学等领域的数据而使之变大,进而研究关联关系(或因果关系,注:本书不认同因果关系的重要性),从而得出概率的分布,然而大量相关数据的引入,按照传统分析过程的时间是不可接受的,需利用高效计算资源,迅速把杂而大的处理结果呈现出来,并且实验者对结果的预期不能要求100%的`精确。大数据并不是数据本身,而是一种思维方式。
大数据令人着迷的地方在于用"科学"的办法挑战了"预测学",帮助人们发现未知,帮忙人们进行决策。然而本书作者Viktor Mayer—Schonberger强调"大数据不是因果关系,而是相关关系,相关关系比因果关系更重要",此观点不能认同,因果关系是宇宙的基本定律,且不说种瓜得瓜、善有善报之类哲学命题,若商家在发现电容器、钉子、高压锅有关联购买关系而去做大量营销的话岂不是有可能发生更多的波士顿爆炸案。
①关联关系在大数据中被提取出来使用,而不去关心因果关系是一种粗暴的、倒退的处理方式,是作者理解的现代社会浮躁的心里体现。我认为的大数据应该是把看起来不相干的数据放到一起分析,找到某些跨领域的关联关系,进而推论因果关系,发现其中价值。作者引用了安德森的观点"现在已经是一个有海量数据的时代,应用数学已经取代了其他的所有学科工具,而且只要数据足够,就能说明问题",数据和所有科学的关系,我觉得有点像现在互联网和其他所有行业的关系一样,互联网终究还是一个工具。作者举了沃尔玛"尿布与啤酒"。
③的故事,这也是大家熟知的一个数据分析的故事,但是沃尔玛真的是这么做的吗?大家可以去沃尔玛的时候留意一下。一家大型的超市,如果为了这种所谓相关关系,所有商品用这种关联关系去摆放,天哪,这将是一家多么混乱的超市,顾客进去将难以区分食品在哪、生活用品在哪!有人可能说这种关联关系更适合电子商务,是的,但是我还是比较看好已知原因的关联关系,比如婴幼儿智力玩具和孕妇减肥放到一起,比如在线播放器旁边放卫生纸的广告(哈哈哈,你懂的)。本书用美国折扣零售店塔吉特与怀孕预测。
②来佐证他的观点,但恰恰是知道因果关系后商业价值才能更多的体现出来,未知因果关系前顾客的父亲生气并要求赔偿,知道因果关系后才使得这种广告理所应当并让客户接受。
互联网信息时代数据的积累以及BI、数据仓库、人工智能、HADOOP、NOSQL等技术的流行,使得人们考虑问题的方式已经发生变化,接下来我们要做的只有接受拥抱数据时代、大数据时代。软件行业程序上线的变更差错率是一个考核IT水平的指标,为此很多公司引进了CMMI体系,以求他保障软件的质量,为此也收集了大量的过程数据。若用数据的思维,是否可能根据之前的各种相关数据预测下次投产变更的成功率?若用大数据的思维,是否可以根据CMMI数据以及程序员开发期间上下班考勤数据、工资发放时间、上线当天天气情况来综合预测投产变更的成功率?用大数据的思维,订餐网站不仅根据之前你定的是咸的还是辣的来给你推荐菜单,可能因为你微博上发了一句"每个月总有那么几天"修改了订餐的推荐菜单(哈哈)!故在数据时代,提议童鞋们检查公司的信息系统,是否有定期删除"垃圾"日志、数据的机制(Viktor说,即使最平凡的信息业可以具有特殊的价值),为了日益廉价的存储而删除日益昂贵的数据,请三思后行吧。
【维克托迈尔舍恩伯格《大数据时代》读后感】相关文章:
亨舍尔和格莱特的童话故事07-16
埃格伯特10-15
飞来伢与女巫德博恩格09-16
关于扎克伯格的经典语录70句09-07
说大话的维克托阅读训练12-26
艾尔和肖恩勇闯赛尔号第十三集09-23
艾尔和肖恩勇闯赛尔号第七集12-03
艾尔和肖恩勇闯赛尔号第八集07-20
艾尔和肖恩勇闯赛尔号第四集10-04
艾尔和肖恩勇闯赛尔号第十集09-20
