我最近一直在搜索互联网模因和空谈,“大数据”堆顶部附近...现在。 我有几个链接,可以帮助你了解这是什么,它意味着在不久的将来可能会为你:
要知道,但不明白:戴维·温伯格科学和大数据
1963年,伯纳德·K. Forscher梅奥诊所的抱怨在著名科学杂志上印制了著名的信中,科学家们产生太多的事实。 名为在砖厂混乱,信中警告说,新一代科学家是太忙了砖翻腾 - 事实 - 不考虑它们如何一起去。 Forscher担心,制砖,已成为目的本身。 “因此发生了这片土地成为用砖头淹没。 成为任务很难找到合适的砖,因为追捕之中这么多。 成为难以完成一个有用的大厦,因为,很快的基础是明显的,他们下一个随机砖雪崩掩埋。“
如果科学看着像在1963年的混乱砖厂,博士Forscher会坐了下来,哭着说,如果他被在GBIF.org显示全球生物多样性信息机构。 在过去的几年中,GBIF的收集了数以千计的生活在我们这个星球的分布其实砖的集合,从细菌波兰国家公共卫生研究所西福尔丘陵南极威德尔海豹政府集合。 GBIF.org设计只是砖厂博士Forscher痛惜排序 - 没有提出假说,理论,或大厦的信息 - 除了要大得多,因为好医生无法预见砖厂网络。
事实上,网络以事实为基础的砖厂是一个发展中的产业。 例如,在ProteomeCommons.org,你会发现各种生物体的特定蛋白质的信息。 蛋白质下议院一个独立的项目,由毕业生提供近13万个数据文件,为12.6万亿字节的信息,数据来自世界各地的科学家,并提供给大家,免费。 斯隆数字巡天 - 下适度标记线测绘宇宙 - 已收集和发布来自25个世界各地的机构聚集的天空地图。 其初步调查结果显示,在2008年完成8年的工作后,发表约230万个天体,其中包括93万的星系的信息;每个星系包含了数百万颗恒星,所以这个砖厂的大小,我们有麻烦命名的数量可能增长。 最有名的新的数据砖厂,人类基因组计划,在2001年,整个人类基因蓝图绘制完成,它在数量上已经超过了国际核苷酸序列数据库协作,2009年5月,聚集了250亿件的遗传数据。
知道:现在的事实是不是事实,反思知识太大,专家到处都是,房间内最聪明的人,就是房间
喜欢你的数据大吗? 约5 万亿美元的记录如何?
http://gigaom.com/cloud/like-your-data-big-how-about-5-trillion-records
据1010data的年度评估 ,数据量继续攀升。 这房子的总数据量增长了33%,而记录的数量增长了45%。 遍布上千个数据表,其中已经达到了约500亿行的最大记录。 和这些数字虽然看起来与天文数据的增长,如报告预测相比, IDC的数字宇宙指数小,重要的是要与业务数据只记得1010data优惠,不与任何数字形式产生的数据全部。
大数据:创新,竞争和生产力的下一个前沿领域
我们的世界中的数据量已爆炸,并分析大量的数据集,所谓的大数据将成为竞争的重要基础,巩固了新一波的生产力增长,创新和消费者剩余,根据麦肯锡的研究和麦肯锡公司的商业技术办公室。 在每一个部门的领导人将抓住大数据的影响,不只是几个数据导向的基金经理。 日益繁重和捕获的信息由企业,多媒体,社交媒体的兴起,物联网的细节将推动指数在可预见的未来的数据增长。
麦肯锡研究在五个在美国,欧洲公共部门,在美国零售,制造和个人定位数据域医疗全球大的数据。 大的数据可以生成每个值。 例如,零售商充分利用大数据可能会增加其经营利润率由60%以上。 在公共部门的治理大数据具有巨大的潜力,也。 如果美国的医疗保健是使用大的数据,创造性地,有效地推动效率和质量,该部门可以创造更多的价值300亿美元,比每年。 三分之二的将是在美国的医疗开支减少约8%的形式。 在欧洲发达经济体,政府管理员可节省超过100欧元,改善运作效率亿美元(约合149亿美元),单独使用大数据,不包括使用大的数据,以减少欺诈和错误,并提高税收收入的集合。 和个人的位置数据服务启用用户可以捕捉到600亿美元的消费者剩余。
给企业带来的大数据
http://www-01.ibm.com/software/data/bigdata/
什么是“大数据?”
http://www.zdnet.com/blog/virtualization/what-is-big-data/1708
在简单的话来说,这句话是指允许组织创建,操作和管理非常大的数据集和储存设施的工具,流程和程序。 这是否平均数TB,PB的,更大的数据集合吗? 这些供应商所提供的答案是“是的。”他们会继续说,“你需要最好的利用,数据的质量管理,使我们的产品。”只要巨大的,动态的套维修所造成的问题的思考数据让我伤透了脑筋。
以下数字面包屑'大数据'黄金
http://www.npr.org/2011/11/29/142521910/the-digital-breadcrumbs-that-lead-to-big-data
2012年的大数据和云上一些大的想法
http://gigaom.com/cloud/some-big-thoughts-on-big-data-and-cloud-for-2012
年龄的exabytes的大数据管理工具和方法:
http://www.readwriteweb.com/reports/big-data
我们正在经历一个大的数据爆炸,结果不仅增加世界各地的人们使用互联网的用途,但也连接互联网设备的数十亿美元。 八年前,例如,只有约5艾字节的数据在线。 两年前,在互联网上传递的数据量超过单月的课程。 和最近的估计,每月约21千兆兆字节的数据,互联网数据流。
- 无论其规模和形式 - 这个数据爆炸导致了人与机器的多种挑战。 不再是由少数人访问的数据的东西。 不再是创建的简单交易信息数据,并不再是可预见的数据 - 无论是作为它写或时,或由何人或什么,它要被读取。 此外,这个数据是非结构化的,也就是说,它并没有清楚地落入一个模式或数据库。 这个数据如何在网络上移动? 它可以被如何处理? 随着它的复杂性,数据的大小,要求存储,处理,网络,分析和可视化的新工具




