1.2 大数据应用场景

随着大数据被越来越多的提及,有些人惊呼大数据时代已经到来了.

2012年《纽约时报》的一篇专栏中写到,“大数据”时代已经降临,在商业、经济及其他领域中,决策将日益基于数据和分析而作出,而并非基于经验和直觉。

但是并不是所有人都对大数据感兴趣,有些人甚至认为这是商学院或咨询公司用来哗众取宠的buzzword,看起来很新颖,但只是把传统重新包装,之前在学术研究或者政策决策中也有海量数据的支撑,大数据并不是一件新兴事物。


应用实例

1. 巨大科学

大型强子对撞机中有1亿5000万个感测器,每秒发送4000万次的数据。实验中每秒产生将近6亿次的对撞,在过滤去除99.999%的撞击数据后,得到约100次的有用撞击数据.

将撞击结果数据过滤处理后仅记录0.001%的有用数据,全部四个对撞机的数据量复制前每年产生25拍字节(PB),复制后为200拍字节。

如果将所有实验中的数据在不过滤的情况下全部记录,数据量将会变得过度庞大且极难处理。每年数据量在复制前将会达到1.5亿拍字节,等于每天有近500艾字节(EB)的数据量。这个数字代表每天实验将产生相当于500垓(5×1020)字节的数据,是全世界所有数据源总和的200倍。

关于数据单位的知识:


2. 卫生学

国际卫生学教授汉斯·罗斯林使用“Trendalyzer”工具软件呈现两百多年以来全球人类的人口统计数据,跟其他数据交叉比对,例如收入、宗教、能源使用量等。


3. 公共部门

目前,发达国家的政府部门开始推广大数据的应用。

2012年奥巴马政府投资近两亿美元开始推行《大数据的研究与发展计划》,本计划涉及美国国防部、美国卫生与公共服务部门等多个联邦部门和机构,意在通过提高从大型复杂的的数据中提取知识的能力,进而加快科学和工程的开发,保障国家安全。


4. 信息审查

创建全面的个人信用评分体系,其包含不少对个人行为的评定,有关指标会影响到个人贷款、工作、签证等生活活动。高科技公司在被政治介入和指挥下为其目的服务,个人大部分行为和社交关系受掌控,几乎无人可免于监控。

除获取网络数据外,还希望从科技公司获得分类和分析信息的云计算能力,通过闭路电视、智能手机、政府数据库等搜集数据,以建造所谓的智能城市和安全城市。

5. 企业的商业应用

  • 亚马逊公司,在2005年的时点,这间公司是世界上最大的以LINUX为基础的三大数据库之一。

  • 沃尔玛可以在1小时内处理百万以上顾客的消费处理。相当于美国议会图书馆所藏的书籍之167倍的情报量。

  • Facebook,处理500亿枚的用户照片。

  • 全世界商业数据的数量,统计全部的企业全体、推计每1.2年会倍増。

  • 西雅图文德米尔不动产分析约1亿匿名GPS信号,提供购入新房子的客户从该地点使用交通工具(汽车、脚踏车等)至公司等地的通勤时间估计值。

  • 软银,每个月约处理10亿件(2014年3月现在)的手机LOG情报,并用其改善手机信号的信号强度。

  • 大企业对大数据技能需求量大,吸引了许多大学诸如伯克利大学开专门提供受过大数据训练的毕业者的大学部门。硅谷纽约为主《The Data Incubator》公司,2012年成立,焦点是数据科学与大数据企业培训,提供国际大数据培训服务。

Copyright © 尚硅谷大数据 2013-2019 all right reserved,powered by Gitbook
该文件最后修订时间: 2018-11-20 18:14:11

results matching ""

    No results matching ""