大数据是什么意思

大数据是什么意思?大数据是指规模庞大、多样化且快速增长的数据集合,通过应用各种技术和工具进行收集、存储、处理和分析,以挖掘出有价值的信息和洞察,以支持决策、创新和优化。

一、定义

大数据(Big data)通常用来形容一个公司创造的大量非结构化数据和半结构化数据,这些数据在下载到关系型数据库用于分析时会花费过多时间和金钱。适用于大数据的技术,包括大规模并行处理(MPP)数据库、数据挖掘电网、分布式文件系统、分布式数据库、云计算平台、互联网和可扩展的存储系统。

二、作用

1.对大数据的处理分析正成为新一代信息技术融合应用的结点。

2.大数据是信息产业持续高速增长的新引擎。

3.大数据利用将成为提高核心竞争力的关键因素。

4.大数据时代科学研究的方法手段将发生重大改变。

三、特征

容量(Volume):数据的大小决定所考虑的数据的价值和潜在的信息

种类(Variety):数据类型的多样性

速度(Velocity):指获得数据的速度

可变性(VarIABility):妨碍了处理和有效地管理数据的过程

真实性(Veracity):数据的质量

复杂性(Complexity):数据量巨大,来源多渠道

价值(value):合理运用大数据,以低成本创造高价值

四、结构

大数据就是互联网发展到现今阶段的一种表象或特征而已,在以云计算为代表的技术创新大幕的衬托下,这些原本很难收集和使用的数据开始容易被利用起来了,通过各行各业的不断创新,大数据会逐步为人类创造更多的价值。在这里分别从互联网的大数据,政府的大数据,企业的大数据和个人的大数据,四个方面来描绘大数据已经展现的美好景象及即将实现的蓝图。

五、应用

洛杉矶警察局和加利福尼亚大学合作利用大数据预测犯罪的发生。

google流感趋势(Google Flu Trends)利用搜索关键词预测禽流感的散布。

统计学家内特.西尔弗(Nate Silver)利用大数据预测2012美国选举结果。

麻省理工学院利用手机定位数据和交通数据建立城市规划。

梅西百货的实时定价机制。根据需求和库存的情况,该公司基于SAS的系统对多达7300万种货品进行实时调价。

医疗行业早就遇到了海量数据和非结构化数据的挑战,而近年来很多国家都在积极推进医疗信息化发展,这使得很多医疗机构有资金来做大数据分析。

guxing 2023-03-13