您好, 访客   登录/注册

大数据时代下数据分析理念研究

来源:用户上传      作者: 王惠

  [摘要]随着信息技术的发展与应用,各种数据信息通过互联网、云终端、交际圈、物联网等之间的大规模传递,人类进入到一个大数据时代,数据信息之间的传递影响着人们的决策成本,传统的信息不对等所造成的差距条件已经消失,而不起眼的数据却能够创造巨大的价值。本文对大数据时代背景下数据分析理念进行分析和指导。
  [关键词]大数据时代;数据分析理念;分析
  [DOI] 10.13939/j.cnki.zgsc.2015.22.074
  在传统的商业运作模式中,在运营过程中对自身经营发展的分析只停留在数据的简单汇总层面,缺乏有效地对客户网络、业务范围、营销产品、竞争对手优劣等方面进行深入解析;而在当今大数据时代,通过所接收的大量内部和外部数据中所蕴含的信息中透露的市场弹性,可以预测市场需求,进行分析决策,从而制定更加行之有效的战略发展计划。“大数据”是一个量特别大,数据类别特别大的数据集,并且这样的数据集无法用传统数据库T具对其内容进行抓取、管理和处理。在当今信息时代,很多企业用户在实际应用中把多个数据集放在一起,已经形成了PB级的数据量;数据类型广,数据来源种类多,且数据种类和格式日渐丰富,囊括了半结构化和非结构化数据,早已打破传统的结构化数据范畴,如何在大数据时代背景下进行科学有效的数据分析这需要加强对市场的了解,对泡沫经济的规避,了解数据所传递的信息真假。
  1 数据化决策的兴起与运用
  在大数据时代,信息之间的爆炸增长,使得各种信息传递非常之快,只需要拿起网络终端就可以了解到地球另一边发生了什么。文字、图形、影像都化作数据流在网络中以电信号的方式传递着信息。数据流在传递各行各业的信息同时形成了渗透于各行业的核心资产和创新驱动力。在大数据时代,企业所拥有的数据集合规模及数据的分析和处理能力决定着企业在市场中的核心竞争力。
  因此通过数据分析进行决策渐渐成为新的分析理念,例如,在支付宝上进行对电影票房的投资,这些投资通过对导演往期作品和演员的表演张力,及投资方的选角等数据进行分析,预测电影的票房,选取投资可获利的电影,进行票房投资,从而获取票房分红。我国的石油油田根据地震技术的收集数据,进行科学统一规划的分析处理,形成对地下油田的分析建模,能够有效直观地展示地下油藏的分布情况,从而选择油井的开采点。中国人民银行通过对人民币汇率的涨幅,进行数据分析,来制定符合中国国情的外汇货币政策,对货币进行宏观调控,这能够有力的保护人民币升值时,在国际贸易市场中国进出口贸易所面临的压力。在大数据时代背景下,通过直觉和经验进行决策分析的优势不断下降,在商业、政治及公共服务领域中,通过对大数据进行数据分析从而做出符合时代背景的决策,已成了目前的潮流。
  2 数据分析理念及方法
  (1)数据分析要引入统计学思想。在大数据时代背景下,传统的抽样分析已经并不适用于对大数据的分析中,在大数据时代应当要转变思维,转变抽样思想,样本就是总体,要分析与某事物相关的所有数据,而不是依靠少量数据样本,这样才能够在最大限度地明白事物发展变更过程,能够对数据所表露的信息进行更好地处理。要更乐于接受数据的纷繁芜杂,不再追求精确的数据,这并不是说其严谨性降低了,而是往往不起眼,不符合常理的数据更能够反映实际的情况。通过对数据网络之间的联系进行分析,不再探求难以捉摸的因果关系,通过数据的分析处理更能够反应数据的变更。这些想法都与统计学相关通过所收集的数据,进行有效的分类处理,能够更好地反应事物的变化,更有利于做出决策。
  (2)数据分析流程。在实际的数据分析过程中,因大数据贯穿区域较广,在地域和行业之间穿插交错,颠覆了传统的线性数据收集模式,而形成了颠覆传统的、非线性的决策基础,这种决策方式要求我们通过对数据进行收集,将各行各业所收集的基本信息,转化为数据,将数据经过初步的整合分类,做出符合当地当时的数据信息,将数据进行深层次的技术处理,将处理过后的信息化为知识,运用到实际的决策中去。在大数据时代,数据的积累并不会贬值,而且还会不断增值,为了更全面、深入地了解研究对象,往往需要对数据进行整合,这就使得数据的积累尤为重要。
  (3)数据分析对统计学的意义。在大数据时代背景下数据分析理念能够有效地对数据流进行合理地分类处理,进行科学的统计行为,统计与分析主要利用分布式数据库,或者分布式计算集群来对存储于其内的海量数据进行普通的分析和分类汇总等,这就意味着所有有用的数据信息均来源于数据分析处理之后的结果。大数据的数据分析理念扩宽了统计学的研究范围,而不仅仅只是实现数据的对比,而是从根本上丰富了研究的内容,如:一些实时性需求会用到EMC的Creen-Plum、Oracle的Exadata,以及基于MySQL的列式存储In-fobright等,而一些批处理,或者基于半结构化数据的需求可以使用Hadoop,满足大多数常见的分析需求,对传统的统计T作有着四个转变。统计研究过程的转变,使统计过程成为收集与研究。统计与分析这部分的主要特点和挑战是分析涉及的数据量大,统计研究T作思想的转变,数据的收集不断增加,信息的录入不断升级,其对系统资源,特别是1/0会有极大的占用。这就使得能够更好地进行数据分析处理决策。
  3 数据分析过程中注意事项
  3.1数据分析要明确变量
  将数据收集进行处理是为了明确市场中的某一个变量意义,这就使得在进行数据分析的时候要能够明确地找寻变量存在前后所发生的变化,通过数据对比可以知道该变量在大数据的市场中所存在的影响因素。是否对市场有着风险或有利于市场的开发利用,能够在数据分析后做出合理决策。
  3.2统计中不再追求精确的数据
  大数据时代下,数据的不精确性不仅不会破坏总体信息可靠性,还有利于进行剥丝抽茧,从而了解总体情况。大数据时代,越来越多的数据提供越来越多的信息,也会让人们越来越了解总体的真实情况。错综复杂的数据能够反映数据之下到底是泥潭还是机遇。数据之间传递的信息良莠不齐,如果要一一追求准确性不利于统计工作的开展,因此可以将个别的异常值剔除。大数定律告诉我们,随着样本的增加,样本平均数越来越接近总体,这就使得样本与总体的差异性很小,更加符合实际情况。
  4 结论
  综上所述,大数据包含结构内外的海量数据,随着云计算平台进行大规模收集处理,通过建立数据库的手段,对数据分流,使用数据挖掘等方法进行处理、分析,使得所数据结果更加符合显示状况。数据分析理念是通过阐明存在于世界、物质、感官享受上的复杂网络关系,从而做出符合时代背景的分析决策。
转载注明来源:https://www.xzbu.com/2/view-7117188.htm