您好, 访客   登录/注册

数据分析系统在技术方面的改进措施

来源:用户上传      作者:

  摘 要:数据分析是指用适当的统计方法对收集到的数据进行分析,将它们加以汇总和理解并消化,以求最大地开发数据的功能,发挥数据的作用。不论是哪个领域,产生数据的量都是十分庞大的,如果可以挖掘其中的价值,就必然会获得巨大的回报。但是仅仅通过人工来分析的效果是很差的,因为人的能力是有限的,所以数据分析系统就成为了一个重要的工具。
  数据分析系统的四个主要功能是配置、采集、处理和应用,并且其中包含采集数据、分析整理、构建模型等流程。这些功能看似简单,但是却能找到数据的规律,从而对某一事件的结果进行预测。这对于很多决策者来说是很具有价值的,分析的结果可以让他们获知市场的大致动向,并减少做出错误决断的情况。因此,该系统对于任何领域来说,其价值都是难以估量的。
  关键词:数据分析系统;技术;改进
  一、数据分析系统概述
  (一)数据分析的常用方法
  现在分析中一些常用方法都是比较可靠的,获取的结果基本是准确的,不会与实际有较大的差异。描述性统计是使用频率最高的方法,它可以较好地揭示数据的分布特性,例如数据的频数分析、集中趋势分析、离散程度分析等。将这些结果进行统一地分析与总结,就能从中找到一个潜在的规律。该方法比较使用与具有顺序规律的数据,整体需要是连续的,这样才能更好地从中获取信息。
  (二)数据分析系统的典型构架
  数据分析系统的功能性主要体现在其采集以及处理两方面,这也是最难通过人工来完成的工作。该系统可以获取大量的业务数据,并对它们进行分类存储以及分析。系统对原始数据进行处理转换,并存储在数据库中,再根据需求将数据转换成可利用的模型,再进行进一步地分析。整个系统是层级结构的,不同功能的进行是分层逐步来完成的,因此效率得到了保证,相互干扰的情况也基本不会出现。
  (三)数据分析系统的基本流程
  在流程中,最不可缺少的一个步骤就是构建数据模型,这样就能将抽象的符号具体化成为可以分析的图形。系统的其中一项功能就是分析这些模型,从而获得所需的结果。数据分析至少包含探索性数据分析、模型选定、推断分析三个过程。因为分析的量通常是巨大的,所以在不同线程中的这三个过程都是并行的,这样的效率会很高,最后的结果只需要进行汇总就可以了。数据在获取后,通常是无序的,类型也使多种多样,很难找到其中存在的关联,所以需要将其制作成相应的图表或是其他类型的形象,并找出其中的规律。在找到大致规律后,需要进行模型选定,先列举出多个模型,最后通过逐步排除来找到最能体现出数据规律特点的模型。最后,就是对模型进行推断分析,获取结果。我们可以将这个流程简单地总结为加工、整理、分析,所有的系统在功能上基本都是大同小异,不会脱离这三个重点。
  二、数据分析系统在技术方面的改进措施
  (一)数据分析指标选取方法的改进
  数据指标是数据分析的有力手段。如果能选择一个合适的指标,就能让分析结果更加可靠,还能减少所需要消耗的资源,可以说是一举两得。数据指标需要符合几个基本特征,才能确定其是比较合适的。首先是具有较高的比较性,可以比较出在不同时段、用户之间的表现差异,这样就可以更容易获得分析对象的走向趋势。易读性也是比较关键的,这直接决定了指标是否容易让人理解,这也是其功能性的侧面验证。最重要的就是具有全面性,也就是有限的指標可以描述出尽可能多的对象特征,这样就更加易于就某一问题做出判断。就这些特征,我们可以总结出大致的改进措施。对指标进行定性与量化,定性可以体现对象的主观因素,具有一定判断性,量化可以衡量客观特征,进而过滤掉一些没有作用的指标,尤其是一些具有欺骗意义的指标。例如网站的“累积注册量”就是这样的一种指标,其并不能体现出网站当前的状态,所以并没有实际的参考价值。
  (二)简历标准的代码库和数据集市
  因为系统中的代码有很多都是面向客户的,所以是根据功能来设计的,并且本身的重复率很高。因此,为了节省在编写代码上消耗的时间,就可以构建一个代码库。这个库中可以存储各种类型的代码,当某个部门需要使用时,就可以按需求从中提取出所需的代码。这样有助于代码的共享,可以促进效率的增长,也能提高代码的利用率。数据集市的概念也与之十分相似,就是将一些数据进行共享或是交易,这样在不同的项目中如果要用到同一批数据,只需要在集市中提取就可以了,这样就能显著减少收集所需要的时间。构建一个规模巨大的集市,有助于推动数据分析这个学科的发展,让不同的领域都能因此而受益。但目前这只是一种想法,因为部分数据是不易公开或用来交易的,所以现在集市的概念大多用在企业之间的合作中。
  (三)数据分析系统的交互与兼容改进
  提高系统的交互与兼容性,是保障数据分析效率的有效手段。现有的系统大多都只是支持文本、表格等几种主要的格式,所以当有一些特定的检索需求时,系统是不能直接完成的。这是一种兼容性不足的体现,所以应当增加可兼容的数据格式。对于一些特殊的数据格式,即使不能识别,也需要为其构建扩展结构,让系统仍然实现一定功能。在系统投入使用前,需要对其进行全面测试,可以通过使用其进行大量的运算,从而测试其容错性能以及在检测、分析方面是否有不足。
  结语:总得来讲,数据分析并不只是存在于理论上,而是可以真正地被使用到各个领域的一个学科。该学科的出现让所有的行业都受到了影响,从积极的角度看,如果可以合理使用分析方法,就能提高数据的利用率,并挖掘其中的价值,从而避免其中包含的珍贵信息被浪费掉。现有的数据分析系统虽然具备强大的分析功能,但是仍然有很多可以改进的地方。如果可以从技术层面上将系统更新,就能提高分析的准确性。文章就目前系统的技术改进提出了一些建议,希望可以起到一定的参考作用。
  参考文献:
  [1]邹鹏.数据分析系统及其技术的改进措施[J].科学与财富,2016,15(6)
  [2]周文琼.大数据环境下的电力客户服务数据分析系统[J].计算机系统应用,2015,24(5)
  [3]刘梅.大数据系统和分析技术综述[J].数字化用户,2018年43期 >
转载注明来源:https://www.xzbu.com/1/view-15222877.htm