您好, 访客   登录/注册

数据仓库技术在零售行业中的应用

来源:用户上传      作者: 杨 丽

  [摘 要] 随着零售行业的迅猛发展,竞争日益激烈,如何降低运营成本、最大限度满足消者购物需求成为大多数企业面临的考验。通过对数据仓库、OLAP及多维数据模型的论述,实现了基于零售系统决策支持的数据仓库,使其能够更充分地了解客户需求,协助企业做出决策,以提高其自身竞争力。
  [关键词] 数据仓库 OLAP 多维数据模型
  
  随着商品经济和电子商务的飞速发展,销售系统数据库中存放了大量关于商品销售情况的数据,这些数据为企业提供了更深入了解客户需求信息和购物行为特征的参考信息,但传统的应用环境不能完全地满足这样的需求,随着数据库及相关技术的发展,通过将数据仓库、数据挖掘与联机分析处理技术三者的结合,利用企业内部的海量数据,挖掘出有价值的知识和规则,则可以帮助和支持企业决策,提高企业的决策力和竞争力。
  一、数据仓库(DW)
  数据仓库用于支持决策,面向分析型数据处理,它不同于企业现有的操作性数据库;数据库是对多个异构的数据源有效集成,然后按主题重组,并包含历史数据,而且存放在数据仓库中的数据一般不再修改。数据仓库具有以下几个特点:
  1.面向主题的
  操作型数据库的数据组织面向事务处理任务,各个业务系统之间各自分离,而数据仓库中的数据是按照一定的主题域进行组织,如顾客、商品、供应商、销售组织。数据仓库关注决策者的数据建模与分析,而不是集中于组织结构的日常操作和事务处理。数据仓库排除对于决策无用的数据,提供特定主题的简明视图。
  2.集成的
  数据仓库中的数据来自多个外部应用系统或本系统中不同的使用部门,数据的组织结构会有所不同,因此需要对来自多个数据源的数据进行清理和集成,确保命名约定、编码结构、属性度量等的一致性,有力地克服了基于关系数据库决策支持数据分散且不易集成的缺点,并支持联机分析处理。
  3.数据仓库中的数据是不可更新的
  数据仓库中的数据主要提供企业决策分析之用,主要的操作是查询,一般不执行修改,但在需要进行新的分析决策时,可能需要进行更新或删除数据,这是由数据篡改库管理员后台实现,终端用户不允许操作。
  4.数据仓库中的数据随时间不断变化
  可以进行增加新数据、删除旧数据、更新与时间有关的一些综合数据。
  数据仓库不同于数据库,两者的应用层次不同,传统数据库用于事务管理,数据仓库用于决策支持、决策分析,是建立决策支持系统(DSS)的基础,数据库为数据仓库提供数据是数据仓库的基础。
  二、联机分析处理(OLAP)
  如果要有效地利用DW中的信息资源,必须有强大的工具对信息进行分析和决策,OLAP就是一个得到广泛应用的数据仓库技术。它专门用于支持复杂的决策分析,是支持信息管理和业务人员决策活动的一种决策分析工具,它可以根据分析人员的要求,迅速、灵活地对大量数据进行复杂的查询处理,并以直观、容易理解的形式将结果提供给各种决策人员,使他们迅速、准确地掌握企业的运作情况,了解客户和市场的需求。
  OLAP是多维数据存储,通常将三维立方体的数据进行切片来显示三维的某一个方面。OLAP的多维分析突破了三维概念,采用旋转、潜逃、切片、钻取和三维可视化技术并在屏幕上展示多维视图的结构,使用户直观地理解和分析数据以及进行决策支持。
  OLAP有两个特点,一是在线,表现在对用户的请求快速响应和交互操作,由客户机/服务器体系结构完成的;二是多维分析,这则是联机分析处理的核心。
  三、多维数据模型
  数据仓库的数据组织方式可以是关系数据存储的也可以是多维数据立方体,最常用的是多维数据模型。数据仓库和OLAP工具都基于该模型,该模型将数据看做数据立方体形式,由维和事实定义,提供多维视图,并允许预计算和快速访问汇总的数据。
  通常多维数据模型围绕中心主题组织数据,包括事实表的名称、度量以及每个相关维表的关键字。当利用数据展现工具确定要观察的维和度量值后,展现工具利用事实表与维度表的关联字段找到各维表的相应值,把它们作为用户分析数据的角度,再根据事实表中的度量值进行统计,最后得到用户想要得到的数据。
  在零售决策支持系统中,多维数据库是建立在数据仓库之上,是实现OLAP的数据引擎,确定多维数据库的维数和维的内容是多维数据库设计的关键。根据决策需求,可以设计如下:分类、品牌、供应商、时间、地区,实际是对数据仓库主题域的局部细化,各维汇总层次的划分可以根据零售决策需求灵活定义,形成多层系的汇总。
  四、实例说明
  以普通商场为例,研究几个数据仓库技术的主要环节。
  1.需求分析
  (1)销售毛利分析:可以从商品分类或柜组的角度,对销售额、成本、毛利、毛利率进行分析。
  (2)商品销售与毛利排行:将某分类或柜组的商品进行销售或毛利指标排序。
  (3)销售趋势分析:从商品分类或柜组的角度,分析在一个时间阶段内,销售额、毛利、毛利率的走向趋势。
  (4)供应商销售分析:按照商品供应商的角度,对各供应商的销售、毛利进行分析,并对供应商的指标以分类逐步深入钻取,比较一个供应商的经营业绩是由哪些分类的商品组成。也能比较同类或同柜组的商品有哪些供应商在供货以及经营状况。
  2.设计方法
  数据仓库的建立是在原有数据库的基础上进行的,设计可以采用自底向上的应用驱动方法来实现:选择来自不同事务系统的数据源通过整理和传送,加载到数据仓库数据库,并不断根据不同的应用,向混合数据载体中添加越来越多的数据源,最终达到覆盖所有数据资源而完成数据仓库数据库构筑的目的。
  3.数据仓库的建立
  (1)概念模型的设计。概念模型主要是对原有数据库中数据进行分析,界定系统边界和确定主要的主题域。数据仓库是面向主题的,零售系统数据仓库的主题可以从销售主题、库存主题和采购主题这三方面来考虑。
  (2)逻辑模型的设计。逻辑建模是数据仓库构筑中的重要环节,在本零售系统的中,包括粒度的选择、关系模式定义和提炼表中数据。逻辑结构模型主要有星形模型和雪花模型。本例中,笔者认为应采用星形模式建模,这种模型交叉点少,通过使用一个包含主题的事实表和多个维度表来执行典型的决策支持系统查询,同时它针对“维”做了大量的预处理,查询速度非常快。事实表可分为商品进销事实表,维度表为商品维度表、时间维度表、供应商维度表、地区维度表、品牌维度表和柜组维度表。
  (3)物理模型设计。包括确定数据的存储结构、确定索引策略(对大记录数的表如商品销售明细、分类销售明细表等建立索引,以获得最大的查询功能)、确定数据存放位置和确定存储分配。
  4.数据仓库的生成
  数据仓库中存有大量的历史数据,以及当前细节数据、轻度综合和高级综合数据,以满足决策者对不同时间和不同力度层次的要求。数据的来源可以是企业内部或外部,常常是由不同的数据系统、操作系统及应用生成,因此,生成数据仓库时,最关键的是数据质量,使数据整齐一致。使用DTS工具进行数据转换或数据导入/导出到数据仓库中时,需要考虑数据提取、转换、清理、加载和汇总这几个过程。
  5.基于数据仓库的决策支持系统
  基于数据仓库的决策支持系统设计的具体的步骤是:存放于各柜组(店铺)的数据通过DTS被抽取到ETL数据库(SQL Server),数据在ETL数据库中完成清洗和转换,再通过DTS加载到仓库数据库(DB2),数据进入仓库数据库后按维度和事实存放,通过DTS调用把仓库数据按主题装载到多维数据库(ESSBASE).TONGUO HPs Server发布编译好的决策支持分析系统脚本,通过Web服务器,用户就可以使用浏览器访问决策支持系统并分析浏览数据了。
  可以采用DB2数据库作为仓库数据库,ESSBASE产品作为OLAP分析工具,微软DTS工具作为ETL工具,开发模式选择B/S模式。
  五、结束语
  数据仓库的根本任务是把数据加以整理归纳,并及时提供给相应的管理决策人员,供他们做出改善其业务经营的决策,使信息发挥作用,支持决策。在零售系统或电子商务中,根据企业自身的发展需求建立数据仓库,将数据仓库、联机分析处理和数据挖掘技术相结合,有助于发现客户购买模式和趋势、提供可靠的货物进销比率、控制库存及降低商业成本等,对企业经济效益的提高具有举足轻重的作用。
  
  
  
  参考文献:
  [1]牛 莉:中小企业数据仓库的构建与应用[J].华南师范大学学报,2007,(02)
  [2][美]W.H.Inmon,R.H.Terdeman,Joyce Norris-Montanari,Dan Meers 电子商务中的数据仓库技术[M].北京:机械工业出版社,2004


转载注明来源:https://www.xzbu.com/3/view-1490640.htm