<%@ page contentType="text/html; charset=gb2312"%> 数据仓库基本概念之一, 决策支持系统(DSS)的发展
网站公告:   ◆北天JAVA技术网热情为java爱好者服务,本网内容包括JAVA(JSP、servlet、EJB、webservice、j2ee、javabean、应用服务器、JavaScript),数据库(MYSQL、SQL Server、Sybase、Oracle、DB2、数据库综合知识),设计研究(设计模式、Struts、Spring、Hibernate、设计框架、设计综合知识),WEB2.0新技术(主要介绍AJAX),以及各种技术的入门、实例、例子等等,欢迎各位多来坐坐!◆  诚邀各位JAVA爱好者加盟!◆  本网站内容丰富,更新快,保证每周20篇以上!  
加入收藏
设为首页
联系站长
承接项目
  相关资源:网站首页 | 免费培训学院 | 技术论坛 | JAVA聊天室 | 作家专栏 | 开发工具 | 认证考试 | 会员俱乐部
  JAVA技术初学者园地 | jsp与servlet | javascript | Java源代码 | EJB | web service | 应用服务器 | JAVA综合知识
  设计研究设计模式 | 设计框架 | Struts | Spring | Hibernate | 开源项目 | 面向对象设计 | 设计综合知识
  数 据 库MYSQL | SQL Server | Sybase | Oracle | DB2 | Informix | Access | 数据库综合知识
  其他资源:AJAX新技术 | 网站开发 | ERP软件 | OA办公软件 | 商业智能BI | 开发综合知识 | 承接项目 | 项目试用

 
 
数据仓库基本概念之一, 决策支持系统(DSS)的发展
     发布者:流浪者 发布时间:2006-08-10
                              
 1、DSS是信息技术进行长期复杂演化的产物。
 (1)单个主文件时期
 (2)随着直接存取设备的出现,数据库管理系统(DBMS)出现了,进而迎来了在线事物处理(OLTP)大规模发展
 (3)随着新型语言(4GL)的出现,出现了早期的管理信息系统(MIS)。
 (4)大型OLAP系统出现不久后,就出现抽取程序,用于从现有的数据库系统中抽取所需的数据,并将这些数据保存到其他文件或数据库中。
 抽取程序有两个优点:
 a、将数据从高性能OLAP系统环境中抽取去来,这样在需要对数据(已抽取)进行总体分析时就不会对系统的系统方面产生冲突了。
 b、抽取后的数据,控制方式发生了改变,用户最终拥有了这些数据。
 基于这些原因,抽取处理的应用十分普遍。
 (5)随着抽取的大批量应用,各部门或组织的抽取,基于抽取的抽取,最终形成了一个抽取蜘蛛网,贯穿于公司或组织的这种抽取模式十分常见,
 人们又称其为:自然演化式体系结构
 
 2、自然演化式体系结构
 2、1 主要问题:
 (1)数据缺乏可信性,主要原因有:数据无时间基准、数据在算法上的差异、抽取的多层次问题、外部数据的问题、无公共起始数据源。
 (2)生产率问题,每次产生不同的报表都需要花费大量的时间,第一次产生报表所花费的时间不能对后续报表的产生提供任何生产率的帮助。
 (3)无法将数据转化成信息,主要原因有:历史遗留系统在建立时没有考虑过集成、而且常常在这些系统中没有存储足够用于DSS的需求的历史数据。
 2、2 -体系结构的变化
 由于自然演化式体系结构存在的诸多问题,出现了一个大变化----体系结构的变化,即体系化的数据仓库环境。在体系化的数据仓库环境的核心中,
 主要存在两种数据:原始数据和导出数据。主要区别有:
          原始数据/操作型数据                                     导出数据/DSS型数据
          面向应用                                                        面向主题
          详细的                                                            结合的、或提炼的
          在访问瞬间是准确的                                      代表过去的数据 
          为日常工作服务                                             为管理者服务
          可更新                                                           不可更新
          重复运行                                                       启发式运行
          处理需求预先告知                                         处理需求预先不知道
          生命周期符合系统开发生命周期                   完全不同的生命周期
          对性能要求很高                                            对性能要求比较宽松
          一次访问一个单元                                        一次访问一个集合
          事物处理驱动                                               分析处理驱动
          更新控制是一个关心的主要问题                  无更新控制问题
          高可用性                                                      放宽的可用性问题
          整体管理                                                      以子集管理
          非冗余性                                                      总是存在冗余
          静态结构:可变的内容                                 结构灵活
          一次处理数据量小                                        一次处理数据量大
          支持日常操作                                              支持管理需求
          访问频繁                                                     访问很少或是适量的
 由于原始数据和导出数据之间的巨大差异,它们不能共存于同一个数据库,甚至于同一个环境中。        
                            
 3、体系结构化环境
 3、1体系结构化环境的层次:操作层、原子/数据仓库层、部门层/数据集市层、个体层
 操作层数据只包含原始数据而且主要服务于高性能OLAP环境。
 数据仓库层存储不可更新的集成的原始历史数据,此外也存在一些导出数据。
 部门/数据集市层则是根据用户的需求而为满足部门的特殊需要而建立的。
 个体层完成大多数启发式分析
 3、2 体系结构化环境中的数据集成
 把数据从操作型环境载入到数据仓库环境时,必须经过抽取/转换/装载(ETL)整个集成,通常这些工作有相关的软件能够自动进行
 
4、数据仓库的用户?
 数据仓库的用户可以称作为DSS分析员,他首先是个商务人员,其次才是技术人员。DSS分析员的主要工作是定义和发现在企业决策中使用的信息。
 从DSS分析员的角度来看,他是在发现模式下工作,直到看到报表或屏幕上的数据,才能确定真正的需求。DSS分析员从现有的需求开始,要将新
 新的需求考虑在内几乎是完全不可能的,故数据仓库具有一种完全不同于传统的系统开发生命周期。
 
 5、数据仓库的开发生命周期
 数据仓库具有一种完全不同于传统的系统开发生命周期(CLDS),它由数据开始,得到数据后,就将数据开始集成,然后如果数据有偏差,就检验
 看看数据存在什么偏差。之后针对数据写程序,分析程序执行结果。最后,系统需求才得到了理解。
 
 6、数据仓库硬件的利用模式
 操作型处理的硬件利用模式中有波峰和波谷,但总归存在相对稳定的利用模式,即对硬件的利用率会保持在一个相对稳定的范围内。
 而数据仓库环境的硬件利用模式明显不同,要么利用全部硬件,要么根本不用硬件。
 因此同时在同一机器上把两种环境混在一起不具有可行性,因为要么针对操作型处理优化机器,要么针对数据仓库优化机器。
 
 7、数据仓库为重建工程创造了条件
 从生产环境转变到体系结构化的数据仓库环境有一个非常有用的副作用:从生产环境中移走了大量的档案数据,使得生产环境变得
 更小、更简单、更集中,为重建工程创造了条件。
 
 8、对数据仓库环境的监控
 数据仓库维护工作中的一个重要部分就是对性能进行管理,这就首先需要对数据仓库环境进行监控。包括两种监控成分:
 8、1 监控数据仓库环境中的数据
 (1)对数据仓库环境中的数据的监控是有效管理数据仓库环境的最基本操作。通过这项操作能取得:
  a、确定发生了什么增长、增长发生在什么地方、增长以什么速率发生。
  b、确定哪些数据正被使用。
  c、估算最终用户得到的响应时间。
  d、确定谁在实际使用数据仓库。
  e、说明最终用户正在使用数据仓库中的多少数据。
  f、精确指出数据仓库何时正被使用。
  g、确定数据仓库中有多少数据正被使用。
  h、检测数据仓库使用率水平。
 (2)在数据监控处理期间,可以建立数据的各种概要文件包括:
  a、数据仓库中所有表的目录
  b、这些表的内容
  c、数据仓库中表的增长情况。
  d、用于访问表的可用的索引目录。
  e、汇总表和汇总源的目录。
 8、2 监控数据仓库活动
 (1)监控数据仓库活动需求通过以下问题可以说明:
  a、什么时候数据正在被访问?
     什么时候访问?
     由谁访问?
     访问频率怎么样?
     在什么细节层次?
  b、对请求的响应时间是什么?
  c、在一天的什么时间提出请求?
  d、请求多大的数据量?
  e、请求是被终止的还是正常结束的?
 (2)能测量DSS环境中的响应时间是对响应时间进行管理的第一步。仅此一点,监控DSS活动就是必须进行的非常重要的步骤。
  a、响应时间度量的问题之一是“要度量什么?”,监控程序需要支持多种对响应时间度量的解释。
  8、3 监控的一个根本问题是在哪里进行监控?
  (1)一个是最终用户终端,这是做监控工作的一个方便位置,对性能几乎没有影响,但是管理很不方便。
  (2)一个是在服务器层次进行监控,这里管理十分方便,但是对性能会有一定的影响。
  (3)实际确定需要进行综合考虑两者的利弊。
  8、4 监控程序最有效的用途之一是能够将今天的结果与每天的平均结果进行比较。
                       
                            
                            
                            
                            
                            
                            
                            
                            
                            
                            
                            
                           
                            
                            
                           
(转载文章请保留出处:北天JAVA技术网(www.java114.com))
 
更多精彩文章:
js“树”读取xml数据(转)
对于struts的一点感触
jsp连接数据库大全
Acegi简介(转贴)
一段过滤HTML控制符的代码
jsp+ajax自动刷新实例
 
最近评论:
        
冰封的往事!
wow power leveling,wow gold,WoW Gold,wow gold max(9836)
        
飞舞的传奇!
传世私服,传世私服.传奇世界私服传奇世界私服,传世私服传世私服, 传奇世界私服传奇世界私服.传奇私服传奇私服. max(2155)
        
标 题:   
内 容:   
 
                                  
 
免责声明:该文章由网友发表,如果对您造成侵权,请联系站长

首页 - 承接项目 - 网站地图 - 联系我们 -
版权所有北天JAVA技术工作室 ICP证号:粤ICP备06079815号