数据仓库是面向主题的、集成的、非易失的,是随时间变化的数据集合,用来支持管理决策。它是在传统的业务数据库的基础上,经过对大量静态业务数据库的提取,形成数据仓库数据。数据仓库可以为决策支持系统的决策支持处理过程提供有效的支持,也同样可以为其他的信息处理系统服务。数据挖掘可以称为数据库中的知识发现,它是从大量数据中发现并提取隐藏在其中的可信的、新颖的、有效的并能被人理解的模式的高级处理过程。
数据挖掘解决了传统分析方法的不足,并能够对大规模数据的进行分析处理。数据挖掘从大量数据中提取出隐藏在数据之后的有用的信息,为人们的正确决策提供了很大的帮助。数据仓库、联机分析处理和数据挖掘三个技术在国外已经取得了广泛的应用,而在我国的应用才刚刚起步。证券业作为我国较早应用信息技术的行业,己经建立了较完善的事务处理系统。
多年的应用也使得证券公司积累了大量的数据,其中隐含着大量有价值的信息。如何利用这些数据,深层次地挖掘信息,为公司的决策服务,己成为证券公司的当务之急。 我们通过查阅资料了解了国内部分行业内如金融、电信、零售业的企业在数据仓库和数据挖掘应用方面的现状,发现这些企业的大部分信息化基础建设已经做得比较好了,数据库中存储了大量的数据,但由于各种原因,如资金问题、专业技术人员等问题,在数据分析方面一直处在观望和准备的状态。本文分析了这种现状说明的问题和企业的困惑,针对这些应用上的问题和困惑,在较为详细介绍了数据仓库和数据挖掘工具方面的知识,如数据仓库的定义、结构,数据挖掘的定义、工具和应用过程后,以证券业的数据仓库和数据挖掘应用为研究对象,通过对它的分析和调查研究,探讨数据仓库的实际建立过程和数据挖掘的应用。
包括从最初的各种需求分析(数据环境分析、业务数据库结构分析、应用系统主题分析)到数据仓库应用系统结构设计、数据模型设计,数据仓库的数据转移方案、数据加载、创建多维数据集,最后利用数据挖掘软件和其他数据分析工具,对抽取的数据进行OLAP分析和股票行情关联分析等,找到理解分析结果的途径,使企业对于数据仓库与数据挖掘在企业中的应用有一个较为直观和详实的认识,。
因篇幅问题不能全部显示,请点此查看更多更全内容