当前位置:首页 期刊杂志

探讨基于SQLServer 2000的数据仓库和数据挖掘

时间:2024-04-23

陈佶福建龙溪轴承(集团)股份有限公司

探讨基于SQLServer 2000的数据仓库和数据挖掘

陈佶
福建龙溪轴承(集团)股份有限公司

针对SQL Server 2000的数据仓库和数据挖掘进行分析,介绍了数据仓库设计。并详细分析了数据挖掘方法,方法主要有:OLEDB数据挖掘,利用SQLServen2000实施数据挖掘两种。

数据仓库;数据挖掘;OLEDB数据源

数据挖掘中的物理结构,对客户应用程序和数据挖掘模型之间的相互作用做出了描述。在OLEDB for DM中,数据挖掘模型是其中的一个概念,其中一个数据挖掘模型,就代表着一个容器。

1 基于SQLServer 2000的数据仓库设计

对结构进行选择,主要是以数据源的大小以及对这一数据挖掘的模型发布预测查询频率进行的。同时以其应用特点作为依据,可以直接对两层体系结构或者三层体系结构方案进行使用[1]。

如果数据挖掘任务进一步提高,客户机所使用的挖掘结果需求量逐渐增大,可以对其中的三层体系结构进行选用。针对这一结构而言,从总体上分析,需要使用一个性能较高的服务器,将其放在中间夹层当中,充当一个数据挖掘引擎,而数据仓库将会被放置在最后端。其中的中间负责层主要是进行数据的挖掘。

2 数据挖掘方法

2.1 OLEDB数据挖掘

在一定程度上,可以将其看成通过不同数据类型所构成的一种关系表,这在并不会对原始数据进行储存,而是通过储存数据挖掘算法在关系表当中所发现的一种模式。为了构建这一数据模型,通过OLEDB for DM对SQL中创建表的语法进行使用,如CREATE语句。

2.1.1 数据挖掘模型测试

构建出一个数据挖掘模型后,其仅仅是以一个空的容器形式存在的。对其进行具体测试过程中,数据挖掘算法分析输入的事件以及挖掘模型已经发现的模式。以针对数据所挖掘的OLEDB作为依据,得到的测试数据可以来源于各种表格数据源,只要其在OLEDB驱动器存在,就不必用户从关系数据源中将数据进行导出,这种情况下,促使数据挖掘过程得到有效简化。可以对SQL中的数据插入句法进行使用,如INSERT INTO语句,或者Openrowset命令,进而从其中的一个OLEDB数据源,进行远程数据的访问。

2.1.2 数据挖掘预测

数据挖掘预测属于数据挖掘工作中的一个重要任务,这一任务的完成,需要一个测试过的数据挖掘模式以及一系列的新鲜事件,所得出的预测结果形成了一个新的记录集,这一记录集中包含了预测列的值,同时还有其他输入列的值。在这一过程中,和关系连接十分相似,其并不是联系两个表,而是对数据挖掘模型以及输入表进行连接。此外,可以使用SQL中的查表语法,例如SELECT等。

由此可知,OLEDB和标准SQL之间紧密结合,能够较为快速并准确的开展相应的查询处理,但是其中的SQL Serven2000数据创建性数据,同时也是数据挖掘过程中的一种相对有效的方案。

2.2 利用SQL Serven2000实施数据挖掘

对基本数据挖掘OLDDB进行使用过程中,可以从不同数据挖掘中的不同数据挖掘算法,较为容易的在用户应用中嵌入[2]。而对于这些数据挖掘算法中的软件包当中,一共存在两个数据挖掘算法,其中有Microsoft决策树,同时有Microsoft集群。对于数据挖掘提供者而言,属于分析服务2000的一部分,其和Microsoft的OLAP服务存在着相同之处,而SQLServen2000中存在的数据挖掘组件,主要是以DBA为核心的。其中的Analysis Sevices是通过OLP以及数据挖掘共同组成的,其属于一种数据分析技术。属于Analysis Services中的一种数据挖掘工具。对于这些工具而言,具有一定的模型建立导向和模型编辑器。此外,还存在着浏览器和DTS预测任务。

对这一应用进行建立之前,需要先建立一个数据挖掘模型,同时对这一模型进行训练,实现这一任务,存在着多种形式,其中比较容易的一种形式就是借助Analysis Services的数据模型向导,这一导向会产生一定的数据挖掘模型以及训练查询[3]。同时借助OLEDB for DM接口将查询指示发送给数据挖掘供应者。还有一种方式便是,对程序进行自行编写,例如借助面向对象编程技术,对一些VB或者VC程序进行编写。此后借助DSD或者ADO对数据挖掘供应者进行连接,然后向着这一供应者对文本查询进行发布。这种方式,类似于数据库开发者对数据库进行处理和查询。从Analysis Services中扩展了DSO模型,进一步为数据挖掘提供了支持。在这种情况下,借助DSO连接数据挖掘供应者,使用DSO对象相连方式,使用相对简单的ADO方式进行比较,存在较大的优越性。例如,能够十分安全的控制这一模型,能够支持远程数据服务和挖掘的仓库[4]。但是,对DSO进行使用,需要实现更多的编码工作,与此同时,相应开发者必须对不同列的对象以及挖掘模型对象的属性进行描述。

结束语

以SQLServer 2000为依据,分析了数据挖掘的具体方式。数据库和数据分析解决方案的完整性,需要符合易用性,功能需满足要求。随着我国科学技术的不断发展,相信会出现更加方便可靠的产品。

[1]俞兰芳,石梅.高校管理信息系统数据仓库设计研究[J].科技通报,2012,02:190-192.

[2]李凯.某出版社数据仓库系统的设计与实现[J].无线互联科技,2012,05:60-61.

[3]尚虎平.我国地方政府绩效评估指标数据仓库的代表性对象选取和构建——以江苏四市为研究点[J].甘肃行政学院学报, 2012,04:4-15+127.

[4]贺明,贺海平.新病案首页数据仓库的构建和应用[J].中国数字医学,2014,11:83-85.

免责声明

我们致力于保护作者版权,注重分享,被刊用文章因无法核实真实出处,未能及时与作者取得联系,或有版权异议的,请联系管理员,我们会立即处理! 部分文章是来自各大过期杂志,内容仅供学习参考,不准确地方联系删除处理!