摘要 星形模式是基于關(guān)系數(shù)據(jù)庫(kù)的數(shù)據(jù)倉(cāng)庫(kù)中的一個(gè)著名概念,由于星形連接模式的設(shè)計(jì)思想能夠滿足人們從不同觀察角度(維)分析數(shù)據(jù)的需求,所以在基于關(guān)系數(shù)據(jù)庫(kù)的數(shù)據(jù)倉(cāng)庫(kù)的設(shè)計(jì)中廣泛地使用了星形模式。本文主要介紹《廣東省高速公路一張網(wǎng)資金結(jié)算情況分
摘要 星形模式是基于關(guān)系數(shù)據(jù)庫(kù)的數(shù)據(jù)倉(cāng)庫(kù)中的一個(gè)著名概念,由于星形連接模式的設(shè)計(jì)思想能夠滿足人們從不同觀察角度(維)分析數(shù)據(jù)的需求,所以在基于關(guān)系數(shù)據(jù)庫(kù)的數(shù)據(jù)倉(cāng)庫(kù)的設(shè)計(jì)中廣泛地使用了星形模式。本文主要介紹《廣東省高速公路一張網(wǎng)資金結(jié)算情況分析系統(tǒng)》中的數(shù)據(jù)倉(cāng)庫(kù)技術(shù)。
關(guān)鍵詞 數(shù)據(jù)倉(cāng)庫(kù);星形模式;維度
1 數(shù)據(jù)倉(cāng)庫(kù)的特點(diǎn)
數(shù)據(jù)倉(cāng)庫(kù)技術(shù)是用以更好地支持企業(yè)或組織的決策分析處理的,面向主題的,集成的,不可更新的、隨時(shí)間不斷變化的數(shù)據(jù)集合。它通過(guò)將數(shù)據(jù)按照不同的綜合程度(即粒度)來(lái)組織,以滿足不同分析的需要。
本文主要介紹一下《廣東省高速公路一張網(wǎng)資金結(jié)算情況分析系統(tǒng)》中如何使用數(shù)據(jù)倉(cāng)庫(kù)技術(shù)來(lái)實(shí)現(xiàn)“異常流水”與其修改量分析與“流水上傳與拆分”分析這兩個(gè)主題。
2 星形模式
星形模式是基于關(guān)系數(shù)據(jù)庫(kù)的數(shù)據(jù)倉(cāng)庫(kù)中的一個(gè)著名概念,由于星形連接模式的設(shè)計(jì)思想能夠滿足人們從不同觀察角度(維)分析數(shù)據(jù)的需求,加上數(shù)據(jù)倉(cāng)庫(kù)通常用來(lái)回答綜合性的問(wèn)題,所以在基于關(guān)系數(shù)據(jù)庫(kù)的數(shù)據(jù)倉(cāng)庫(kù)的設(shè)計(jì)中廣泛地使用了星形模式,如電信運(yùn)營(yíng)商中普遍進(jìn)行的話務(wù)總體分析。
3 系統(tǒng)中的數(shù)據(jù)倉(cāng)庫(kù)設(shè)計(jì)
3.1 廣東聯(lián)合電子結(jié)算中心操作型環(huán)境 DB2 數(shù)據(jù)庫(kù)服務(wù)器下的數(shù)據(jù)組織情況
在廣東聯(lián)合電子結(jié)算中心, “異常流水”、“流水拆分”、“流水上傳”有關(guān)的關(guān)系模式
l 粵通卡精確拆分結(jié)果明細(xì)表
tb_cardaccuratesplitresult (流水號(hào),工班, 出口路段…, 收入路段)
l 現(xiàn)金精確拆分結(jié)果明細(xì)表
tb_cashaccuratesplitresult (流水號(hào),工班, 出口路段…,收入路段)
l 流水非精確拆分記錄表
tb_inaccuratesplitrecord (流水號(hào),工班, 出口路段…, 收入路段)
l 拆分流水異常記錄表
tb_outlistspliterrorgb(流水號(hào),工班,出口路段, …,錯(cuò)誤類(lèi)型代碼)
l 拆分流水異常記錄歷史表
tb_outlistspliterrorgb_his(流水號(hào),工班,出口路段, …,錯(cuò)誤類(lèi)型代碼)
l 流水異常記錄表
tb_outlisterrorgb(流水號(hào),工班,出口路段, …,錯(cuò)誤類(lèi)型代碼)
l 流水異常記錄歷史表
tb_outlisterrorgb_his(流水號(hào),工班,出口路段, …,錯(cuò)誤類(lèi)型代碼)
l 出口流水表
tb_outlistgb (流水號(hào),工班,出口路段, …,上傳時(shí)間)
3.2 系統(tǒng)的中數(shù)據(jù)倉(cāng)庫(kù)設(shè)計(jì)
考慮到篇幅,各步驟經(jīng)過(guò)簡(jiǎn)化如下:
l 概念模型設(shè)計(jì)
l 邏輯模型設(shè)計(jì)
l 數(shù)據(jù)倉(cāng)庫(kù)生成
3.2.1概念模型設(shè)計(jì)中的界定系統(tǒng)邊界
在廣東電信公話中心,管理者最迫切進(jìn)行的分析主要有:
l 各高速公路路段公司不同工班的流水上傳、流水拆分。
l 分析各個(gè)高速公路路段公司上傳的異常流水(包含異常及拆分異常)、及其修改的情況;
要進(jìn)行以上的分析,所需數(shù)據(jù)應(yīng)包括:
l 分析各個(gè)高速公路路段公司在一段周期內(nèi)的流水上傳、拆分、異常總量、異常修改情況。
l 分析各個(gè)高速公路路段公司上傳的異常流水(包含異常及拆分異常)、及上傳的異常的流水(包含異常及拆分異常)流水的修改情況;
l 各個(gè)高速公路路段公司及他們的軟件開(kāi)發(fā)商
l 廣東省高速公路所有的路段信息;
3.2.2 邏輯模型設(shè)計(jì)
因?yàn)榧?xì)節(jié)級(jí)數(shù)據(jù)太大,數(shù)據(jù)倉(cāng)庫(kù)又建立在本人的PC機(jī)上 MS SQL SERVER 服務(wù)器上,加之迫于分析任務(wù)提交時(shí)間的壓力,故本數(shù)據(jù)倉(cāng)庫(kù)中不再涉及細(xì)節(jié)級(jí)數(shù)據(jù)表的設(shè)計(jì)、數(shù)據(jù)挖掘。
關(guān)系模式定義:
ok_xiugai (LISTNO, UPLOADTIME, OUTROADNO, SQUADDATE, ERRCODE, ERRMSG…)
no_xiugai (LISTNO, UPLOADTIME, OUTROADNO, SQUADDATE, ERRCODE, ERRMSG…)
upload_split(路段編碼, 路段名稱, 工班, 上傳流水?dāng)?shù)量, 拆分流水?dāng)?shù)量…)
kaifa (roadno, kaifa_name)
tb_road(areano,roadno,roadname,…)
3.2.3 數(shù)據(jù)倉(cāng)庫(kù)數(shù)據(jù)生成
數(shù)據(jù)倉(cāng)庫(kù)中數(shù)據(jù)的生成包括操作型環(huán)境數(shù)據(jù)的挖掘和數(shù)據(jù)倉(cāng)庫(kù)中數(shù)據(jù)的生成這兩部分的內(nèi)容。在這一步里所要做的工作是接口編程,以實(shí)現(xiàn)將操作型環(huán)境下的數(shù)據(jù)裝載進(jìn)入數(shù)據(jù)倉(cāng)庫(kù)環(huán)境。
4 數(shù)據(jù)倉(cāng)庫(kù)的數(shù)據(jù)導(dǎo)出與展現(xiàn)
4.1 萬(wàn)能數(shù)據(jù)庫(kù)查詢分析器
萬(wàn)能數(shù)據(jù)庫(kù)查詢分析器,中文版本《DB 查詢分析器》、英文版本《DBQuery Analyzer》。它具有強(qiáng)大的功能、友好的操作界面、良好的操作性、跨越各種數(shù)據(jù)庫(kù)平臺(tái)乃至于EXCEL和文本文件。
你可以通過(guò)它查詢ODBC數(shù)據(jù)源(包括世面上所有的數(shù)據(jù)庫(kù)、TXT/CSV文件、EXCEL文件)的數(shù)據(jù)。你可以同時(shí)執(zhí)行多條DML語(yǔ)句乃至存貯過(guò)程,結(jié)果會(huì)以你設(shè)定的表格、文本框、文件來(lái)返回。從數(shù)據(jù)庫(kù)導(dǎo)出千萬(wàn)條數(shù)據(jù)時(shí),效率與DBMS沒(méi)有什么區(qū)別。
《萬(wàn)能數(shù)據(jù)庫(kù)查詢分析器》中文版本《DB 查詢分析器》在中關(guān)村在線下載量超過(guò)10萬(wàn)次,位居整個(gè)數(shù)據(jù)庫(kù)類(lèi)排行榜中第8位,所以在實(shí)際工作中,本人用《DB 查詢分析器》作為客戶端,實(shí)現(xiàn)將數(shù)據(jù)倉(cāng)庫(kù)中的數(shù)據(jù)展現(xiàn)與導(dǎo)出。
4.2 本系統(tǒng)中的兩個(gè)主題的星形模式4.3 數(shù)據(jù)樣例示意
圖6 數(shù)據(jù)展現(xiàn)1
圖7 數(shù)據(jù)展現(xiàn)2
圖8 點(diǎn)擊“DB 查詢分析器”的工具欄按鈕,即可導(dǎo)出數(shù)據(jù)1
圖9 點(diǎn)擊“DB 查詢分析器”的工具欄按鈕,即可導(dǎo)出數(shù)據(jù)2
5 結(jié)束語(yǔ)
筆者在《廣東省高速公路一張網(wǎng)資金結(jié)算情況分析系統(tǒng)》的研究與開(kāi)發(fā)過(guò)程中,是數(shù)據(jù)倉(cāng)庫(kù)技術(shù)在實(shí)際工作中的又一次運(yùn)用。
參考文獻(xiàn):
[1] 馬根峰 · 萬(wàn)能數(shù)據(jù)庫(kù)查詢分析器中的事務(wù)管理在Oracle中的應(yīng)用· 上海:微型電腦應(yīng)用2008.4
[2] 新產(chǎn)品&工具點(diǎn)評(píng) 特別推薦:“萬(wàn)能數(shù)據(jù)庫(kù)查詢分析器”發(fā)布 · 程序員,2007.2
[3] 馬根峰 · DB QueryAnalyzer中的事務(wù)管理在DB2中的應(yīng)用· 北京:電腦編程技巧與維護(hù)2011.22
[4] 馬根峰 · 《DB 查詢分析器》批量執(zhí)行DML語(yǔ)句并返回更詳細(xì)的信息· 北京:電腦編程技巧與維護(hù)2011.24
[5] 王珊 · 數(shù)據(jù)倉(cāng)庫(kù)技術(shù)與聯(lián)機(jī)分析處理 · 北京:科學(xué)出版社,1998.6
[6] MichaelCorey(美),MichaelAbbey(美) · SQL SERVER 7 Data Warehousing · 北京:希望電子出版社,2000.1
[7] 袁鵬飛 · SQLServer 7.0數(shù)據(jù)庫(kù)系統(tǒng)管理與應(yīng)用開(kāi)發(fā) · 北京:人民郵電出版社,1999.5
聲明:本網(wǎng)頁(yè)內(nèi)容旨在傳播知識(shí),若有侵權(quán)等問(wèn)題請(qǐng)及時(shí)與本網(wǎng)聯(lián)系,我們將在第一時(shí)間刪除處理。TEL:177 7030 7066 E-MAIL:11247931@qq.com