點(diǎn)擊查看:2018全國計(jì)算機(jī)四級(jí)數(shù)據(jù)庫工程師過關(guān)試題及答案匯總
1 . 什么是并行數(shù)據(jù)庫系統(tǒng)? (填空題)
答案
答案要點(diǎn):并行數(shù)據(jù)庫系統(tǒng)是在并行機(jī)上運(yùn)行的具有并行處理能力的數(shù)據(jù)庫系統(tǒng)。并行數(shù)據(jù)庫系統(tǒng)是數(shù)據(jù)庫技術(shù)與并行計(jì)算技術(shù)相結(jié)合的產(chǎn)物。
2 . 試述并行數(shù)據(jù)庫系統(tǒng)的研制目標(biāo)。 (填空題)
答案
答案要點(diǎn):并行數(shù)據(jù)庫系統(tǒng)該實(shí)現(xiàn)如下目標(biāo): ? 高性能 并行數(shù)據(jù)庫系統(tǒng)通過將數(shù)據(jù)庫管理技術(shù)與并行處理技術(shù)有機(jī)結(jié)合,發(fā)揮多處理機(jī)結(jié)構(gòu)的優(yōu)勢(shì),提供比相應(yīng)的大型機(jī)系統(tǒng)更高的性能價(jià)格比和可用性。 ? 高可用性 并行數(shù)據(jù)庫系統(tǒng)可通過數(shù)據(jù)復(fù)制來增強(qiáng)數(shù)據(jù)庫的可用性。 ? 可擴(kuò)充性系統(tǒng)通過增加處理和存儲(chǔ)能力來平滑地?cái)U(kuò)展性能,應(yīng)具有線性伸縮比和線性加速比。具體說明可參考《概論》15.2。
3 . 什么是并行數(shù)據(jù)庫系統(tǒng)的伸縮比和加速比? (填空題)
答案
答案要點(diǎn): 線性伸縮比是指當(dāng)任務(wù)擴(kuò)大N倍,系統(tǒng)處理和存儲(chǔ)能力也擴(kuò)大N倍時(shí)系統(tǒng)性能不變。線性伸縮比= (小任務(wù)在小系統(tǒng)上的運(yùn)行時(shí)間)/(大(N倍)任務(wù)在大任務(wù)上的運(yùn)行時(shí)間)=1 線性加速比是指當(dāng)任務(wù)不變而系統(tǒng)處理和存儲(chǔ)能力擴(kuò)大N倍時(shí),系統(tǒng)性能也提高N倍。線性加速比= (小系統(tǒng)上執(zhí)行一個(gè)任務(wù)的時(shí)間)/(大(N倍)系統(tǒng)上執(zhí)行同一任務(wù)的時(shí)間)=N
4 . 并行數(shù)據(jù)庫系統(tǒng)有哪幾種體系結(jié)構(gòu)?試比較它們的特點(diǎn)。 (填空題)
答案
答案要點(diǎn):從硬件結(jié)構(gòu)來看,根據(jù)處理機(jī)與磁盤、內(nèi)存的相互關(guān)系可以將并行計(jì)算機(jī)分為三種基本的體系結(jié)構(gòu): ?共享內(nèi)存結(jié)構(gòu)(SM); ?共享磁盤結(jié)構(gòu)(SD); ?無共享資源結(jié)構(gòu)(SN)。此外還有混合結(jié)構(gòu),即整個(gè)系統(tǒng)是Shared_Nothing結(jié)構(gòu)而每個(gè)結(jié)點(diǎn)是Shared_Memory結(jié)構(gòu)。這種結(jié)構(gòu)綜合了SM與SN的優(yōu)點(diǎn)。 (1) SM并行結(jié)構(gòu) SM并行結(jié)構(gòu)由多個(gè)處理機(jī)、一個(gè)共享內(nèi)存(主存儲(chǔ)器)和多個(gè)磁盤存儲(chǔ)器構(gòu)成。多處理機(jī)和共享內(nèi)存由高速通訊網(wǎng)絡(luò)連接,每個(gè)處理機(jī)可直接存取一個(gè)或多個(gè)磁盤,即所有內(nèi)存與磁盤為所有處理機(jī)共享。 (2) SD并行結(jié)構(gòu) SD并行結(jié)構(gòu)由多個(gè)具有獨(dú)立內(nèi)存的處理機(jī)和多個(gè)磁盤構(gòu)成。每個(gè)處理機(jī)都可以讀寫任何磁盤。 (3) SN并行結(jié)構(gòu) SN并行結(jié)構(gòu)由多個(gè)處理節(jié)點(diǎn)構(gòu)成。每個(gè)處理節(jié)點(diǎn)具有自己獨(dú)立的處理機(jī)、內(nèi)存和磁盤存儲(chǔ)器。多個(gè)處理機(jī)結(jié)點(diǎn)由高速通信網(wǎng)絡(luò)連接。并行數(shù)據(jù)庫系統(tǒng)體系結(jié)構(gòu)的詳細(xì)說明可參考《概論》15.3.1、15.3.2、15.3.3。
5 . 闡述并行數(shù)據(jù)庫系統(tǒng)中并行粒度的概念。 (填空題)
答案
答案要點(diǎn): 并行粒度是用來刻畫查詢執(zhí)行的并行程度,有四種并行粒度:不同用戶事務(wù)間的并行性、同一事務(wù)內(nèi)不同查詢間的并行性、同一查詢內(nèi)不同操作間的并行性和同一操作內(nèi)的并行性。具體說明可參考《概論》15.4.1。
6 . 舉例說明水平并行和垂直并行的概念。 (填空題)
答案
水平并行化指:互相獨(dú)立的多個(gè)操作或者一個(gè)操作內(nèi)互相獨(dú)立的多個(gè)子操作分別由不同的處理機(jī)并行執(zhí)行的形式。如果兩個(gè)操作OP1和OP2之間沒有數(shù)據(jù)的依賴關(guān)系,這兩個(gè)操作可以獨(dú)立地并行執(zhí)行。例如圖(a)中對(duì)不同表的掃描操作Scan S和Scan P,由不同的處理機(jī)并行執(zhí)行就是水平并行化的實(shí)例。如果把操作的輸入數(shù)據(jù)分解為多個(gè)子集,該操作就可以分成多個(gè)獨(dú)立的子操作,每個(gè)子操作只處理一部分?jǐn)?shù)據(jù),這種針對(duì)單個(gè)操作的并行被稱為操作內(nèi)并行。例如圖(c)中的Scan S和Sort S都被分解成三個(gè)子操作,每個(gè)子操作只對(duì)部分?jǐn)?shù)據(jù)進(jìn)行掃描和排序。如果一個(gè)操作的輸出流是另一個(gè)操作的輸入流,這兩個(gè)操作之間就存在著流水線并行性,操作間流水線并行又被直觀地稱為垂直并行。垂直并行化也就是指存在流水線方式依賴關(guān)系的操作分別由不同處理機(jī)并行執(zhí)行的形式。例如圖(b)中的四個(gè)操作都可以采用流水線方式并行執(zhí)行。詳細(xì)說明可參考《概論》15.4.2。
7 . 并行數(shù)據(jù)庫系統(tǒng)中并行查詢優(yōu)化的必要性和困難何在? (填空題)
答案
答案要點(diǎn): 查詢優(yōu)化始終是數(shù)據(jù)庫管理系統(tǒng)的重要組成部分,查詢優(yōu)化的目標(biāo)在于提高執(zhí)行效率。由于并行數(shù)據(jù)庫環(huán)境中存在多個(gè)處理機(jī),并行查詢優(yōu)化應(yīng)盡可能地使每個(gè)操作并行處理,充分利用系統(tǒng)資源提高并行度來達(dá)到提高系統(tǒng)性能的目的。并行查詢優(yōu)化面臨的兩大困難在于:(1) 執(zhí)行計(jì)劃的搜索空間十分龐大(2) 執(zhí)行時(shí)的某些系統(tǒng)參數(shù)比如CPU數(shù)目、內(nèi)存大小在優(yōu)化時(shí)是未知的。具體說明可參考《概論》15.4.4。
8 . 試述數(shù)據(jù)劃分在并行查詢處理中的重要性。 (填空題)
答案
答案要點(diǎn):數(shù)據(jù)劃分是并行查詢處理的重要基礎(chǔ)。研究和實(shí)際表明,數(shù)據(jù)劃分對(duì)于并行數(shù)據(jù)庫系統(tǒng)的性能具有很大的影響。通過將每個(gè)關(guān)系的數(shù)據(jù)劃分為小的片段,并把這些小片段均勻地分布在系統(tǒng)的多個(gè)磁盤驅(qū)動(dòng)器上可以降低數(shù)據(jù)的聚集度,使得每個(gè)操作能夠由多個(gè)處理機(jī)來承擔(dān),從而減少查詢的響應(yīng)時(shí)間并提高整個(gè)系統(tǒng)的吞吐量。若負(fù)載不均,往往會(huì)造成多個(gè)處理機(jī)結(jié)點(diǎn)能力的浪費(fèi)。所以使用正確的數(shù)據(jù)分布算法以達(dá)到負(fù)載均衡是并行數(shù)據(jù)庫中數(shù)據(jù)分布的關(guān)鍵問題。具體說明可參考《概論》15.5.1。
9 . 并行數(shù)據(jù)庫系統(tǒng)中有哪幾種常用的數(shù)據(jù)劃分方法? (填空題)
答案
答案要點(diǎn):劃分?jǐn)?shù)據(jù)時(shí)可以依據(jù)一個(gè)屬性的值,也可以同時(shí)依據(jù)多個(gè)屬性的值,前者稱為一維數(shù)據(jù)劃分,后者則稱為多維數(shù)據(jù)劃分。一維數(shù)據(jù)劃分方法相對(duì)比較簡單,常用的數(shù)據(jù)劃分方法有: ?輪轉(zhuǎn)法 ?Hash法 ?值域劃分法此外,還有用戶定義的劃分法、模式劃分法、Hybrid_Range劃分法等。具體說明可參考《概論》15.5.1。
10 . 試述并行數(shù)據(jù)庫系統(tǒng)與分布式數(shù)據(jù)庫系統(tǒng)的區(qū)別。 (填空題)
答案
答案要點(diǎn):分布式數(shù)據(jù)庫系統(tǒng)與并行數(shù)據(jù)庫系統(tǒng)特別是與SN結(jié)構(gòu)的并行數(shù)據(jù)庫系統(tǒng)具有很多相似點(diǎn): ? 它們都是用網(wǎng)絡(luò)連接各個(gè)數(shù)據(jù)處理結(jié)點(diǎn); ? 整個(gè)網(wǎng)絡(luò)中的所有結(jié)點(diǎn)構(gòu)成一個(gè)邏輯上統(tǒng)一的整體; ? 用戶可以對(duì)各個(gè)結(jié)點(diǎn)上的數(shù)據(jù)進(jìn)行透明存取等等。分布式數(shù)據(jù)庫系統(tǒng)和并行數(shù)據(jù)庫系統(tǒng)的應(yīng)用目標(biāo)和具體實(shí)現(xiàn)方法不同,使得它們具有很大的不同: ? 應(yīng)用目標(biāo)不同并行數(shù)據(jù)庫系統(tǒng)的目標(biāo)是充分發(fā)揮并行計(jì)算機(jī)的優(yōu)勢(shì),利用各個(gè)處理機(jī)結(jié)點(diǎn)并行地完成任務(wù),提高系統(tǒng)的整體性能。分布式數(shù)據(jù)庫系統(tǒng)的目標(biāo)是實(shí)現(xiàn)場(chǎng)地自治和數(shù)據(jù)的全局透明共享,而不要求利用網(wǎng)絡(luò)中的各個(gè)結(jié)點(diǎn)來提高系統(tǒng)處理性能。 ? 實(shí)現(xiàn)方式不同在并行數(shù)據(jù)庫系統(tǒng)中各結(jié)點(diǎn)間采用高速網(wǎng)絡(luò)互連,結(jié)點(diǎn)間的數(shù)據(jù)傳輸代價(jià)相對(duì)較低,因此當(dāng)某些結(jié)點(diǎn)處于空閑狀態(tài)時(shí),可以將工作負(fù)載過大的結(jié)點(diǎn)上的部分任務(wù)通過高速網(wǎng)傳送給空閑結(jié)點(diǎn)處理,從而實(shí)現(xiàn)系統(tǒng)的負(fù)載平衡。在分布式數(shù)據(jù)庫系統(tǒng)中,各結(jié)點(diǎn)間一般采用局域網(wǎng)或廣域網(wǎng)相連,網(wǎng)絡(luò)帶寬較低,點(diǎn)到點(diǎn)的通信開銷較大,因此在查詢處理時(shí)一般應(yīng)盡量減少結(jié)點(diǎn)間的數(shù)據(jù)傳輸量。 ? 各結(jié)點(diǎn)的地位不同在并行數(shù)據(jù)庫系統(tǒng)中,不存在全局應(yīng)用和局部應(yīng)用的概念。各結(jié)點(diǎn)是非獨(dú)立的。而在分布式數(shù)據(jù)庫系統(tǒng)中,各結(jié)點(diǎn)除了能通過網(wǎng)絡(luò)協(xié)同完成全局事務(wù)外,更重要的是各結(jié)點(diǎn)具有場(chǎng)地自治性。
微信搜索"考試吧"了解更多考試資訊、下載備考資料
相關(guān)推薦:
2018年9月全國計(jì)算機(jī)等級(jí)考試試題匯總(各科目)
2018年全國計(jì)算機(jī)等級(jí)考試必做試題匯總(各科目)
2018年全國計(jì)算機(jī)等級(jí)考試復(fù)習(xí)知識(shí)點(diǎn)匯總(各科目)
北京 | 天津 | 上海 | 江蘇 | 山東 |
安徽 | 浙江 | 江西 | 福建 | 深圳 |
廣東 | 河北 | 湖南 | 廣西 | 河南 |
海南 | 湖北 | 四川 | 重慶 | 云南 |
貴州 | 西藏 | 新疆 | 陜西 | 山西 |
寧夏 | 甘肅 | 青海 | 遼寧 | 吉林 |
黑龍江 | 內(nèi)蒙古 |