21.文件系統(GFS)通過( )方式提高可靠性。
A.雙備份 B.冗余 C.日志 D.校驗碼
22.建立在相關關系分析法基礎上的預測是大數據的( )。
A.基礎 B.前提 C.核心 D.條件
23.下列關于聚類挖掘技術的說法中,錯誤的是( )。
A.不預先設定數據歸類類目,完全根據數據本身性質將數據聚合成不同類別
B.要求同類數據的內容相似度盡可能小
C.要求不同類數據的內容相似度盡可能小
D.與分類挖掘技術相似的是,都是要對數據進行分類處理
24.大數據的結構類型不包括( )。
A.完全結構化 B.非結構化
C.半結構化 D.結構化
25.下列關于舍恩伯格對大數據特點的說法中,錯誤的是( )。
A.數據規模大 B.數據類型多樣
C.數據處理速度快 D.數據價值密度高
21.【答案】B。解析:為了提高數據可靠性,采用的方式是:對冷數據進行編碼冗余,對熱數據進行副本冗余。
22.【答案】C。解析:建立在相關關系分析法基礎上的預測是“大數據分析的核心”。
23.【答案】B。解析:聚類挖掘技術就是根據實體的特征將其分為不同的類別,所以要求是同類數據的內容相似度盡可能大,這樣更加方便于分類。
24.【答案】A。解析:大數據的數據類型包括結構化、半結構化和非結構化。
25.【答案】D。解析:大數據的特點有:數據容量大(Volume):數據的大小決定所考慮的數據的價值和潛在的信息;數據種類多種類(Variety):數據類型的多樣性;數據處理速度快(Velocity):指獲得數據的速度;可變性(Variability):妨礙了處理和有效地管理數據的過程。真實性(Veracity):數據的質量。復雜性(Complexity):數據量巨大,來源多渠道。價值(value):價值密度低,價值密度的高低與數據總量的大小成反比。
2022年四川國企招錄信息歡迎關注四川國企考試頻道,或關注四川中公國企微信公眾號(scgqzp),及時掌握國企招考資訊!
免責聲明:本站所提供試題均來源于網友提供或網絡搜集,由本站編輯整理,僅供個人研究、交流學習使用,不涉及商業盈利目的。如涉及版權問題,請聯系本站管理員予以更改或刪除。