2018年4月7日 星期六

計概01-04資料處理-公職試題

【選擇題】

D01.下列何項工作,較適合即時處理的作業方式? (A)電費繳納通知單 (B)薪資發放作業 (C)年度報表的列印 (D)網路訂票作業。[111鐵路員級]

即時處理(Real-time):立即處理和回應,如資料查詢、訂位系統、ATM系統、導航系統、網路訂票作業。

 

A02.銀行在處理信用卡用戶的帳單時,採取每個月一次印製與寄發所有客戶的繳費單。這樣的資料處理方式與下面那種類型系統的設計概念相同? (A)批次系統(batch system) (B)分散式系統(distributed system) (C)即時系統(real-time system) (D)分時系統(time-sharing system)[113關務四等]

批次系統:收集大量資料後再一次處理完畢,如水電費帳單,電腦閱卷,薪資作業。


計概01-04資料處理

過程

IPOS:輸入(Input)、處理(Process)、輸出(Output)、儲存(Storage)

   資料(Data)    →   資訊(Information)

名詞

電子資料處理(EDP, Electronic Data Process):透過電腦來處理資料

GIGO(Garbage In Garbage Out):垃圾進垃圾出,強調輸入正確資料的重要性。

型態

整批處理

(批次Batch)

收集大量資料後再一次處理完畢

水電費帳單,電腦閱卷,薪資作業

即時處理

(Real-time)

立即處理和回應

資料查詢,訂位系統,ATM系統,導航系統

分時處理

(Time-sharing)

輪流使用CPU

同時上網和列印資料

交談式處理

(Interactive)

系統與使用者一問一答

自動櫃員機

連線處理

(Online)

CPU和輸出入設備隨時保持連結

網路銀行轉帳,線上查詢系統

離線處理

(Offline)

CPU和輸出入設備未保持連結

離線瀏覽網頁

集中處理

(Central)

集中於某一部電腦處理

網路線上測驗

分散處理

(Distributed)

分散各地的電腦處理

選舉的投開票

主從式處理

提供資源服務的伺服主機與使用資源的客戶端,如:FTP伺服器

1.即時處理一定是連線處理;連線處理不一定是即時處理。

2.自動櫃員機(ATM)具即時、連線、交談式處理。

3.網路線上測驗具即時、連線、集中處理。

4.購票系統具即時、連線、交談式、集中/分散處理。

計概01-03資訊科技的應用-檢定試題

【丙級電腦軟體應用試題】

101.常用於大數據(Big Data)分析工具Hadoop中的MapReduce架構主要是執行哪一項功能? (1)運算處理(Process) (2)叢集(Cluster) (3)互動(Interaction) (4)儲存(Store)[1060319-07]

 

202.進行大數據(Big Data)分析時,通常應該使用多少資料來分析? (1)變化量較快的30%資料 (2)盡量使用全部資料 (3)最近儲存時間的30%資料 (4)單筆資料量較大的前30%資料。[1070415-64]

 

103.大數據(Big Data)分析技術中,常使用NoSQL資料庫,下列哪一個是屬於NoSQL資料庫軟體? (1)MongoDB (2)PostgreSQL (3)MariaDB (4)Sybase[1080317-30]

 

104.大數據(Big Data)分析的標的來源為何? (1)原始數據(Raw Data) (2)隨機取夠多樣本即可 (3)依據統計理論取樣本 (4)分類取樣本。[1090315-53]

 

105.大數據(Big Data)分析方式中,最能夠直觀呈現大數據特點的方法是 (1)可視化分析(Visibility Analysis) (2)預測性分析(Predictive Analysis) (3)資料管理分析(Data Management Analysis) (4)資料探勘(Data Mining)[1090315-56]

 

406.大數據(Big Data)對於即時性的資料可以快速加入分析,這特性指的是 (1)Veracity (2)Volume (3)Variety (4)Velocity[1110320-68]

 

207.大數據(Big Data)分析中的"大量數據",指的是哪個特性? (1)Variety (2)Volume (3)Veracity (4)Velocity[1130414-42]

 

108.有關物聯網之應用層的敘述,下列何者正確? (1)可提供智慧生活的應用 (2)負責將感測的資訊傳到雲端 (3)可用於感測溫溼度 (4)提供物與物之間的訊號傳輸。[1100320-31]

 

409.關於Apache Spark運件的敘述,下列何者正確? (1)程式只能在記憶體內做運算 (2)非常不適合用於機器學習演算法 (3)程式只能在磁碟內做運算 (4)能將資料加載至叢集記憶體內,並可多次對其進行查詢。[1090315-52]

 

310.對於適用大數據分析的叢集運算框架Apache Spark專案中,下列哪項組件是專做分散式機器學習的? (1)GraphX (2)Spark Streamong (3)Spark Mllib (4)Spark SQL[1090412-36]

 

【乙級電腦軟體應用試題】

401.大數據(Big Data)分析的數據多屬於非結構化全數據(Raw Data),很難做到大量資料Schema的規劃及異動資料庫的擴展,因此大多採用NoSQL工具。NoSQL工具使用哪一種模式來解決這樣的問題? (1)Row Based (2)Column Based (3)Multi-Level Fields (4)Key-Value[1060716-58]

 

402.存取大數據(Big Data)經常採用NoSQL,下列何者是NoSQL的特點? (1)資料表的模式須固定 (2)只能使用結構化查詢語言 (3)不能Scale out儲存容量 (4)採用非同步的複製。[1061106-33]

 

103.大數據(Big Data)分析大多分為兩階段分析,第一階段為全數據分析,提取指標數據,第二階段將提取指標數據進行測試、優化、建模、分析。下列哪項工具適合使用在第一階段? (1)Hadoop (2)Mathlab (3)Python (4)R[1070318-02]

 

404.大數據分析工具Spark框架之重要特色為所有的運算都在記憶體中執行,這樣的技術稱為 (1)Ubiquitous Computing (2)Distributed Computing (3)Build-In Computing (4)In-Memory Computing[1081103-45]

 

205.從大數據(Big Data)的觀點來看,下列關於資料價值的敘述,何者正確? (1)政府公開的資料沒有價值 (2)臉書(Facebook)表情符號的點擊數是有價值  (3)資料廢氣(Data Exhaust)沒有價值 (4)資料擺久一定不會貶值。[1101219-35]

 

106.大數據分析工具Spark框架的核心將資料抽象化成資料集,以直接在多台機器的記憶體處理資料,這樣的資料集稱為 (1)Resilient Distributed Dataset (2)In-Memory Dataset (3)Distributed In-Memory Dataset (4)In-Memory Distributed Dataset[1131103-41]

 

107.IBM提出下列何種概念,可視為物聯網的雛型? (1)智慧地球 (2)智慧城市 (3)感知城市 (4)感知地球。[1060319-22]

 

108.歐洲電信標準協會(ETSI)將物聯網分成三個階層,智慧交通系統的使用者介面屬於下列哪一層? (1)應用層 (2)感知層 (3)傳輸層 (4)網路層。[1060319-25]

 

109.有關物聯網的敘述,下列何者正確? (1)物聯網可賦予物件擁有與其他物件或人溝通的能力 (2)美國提出的感知美國概念為物聯網之雛型 (3)GPRS最適合用於物聯網的物件進行資料通訊 (4)IBM提出的感知地球概念為物聯網之雛型。[1081103-02]

 

410.物聯網(IoT)通訊物件通常具備移動性,為支援這樣的通訊特性,需求的網路技術主要為下列何者? (1)網路運算 (2)跨網域運算能力 (3)分散式運算 (4)物件動態連結。[1101219-59]

 

111.在物聯網的概念中,下列何者屬於網路層的技術? (1)雲端運算技術 (2)智能電網 (3)遠端醫療 (4)射頻辨識標籤。[1111106-41]

 

412.下列何者不是「資料倉儲(Data Warehouse)」的主要資料模型(Data Model) (1)星狀模型(Star Schema) (2)雪花狀模型(Snowflake Schema) (3)星座模型(Constellation Schema) (4)階層模型(Hierarchical Schema)[1001113]

 

113.下列何者不是「資料倉儲(Data Warehouse)」的主要特性? (1)揮發性(Volatile) (2)時間變動性(Time-Variant) (3)整合性(Integrated) (4)主題導向(Subject-Oriented)[1070318-35]

資料倉儲的特性:主題導向(Subject-Oriented)、整合性(Integrated)、時間差異性(Time-Variant)、不變動性(Nonvolatile)

 

114.下列關於「資料探勘(Data-Mining)」的敘述,何者不正確? (1)通常直接對交易型資料庫(Transaction Database)進行資料探勘 (2)序列探索(Sequence Discovery)可以依據客戶的訂購歷史來預測客戶即將購買的商品 (3)統計方法、人工智慧技術、資料庫技術是核心基礎 (4)關聯法則分析(Association Rule Analysis)可以用來瞭解哪些商品經常被一起購買。[1060319-17]

 

12415.下列哪些是資料探勘(Data Mining)的應用?(複選) (1)根據過去屬性觀察值來預測該屬性之未來值 (2)使用統計分析方法尋找資料中有用的特徵及關連性 (3)協助尋找遺漏的歷史資料 (4)按照屬性分門別類建立類組。[1091101-78]

 

計概01-04資料處理-檢定試題

【丙級電腦軟體應用試題】 【 2 】 01. 將類似資料收集起來於固定時間一起處理的作業方式,稱為 (1) 即時處理 (2) 批次處理 (3) 分時處理 (4) 連線處理。 [1010416-14] 即時處理:電腦系統收到資料或命令後,立即進行處理,並在最短時間內...