2018年4月7日 星期六

計概01-03資訊科技的應用

1-3.1人工智慧

1-3.1.1人工智慧(Artificial Intelligence, AI)

定義

利用電腦程式來模擬人類的思考邏輯、行為模式與決策能力,具獨立思考的特性

發展過程

學習—感知—邏輯推理—統計分析—校正修改—行為動作

發展領域

機器人(Robot)、影像辨識(Image Recognition)、語音辨識(Speech Recognition)、電腦視覺(Computer Vision)、專家系統(Expert Systems)

範圍

人工智慧>機器學習>深度學習

 

1-3.1.1.1補充

影像辨識(Image Recognition)

影像比對,如:臉部辨識、指紋辨識、掌紋辨識、虹膜辨識。

專家系統(Expert Systems)

包含使用者介面、推論引擎、知識庫,如:探礦專家系統。

類神經網路(Artificial Neural Network)

模擬人類腦神經細胞網路的科學,如:語音合成與辨識、影像處理與分析。

模糊邏輯(Fuzzy Logic)

處理概念模糊不確定的事物,具容錯能力,如:Fuzzy智慧型洗衣機。

 

1-3.1.2機器學習(Machine Learning, ML)

定義

透過演算法,從大量資料中找出規律性,作為預測的依據。

機器學習的核心是演算法的集合。

分類

1.監督式學習(Supervised Learning):使用有標記(Labeled)的資料,利用演算法找出模型,可根據模型預測結果。演算法有回歸(regression)、分類(classification)

2.非監督式學習(Unsupervised Learning):使用無標記的資料,利用演算法找出模型,並將這些資料做出分類。演算法有降維(dimension reduction)、聚類(Clustering)

3.半監督式學習(Semi-supervised learning):介於監督學習與非監督學習之間。透過少數有標記的資料找出模型,並對其它資料進行分類。

4.增強式學習(Reinforcement Learning):隨環境變動而調整行為,以取得最大化的預期利益。演算法有Model-BasedModel-Free

 

1-3.1.3深度學習(Deep Learning, DL)

定義

利用多層次的人工神經網路,使用原始資料找出模型,並做出正確的預測。

方法

非線性演算法(分層演算法)

 

1-3.1.4自然語言處理(Natural Language Processing, NLP)

定義

讓電腦能妥善處理人類語言文字技術

目標

讓電腦和人類溝通順暢,完成任務。

 

1-3.2大數據分析

定義

將巨量資料藉由電腦進行統計、比對、分析而獲得客觀有用的資訊,協助企業掌握商業趨勢並輔助決策。

特性

4V

資料量大(Volume)

資料多樣性(Variety)

資料即時性(Velocity)

資料真實性(Veracity)

分析

1.數據統計:處理數據的第一步是獲得並儲存,若能儲存大量資料,只是簡單的描述統計,也有助於了解提供數據者的特徵。

2.資料探勘:使用人工智慧、機器學習等技術,讓機器協助人類在短時間內分析巨量資料,並找出其中規律的過程。應用於偵查、取得線索、追查犯罪者、預測犯罪地點。

分析

步驟

1.取得

2.儲存

3.運算

4.視覺化

工具

1.取得工具:Google FormSurveyCake

2.儲存工具:Apache Hadoop

3.分析工具:Hadoop MapReduceSpark

4.視覺化工具:TableauWordcloud

憂患

隱私。企業在蒐集數據前,應告知使用者將提供何種數據給第三方,以及數據可能的使用方式,並應維護使用者的隱私權。

趨勢

快速掌握現在局勢、推斷未來走向。

掌握最新情報,在危機發生時第一時間反應,作好危機處理降低風險。

 

1-3.3區塊鏈(Block Chain)

起源

中本聰(Satoshi Nakamoto)的比特幣(Bitcoin)

定義

又稱價值網際網路,藉由密碼學(雜湊函數)串接及保護內容的串聯紀錄,每一個區塊皆包含前一個區塊的加密函數、交易訊息及時間。

種類

公有鏈:可自由加入。

私有鏈:僅特定對象加入。

聯盟鏈:聯盟成員,私有鏈之擴充。

核心

處理

要素

1.分散式共享帳簿交易鏈(Shared Ledger)

2.智慧合約(Smart contract)

3.隱私安全

4.共識演算法

 (1)工作量證明(Proof of Work, PoW)

 (2)權益證明(Proof of Stake, PoS)

 (3)權益授權證明(Delegated Proof of Stake, DPoS)

 (4)實用拜占庭容錯(Practical Byzantine Fault Tolerance, PBFT)

特性

去中心化、可溯性、開放性、獨立性、安全性、匿名性

說明

利用非對稱式公鑰和私鑰技術。

比特幣區塊鏈使用橢圓曲線密碼術。

 

1-3.4資料倉儲(Data Warehouse)

提出

1990年,資料倉儲之父W. H. Inmon提出。

主要

功能

將透過資訊系統線上交易處理(OLTP)長期累積的大量資料,運用資料倉儲理論特有的資料儲存架構,做有系統的分析整理,以利各種分析方法如線上分析處理(OLAP)、資料探勘(Data Mining)之進行,進而支援如決策支援系統(DSS)、主管資訊系統(EIS)之建立,幫助決策者快速有效的自大量資料中,分析出有價值的資訊,以利擬定決策及快速回應外在環境變動,幫助建構商業智慧型(BI)

架構

1.可由關聯式資料庫,或專為資料倉儲開發的多維資料庫建立。

2.若由多維資料庫建立,架構分為星狀(Star Schema)及雪花狀(Snowflake Schema),包含數個維度資料表,及一個事實資料表。

特性

1.主題導向(Subject-Oriented):資料倉儲的資料著重於按其意義,歸類至相同的主題區。

2.整合性(Integrated):資料倉儲的資料會從不同的資料來源整合而來並維持一致的條理。

3.時間差異性(Time-Variant):資料倉儲會累積隨著資料變化的動態資料,因為累積了許多歷史新資料。

4.不變動性(Nonvolatile):資料一旦存入資料倉儲就會被保留下來,即使資料有錯誤也不會被取代或刪除。

※資料倉儲的容量,隨著儲存年度的增加而逐漸擴增。

 

1-3.5資料探勘(Data Mining)

定義

運用人工智慧、機器學習、統計學和資料庫的交叉方法,在大型資料集中發現模式的計算過程。

從大量的資料中自動搜尋隱藏於其中有特殊關聯性的訊息。

任務

1.異常檢測(異常/變化/偏差檢測)

2.關聯規則學習(依賴建模)

3.聚類。

4.分類。

5.回歸。

6.匯總。

方法

監督式學習、非監督式學習、半監督學習、增強學習。

1.監督式學習:分類、估計、預測。

2.非監督式學習:聚類,關聯規則分析。

 

1-3.6物聯網(Internet of Things, IoT)

源起

1998年,Kevin Ashton提出

簡介

運用感測器、應用程式介面(API)將物件和設備互聯的網路。

智慧型手機是操控中樞。

具備通用唯一辨識碼(UID),透過網路傳輸資料,不需人機互動。

架構

歐洲電信標準協會(European Telecommunications Standards Institute, ETSI)分三層。

底層:感知層/感測層(Sensors & Actuators),感知數據資料。

中層:網路層(Interconnection),接收感知層的數據資料,並傳送至應用層。

上層:應用層(Models & Analytics),將接收到的數據資料,作最有效的運用,最貼近現實生活。

服務

型態

互聯網:用戶與雲端資訊連結關係,雲端為服務中心。

物聯網:用戶與實體資訊連結關係,用戶為服務中心。

沒有留言:

張貼留言

計概01-04資料處理-檢定試題

【丙級電腦軟體應用試題】 【 2 】 01. 將類似資料收集起來於固定時間一起處理的作業方式,稱為 (1) 即時處理 (2) 批次處理 (3) 分時處理 (4) 連線處理。 [1010416-14] 即時處理:電腦系統收到資料或命令後,立即進行處理,並在最短時間內...