Professional Documents
Culture Documents
資料庫系統理論與設計實務
Database System: Concept,
Design, and Implementation
第 1 章 檔案 處理與 資料 庫
• 1-1 資料與資料處理
• 1-2 資料庫
• 1-3 檔案處理與資料庫系統
• 1-4 資料庫系統發展的歷史演進
• 1-5 資料庫技術的發展趨勢
1-1 資料與資 料處 理
• 1-1-1 資料
• 1-1-2 資訊
• 1-1-3 資料處理
• 1-1-4 資料階層
1-1-1 資料 - 定義
• 「資料」( Data )是指收集但是沒有經過
整理和分析的原始數值、文字或符號,它
是資訊的原始型態。
「 ANSI 」( American National
Standards Institute )定義的資料,如下
:
– 資料是使用正規方式所代表的事實、概念或指
令,可以適用人類或程式間進行通訊、解釋和
處理。
– 資料可以代表一些特性或數量,換句話說,我
們可以針對資料執行一些操作來轉換成資訊,
這就是「資料處理」( Data Processing )。
1-1-1 資料 - 範例
• 資料本身並沒有意義,需要經過處理後,才會成
為有意義的資料,也就是資訊。資料可以是一堆
文件或報紙,整個公司的員工記錄、多種不同的
開會記錄、整個醫院病歷資料或整班學生的成績
資料。例如:整班學生必修課的一疊成績資料,
如下圖所示:
1-1-2 資訊
• 「資訊」( Information )是經過處理的資料,
在經過整理和分析後,就可以成為有用或可供決
策的資訊。換句話說,資料是資訊的原始型態,
資訊是處理後的有意義資料,如下圖所示:
1-1-3 資料 處理
• 「資料處理」( Data Processing )是使用 ! 特
定方法將資料轉換成資訊的過程,我們需要將資
料進行搜尋、排序、分類、計算、收集、選取或
結合等操作,以便產生所需的資訊,如下圖所
示:
1-1-4 資料 階層 - 說明
• 資料階層一共分成六個階層:位元、位元組、欄
位、記錄、檔案和資料庫,如下圖所示:
1-1-4 資料 階層 - 位元
( Bits )
• 電腦的資料是使用二進位的 0 或 1 ,每一
個 0 或 1 是最小的儲存單位,也就是位元
。
1-1-4 資料 階層 - 位元 組
( Bytes )
• 位元組是組合 8 個位元,或稱為字元
( Character ),這是一般電腦記憶體的
最小單位,也是電腦檔案儲存資料的最小
單位。
1-1-4 資料 階層 - 欄位
( Fields )
• 欄位是由 1 或多個位元組或字元組成,屬
於相同性質資料組成的資料項目,以欄位
名稱來識別。例如:一組字元組成的字
串 "Joe" 和 "Chen" ,可以使用欄位名
稱 " 姓名 " 來識別,或數值 33 、 29 ,可
以使用欄位名稱 " 年齡 " 來識別等。
1-1-4 資料階層 - 記錄
( Records )
• 在欄位之後是記錄,記錄是相關欄位的集
合,記錄的欄位是儲存「實體」
( Entity )的一些「屬性」
( Attributes )值,實體是用來描述真實
世界的東西。例如:學生實體,欄位是學
生的屬性,即前述的欄位階層。
• 記錄則為學生的詳細資料。
– 例如:姓名、年齡、地址等欄位的值。
1-1-4 資料 階層 - 檔案
( Files )
• 如果記錄是欄位的集合,檔案就是相關聯
記錄的集合,檔案是以檔案名稱儲存在電
腦周邊裝置的磁碟。程式設計者可以撰寫
電腦程式使用檔案名稱來開啟和存取檔案
內容的記錄,其相關操作如下所示:
– 讀取記錄。
– 更新記錄。
– 新增記錄。
– 刪除記錄。
1-1-4 資料階 層 - 資料庫
( Database )
• 最後一階的資料階層是本書的主題:資料
庫,資料庫是相關檔案的集合,使用「資
料庫管理系統」( Database
Management System )集中管理資料庫
中儲存的資料。
1-2 資料庫
• 1-2-1 資料庫的定義
• 1-2-2 資料塑模( Data Modeling )
• 1-2-3 資料庫資料的三個層次
1-2 資料庫 - 說明
• 資料庫系統是由「資料庫」( Database )和
「資料庫管理系統」( Database Mangement
System , DBMS )所組成,如下圖所示:
1-2 資料庫 - 其儲 存的 資料
• 資料庫儲存的資料包括:資料和資料本身
的定義,這是資料本身的描述資料,稱為
「中繼資料」( Meta-data , The data
about data )。
• 通常這些資料是使用不同檔案來分開儲存
,所以在資料階層的資料庫是一個相關聯
檔案的集合。
1-2-1 資料 庫的定 義 - 範例
• 「資料庫」( Database )這個名詞是一個概念
,在資料階層是一種資料儲存方式,一些組織的
資料集合。有很多我們現成擁有或一些常常使用
的資料集合,都可以稱為資料庫,如下所示:
– 在 Word 文件中的通訊錄資料。
– 使用 Excel 管理的學生成績資料。
– 一個將資料儲存在大型檔案的應用程式,在應用程式
提供相關功能來維護和分析資料。
– 銀行的帳戶資料和交易資料。
– 醫院的病人資料。
– 大學的學生、課程、選課和教授資料。
– 電信公司的帳單資料。
1-2-1 資料 庫的定 義 - 通用定
義
• 資料庫正式的定義有很多種,比較通用的定義,
如下所示:
定義 1.1 :資料 庫( Database )是一 個儲存
資料的 電子文 件檔 案櫃( An Electronic
Filing Cabinet )。
• 電子文件檔案櫃用來儲存的資料是:
– 結構化( Structured )
– 整合的( Integrated )
– 相關聯( Interrelated )
– 共享( Shared )
– 可控制( Controlled )
1-2-1 資料 庫的定 義 - 長存資
料( Persistent Data )
• 在企業或組織的資料庫,其儲存的大量資料並非
是一種短暫儲存的暫時資料,而是一種長時間存
在的資料,稱為「長存資料」( Persistent
Data ),這些資料是維持企業或組織正常運作的
重要資料,如下所示:
– 通常組織中的資料需要一些操作或運算來維護資料,
例如:公司員工有人離職或新進員工,所以員工資料
一定需要新增、刪除操作來維護資料。
– 資料是相關聯的,例如:員工資料和出勤資料是相關
聯的,一位員工擁有一份出勤資料。
– 資料不包含輸出資料、暫存資料或任何延伸資訊,例
如:員工平均出勤資料、年齡和居住地分佈資料等並
不屬於長存資料,因為這些資料都可以由操作資料運
算而得。
1-2-2 資料 塑模 - 說明
• 資料庫儲存是結構化收集的「實體」( Entity )
資料,實體是現實生活中存在的東西,只是將它
塑模( Modeling ),如下圖所示:
1-2-2 資料 塑模 - 過程
• 「資料塑模」( Data Modeling )是將真實東
西轉換成模型,這是一種分析客戶需求的技術,
其目的是建立客戶所需資訊和商業處理的正確模
型,將需求使用圖形方式來表示,其塑模的過程
,如下圖所示:
1-2-2 資料 塑模 - 目的
• 將真實東西塑模,其目的是使用模型來解
釋真實東西、事件和其關聯性。以資料庫
來說,塑模的主要目的是定義資料的結構
,也就是後面說明的邏輯關聯資料。
1-2-2 資料 塑模 - 邏輯關 聯資
料
• 資料庫是將真實東西轉換成模型定義的資
料結構。例如:塑模一間大學或技術學院
,也就是從大學或技術學院儲存的資料中
識別出:
– 實體
– 屬性
– 關聯性
1-2-2 資料 塑模 - 邏輯關 聯資
料
實體( Entities )
• 在真實世界識別出的東西。例如:從大學
和技術學院可以識別出學生、指導老師、
課程和員工等實體,如下圖所示:
1-2-2 資料 塑模 - 邏輯關 聯資
料
屬性( Attributes )
• 每一個實體擁有的特性。例如:學生擁有
學號、姓名、地址和電話等屬性,如下圖
所示:
1-2-2 資料 塑模 - 邏輯關 聯資
料
關聯性( Relationships )
• 二個或多個實體間所擁有的關係,以基數比限制
條件( Cardinality Ratio Constraints )來說
,主要分為三種,如下所示:
– 一對一 ( 1:1 ): 指一個實體只關聯到另一個實體。
例如:指導老師是一位學校員工,反過來,此員工就
是指這位指導老師。
– 一對多 ( 1:N ): 指一個實體關聯到多個實體。例如
:學生寫論文時可以找一位指導老師,但是,一位指
導老師可以同時收多位學生。
– 多對多 ( M:N ): 指多個實體關聯到多個其他實體。
例如:一位學生可以選修多門課程,反過來,同一門
課程可以讓多位學生來選修。
1-2-2 資料 塑模 - 邏輯關 聯資
料
1-2-3 資料 庫資料 的三 個層次
• 在資料庫儲存的資料是使用模型找出的實體和屬
性所轉換成的資料,可以分成三個層次,如下:
– 資料模 型( Data Model ): 將真實東西轉換成資
料模型的實體、屬性和關聯性,使用圖形化的高階模
型來描述這些資料,通常使用在資料庫設計階段來分
析資料庫儲存的資料。
– 中繼資 料( Meta-data ) : 這是用來描述資料庫儲
存的是什麼樣的資料,定義資料列( Rows )或記錄
( Record )型態,也就是定義各資料欄
( Columns )或資料項目( Data Item )的型態。
– 資料( Data ): 資料庫實際儲存的資料列
( Rows ),或稱為記錄( Records )。
1-3 檔案處理 與資 料庫系 統
• 1-3-1 檔案處理方式
• 1-3-2 檔案處理系統的問題
• 1-3-3 資料庫方式
1-3 檔案處理 與資 料庫系 統
• 「檔案系統」( File System )是一種非
常原始的資料庫,不論是 UNIX/Linux 檔
案系統, Windows 作業系統的 NTFS 檔
案系統,資料都是使用相同觀念,以檔案
方式儲存,我們可以撰寫應用程式處理檔
案儲存的資料,稱為「檔案處理系統」
( File Processing System )。
1-3-1 檔案 處理方 式 - 架構
1-3-1 檔案 處理方 式 - 資料檔
案的 內容
• 檔案管理系統的程式是處理邏輯檔案的資料,邏
輯檔案的每一列是一筆記錄,第一列是欄位名稱
的資料定義。
• 不過實際儲存的檔案內容並沒有第一列的欄位名
稱,只有學生資料,檔案可以使用固定欄寬(例
如:前 4 個字元是學號,第 5~15 個字元是姓名
等,以此類推)或以特殊分隔字元儲存欄位資料
,如下所示: