430 likes | 587 Views
數位典藏聯合目錄計畫 執行經驗談. 主講人:范紀文. 大綱. 簡介 相關技術說明 聯合目錄規劃與設計 未來發展方向. 聯合目錄簡介. 宗旨與目的. 宗旨 提供國內外學者更好的學術研究環境 目的 整合數位典藏相關計畫藏品資源 資料 檢索界面. 目標. 建立數位典藏藏品內容清單 建立數位典藏共同藏品資料分類架構 發展數位典藏共同檢索界面. 發展現況. 現階段發展現況 已完成系統雛型設計 藏品分類目錄尚未完成訂定 相關典藏計畫無法配合將藏品資料轉入 雛型系統 共 250 筆藏品資料
E N D
數位典藏聯合目錄計畫執行經驗談 主講人:范紀文
大綱 • 簡介 • 相關技術說明 • 聯合目錄規劃與設計 • 未來發展方向
宗旨與目的 • 宗旨 • 提供國內外學者更好的學術研究環境 • 目的 • 整合數位典藏相關計畫藏品資源 • 資料 • 檢索界面
目標 • 建立數位典藏藏品內容清單 • 建立數位典藏共同藏品資料分類架構 • 發展數位典藏共同檢索界面
發展現況 • 現階段發展現況 • 已完成系統雛型設計 • 藏品分類目錄尚未完成訂定 • 相關典藏計畫無法配合將藏品資料轉入 • 雛型系統 • 共250筆藏品資料 • 具分類目錄瀏覽、全文檢索、 Dublin Core檢索功能
可能造成的影響 • 成功情況 • 成為學術界重要的學術資源檢索窗口 • 成為內容產業界產品加值的泉源 • 加深變成漢學研究的重鎮 • 失敗情況 • 損及中研院學術地位 • 造成相關藏品資料的流失 (無維運計畫者)
國外相關應用 • 學術研究機構 • DSpace • CDSware • ePrints • 大型電子公版商 • Elsevier Science • SUIRUS
目前遭遇的困難 • 相關人員對計畫了解程度不足 • 計畫高層評估錯誤 • 藏品分類目錄的產生方式 • 數位化藏品資料量 • 權責不分,執行力不佳
估計所需投入人力與時間 • 預計兩年內所有計畫全部上線 • 12個主題 • 計畫超過50個以上 • 資料庫超過90個以上 • 平均2個月處理一個主題計畫 • 1專案經理,1系統分析師,1程式設計師,2個系統分析助理 • 訂定領域分類目錄 • 訂定藏品資料與領域分類目錄及Dublin Core的對應規則 • 為各個資料庫撰寫匯出藏品資料的程式 • 協助各計畫建立Data Provider • 協助建立各主題及總計畫的Service Provider • 協調溝通各計畫之意見 • 一年人事成本估計至少需300萬
OAI簡介 • 發展背景與歷史 • Paul Ginsparg. Rick Luce. Herbert Van deSompel 等人於1999年10月在Universal Preprint Service 會議中提出OAI的概念 • 2001年1月正式公佈OAI-PMH 1.0版 • 2002年5月正式公佈OAI-PMH 2.0版 • 目的 • 解決資料分散儲存於不同系統不易整合檢索的問題
OAI系統運作流程 1. 以OAI-PMH的ListIdentifiers指令取得各單位典藏資源的識別碼 各單位存放典藏資料的Data Provider OAIHarvester OAI資料交換管理介面 數位典藏聯合目錄 2. Data Provider以XML格式傳回後設資料 3. 以OAI-PMH的GetRecord指令向各單位的Data Provider擷取後設資料
OAI-PMH簡介- Identify • 擷取Data Provider的識別資訊 • 相關參數 • 無 • 範例 • http://140.109.18.52:8080/oaicat/OAIHandler?verb=Identify
OAI-PMH簡介- ListSets • 擷取Data Provider內的資料分類(set)樹狀目錄 • 相關參數 • resumptionToken • 範例 • http://140.109.18.52:8080/oaicat/OAIHandler?verb=ListSets • http://140.109.18.52:8080/oaicat3/OAIHandler?verb=ListSets&resumptionToken=1075174366718:15:33
OAI-PMH簡介- ListMetadataFormats • 擷取Data Provider所支援的metadata描述格式 • 相關參數 • identifier • 範例 • http://140.109.18.52:8080/oaicat/OAIHandler • http://140.109.18.52:8080/oaicat/OAIHandler?verb=ListMetadataFormats&identifier=oai_dc
OAI-PMH簡介- ListIdentifiers • 擷取資料記錄的標頭識別資訊 • 相關參數 • from • until • metadataPrefix • set • resumptionToken • 範例 • http://140.109.18.52:8080/oaicat/OAIHandler?verb=ListIdentifiers&metadataPrefix=oai_dc
OAI-PMH簡介- ListRecords • 擷取Data Provider所登錄的後設資料記錄 • 相關參數 • from • until • metadataPrefix • set • resumptionToken • 範例 • http://140.109.18.52:8080/oaicat/OAIHandler?verb=ListRecords&metadataPrefix=oai_dc
OAI-PMH簡介- GetRecord • 從Data Provider擷取特定識別碼的後設資料記錄 • 相關參數 • identifier • metadataPrefix • 範例 • http://140.109.18.52:8080/oaicat/OAIHandler?verb=GetRecord&metadataPrefix=oai_dc&identifier=oai:npm.ndap.org.tw:故瓷017194N000000000
XML簡介 • 發展背景與歷史 • GML-1969 • SGML 1980~ • 特性 • 自行定義標籤名稱 • 只規範文件的結構與格式 • 資料的呈現與處理是分開的 • 適於作為資料交換的媒介
DTD範例 <?xml version="1.0" encoding="Big5"?> <!--數位典藏共同目錄資料輸入格式--> <!ELEMENT DACatalog (AdminDesc, MetaDesc)> <!--管理性資訊描述段--> <!ELEMENT AdminDesc (Project, Catalog?, DigiArchiveID, Hyperlink?, ICON?)> <!--計畫資料描述--> <!ELEMENT Project (#PCDATA)> <!ATTLIST Project GenDate CDATA #REQUIRED Creator CDATA #REQUIRED > <!--相對應的資料分類目錄--> <!ELEMENT Catalog (Record+)> <!--分類目錄,目錄與目錄之間請以":"符號分隔--> <!ELEMENT Record (#PCDATA)>
XML範例 <?xml version="1.0" encoding="Big5"?> <DACatalog> <AdminDesc> <Project GenDate='2003-10-07 11:08:37.0' Creator='中研院資訊所'>故宮書畫數位典藏子計畫</Project> <Catalog> <Record>故宮博物院(NPM):故宮書畫數位典藏子計畫</Record> <Record>書畫:繪晝</Record> </Catalog> <DigiArchiveID>故書000005N000000000</DigiArchiveID> <Hyperlink>http://ndweb.iis.sinica.edu.tw/npm_public/System/View.jsp?type=1&ObjectID=1642</Hyperlink> <ICON>http://oai.npm.gov.tw:8080/pic/K2B000005N000000000AA.jpg</ICON> </AdminDesc>
使用XML的優劣 • 優點 • 簡單容易了解 • 突破平台與技術之限制 • 降低系統整合之成本 • 缺點 • 需要額外的處理成本 • 不適於小型系統的使用
Dublin Core簡介 • 緣起 • 解析電子資源描述著錄與檢索問題.1995~ • 特性 • 簡單---由15個項目所組成 • 適合跨領域資料整合與檢索 • DC元素 • Title、 Creator 、Subject、Description 、Publisher 、Contributor 、Date 、Type 、Format 、Identifier 、Source 、Language 、Relation 、Coverage 、Rights
設計理念 • 以提供數位典藏計畫藏品之清單為目標 • 以領域作為共同目錄系統的分類架構基礎 • 允許一個藏品對應到多個分類目錄
系統需求 • 共同目錄系統需求 • 使用層面 • 共同目錄瀏覽系統 • 藏品資料檢索系統 • 典藏資料管理面 • 典藏目錄資料匯入資料提供者模組 • OAI協定相關模組
使用者 聯合目錄運作模式 OAI-PMH OAI ServiceProvider 典藏資料庫 領域後設資料共通交換標準(XML) OAI Data Provider DB 領域分類目錄瀏覽 領域 後設資料 DB DB 領域後設資料 與 DC對應機制 DC標準 後設資料 DC & Full-TextSearch DB
領域後設資料訂定模式 1 自然科學博物館 多媒體後設資料 3 人類學領域後設資料 人類學多媒體後設資料 共通交換標準 2 台灣原住民 影像後設資料 歷史博物館 影像後設資料
領域分類架構 • 目錄的特性 • 依領域建立適當的典藏資料分類目錄 • 同一領域具有多種的分類目錄 • 目錄的作用 • 作為典藏資料瀏覽的界面 • 提供知識/資料分類的依據 • 範例 • 人類學目錄(參考用) • 族群 • 阿美族、 泰雅族、布農族、排灣族、卑南族、魯凱族、賽夏族.邵族、鄒族、雅美族 • 平埔族 • 西拉雅 • 資料類型 • 契約、文本、文件 、相片、文物、錄音帶、錄影帶、參考文獻、地圖
如何建置OAI Data Provider • 將典藏資料從典藏系統匯出成為XML檔案格式 • 依據內容專家訂定之藏品分類目錄,匯出藏品資料 • 匯入XML格式的典藏資料到Data Provider • 以藏品識別碼與XML檔案的最後更新時間,作為藏品資料匯入的基準 • 上線測試OAI Data Provider相關服務
如何建置Service Provider • 向各個已註冊的Data Provider請求擷取藏品目錄資料 • 進行藏品資料與DC及分類目錄之對應 • 建立藏品資料的全文索引記錄 • 提供目錄瀏覽與檢索服務