560 likes | 712 Views
個人化資訊服務. 柯皓仁 交通大學圖書館副教授兼數位圖書資訊組組長 claven@lib.nctu.edu.tw. 大綱. 前言 相關研究 個人化資訊服務系統 -- PIE@NCTU 資料探勘與個人化、群體化數位服務 結論與未來發展. 前言 . 圖書館的任務:協助讀者有效地利用圖書館獲取資訊、運用資訊,從而產生知識。 每位讀者都有其特別的資訊需求,圖書館應該把每位讀者視為不同的個體,儘量去滿足每一讀者個別的資訊需求 採用 CRM 的理念並推動個人化服務
E N D
個人化資訊服務 柯皓仁 交通大學圖書館副教授兼數位圖書資訊組組長 claven@lib.nctu.edu.tw
大綱 • 前言 • 相關研究 • 個人化資訊服務系統 -- PIE@NCTU • 資料探勘與個人化、群體化數位服務 • 結論與未來發展
前言 • 圖書館的任務:協助讀者有效地利用圖書館獲取資訊、運用資訊,從而產生知識。 • 每位讀者都有其特別的資訊需求,圖書館應該把每位讀者視為不同的個體,儘量去滿足每一讀者個別的資訊需求 • 採用CRM的理念並推動個人化服務 • 與個人化相對的概念是群體化。有時知識的產生不能光靠單一個體,而是得藉由具有相同興趣、專長的個體組成社群,彼此激發靈感與分享心得,方能促成知識的產生。 • 個人化之資訊服務,並支援社群概念 輔助網路學習
圖書館的新價值鏈 賴忠勤,書苑季刊51期(pp.51-64)
圖書館CRM架構圖 賴忠勤,書苑季刊51期(pp.51-64)
相關研究 • 個人化資訊服務技術 • 個人化使用界面 (Customizable User Interface ) • 個人興趣記錄 (User Profile) • 資訊選粹服務 (Selective Dissemination of Information) • 個人化檢索 (Personal Search) • 網路學習 • 透過網路科技的運用及提供虛擬的真實情境,結合生手與專家針對學習主題,作資源共享、經驗分享,經由彼此磋商討論與互動溝通等方式,共同參與學習活動 • 最新消息佈告欄、學習社群討論區、課程資料中心、學習活動公告、學習資源分享區、成員資料中心、社群專家諮詢區、心情故事留言板、網路學習紀錄區
相關研究 (續) • 個人化使用界面 (Customizable User Interface) • 使用者可以依自己的喜好來排列組合他的使用環境 • 自訂桌面、更改顏色、選擇服務 • 搜尋網站 • MyYahoo!、MyKimo • 個人報紙 • CNN Custom News、LA Times Custom Services • 數位圖書館 • MyLibrary 、MyLibrary@NCSU 、MyGateway
相關研究 (續) – 個人興趣記錄 • 由讀者人工填寫個人興趣記錄 (User Profile) • 方法 • 興趣關鍵字 [MyLibrary@NCSU] • 興趣類別 [MyYahoo!] • 優點:直覺 (因為是由使用者輸入興趣資料) • 缺點 • 使用者會以過於普遍的字來描述興趣,對興趣的描述不夠精確 • 不能期望使用者都是勤勞、有足夠耐心,且總是能正確輸入關鍵字詞
相關研究 (續) – 個人興趣記錄 • 運用電腦科技推導產生 • 以瀏覽過網頁之關鍵字為興趣 • 不精確,因為網頁太過龐雜 • 以電子郵寄通信記錄的關鍵字為興趣 • 由通信記錄抽取關鍵字,再依固定時間間隔將關鍵字加以分群(Clustering) • 以電子交易行為推導興趣 • 以讀者借閱歷史紀錄推導興趣 • 鄭愁予、席慕容、楊牧 新詩
相關研究 (續) • 資訊選粹服務 • 根據個人興趣記錄,依使用者興趣過濾出使用者有興趣的新進資訊。 • 資訊過濾 • 內容式資訊過濾技術 (Content-based Information Filtering) • 以文件的內容做為過濾的對象,使用者在興趣檔中只要紀錄有興趣的關鍵字,系統便會將新進資訊和興趣檔做比對 • 協力式資訊過濾技術 (Collaborative Information Filtering) • 個人新聞服務:CNN Custom News 、LA Times Custom News Services 、MyYahoo! • 個人新書通報服務 • MyLibrary@NCSU
相關研究 (續) • 個人化檢索 • 依個別讀者的需求幫助使用者尋找所需資訊 • 以資訊過濾技術過濾檢索結果
動態學習使用者興趣 • 透過檢索策略來解讀使用者興趣 • 個人檢索策略的頻率 • 各檢索策略的相關性 • 時間對興趣的影響 • 利用「個人興趣關連圖」來求得使用者興趣 • 資訊選粹 • 個人化檢索
詩 詞 古典 數位圖書館 關鍵字詞 檢索語間的權重 個人興趣關連圖 • 藉由關連圖,我們可以很清楚地看出使用者所有興趣間的關連性 • 若某一使用者之關連圖中有兩個端點以邊線相連,則對該使用者而言代表其曾經同時使用過兩個端點所代表的檢索語。 • 可計算各檢索語 (Query Term) 之間關係,求出權重 (Weight) 、判斷使用者的興趣。
Hlk: 第k時區的時間係數 時間對興趣的影響 • 時間對興趣的影響呈半衰期 (half-life) 遞減 • 方法 • 將檢索歷程固定時間間隔劃分成 n 個區段 • 第k區段對使用者整體興趣影響率為 • 範例 • n =5 • (k1, k2, k3, k4, k5) = (16/31, 8/31, 4/31, 2/31, 1/31)
關鍵字權重計算 • 考慮時間與個人關鍵字的使用頻率 頻率 時間係數 總數 Wi :檢索語i 的權重。 TFi,k:在第k個時間區段中,使用者使用檢索語i 的頻率 n,k :在第k個時間區段中,使用者使用的檢索語總數 Hlk :在第k時區中時間對興趣的影響係數
檢索策略 關鍵字 使用者興趣關鍵字詞(範例) • 以2星期為一個週期,求“Digital Library”於每星期結束時權重的變化
Digital Library 0.2474 0.0825 Interface IEEE Wij :對個別使用者而言 ‘i AND j’這個檢索語的權重 :在第k個時間區段中,使用者使用i檢索語時亦會使用j檢索語的權重 EFijj:在第k個時間區段中,使用者的檢索策略中含有 ‘i AND j ‘這 個檢索策略的頻率 Hlk:在第k時區中時間對興趣的影響係數 關鍵字關連權重計算 • 目的: 計算兩兩關鍵字詞的關連程度 • 方法 i AND j 出現的頻率 時間係數 i 出現的頻率 j 出現的頻率
個人檢索策略關連 (範例) • 以2星期為一個週期,求“Digital Library” 以及 ”Interface ”每星期結束時兩者關係的權重變化
PKRG (Keyword Extraction) Query Strategies Profiles Item Input SDI Mail Files 新進資訊選粹 • 方法 • 利用「個人興趣關連圖」之關鍵字權重計算方法 • 選出前幾個關鍵字詞作為使用者興趣關鍵字詞 • 比對使用者興趣關鍵字詞與新進資訊 • 若相符則該資訊為使用者有興趣的新進資訊
檢索結果選粹 • 方法 • 根據「個人興趣關連圖」找出和當次檢索策略有關的使用者興趣關鍵字詞 • 根據檢索結果資料所含使用者興趣關鍵字詞多寡與權重排列檢索結果 PKRG (Keyword Relationship Extraction) Personal Search Query Strategies Profiles Query Personal Search Result Digital Library
PIE@NCTU交大個人化數位圖書資訊環境 • 目的 • 針對使用者需求給予個別的使用環境 • 動態偵測讀者興趣,協助讀者尋找交大圖書館館藏 • 提供資訊選粹服務,定期通知讀者有興趣的新進資訊
PIE@NCTU系統簡介 • 中西文新書整合目錄 • 個人化使用者界面 • 個人環境設定 • 個人化桌面 • 個人服務設定 • 個人興趣設定 • 個人化搜尋引擎 • 個人書籤 • 個人新書選粹服務 • 個人通告 • 管理者界面
中西文新書整合目錄 • 交通大學圖書館現行分類狀況 • 中文:中國圖書分類法 • 西文:美國國會圖書分類法 • 交大圖書館現有新書目錄的缺點 • 書少而類多 • 類別無法中西文對照 • 中西文類別對照簡表 • 以「中國圖書分類法」為基礎 • 二階層的中西文類別對照簡表 • 9個類別 (main classes) 、52個簡表 (outline of the classification tables) • 以讀者角度切入製作而成
中西文新書整合目錄(續) • 中西文新書整合目錄 • 利用「中西文類別對照簡表 」將新書重新分類 • 貢獻 • 可提高讀者瀏覽圖書館新進館藏的效率 • 可知道圖書館當月新書在各類別的分佈情形以及中西文新書的比重
個人環境設定 • 個人化桌面 • 讀者能動態改變使用界面 • PIE@NCTU提供的可個人化類別包括:圖書館服務、圖書館導覽、館藏查詢、資料庫查詢、新書通告、借閱狀況、檢索界面、系統公告、圖書館連結等 • 個人服務設定 • 啟動/取消服務: 個人新書目錄,藝文活動通告,圖書館公告 • 個人興趣設定 • 彌補系統判斷使用者興趣的不足 • 讀者自行選填興趣 • 選擇系統關鍵字詞 • 設定個人興趣關鍵字詞 • 設定個人興趣類別
檢索結果 系統判斷的使用者檢索策略關連 使用者自訂關鍵字 使用者自選類別 第0級 第五級 第四級 ‧‧‧ 個人化搜尋引擎 • PIE@NCTU提供兩種個人化搜尋引擎服務 • 個人館藏查詢 • 直接抓取交通大學館藏查詢系統的檢索結果,以獲得所需資訊 • 個人新書查詢 • 系統定期從圖書館館藏系統中抓取新進館藏存在PIE@NCTU的資料庫 • 讀者查詢新書時,則從本地的資料庫中獲取所需資訊
貝多芬:小提琴協奏曲/莫札特:第五號小提琴協奏曲[CD]/貝多芬,莫札特作曲, CD 910.8 4042 v.5 快樂頌﹣貝多芬合唱交響樂,席勒詩著,顧一樵譯,月韻, R 912.31 0044 第五級 1 2 3 ‧ ‧ ‧ ‧ ‧ Profile 貝多芬? 小提琴0.8 交響樂0.5 第四級 第四級 鋼琴 協奏曲 莫札特 第三級 第二級 第二級 912 910 083 第一級 第0級 個人化搜尋引擎 (範例)
個人化搜尋引擎 (續) 以“貝多芬”為索引點產生出來的檢索結果
知識分享(二) Data Mining
系統判斷的使用者關鍵字 使用者自訂關鍵字 使用者自選類別 ‧‧‧ 個人新書粹選服務 • 定期比對圖書館新進書刊和使用者興趣是否相符
管理者界面 • 新增、刪除、修改PIE@NCTU網站 • 更改自動執行程式的相關設定 • 發送圖書館通知
資料探勘 • 資料探勘:從儲存於資料庫、資料倉儲或其他資訊儲存器的大量資料中發掘出我們感興趣的知識之處理過程 • 尿布與啤酒
資料探勘程序 Selected Data Preprocessed Data Transformed Data Extracted Information Assimilated Knowledge Logical Database Analyze and Select Preprocess Transform Mine Assimilate
Transactions Large Itemsets Rules and Patterns (1) (2) Support>s Confidence>c 相關規則探勘及有序性規則探勘 • Association rules and Sequential patterns • Given two thresholds c and s we want to find rules XY with sup(xy) > s and conf(xy) > c in given database. • Two Step of Mining Association Rules and Sequential Patterns • Find the Large Itemsets • Generate the desired rules.
動機與目的 • 動機 • 應用資訊科技及企業化模式經營圖書館 • 目的:利用資料探勘及統計技術,以達成: • 探索讀者社群關係 個人化及群體化服務 • 吸引讀者到館借閱 個人化及群體化服務 • 提昇館藏借閱率 個人化及群體化服務 • 提昇讀者忠誠度 個人化及群體化服務 • 協助館藏複本採訪政策 電子化業務 • 促進館藏流通率電子化業務
Mining in LIB@NCTU • 資料來源 • 交通大學圖書館之書目、館藏及交易歷史資料 • 資料選取 • 書目、館藏資料:圖書405,785本,期刊:526,868本,可外借館藏不含複本282,250本 • 交易資料:1998/1/1 至2000/8/31之交易歷史資料共441,688筆 • 資料前置處理及轉換 • 館藏借閱之共同性:每位讀者於一段時間內(如一學期或一學年)所借閱及預約之書目為一筆交易 • 館藏借閱之順序性:每位讀者借閱過之館藏所形成之序列為一筆交易
探索讀者社群關係 • 館藏借閱之共同性 • 興趣類似之讀者所借閱之館藏也很類似 • 館藏借閱之順序 • 先借入門之館藏再借進階之館藏 • 結合個人化服務
探索讀者社群關係 • 資料前置處理及轉換 • 將資料量增加為1998年1月至2000年8月的資料 • 讀者所借過之所有館藏為一筆交易 • 刪除只借閱一本館藏之交易歷史資料 • 加入預約書資料 • 針對書籍部份做探勘 • 交易筆數 • 11,398筆 • 最小支持度 • 0.21%,約為24筆
探索讀者社群關係(續) • 1998年1月至2000年8月書籍部份之讀者社群關係
資源與知識分享 網路學習平台 參考諮詢、專業整理 資源與知識分享 搜尋、擷取 提供資源與知識 組織、整理 網路學習時代的圖書館、讀者、與資源間的關係 非網路學習時代:片面且單向 讀者 圖書館 資源
圖書館在網路學習中應扮演積極角色… • 圖書館擁有規劃完整的知識儲存環境以及良好的查詢系統,對於使用者而言是最熟悉的知識獲取環境 • 如果以數位圖書館當成數位學習平台的中心,發展數位學習關鍵模組,將使用者跟知識所在的環境緊密結合,對於數位知識教育的推廣是具有相當大的優勢 • 若以資訊技術的角度來看,開發資訊模組架構在每個學校或者單位本身的數位圖書館之上,不但節省重新開發資訊環境所耗費的人力,並且讓使用者從原本熟悉的環境自然地進入到數位學習的環境當中,對於數位學習的推廣將會具有相當的助益
輔助網路學習的數位圖書館 • 能夠幫助讀者快速地依照個人興趣,收集相關資料提供使用者閱讀﹔可推薦相關的研究參考資料﹔根據使用者的程度提供相關的參考主題館藏 • 使用者能夠快速地找尋圖書館內的館藏,如何有效地綜合檢索圖像及文字等多媒體型態的數位化內容 • 要能夠快速持續地吸收新知提供使用者學習參考,除了館藏的增加,也可以收集讀者知識的回流,讓讀者隨時提供自己的作品、心得及經驗給圖書館 • 數位化圖書館可以很容易地與讀者互動