1 / 46

정보 검색

정보 검색. 정보학의 연구 영역. 정보학이 추구하는 목표 정보 생산자와 이용자 간에 발생하는 요구 정보의 효율적인 커뮤니케이션을 촉진 정보학이란 ? 다양한 정보시스템에 축적 되어 있는 정보 가운데 이용자가 원하는 정보를 검색 하여 제공 하는 과정과 ( 정보의 축적 및 검색 ) 정보의 이용 과 새로운 정보를 생성 하는 과정에 대하여 연구하는 학문. 정보검색의 위치. 정보학 상에서의 정보검색의 위치 정보학 교과목 가운데 기초적이면서도 핵심적인 과목

lavey
Download Presentation

정보 검색

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. 정보 검색

  2. 정보학의 연구 영역 • 정보학이 추구하는 목표 • 정보 생산자와 이용자 간에 발생하는 요구 정보의 효율적인 커뮤니케이션을 촉진 • 정보학이란? • 다양한 정보시스템에 축적되어 있는 정보 가운데 이용자가 원하는 정보를 검색하여 제공하는 과정과 (정보의 축적 및 검색) • 정보의 이용과 새로운 정보를 생성하는 과정에 대하여 연구하는 학문

  3. 정보검색의 위치 • 정보학 상에서의 정보검색의 위치 • 정보학 교과목 가운데 기초적이면서도 핵심적인 과목 • 정보학의 궁극적인 목표를 “이용자가 요구하는 정보를 가장 효율적으로 전달할 수 있는 여러 가지 방안을 마련하기 위한 것”으로 볼 때 필요한 정보의 검색은 가장 필수적인 것임 • 정보학의 여러 주제 분야 가운데 오래된 분야인 동시에 가장 잘 발달된 분야 • 다양한 연구 분야가 존재

  4. 관련분야 • 정보의 축적 • 문헌에 대한 표현 기법 (색인, 초록, 분류 등) • 이용자 질의 및 매칭 • Hypertext and Web • 메타 데이터 • Digital Libraries • Multimedia (storage and retrieval) • Data Mining • Information Filtering • Databases • Knowledge Bases ……

  5. 정보검색의 발달 요인 • 정보검색의 발달 요인 들 • 정보의 양적 증가 • 정보의 중요성에 대한 부각 • 정보에 대한 요구 증가 • 정보검색 환경의 변화 • 정보에 대한 효율적인 접근 수단이 요구 • 정보처리 기술의 발달 • 컴퓨터 및 통신기술의 발달

  6. 정보검색의 발달 요인 (1) • 정보의 양적 증가 • 정보 생산량의 획기적 증가 • 1930년대 150년 마다 정보의 양이 배증 • 1960년대는 5년마다 배증 • 2020년 73일마다 배증 • 인터넷의 등장과 함께 정보의 증가 속도는 예측 불허 • Why? : • 정보 생산자와 수요자에 대한 경계가 불분명 • 과거 정보의 생산자는 극히 제한 • 정보의 중요성 부각 • 지식, 정보사회로의 발전 • 지식이나 정보가 가장 중요한 재원으로 등장

  7. 정보검색의 발달 요인 (2) • 정보에 대한 요구 증가 • 과거 : 정보의 부재가 문제 • 현재 : 많은 정보 가운데 적절한 정보를 찾는 것 • 구멍가게와 슈퍼마켓 • 정보의 조직화에 대한 요구 (검색의 용이성 추구) • Why? • 양적 증가로 인하여 더 이상 기억에 의존한 검색이 어려움 • 조직화된 정보를 이용하여 검색하는 것이 보다 용이 • 조직화된 정보 : 주제에 의한 분류, MARC 데이터 등 • 정보 검색 환경의 변화 • 1970년 중반 : 이용자가 수작업을 통해 직접 입수 • 1980 : 정보 전문가에게 의뢰하여 정보를 입수 (정보 전문가는 정보의 검색을 대행) • 현재 : 온라인을 통하여 이용자가 직접 검색하고 정보를 입수 (인터넷의 등장)

  8. 정보검색의 발달 요인 (3) • 정보처리 기술의 발달 • 실제 방대한 양의 정보원으로부터 필요한 정보만을 추출하는 작업을 수작업에 의한 방식으로는 더 이상 불가능 • 따라서 이를 신속하고 정확하게 처리할 수 있는 정보검색기술이 요구 • DBMS는 데이터의 저장 및 관리에 적절하지만 대용량의 데이터를 검색하는 데 한계 • 이러한 문제점을 해결하기 위한 방법으로 IRS가 제시 • IRS는 RDBMS와 달리 전문(full-text)검색을 기반으로 하는 저장구조 및 검색방식을 채택하여 신속하고 효율적인 검색기능을 제공 • 컴퓨터 및 통신 기술의 발달 • 가장 큰 영향을 준 요소는?

  9. 정보 관리 • 정보의 검색에 앞서 .... • 정보관리 : 정보의 수집, 가공, 축적, 검색, 제공 등 정보가 유통되는 일련의 과정을 다루는 분야 • 정보의 수집, 가공, • 정보의 축적 : 데이터베이스 • 정보의 검색 : 정보량의 증가, 전문화, 세분화에 따라 적합한 정보를 검색하기 위한 수단 • 정보 서비스 : 검색된 정보를 제공하는 서비스 • 최종 목표: 최적의 정보를 적시에 입수하여 필요로 하는 이용자에게 제공될 수 있도록 체계적으로 관리

  10. 정보 검색 - 어원 • “Retrieval"이라는 단어는 고대 불어에서 유래 • 영어의 again(재, 다시)에 해당되는 의미를 갖는 “re"와 find(찾다)라는 의미를 가진 trouver"의 합성어 • “다시 찾는다”라는 의미 • 즉, 검색이란 어떤 목적이나 관점에서 모아진 집합체 가운데 관련된 목적에 부합되는 그 어떤 것을 찾는 행위 • 정보 검색(information retrieval)이란 용어는 1950년 무어즈(Calvin. N. Moores)에 의하여 처음으로 소개

  11. 탐색과 검색 • 탐색 • 특정 데이터베이스에 찾고자 하는 정보가 포함되어 있는 지의 여부와 관계없이 막연히 정보를 찾아보는 것을 의미 • 검색 • 특정 데이터베이스에 찾고자 하는 정보가 포함되어 있음을 가정하고 질문에 적합한 정보를 찾기 위하여 정보를 모아서 간추려 놓은 대상물 즉, 데이터베이스 내에서 특정 주제에 대한 레코드를 체계적으로 찾아내는 행위 • 그러나 인위적인 구분과는 달리 검색과 탐색은 일반적으로 혼용

  12. 정보검색 - 정의 • 이미 축적되어 있는 정보 가운데 필요한 정보를 찾아내는 활동 • 수집된 정보의 내용을 분석, 가공하여 파일(데이터베이스)로 축적 • 정보의 가공, 색인 파일의 작성, 정보의 물리적 축적 과정 등이 포함 • 축적된 정보로부터 이용자의 정보 요구에 적합한 정보를 찾아내는 일련의 과정을 포함 • 검색 주제의 분석, 검색어 선정, 검색실행, 검색결과의 평가 등의 과정

  13. 전제 조건 • 정보 검색은 이미 축적되어 있는 정보 가운데 필요한 정보를 찾아내는 활동 • 검색 대상 정보의 존재 • 축적된 정보를 대상으로 함 • 즉, 검색을 위해서 정보는 우선 수집된 정보의 내용을 분석, 가공하여 데이터베이스나 파일 등의 일정한 형태로 축적되어야 함을 의미 • 정보에 대한 요구가 존재 • 정보의 검색이 가능하도록 하는 다양한 기술 • 검색 기술, 검색시스템 등

  14. Ad Hoc RetrievalInformation Filtering 유사도 비교 유사도 비교 Document Query Base Query Document Base Retrieval Results Filtering Results Relevance Feedback Relevance Feedback User User Relevance Information Relevance Information

  15. 정보검색의 주요 주제 • Text Representation (주제 분석, 분류, 색인, 초록) • 검색 대상이 되는 문헌에 대한 설명 혹은 정보 • Representing Information Need (Query Formulation) • 질의 (정보 요구, 대체로 질의어로 표현) • Language in IR (검색 언어) • Comparing Representations (Matching and Retrieval) • 검색 대상 문헌에 대한 정보와 이용자 질의의 비교 • Searching Techniques (탐색기법) & IR models(검색 모델) • IRS (정보검색 시스템) • Evaluating Retrieved Text (Feedback) • 검색된 문헌에 대한 적합성 평가

  16. 정보검색 발달사 • 정보 검색의 흐름을 살펴보면 • 정보 이용자가 수작업을 통해 직접 정보를 입수하는 시대에서 • 정보전문가에게 의뢰하는 시대 • 이용자가 직접 검색하는 시대로 변모 • 오늘날의 정보검색은 특히 인터넷의 등장과 더불어 온라인을 통한 이용자가 직접 수행하는 직접 검색이 일반화 • 그 발전 단계를 살펴보면 수작업에 의존하던 검색과 컴퓨터의 등장과 정보량의 급증을 계기로 컴퓨터를 이용한 정보검색으로 구분

  17. 정보검색 발달사 • 1940년 대 이전의 수작업에 의한 정보 검색 • 1920년대 컴퓨터가 등장하기 시작하였으나 그 당시 컴퓨터의 주요 기능은 문자의 처리보다는 단순 수치를 계산하고 처리하는 초기 단계 • 따라서 문자의 처리를 통한 텍스트의 검색은 연구 차원 • 이 시기에는 주로 목록 카드나 책자 형태의 색인을 이용하여 수작업에 의한 텍스트 자료의 관리와 검색이 주류 • 주요 탐색 도구로는 분류번호와 주제명이 사용

  18. 정보검색 발달사 • 1940 -1950년대 (태동기) • 2차 대전의 종전 후 연구개발에 대한 투자 증가 • 컴퓨터의 처리 능력 향상으로 문자 처리 기술이 발전되고 이에 의거한 정보검색이 시작된 태동기 • 색인과 검색의 개념이 정립된 시기 • 자동 색인, 자동 분류, 자동 초록의 연구가 시작 • 이 기간 동안에 개발된 시스템들은 펀치 카드나 마이크로 필름을 사용한 자동 검색기가 대부분 • 필요한 정보를 검색하기 위하여 여러 개의 주제어를 색인어로 사용하고 검색시 이를 조합하는 후조합방식 출현 (by Taube) • 1949년 Boole에 의해 발표된 불리언 논리를 검색과 색인에 도입, 활용 • 불리언 논리는 인간의 추론 과정에 기초한 것으로 복잡한 개념을 형성하기 위하여 다른 개념을 추가하거나 혹은 복잡한 개념을 단순한 개념으로 분리

  19. 정보검색 발달사 • 1960년대 (발전기) • 문자 처리 능력의 발전과 텍스트 자료의 전자화가 시작된 시기로 컴퓨터를 통한 정보검색의 발전기 • 컴퓨터 기술이 발전함에 따라 기계 가독형 문헌 데이터와 색인을 사용하는 시스템이 개발 • MARC의 출현 • 컴퓨터와 저장 장치의 가격이 고가였기 때문에 컴퓨터의 처리 능력을 최대한 이용하는 것에 초점 • 따라서 검색이 필요한 데이터를 한번에 모아서 처리하는 배치 처리방식 중심으로 도서관에서 이용 • 온라인 정보검색 시스템이 최초로 일반 이용자에게 시험적으로 공개 (DIALOG) • 오프라인에 의한 배치 검색 서비스의 시대

  20. 1970년대 (중흥기) • 본격적인 데이터베이스의 구축 및 실용화가 이루어졌으며, 네트웍의 발전으로 온라인을 통한 정보 검색이 급속히 발전한 시기 • 정보검색시스템의 특징은 기존의 오프라인 방식에서 실시간 온라인 방식으로의 방향 전환 • 문헌에 대한 서지정보 데이터베이스 및 이를 상용으로 서비스하기 위한 온라인 데이터뱅크의 출현 • 서지정보에 대한 검색과 검색된 데이터의 원문을 획득하기 위하여 원문복사 제공 서비스가 시작 • 시험적이긴 하지만 필요한 정보의 one-stop 제공을 위하여 일부 원문 데이터베이스가 축적되기 시작 • 컴퓨터의 가격과 네트웍 사용료가 고가, 일반 이용자가 직접 검색을 하기보다는 검색 시간의 단축을 위하여 검색 전문가들에 의한 검색이 주류

  21. 1980년대 • 1980년대는 국내 온라인 서비스가 등장 • 1982년 데이콤이 설립되고 외국의 유명 데이터베이스를 온라인으로 직접 사용, 1983년 산업연구원이 국내 최초로 KINITI-LINE을 통한 온라인 서비스를 시작 • 컴퓨터 가격의 하락과 PC의 등장으로 국내 대학도서관 및 연구 전문도서관을 중심으로 도서관 자동화가 시작 • 이용자가 직접 정보를 검색할 수 있는 기회부여 • 문자 정보 중심에서 수치정보 및 사실정보 데이터베이스와 원문 데이터베이스가 증가한 시기로 CD-ROM 형태의 데이터베이스가 증가하여 개인용 컴퓨터를 이용한 CD-ROM 데이터베이스의 탐색이 보편화 • 데이터베이스의 발전과 다양화의 시대

  22. 1990년대 • 1990년대는 정보의 관리, 검색, 제공에 있어서 획기적인 변화가 일어난 시기 • 인터넷의 실용화와 WWW(World Wide Web)의 탄생으로 정보 검색은 새로운 중흥기 (네트웍 기반) • 기존의 정적(Static) 데이터베이스를 검색하는데 초점을 두었던 정보검색시스템은 이후부터 인터넷에 존재하는 다양한 정보를 수집하고 분석, 가공하는 기능을 탑재 • 컴퓨터 기술이 발전하여 수백 기가바이트(Gbyte) 혹은 수십 테라바이트(Tera-byte)의 정보를 처리할 수 있는 기능과 함께 속도의 현저한 증가 • 이를 바탕으로 검색시스템의 성능 또한 획기적으로 발전

  23. 2000년대 • 이용자에 의한 직접 검색이 중심 • 멀티미디어 데이터에 대한 검색 • 원문 정보 데이터베이스 • 텍스트 중심에서 멀티미디어 데이터로 • 이기종 컴퓨터 및 데이터베이스에 대한 통합 검색 기술이 보편화 • 다국어 검색, 내용기반 검색

  24. 정보검색 인물 탐구 • Mortimer Taube • 문헌(정보)을 효율적으로 색인하고 이를 통하여 검색하기 위한 다양한 방법의 연구를 시도 • 컴퓨터를 이용한 정보 검색의 기초 마련(현대적 정보검색) • 조합 색인을 창안 • 왜 조합색인이 요구되었는가? • 2차 대전 동안 생산된 막대한 양의 기술보고서와 과학문헌을 검색하기 위한 기존의 수작업 색인이나 검색시스템이 부적절 • 정보 표현을 위한 자모순 배열과 계층구조 방법(주제명 표목표와 분류법)은 학문과 연구개발로부터 발생된 새로운 용어를 수용할 수 없었음 • Why? • 인쇄형태 혹은 책자형으로 발간 (새로운 용어의 출현시 즉각적인 수정이나 보완이 불가)

  25. 정보검색 인물 탐구 • Mortimer Taube - 계속 • 조합색인은 유니텀(Uniterm)과 불리언 논리에 기초 • 유니텀이란 • 한 문헌의 여러 가지 패싯을 나타내기 위해 색인자가 선택한 용어군 • 문헌의 내용을 대표하는 용어 집합 • 키워드와 동일 (문헌으로부터 추출된 것으로 어휘통제가 안됨) • 불리언 탐색의 기초가 됨 • 조합색인 (Coordinate Index)이란? • 조합방식으로 만들어진 색인????? • 주어진 색인어를 필요에 따라 색인어 작성시 여러 색인어를 조합하여 만들거나, 혹은 검색시 주어진 색인어를 조합하여 사용할 수 있도록 하는 방법

  26. 정보검색 인물 탐구 • Hans Peter Luhn • 컴퓨터 기반 정보검색의 현실화 • 자동 초록과 자동 색인의 개념 도입, 완성 • 통계적 방법을 이용하여 색인과 초록을 자동으로 생산하기 위한 알고리즘을 개발 • 자동색인 • 문헌에 나타나는 주요 단어의 선정이 핵심 • 출현 빈도 (빈도 수에 따라 불용어의 선정 등) • 출현 위치 등 • 자동초록 • 키워드가 빈번하게 나타나는 문장을 선정 (문헌을 가장 잘 표현할 수 있는 중요 단어를 식별하여 그 단어가 포함된 문장을 추출하여 초록을 작성) • 문장 내에 키워드 간의 거리(근접성)이 가까운 문장을 추출하여 사용

  27. 정보검색 인물 탐구 • Hans Peter Luhn - 계속 • KWIC, KWOC, KWIT • Keyword-in-context, Keyword-out-of-context, Keyword-in-title • 키워드 색인을 생성하기 위한 방법으로 활용 • 전통적인 분류와 주제명 표목으로부터 나온 용어가 아닌 한 문헌에 있는 제목이나 맥락(context)을 이용하여 여러 패싯을 표현하고 검색하는데 사용 • 용어 색인(concordance)으로부터 유래된 것으로, 문헌에 포함된 문장들이 용어 색인을 구성하고 있으며, 이를 대표할 수 있는 표제가 KWIC을 생산할 수 있는 맥락(context)으로 사용 • 표제에 포함된 키워드의 치환(위치변환, permutation)을 이용하여 검색에 활용이 가능하도록 함 • 즉 맥락 내에서 특정 키워드를 정렬시켜 놓은 KWIC와 맥락 밖의 왼쪽에 특정 키워드를 정렬 • SDI (Selective Dissemination of Information)의 개발 • 목표 이용자들에게 그들 자신의 프로파일에 기초하여 새로운 학술정보를 효과적으로 보급해 주는 방법 • 현대적 정보 필터링 기법의 시초

  28. 정보검색 인물 탐구 • Calvin N. Mooers • 정보검색 (Information Retrieval)이란 용어의 사용 • 정보검색이란 검색 대상 정보의 위치나 존재조차도 불분명한 것까지도 찾아내는 것 • 즉, 조직화된 정보는 물론 비조직화된 정보 등 모든 정보를 대상으로 한다는 점에 있어 현대적 의미의 진정한 정보 검색 • Mooers’ Law(무어의 법칙) • 정보를 사용할 때의 불편함이 정보를 사용하지 않을 때의 불편함보다 크다면 이용자는 정보를 사용하지 않으려 함 • 정보검색 시스템을 이용하는 것보다 이용하지 않는 것이 더 문제가 될 때에만 정보검색 시스템을 이용 • 결과적으로 이용자의 요구와 현실을 반영한 시스템은 더 쉽게, 더 많이 이용됨

  29. 정보검색 인물 탐구 • Gerald Salton • 전문(full-text)에 대한 처리 방법을 근본적으로 변화시킴 • 전문에 대한 검색 개념 (Automatic text processing의 창시자) • 정보검색모델 (백터공간모델, 확장 불리언 모델), 적합성 피드백, 클러스터링, 용어분리가, 구절 검색 등에 절대적 공헌 • 최초의 검색시스템인 SMART (System for the Manipulation and Retrieval of Texts) 개발 • WAIS (Wide Area Information Server), DowQuest (Dow Jones의 뉴스 서비스), INQUERY 검색시스템의 기반 시스템

  30. 개념 정립 • 정보 • 정보표현 • 문헌의 내용을 대표할 수 있는 요소를 추출하여 용어나 기타 표현단위로 나타내는 행위 • 색인, 초록, 분류, 요약, 발췌 • 정보검색 • 정보접근: 정보에 도달하거나 정보의 획득 중점 • 정보추구: 정보 검색과정에 참여하는 이용자의 행위에 중심 • 정보탐색: 정보를 찾는 방법에 중심

  31. 정보검색의 구성 요소 • 인간 : 정보의 생산자 (연구자, 작가, 기자 등), 가공 분석자 (색인 작성자, 주제 분류자, 데이터 입력자 등), 중재자 (검색 대행자, 사서 등), 최종 이용자 • 검색 대상 정보 : 축적 대상 정보 (문헌, 화상, 음성 등), 축적된 정보 (일반적으로 데이터베이스 형태로 나타남) • 탐색 언어 : 정보의 검색을 위하여 사용되는 언어 (색인어, 주제 분류번호, 주제명, 통제어, 자연어) • 탐색 알고리즘 : 축적된 정보를 검색하기 위하여 시스템에서 제공되는 논리 체계 • 기본 탐색 알고리즘 • 키워드를 이용한 탐색 • 불리언 탐색 • 인접, 절단 • 고급 탐색 알고리즘 • 가중치 탐색 • 정보검색시스템 : 검색엔진, 인터페이스 등

  32. 최종 이용자 • 정보의 생산자 • 연구자 • 작가 • 기자 • 축적 대상 정보 • 문헌 • 영상 • 음성 • 가공, 분석자 • 색인작성자 • 분류자 • 입력자 • 정보검색시스템 • 데이터베이스 • 검색엔진 • 인터페이스 • 중재자 • 검색대행자 • 사서 구성 요소간 관계 및 역할 직접검색 정보 생산 검색 면담 입력 색인 작성 간접검색 가공 없이 직접 입력

  33. 색인 작성자 최종 이용자/ 중재자 축적 대상 문헌 문헌의 표현 개념분석 및 번역 개념분석 및 번역 질의와 대상 문헌 간의 매칭 시소러스 주제명표목표 기타 사전 비교, 대조,매칭 검색식 검색질문

  34. 정보검색 시스템 구조 새로운 질의어 입력 적합성 여부 판단 정보 요구 질의작성 비교, 매칭 적합성평가 유사도에 따른 검색 문헌의 제시 검색 효율성에 대한 평가 구체화된 요구 질의어 작성 질의어와 문헌과의 유사도 계산 적합성 정보 문헌 DB 문헌표현 색인생성 문헌 입력

  35. 정보검색시스템 상세 개념도 원정보(text 등) 이용자 질의 질의의 분석, 가공 : 주제 분석 원정보의 내용분석 : 주제분석 (초록, 분류) 색인 작성 : 색인어로 변환 색인 작성 : 색인어로 변환 어휘 통제 요구에 대한 프로파일 작성 원정보 DB 색인파일의 작성 (DB) 탐색 : 요구사항과 색인파일의 대조 탐색 탐색결과 : 원정보 탐색결과 :서지정보 이용자에게 제공

  36. 불특정 정보의 집합 정보제공자의 역할 활용, 새로운 정보의 생산 선택입수 이용자의 역할 검색 데이터베이스 학술정보 도서관 특화된 정보의 집합 선택된 정보의 집합 주제별 전문DB 개인도서관 검색제공 검색 정보제공자, 이용자 지적활동과 정보의 관련성

  37. 정보 요구 발생 검색전략 결정 검 색 검색결과 평가 검색 종료 검색질문의 명확화 중재자와 이용자의 상호 작용 정보 검색 과정

  38. 정보검색의 종류 • 구분 • 축적된 정보의 내용(종류)에 따른 구분 • 참조검색 (Reference Retrieval) • 사실검색 (Fact Retrieval) • 전문검색 (Full-text Retrieval) • 탐색시점에 따른 구분 • 소급탐색 (Retrospective Retrieval) • 최신정보주지 (SDI, Current Awareness) • 처리 방식에 따른 구분 • 오프라인 검색 혹은 배치검색 (Off-line or Batch Retrieval) • 온라인 검색 (On-line Retrieval)

  39. 정보의 내용에 따른 구분 • 참조검색 (Reference Retrieval) : • 원문의 획득에 도움이 될 수 있거나 참조할 수 있는 사항을 검색하는 것 • 서지 사항을 통한 정보의 검색을 의미하며,문헌정보에 대한 정보 검색은 대부분 이 범주에 속함 • 서지 사항이란 각각의 정보 아이템(예: 문헌)을 대표할 수 있는 정보를 포함하는 것으로 제목, 저자, 출판사항 등을 포함 • 경우에 따라 초록이나 주제를 나타내는 키워드가 포함되기도 함. • 서지 사항을 통한 검색된 결과를 바탕으로 2차 검색이나 원문 신청을 통하여 정보의 획득이 가능

  40. 정보의 내용에 따른 구분 • 사실 검색 (Fact Retrieval) : • 데이터 검색이라고도 함 • 데이터 또는 비교적 간단하고 기본적인 사실이나 데이터를 검색 • 화합물의 구조, 물질의 특성, 유전정보, 실험 수치 등과 같은 실물 정보의 검색이 이 범주에 속함 • 이 검색은 자연과학이나 응용과학 분야에서 주로 사용되는 물질이나 재료의 성질에 관한 정보, 자연이나 환경의 관측 결과 정보, 각종 경제지표, 기업의 재무 등 각종 수치 정보가 주요 검색 대상

  41. 정보의 내용에 따른 구분 • 전문 검색 (Full-text Retrieval) : • 문헌의 전문(full-text)을 축적해 놓은 데이터베이스로부터 서지 데이터는 물론 원문의 전부 혹은 일부를 검색하는 것 • 대상 문헌에 포함된 전체 내용이 검색의 대상이 된다는 점에서 전문 검색은 참조 검색과 차이 • 전문 검색은 문헌의 디지털화의 증가와 검색 기술의 발달로 점차 확대

  42. 정보의 내용에 따른 구분 • 질문 응답 (Question-Answering) : • 사실적인 정보를 검색할 수 있도록 만든 시스템으로 이용자의 질의와 검색되는 정보도 자연어이다. • 자연어 처리가 중요하기 때문에 인공지능 연구의 초기 단계에 시험적으로 운영되었으나 최근에는 지능형 정보시스템의 인터페이스로 많이 이용 • 화상정보를 데이터베이스에 수록하여 이용자에게 제공하는 화상정보 검색 • 검색되는 정보의 유형이 문자정보, 화상정보, 음성정보 등의 다양한 형태를 검색할 수 있는 멀티미디어 검색(Multimedia Retrieval)

  43. 탐색 시점에 따른 구분 • 소급 탐색 (Retrospective Search) : • 기존에 생성된 정보에 대한 검색을 의미 • 즉, 특정한 주제와 관련된 정보자료를 소급하여 탐색하는 것으로 데이터베이스에 수록되어 있는 관련 자료를 모두 검색하는 것 • 정보의 검색은 검색의 대상이 현재 존재한다는 가정 하에서 검색이 수행되며, 한번의 검색으로 작업이 종료

  44. 탐색 시점에 따른 구분 • 최신 정보 주지 (Current Awareness Service) : • 소급 탐색은 과거의 선행 연구를 조사하기 위한 것 • 최신 정보 주지는 향후 새롭게 도착되는 정보를 대상으로 검색이 수행 (정보 필터링 기술이 요구) • 즉, 현재 생성되지 않은 정보에 대해서 개인이나 단체가 필요한 정보에 대한 주제를 선택하여 등록하고 새로운 정보가 생성될 때마다 자동으로 검색하여 등록된 주제에 일치하는 정보를 제공 • 이용자의 검색 행위가 발생하는 시점에서 검색의 대상이 되는 정보가 존재하지 않는다는 점에서 소급 검색과는 정반대의 개념 • 현재 널리 활용되고 있는 선택적 정보제공(SDI: Selective Dissemination of Information)이나 E-mail Push Service가 좋은 예

  45. 온라인 검색 • 온라인 검색 • 이용자에 의한 직접 검색이 가능 • 실시간(Real-time) 검색이 가능 • 응답시간이 단축 • 검색조건의 변경이 가능 (이용자에 의한, 중재자에 의한) • 이용자와 중재자간의 대화가 요구 • 이용자의 요구에 대한 정확한 이해가 요구 • 이용자 자신은 자신이 요구에 대한 정확한 표현이 요구 • 이용자와 중재자간의 협상 • 검색결과에 대한 처리가 용이 (이용자가 현장에서 직접 판단) • 정보의 입수에 소요되는 시간이 짧다

  46. 배치 검색 • 배치 검색 • 이용자의 검색 요구를 축적하여 일괄적으로 검색 • 이용자에 의한 직접 검색이 불가능 • 실시간(Real-time) 검색이 불가 • 응답시간이 길어짐 • 검색결과에 대한 처리가 어려움 • 검색결과가 제공된 후 이용자의 요구 사항을 재 반영 • 실제 정보 검색에 소요되는 시간과 비용의 절감이 가능

More Related