190 likes | 406 Views
11.멀티미디어 정보검색 모델과 언어. 목차 11.1 소개 11.2 데이터 모델링 11.3 질의어 11.4 연구 동향 및 쟁점 11.5 참고 문헌 고찰. 11. 1 소개. 멀티미디어 정보 시스템의 중요 특징 : 다양한 자료들을 다루어야 한다 매우 복잡한 구조의 객체에 대한 기본 자료 모형, 질의어 ,접근법, 저장법이 지원 되야 한다. 데이터 검색 : 데이터 속성 뿐만 아니라 멀티미디어 객체의 내용을 이용 사용자 요구 효율적 검색 하는것이 멀티미디어 정보 검색 시스템의 주 목표.
E N D
11.멀티미디어 정보검색 모델과 언어 목차 11.1 소개 11.2 데이터 모델링 11.3 질의어 11.4 연구 동향 및 쟁점 11.5 참고 문헌 고찰 Chapter 11
11. 1 소개 • 멀티미디어 정보 시스템의 중요 특징 : 다양한 자료들을 다루어야 한다 매우 복잡한 구조의 객체에 대한 기본 자료 모형, 질의어 ,접근법, 저장법이 지원 되야 한다. • 데이터 검색 : 데이터 속성 뿐만 아니라 멀티미디어 객체의 내용을 이용 사용자 요구 효율적 검색 하는것이 멀티미디어 정보 검색 시스템의 주 목표 Chapter 11
11. 1 소개(계속) • 데이터 검색에 기본단계 - 질의 명세 : 사용자가 자신의 요구 명시 - 질의 처리 및 최적화 : 시스템 내부 표현 생성시 가장 좋은 평가 계획 수립 하도록 질의 최적화 - 질의 응답 : 검색 객체 연관성의 역순으로 제시 - 질의 반복 : 사용자가 만족할때 까지 반복 • 멀티미디어, 전통적 정보검색 시스템차이 - 멀티미디어 객체는 전통적인 정보 검색 시스템이 다루는 텍스트 데이터 구조보다 복잡 - 객체 검색은 유사도에 의지, 검색된 객체들은 유사도 순으로 정렬 사용자에게 보여짐 Chapter 11
11. 2 데이터 모델링 • 멀티미디어 데이터와 일반데이터의 차이 - 스키마에 의해서 제공된 속성으로 표현될 수 없다 - 멀티미디어 데이터는 대량의 메모리가 요구 • 정보 검색 시스템의 관점에서 데이터 모델링의 문제점 - 자료형과 멀티미디어 자료형을 함께 지원할수 있어야 한다. - 멀티미디어 데이터를 시스템 내에 어떻게 표현할 것인가 Chapter 11
11. 2. 1 상용 DBMS에서 멀티 미디어 데이터 지원 • 상용 DBMS에서 가변 길이 자료형을 다루는 방법은 표준화 가 안됨 (각각의 회사들은 가변길이 자료형을 서로 다른 이름으로 부름, 가변 자료형 연산도 틀림) • DBMS는 데이터 내용에 관한 해석 제공 안함, 자료형들이 매우 제한적, DBMS에서 제공되는 내장 함수로 수행할 연산 매우 단순 • SQL3 : 일반 객체 지향 환경에서처럼 복잡한 객체 모델링하도록 관계형 모델 확장한 언어 표준 Chapter 11
11. 2. 1 상용 DBMS에서 멀티 미디어 데이터 지원(계속) • 상용 SQL3에 종류 - 데이터 커트리지(ORACLE) - 데이터 블레이드(ILLUSTRA) • 객체 관계 기술과 확장타입 시스템 - La Scala 아카이브 연구과제 (Oracle 기술인 Teatro alla Scala의 멀티 미디어 아카이브 개발하는것) Chapter 11
11. 2. 2 MULTOS 데이터 모델 • MULTOS - 고급 문헌 검색이 가능한 멀티미디어 문헌 서버 - 클라이언트/서버구조에 바탕 - MULTOS 데이터 모델은 고수준의 개념 표현 가능 Chapter 11
11. 2. 2 MULTOS 데이터 모델(계속) 그림 11.1은 타입 Generic_Letter의 개념 구조이며, 노드 Letter_Body는 스프링 컴포넌트 타입이다. 그림11.2는 타입 Business_Product_Letter의 완전한 개념 구조이며, 그림 11.1의 Letter_Body를 복잡한 개념 요소로 명시화 함으로써 만들어진 것이다. 이 개념 요소는 다섯 개의 개념 요소를 포함하는 집합이다. 개념모델에 따라서 문헌 타입 Business_Product_Letter는 is_a관계로 문헌 타입 Generic_Letter와 연결된다. 예에서 구성 요소 Receiver에 붙은 + 기호는 여러 개의 값을 가지고 있음을 의미하며, Name과 Address는 개념 요소 Receiver와 Sender를 루트로 하는 두 서브트리 내에 있다. Chapter 11
11. 3 질의어 • 멀티미디어 질의 설계 고려사항 • 사용자는 자신의 요구를 어떻게 시스템에 입력할 것인가? • 사용자는 멀티미디어 객체에 관한 어떤 조건을 요구로 명시할 것인가? • 불확실성 정도, 유사도, 가중치는 어떤 방법으로 질의어 설계에 반영되나 Chapter 11
11. 3. 1 요구 명세 • 객체 질의 위한 두 종류의 인터페이스 - 브라우징과 항해에 기반 - 질의에 기반 • 질의의 명시 두가지 - 특졀한 질의어(전통적인 데이터에 사용) - 예제 기반 질의 방법(이미지와 오디오 데이터에 유용) Chapter 11
11. 3. 2 멀티미디어 데이터에 대한 조건들 • 질의 술어 세가지 그룹 - 속성 술어 : 멀티 미디어 객체의 속성 - 구조적 술어 : 고려되어야 할 데이터의 구조 - 의미적 술어 : 포함된 데이터의 의미와 구조화되지 않은 내용 Chapter 11
11. 3. 3 질의 표현 내의 불확실성과 근접성 및 가중치 • 검색된 객체의 연관성 정도 명시 방법 - Nomal, unacceptable, typical과 같이 부정확한 용어를 사용 - 특정한 근접 술어를 명시 - 각각의 조건 혹은 용어에 가중치 부여 Chapter 11
11. 3. 4 몇 가지 제안 • SQL질의어 : SQL-92에 비해 개선된점 - 함수와 저장된 프로시듀어 - 활동 데이터베이스 기능 • 장점 - 멀티미디어 응용에 적합한 인터페이스 언어로 사용 - 외부 함수와 사용자 정의 데이터 타입들을 다루는 능력은 복잡한 구조를 가진 멀티미디어 객체 다루도록 함 - 데이터 베이스의 일관성이 유지 Chapter 11
11. 3. 4 몇 가지 제안(계속) • 단점 - 어떤 정보 검색 기술들도 SQL3 질의 처리기와 통합 될수 없다. - 객체들은 순위화 되지 않고, 하나의 집합으로 응용에 반환 - 사용자가 색인 기술을 알아야 한다. Chapter 11
11. 3. 4 몇 가지 제안(계속) • MULTOS 질의어 : 개발의 이유 - 문헌 구조를 통해 쉽게 항해할 수 있어야 함 - 복잡한 구성 요소에 대한 질의 술어들이 반드시 지원되어야 함 Chapter 11
11. 3. 4 몇 가지 제안(계속) - MULTOS 질의 형식 FIND DOCUMENTS VERSION version-clause SCOPE scope-clause TYPE type-clause WHERE condition-clause WITH component • MULTOS가 지원하는 술어 - 데이터 속성에 관한 술어 - 텍스트 구성 요소에 관한 술어 - 이미지에 관한 술어 Chapter 11
11. 3. 4 몇 가지 제안(계속) 보기2 FIND DOCUMENT VERSIONS LAST WHERE Document.Date > 1/1/1998 AND (*Sender.Name = "Olivetti" OR *Product_Presentation CONTAINS "Olivetti")AND *Product_Description CONTAINS "Personal Computer" AND (*Address.Country = "Italy" OR TEXT CONTAINS "Italy") AND WITH *Company_Logo. Chapter 11
11. 3. 4 몇 가지 제안(계속) FIND DOCUMENT VERSIONS LAST WHERE (Document.DateBETWEEN (12/31/1998, 1/31/98) PREFERRED BETWEEN (2/1/1998, 2/15/98) ACCEPTABLE) HIGH AND (*Sender.Name= "Olivetti" OR *Product_Presentation CONTAINS "Olivetti") HIGH AND (*Product_Description CONTAINS "Personal Computer") HIGH AND (*Product_Description CONTAINS "good ergonomics") LOW AND (*Address.Country= "Italy" OR TEXT CONTAINS "Italy") HIGH AND WITH *Company_Logo HIGH (IMAGE MATCHES screen HIGH keyboard HIGH AT LEAST 2 floppy_drives LOW) HIGH Chapter 11
11. 4 연구동향 및 쟁점 • DBMS 정보 검색 기술 통합 • 멀티 미디어 데이터 모델 정의할때 발생하는 문제 • 멀티 미디어 데이터 내용 내부적적으로 표현하는 기능 Chapter 11