1 / 31

Multimedia data : 여러 데이터가 통합된 형태

미디어 클래스. Media. 장비 클래스. Text. Image. Audio. Video. Device. Capture-Device. Storage-Device. Presentation-Device. 6. 멀티미디어 데이터베이스 – 6 .1 개요. Multimedia data : 여러 데이터가 통합된 형태. 복잡한 데이터 검색. - 순차 검색 - 설명 기반 (description-based) 검색 - 내용 기반 (content-based) 검색. 복잡한 데이터 구조.

dava
Download Presentation

Multimedia data : 여러 데이터가 통합된 형태

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. 미디어 클래스 Media 장비 클래스 Text Image Audio Video Device Capture-Device Storage-Device Presentation-Device 6. 멀티미디어 데이터베이스 – 6.1 개요 • Multimedia data : 여러 데이터가 통합된 형태

  2. 복잡한 데이터 검색 - 순차 검색 - 설명 기반 (description-based) 검색 - 내용 기반 (content-based) 검색 복잡한 데이터 구조 - 개념 구조 (conceptual structures) (예 : 개요, 가격, 도면 등) - 논리 구조 (logical structures) (예 : 장, 절, 구절 등) - 레이아웃 구조 (layout structures) (예 : 페이지, 화면 단위 등) 6.2 멀티미디어 데이터의 특징 대용량 데이터

  3. 각 미디어 데이터별 크기 Media Representation Data Size Text ASCII 200KB/100pages Image GIF, TIFF JPEG 3.2MB/image 0.4MB/image Video Uncompressed HDTV MPEG 20MB/sec 110MB/sec 0.2-1.5Mbits/sec Audio Uncompressed CD-quality 64Kbits/sec 1.4Mbits/sec

  4. Feature Extraction Module Query Processing Module Multi-dimensional Data Index DBMS 내용 기반 검색 기법을 이용하는 환경

  5. 실제 데이터 Raw data - 멀티미디어 데이터 그 자체 - 예 : 문자의 집합, 이미지 픽셀의 집합, 오디오 샘플의 시퀀스 등 설명 데이터 Description data - 저장된 미디어를 검색하기 위하여 저장된 데이터 - 예 : 저장 미디어의 제목, 구조, 특징 등 - 선택 사항 6. 2.3 복잡한 데이터 구조 등록 데이터 Registration data - 비정형 데이터의 특성 및 필요한 정보를 따로 추출하여 저장한 데이터 - 실제 데이터를 출력하거나 처리하기 위하여 필요한 데이터

  6. 멀티미디어 데이터 구성 Raw Data Registration Data Description Data (Retrieval Data)

  7. 현 전산 시스템 공로 현 전산 시스템 한계 • DB 구축 및 활용 보편화 • OLTP 업무 성공적 지원 • 각종 레포트 생성 • 전체적 일관성 결여 • 효율적 의사결정 지원 불가 • “고급 정보” 추출 불가 데이터 웨어하우스 출현 DSS/EIS 기대감 증가 • 저책 결정 중요성 증가 • DSS/EIS 요구 증가 • 클라이언트 컴퓨터 환경 발전 • GUI 기술 발전 6.2. 데이터 웨어하우스 – 6.2.1출현 배경

  8. 6.2.2 데이터 웨어하우스 정의 정의(I) 경영 및 정책 결정에 필요한 정보 처리 기능을 효율적으로 지원하는 대용량 데이터베이스 정의(II) 의사 결정 지원을 위한 데이터 모음으로 주제 중심 (subject-oriented), 통합성 (integration), 시간성 (time-variant), 비갱신성 (non-volatile) 등의 특성을 지닌다. 정의(III) 기존 시스템의 운영 데이터 (operational data)로부터 추출한 것을 저장소 DBMS로 적재하기 이전에 저장, 변형, 통합, 검증 등의 과정을 거친 이력 데이터를 관리하는 구조물

  9. 운영 데이터 데이터 웨어하우스 저축 고객 대출 자금운용 신용도 기획 주소 Applications-Oriented Subject-Oriented 6.2.3 주제 중심적(subject-oriented) 구성 • 데이터 웨어하우스는 각 조직의 주요 주제를 중심으로 데이터를 구성함 • 데이터 웨어하우스는 의사 결정에 필요한 데이터만을 유지함 • 데이터간의 관계에서도 시간을 비롯한 여러 가지 분석 관점이 따름

  10. Desc.1 of Appl.1 Desc. of Data Warehouse Desc.2 of Appl.2 Desc.3 of Appl.3 JaehoLee of Appl.1 JaehoLee of Data Warehouse 이재호 of Appl.2 JHL of Appl.3 male of Appl.1 남 of Appl.2 male of Data Warehouse 1 of Appl.3 6.2.4 통합된(integrated) 내용 • 데이터 웨어하우스의 데이터는 통합되어 있음 • 통합 : 속성의 이름, 자료 표현, 계산 단위 등이 일관성이 있음을 의미함

  11. 운영 데이터 데이터 웨어하우스 time 1 time 2 최근값으로 변경 새로운 레코드의 추가 time 3 6.2.5 시간에 따라 변화되는(time-variant) 값의 유지 • 데이터 웨어하우스는 시간에 따른 모든 순간의 값을 유지한다. • 일단 일련의 스냅샷(snapshot)으로 올바르게 기록되면 갱신되지 않음

  12. 운영 데이터 데이터 웨어하우스 load select insert update delete read-only 6.2.6 비갱신성(non-volatile) • 데이터 웨어하우스에서 데이터 갱신은 초기 적재 이후 발생하지 않음 • 설계시 갱신 이상 (update anomaly)을 염려할 필요가 없음

  13. 6.2.7 데이터 웨어하우스 특성 분석 • 데이터 웨어하우스는 기존의 OLTP 전용 전산 시스템과는 여러가지 측면에서 차이점이 존재한다. • 사용 목적에 있어서 차이점 존재 • 사용 대상에 있어서 차이점 존재 • 처리 데이터의 특성상에 차이점 존재 • 데이터 모델 분야에 차이점 존재 • 데이터베이스 크기 차이점 존재 • 질의 특성 분야에서도 차이점 존재

  14. DSS EIS 변환/추출 DW 보고서 기존 응용 시스템 데이터 처리 (Data Processing) 정보 처리 (Information Processing) 데이터 웨어하우스 구성도

  15. 데이터 특성 구분 특징 정보 특성 포함 데이터 개발 단계 OLTP 시스템 데이터 처리 재래시스템 DB 공장 - - 기개발, 보완 ODS 공장 창고 전술적 정보 1일이내 데이터 3단계 OLAP 시스템 정보 처리 DW 물류 창고 전략적 정보 1일경과 데이터 1단계 데이터 마트 상점 특정 분야 정보 1일경과 데이터 2단계 데이터 웨어하우스 (DW 구성 요소 예)

  16. 종 류 업무처리/창구 직원 경영자/분석가 구분 OLTP DW 동 시 성 많은 동시성 적은 동시성 사용자 응 답 시 간 즉시 응답 특 징 단위(atomic) 요약(summary) 구 성 응용 중심 주제 중심 데이터 시 간 성 현재 과거 갱 신 동적(dynamic) 정적(static) 목 표 업무처리 정보 검색, 분석 데 이 터 모 델 정규화된 모델 다차원 모델 기타 D B 크 기 수~수십GB 수백GB~수TB 질 의 레 코 드 10여개 수십~수십만개 질 의 predictable Unpredictable, Ad hoc 일 관 성 지역 일관성 전역 일관성 성 능 평 가 TPC-C 등 TPC-D 요 구 사 항 구축된 완전정의 구축전 완전정의 불가능 데 이 터 출 처 내부 내부, 외부 OLTP 시스템과 DW 특성 비교

  17. 6.2.8 데이터 웨어하우스 구축 방법론 –고려 사항 • 사용자 측면에서의 고려 • 현업 사용자 • 데이터 웨어하우스 사용자 • 경영자 입장 • 기술적인 측면에서의 고려 • 적용 업무 • 예산 선정

  18. Planning Requirements & Design Prototype (Supertype) Physical Design Develop & Install Evaluate & Refine 6.2.8 데이터 웨어하우스 구축 방법론 –구축 방법 • 하향식 방법 • 전사적인 데이터 웨어 하우스를 구성한 후 데이터 마트를 추가로 구성해 나감 • 데이터의 일관성 유지 및 확장이 용이함

  19. Development Construction Planning Scope Analysis & Design Requirements Phase 1 Phase 2 Phase 3 6.2.8 데이터 웨어하우스 구축 방법론 –구축 방법 • 상향식 방법 • Spiral 방식에 의거하여 데이터 마트부터 구성한 후 전사적인 데이터 웨어 하우스를 구축해 나감 • 위험 부담이 적고, 분산 웨어하우스의 근간을 이룰 수 있음

  20. 6.2.9 데이터 웨어하우스 구축 절차 • 구축 절차 • 요구사항 분석 및 주제 영역 선정 –1단계 파일롯 시스템 구축 • 데이터 웨어하우스 구조 설계 • 파일롯(pilot) 시스템을 구축 • 1단계로 개발한 파일롯 시스템에 대한 시험 테스트 • 주제 영역 확장(추가)하여 개발 작업 시행 • 고려 사항 • 정확한 업무 분석 • 기존 구축 시스템과의 통합 또는 연계 방안 수립 • 각 단위 사이트 특성에 적합한 데이터 웨어하우스 구조 정립 • 철저한 사례 분석 작업을 통한 적용 주제 영역 정립

  21. 6.3 데이터 마이닝 – 6.3.1 출현 배경 • 데이터의 홍수 시대 • - 기업의 데이터베이스는 매년 사업 관련 데이터의 양이 2배 이상씩 증가 • 대용량 데이터베이스 구축(데이터 웨어하우스) • - 사용자가 필요한 정보를 효과적으로 찾아내는 것이 중요한 이슈가 됨 • 정보 기술(IT : Intormation Technology) 발전 단계 • - 1960년대 : 데이터 수집(data collection) 기술 • - 1980년대 : 데이터 접근(data access) 기술 • - 1990년대 : 데이터에 대한 질의(data queries) 기술 • - 1990년대 : 데이터 과잉 문제(data glut problem) 발생하여 데이터간에 의미 있는 정보를 추출하는 데이터 마이닝(DM: Data Mining) 기술이 주요 기술로 부상함 • 데이터 마이닝 기술 • - 의사 결정자들을 효과적으로 지원할 수 있도록 귀중한 정보를 찾아내는 방법

  22. 6.3.2 데이터 마이닝 기술 정의 정 의 대용량 데이타베이스내에서 이전에 알려지지 않았던 패턴들을 효과적으로 발견하는 기술 잠재적으로 유효하고,새롭고 타당성이 있으면서 궁극적으로 데이터에서 이해할 수 있는 패턴을 찾아내는 기술 대량의 데이터로 부터 묵시적이고, 잠재적으로 유용한 정보를 추출하는 기술 데이터간의 상호 관련성, 패턴, 경향 등 유용한 정보를 추출하여 실제의 의사 결정에 적용하느 전 과정 의사 결정자들의 행동 기준이 될 새로운 지식 창출

  23. 데이터 마이닝 AI DB 크기 데이터 저장소 (VLDB : Very Large DB) 지식 베이스 (Small size DB) 기반 메모리 디스크 기반 (Disk based) 주기억 장치 기반 (Main Memory based) 6.3.3 데이터 마이닝 기술의 특징 • 데이터 마이닝 기술 - 다양한 분야의 기술들이 사용되는 복합 기술 • 데이터 마이닝 vs. AI • 데이터 마이닝 vs. 기계 학습 데이터 마이닝 기계 학습 갱신 빈도 동적 정적 정확도 부정확(오류 포함) 정확(오류 포함) 누락 허용 여부 허용 불허용 주제와의 연관성 주제와 무관한 데이터 혼재 주제와 관련 있는 데이터 DB크기 대용량 소용량

  24. 결과 분석 데이터 마이닝 마이닝 툴 선정 Data cleaning Coding, Enrichment 원천데이터 선택 적용 업무 정의 6.3.4 데이터 마이닝 개발 절차

  25. 6.3.5 데이터 마이닝 요소 기술 분석 목표 영역 지식 결정 규칙 사용자 질의 데이터 스키밍 특성화 분류화 논리적 입력 군집화 입력 적용 기술 정상입력 연관규칙 탐사 Belief 지식 데이터 마이닝 이슈 물리적 입력 경향분석 Priori 지식 비정상 입력 패턴분석 불완전 입력 유용성 추출지표 오류 입력 지지도 신뢰도 설득치 흥미도 경이도 분포도 상관도 유사도

  26. 클라이언트(Client) 웹 서버(Web Server) DB 서버(DB Server) Script 번역기 DBMS Plug-In WWW 브라우저 CGI CGI 응용 DB 외부 뷰어 DB 응용 확장 API WWW 문서 서비스 모델 연동 구조 저장 모델 • HTML, XML • XHTML, PHP • C/C++ • SQL • ASP • Java Script • Perl • CGI 실행 파일 • CGI 응용 서버 • 전용 연동 서버 • 웹서버 확장 API • ODBC • JDBC • CORBA(ORB) • 관계 모델 • 객체-관계 모델 • 객체지향 모델 인터넷(HTTP) DB 검색 6.4 웹 데이터베이스 – 6.4.1 출현 배경 • 새로운 웹 서비스의 출현으로 대용량 데이터의 관리가 필요 • 웹 데이터베이스 시스템 구성 형태

  27. DB 통로 구현 방법 서버측 확장 방법 클라이언트 확장 방법 확장 API 방법 CGI 응용 방법 외부 뷰어 추가 브라우저 기능 확장 CGI 실행 파일 방법 CGI 응용 서버 방법 6.4.2 웹 데이터베이스 연동 기법 • 데이터베이스 통로(DB Gareway)- 웹 서비스와 데이터베이스 시스템 간의 상이한 성질을 가지는 두 서비스간의 연동을 수행하는 미들웨어(middleware)를 말함 • 웹 데이터베이스 연동방식

  28. DB 통로 프로세스 1 프 로 세 스 파 이 프 DB 통로 프로세스 2 D B M S DB CGI WWW Server DB 통로 프로세스 2 DB 통로 프로세스 n 6.4.3 CGI 실행 파일 방식 • 기존의 웹 서버와 웹 브라우저의 수정이 불필요한 방식 • CGI 실행 방식 동작 개념

  29. 디스패처 프 로 세 스 파 이 프 디스패처 D B M S Daemon DB CGI WWW Server 디스패처 디스패처 6.4.4 CGI 응용 서버 방식 • CGI 실행 파일 방식 접근 프로세서를 데몬(daemon) 으로 변경한 방식 • CGI 응용 서버 방식 동작 개념

  30. D B M S DB API WWW Server 6.4.5 확장 API 사용 방식 • API(Application Program Interface)를 이용 웹 서버 자체에 데이터베이스 접속 기능을 부가한 형태 • 확장 API 사용 방식 동작 개념

  31. 6.4.6 XML 저장 시스템 • HTML • 유한 개수의 태그(tag) 지원으로 단순한 명령들을 포함 • 배우기가 쉽다 • 다양한 소프트웨어에서 사용 • 복잡한 응용분야에서 이용이 부적합함 • XML(eXtensible Markup Language) • 1997년 W3C(WWW Consortium)에서 HTML의 편리한 사용성과 SGML 의 확장성 등의 장점을 조합한 XML을 정의 • 정보를 표현하는 외형과 내용을 분리하여 구조화함 • 문서를 데이터베이스로 저장하여 사용하기에 적합함

More Related