slide1 n.
Download
Skip this Video
Loading SlideShow in 5 Seconds..
Multimedia data : 여러 데이터가 통합된 형태 PowerPoint Presentation
Download Presentation
Multimedia data : 여러 데이터가 통합된 형태

Loading in 2 Seconds...

play fullscreen
1 / 31

Multimedia data : 여러 데이터가 통합된 형태 - PowerPoint PPT Presentation


  • 106 Views
  • Uploaded on

미디어 클래스. Media. 장비 클래스. Text. Image. Audio. Video. Device. Capture-Device. Storage-Device. Presentation-Device. 6. 멀티미디어 데이터베이스 – 6 .1 개요. Multimedia data : 여러 데이터가 통합된 형태. 복잡한 데이터 검색. - 순차 검색 - 설명 기반 (description-based) 검색 - 내용 기반 (content-based) 검색. 복잡한 데이터 구조.

loader
I am the owner, or an agent authorized to act on behalf of the owner, of the copyrighted work described.
capcha
Download Presentation

PowerPoint Slideshow about 'Multimedia data : 여러 데이터가 통합된 형태' - dava


An Image/Link below is provided (as is) to download presentation

Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author.While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server.


- - - - - - - - - - - - - - - - - - - - - - - - - - E N D - - - - - - - - - - - - - - - - - - - - - - - - - -
Presentation Transcript
slide1

미디어

클래스

Media

장비

클래스

Text

Image

Audio

Video

Device

Capture-Device

Storage-Device

Presentation-Device

6. 멀티미디어 데이터베이스 – 6.1 개요

  • Multimedia data : 여러 데이터가 통합된 형태
slide2

복잡한 데이터 검색

- 순차 검색

- 설명 기반 (description-based) 검색

- 내용 기반 (content-based) 검색

복잡한 데이터 구조

- 개념 구조 (conceptual structures)

(예 : 개요, 가격, 도면 등)

- 논리 구조 (logical structures)

(예 : 장, 절, 구절 등)

- 레이아웃 구조 (layout structures)

(예 : 페이지, 화면 단위 등)

6.2 멀티미디어 데이터의 특징

대용량 데이터

slide3

각 미디어 데이터별 크기

Media

Representation

Data Size

Text

ASCII

200KB/100pages

Image

GIF, TIFF

JPEG

3.2MB/image

0.4MB/image

Video

Uncompressed

HDTV

MPEG

20MB/sec

110MB/sec

0.2-1.5Mbits/sec

Audio

Uncompressed

CD-quality

64Kbits/sec

1.4Mbits/sec

slide4

Feature

Extraction

Module

Query

Processing

Module

Multi-dimensional

Data Index

DBMS

내용 기반 검색 기법을 이용하는 환경

slide5

실제 데이터

Raw data

- 멀티미디어 데이터 그 자체

- 예 : 문자의 집합, 이미지 픽셀의 집합, 오디오 샘플의 시퀀스 등

설명 데이터

Description data

- 저장된 미디어를 검색하기 위하여 저장된 데이터

- 예 : 저장 미디어의 제목, 구조, 특징 등

- 선택 사항

6. 2.3 복잡한 데이터 구조

등록 데이터

Registration data

- 비정형 데이터의 특성 및 필요한 정보를 따로 추출하여 저장한 데이터

- 실제 데이터를 출력하거나 처리하기 위하여 필요한 데이터

slide6

멀티미디어 데이터 구성

Raw Data

Registration Data

Description Data

(Retrieval Data)

slide7

현 전산 시스템 공로

현 전산 시스템 한계

  • DB 구축 및 활용 보편화
  • OLTP 업무 성공적 지원
  • 각종 레포트 생성
  • 전체적 일관성 결여
  • 효율적 의사결정 지원 불가
  • “고급 정보” 추출 불가

데이터 웨어하우스 출현

DSS/EIS 기대감 증가

  • 저책 결정 중요성 증가
  • DSS/EIS 요구 증가
  • 클라이언트 컴퓨터 환경 발전
  • GUI 기술 발전

6.2. 데이터 웨어하우스 – 6.2.1출현 배경

slide8

6.2.2 데이터 웨어하우스 정의

정의(I)

경영 및 정책 결정에 필요한 정보 처리 기능을 효율적으로 지원하는 대용량

데이터베이스

정의(II)

의사 결정 지원을 위한 데이터 모음으로 주제 중심 (subject-oriented),

통합성 (integration), 시간성 (time-variant), 비갱신성 (non-volatile) 등의

특성을 지닌다.

정의(III)

기존 시스템의 운영 데이터 (operational data)로부터 추출한 것을 저장소

DBMS로 적재하기 이전에 저장, 변형, 통합, 검증 등의 과정을 거친

이력 데이터를 관리하는 구조물

slide9

운영 데이터

데이터 웨어하우스

저축

고객

대출

자금운용

신용도

기획

주소

Applications-Oriented

Subject-Oriented

6.2.3 주제 중심적(subject-oriented) 구성

  • 데이터 웨어하우스는 각 조직의 주요 주제를 중심으로 데이터를 구성함
  • 데이터 웨어하우스는 의사 결정에 필요한 데이터만을 유지함
  • 데이터간의 관계에서도 시간을 비롯한 여러 가지 분석 관점이 따름
slide10

Desc.1 of Appl.1

Desc. of Data Warehouse

Desc.2 of Appl.2

Desc.3 of Appl.3

JaehoLee of Appl.1

JaehoLee of Data Warehouse

이재호 of Appl.2

JHL of Appl.3

male of Appl.1

남 of Appl.2

male of Data Warehouse

1 of Appl.3

6.2.4 통합된(integrated) 내용

  • 데이터 웨어하우스의 데이터는 통합되어 있음
  • 통합 : 속성의 이름, 자료 표현, 계산 단위 등이 일관성이 있음을 의미함
slide11

운영 데이터

데이터 웨어하우스

time 1

time 2

최근값으로 변경

새로운 레코드의 추가

time 3

6.2.5 시간에 따라 변화되는(time-variant) 값의 유지

  • 데이터 웨어하우스는 시간에 따른 모든 순간의 값을 유지한다.
  • 일단 일련의 스냅샷(snapshot)으로 올바르게 기록되면 갱신되지 않음
slide12

운영 데이터

데이터 웨어하우스

load

select insert update delete

read-only

6.2.6 비갱신성(non-volatile)

  • 데이터 웨어하우스에서 데이터 갱신은 초기 적재 이후 발생하지 않음
  • 설계시 갱신 이상 (update anomaly)을 염려할 필요가 없음
slide13

6.2.7 데이터 웨어하우스 특성 분석

  • 데이터 웨어하우스는 기존의 OLTP 전용 전산 시스템과는 여러가지 측면에서 차이점이 존재한다.
    • 사용 목적에 있어서 차이점 존재
    • 사용 대상에 있어서 차이점 존재
    • 처리 데이터의 특성상에 차이점 존재
    • 데이터 모델 분야에 차이점 존재
    • 데이터베이스 크기 차이점 존재
    • 질의 특성 분야에서도 차이점 존재
slide14

DSS

EIS

변환/추출

DW

보고서

기존 응용

시스템

데이터 처리

(Data Processing)

정보 처리

(Information Processing)

데이터 웨어하우스 구성도

slide15

데이터 특성

구분

특징

정보 특성

포함 데이터

개발 단계

OLTP

시스템

데이터 처리

재래시스템 DB

공장

-

-

기개발, 보완

ODS

공장 창고

전술적 정보

1일이내 데이터

3단계

OLAP

시스템

정보 처리

DW

물류 창고

전략적 정보

1일경과 데이터

1단계

데이터 마트

상점

특정 분야 정보

1일경과 데이터

2단계

데이터 웨어하우스 (DW 구성 요소 예)

slide16

종 류

업무처리/창구 직원

경영자/분석가

구분

OLTP

DW

동 시 성

많은 동시성

적은 동시성

사용자

응 답 시 간

즉시 응답

특 징

단위(atomic)

요약(summary)

구 성

응용 중심

주제 중심

데이터

시 간 성

현재

과거

갱 신

동적(dynamic)

정적(static)

목 표

업무처리

정보 검색, 분석

데 이 터 모 델

정규화된 모델

다차원 모델

기타

D B 크 기

수~수십GB

수백GB~수TB

질 의 레 코 드

10여개

수십~수십만개

질 의

predictable

Unpredictable, Ad hoc

일 관 성

지역 일관성

전역 일관성

성 능 평 가

TPC-C 등

TPC-D

요 구 사 항

구축된 완전정의

구축전 완전정의 불가능

데 이 터 출 처

내부

내부, 외부

OLTP 시스템과 DW 특성 비교

slide17

6.2.8 데이터 웨어하우스 구축 방법론 –고려 사항

  • 사용자 측면에서의 고려
    • 현업 사용자
    • 데이터 웨어하우스 사용자
    • 경영자 입장
  • 기술적인 측면에서의 고려
    • 적용 업무
    • 예산 선정
slide18

Planning

Requirements

& Design

Prototype

(Supertype)

Physical

Design

Develop

& Install

Evaluate

& Refine

6.2.8 데이터 웨어하우스 구축 방법론 –구축 방법

  • 하향식 방법
  • 전사적인 데이터 웨어 하우스를 구성한 후 데이터 마트를 추가로 구성해 나감
  • 데이터의 일관성 유지 및 확장이 용이함
slide19

Development

Construction

Planning

Scope

Analysis

&

Design

Requirements

Phase 1

Phase 2

Phase 3

6.2.8 데이터 웨어하우스 구축 방법론 –구축 방법

  • 상향식 방법
  • Spiral 방식에 의거하여 데이터 마트부터 구성한 후 전사적인 데이터 웨어 하우스를 구축해 나감
  • 위험 부담이 적고, 분산 웨어하우스의 근간을 이룰 수 있음
slide20

6.2.9 데이터 웨어하우스 구축 절차

  • 구축 절차
    • 요구사항 분석 및 주제 영역 선정 –1단계 파일롯 시스템 구축
    • 데이터 웨어하우스 구조 설계
    • 파일롯(pilot) 시스템을 구축
    • 1단계로 개발한 파일롯 시스템에 대한 시험 테스트
    • 주제 영역 확장(추가)하여 개발 작업 시행
  • 고려 사항
    • 정확한 업무 분석
    • 기존 구축 시스템과의 통합 또는 연계 방안 수립
    • 각 단위 사이트 특성에 적합한 데이터 웨어하우스 구조 정립
    • 철저한 사례 분석 작업을 통한 적용 주제 영역 정립
slide21

6.3 데이터 마이닝 – 6.3.1 출현 배경

  • 데이터의 홍수 시대
  • - 기업의 데이터베이스는 매년 사업 관련 데이터의 양이 2배 이상씩 증가
  • 대용량 데이터베이스 구축(데이터 웨어하우스)
  • - 사용자가 필요한 정보를 효과적으로 찾아내는 것이 중요한 이슈가 됨
  • 정보 기술(IT : Intormation Technology) 발전 단계
  • - 1960년대 : 데이터 수집(data collection) 기술
  • - 1980년대 : 데이터 접근(data access) 기술
  • - 1990년대 : 데이터에 대한 질의(data queries) 기술
  • - 1990년대 : 데이터 과잉 문제(data glut problem) 발생하여 데이터간에 의미 있는 정보를 추출하는 데이터 마이닝(DM: Data Mining) 기술이 주요 기술로 부상함
  • 데이터 마이닝 기술
  • - 의사 결정자들을 효과적으로 지원할 수 있도록 귀중한 정보를 찾아내는 방법
slide22

6.3.2 데이터 마이닝 기술 정의

정 의

대용량 데이타베이스내에서 이전에 알려지지 않았던 패턴들을

효과적으로 발견하는 기술

잠재적으로 유효하고,새롭고 타당성이 있으면서 궁극적으로

데이터에서 이해할 수 있는 패턴을 찾아내는 기술

대량의 데이터로 부터 묵시적이고, 잠재적으로 유용한 정보를

추출하는 기술

데이터간의 상호 관련성, 패턴, 경향 등 유용한 정보를 추출하여

실제의 의사 결정에 적용하느 전 과정

의사 결정자들의 행동 기준이 될 새로운 지식 창출

slide23

데이터 마이닝

AI

DB 크기

데이터 저장소

(VLDB : Very Large DB)

지식 베이스

(Small size DB)

기반 메모리

디스크 기반

(Disk based)

주기억 장치 기반

(Main Memory based)

6.3.3 데이터 마이닝 기술의 특징

  • 데이터 마이닝 기술 - 다양한 분야의 기술들이 사용되는 복합 기술
  • 데이터 마이닝 vs. AI
  • 데이터 마이닝 vs. 기계 학습

데이터 마이닝

기계 학습

갱신 빈도

동적

정적

정확도

부정확(오류 포함)

정확(오류 포함)

누락 허용 여부

허용

불허용

주제와의 연관성

주제와 무관한 데이터 혼재

주제와 관련 있는 데이터

DB크기

대용량

소용량

slide24

결과 분석

데이터 마이닝

마이닝 툴

선정

Data cleaning

Coding,

Enrichment

원천데이터

선택

적용 업무

정의

6.3.4 데이터 마이닝 개발 절차

slide25

6.3.5 데이터 마이닝 요소 기술 분석

목표

영역

지식

결정

규칙

사용자

질의

데이터

스키밍

특성화

분류화

논리적 입력

군집화

입력

적용

기술

정상입력

연관규칙

탐사

Belief

지식

데이터

마이닝

이슈

물리적 입력

경향분석

Priori

지식

비정상 입력

패턴분석

불완전

입력

유용성

추출지표

오류

입력

지지도

신뢰도

설득치

흥미도

경이도

분포도

상관도

유사도

slide26

클라이언트(Client)

웹 서버(Web Server)

DB 서버(DB Server)

Script 번역기

DBMS

Plug-In

WWW 브라우저

CGI

CGI 응용

DB

외부 뷰어

DB 응용

확장 API

WWW 문서

서비스 모델

연동 구조

저장 모델

  • HTML, XML
  • XHTML, PHP
  • C/C++
  • SQL
  • ASP
  • Java Script
  • Perl
  • CGI 실행 파일
  • CGI 응용 서버
  • 전용 연동 서버
  • 웹서버 확장 API
  • ODBC
  • JDBC
  • CORBA(ORB)
  • 관계 모델
  • 객체-관계 모델
  • 객체지향 모델

인터넷(HTTP)

DB 검색

6.4 웹 데이터베이스 – 6.4.1 출현 배경

  • 새로운 웹 서비스의 출현으로 대용량 데이터의 관리가 필요
  • 웹 데이터베이스 시스템 구성 형태
slide27

DB 통로 구현 방법

서버측 확장 방법

클라이언트

확장 방법

확장 API 방법

CGI 응용 방법

외부 뷰어 추가

브라우저

기능 확장

CGI 실행 파일 방법

CGI 응용 서버 방법

6.4.2 웹 데이터베이스 연동 기법

  • 데이터베이스 통로(DB Gareway)- 웹 서비스와 데이터베이스 시스템 간의 상이한 성질을 가지는 두 서비스간의 연동을 수행하는 미들웨어(middleware)를 말함
  • 웹 데이터베이스 연동방식
slide28

DB 통로

프로세스 1

DB 통로

프로세스 2

D

B

M

S

DB

CGI

WWW

Server

DB 통로

프로세스 2

DB 통로

프로세스 n

6.4.3 CGI 실행 파일 방식

  • 기존의 웹 서버와 웹 브라우저의 수정이 불필요한 방식
  • CGI 실행 방식 동작 개념
slide29

디스패처

디스패처

D

B

M

S

Daemon

DB

CGI

WWW

Server

디스패처

디스패처

6.4.4 CGI 응용 서버 방식

  • CGI 실행 파일 방식 접근 프로세서를 데몬(daemon) 으로 변경한 방식
  • CGI 응용 서버 방식 동작 개념
slide30

D

B

M

S

DB

API

WWW

Server

6.4.5 확장 API 사용 방식

  • API(Application Program Interface)를 이용 웹 서버 자체에 데이터베이스 접속 기능을 부가한 형태
  • 확장 API 사용 방식 동작 개념
slide31

6.4.6 XML 저장 시스템

  • HTML
    • 유한 개수의 태그(tag) 지원으로 단순한 명령들을 포함
    • 배우기가 쉽다
    • 다양한 소프트웨어에서 사용
    • 복잡한 응용분야에서 이용이 부적합함
  • XML(eXtensible Markup Language)
    • 1997년 W3C(WWW Consortium)에서 HTML의 편리한 사용성과 SGML 의 확장성 등의 장점을 조합한 XML을 정의
    • 정보를 표현하는 외형과 내용을 분리하여 구조화함
    • 문서를 데이터베이스로 저장하여 사용하기에 적합함