210 likes | 849 Views
벡터 양자화와 유전 알고리즘을 이용한 문서 영상 압축. 전북 대학교 전자 정보 공학부 컴퓨터 비젼 연구실 김영원. 2001. 8. 24. 목차. 1. 서론 2. 유전 알고리즘과 LBG 알고리즘을 이용한 벡터 양자화 2.1 벡터 양자화 2.2 유전 알고리즘 2.3 LBG 알고리즘 2.4 혼합형 유전 알고리즘 3. 문서 영상 압축을 위한 알고리즘 3.1 부분 영상 코드북 설계 3.2 압축률 분석 4. 결론. 1. 서론. 영상의 처리 , 전송 , 저장 등 증가 추세
E N D
벡터 양자화와 유전 알고리즘을 이용한 문서 영상 압축 전북 대학교 전자 정보 공학부 컴퓨터 비젼 연구실 김영원 2001. 8. 24
목차 1. 서론 2. 유전 알고리즘과 LBG 알고리즘을 이용한 벡터 양자화 2.1 벡터 양자화 2.2 유전 알고리즘 2.3 LBG 알고리즘 2.4 혼합형 유전 알고리즘 3. 문서 영상 압축을 위한 알고리즘 3.1 부분 영상 코드북 설계 3.2 압축률 분석 4. 결론 전북대학교 컴퓨터 비젼실
1. 서론 • 영상의 처리, 전송, 저장 등 증가 추세 - 영상 압축의 필요성 급증 - 압축방법 : JPEG, MPEG, 벡터 양자화 (Vector Quantization), 유전 알고리즘과 LBG알고리즘을 결합한 알고리즘 Zheng–Julstrom-Cheng, 1997 • e-book, 전자 도서관 등의 사업 - 문서 영상 압축의 필요성 대두 - 문서 영상 특성 •정형화된 모양을 갖는 획들로 구성 • white 영역 넓음 • 연구내용 - 문서 영상의 특성을 이용한 효율적인 압축 - Zheng–Julstrom-Cheng의 알고리즘 도입 전북대학교 컴퓨터 비젼실
코드워드 그림1. 벡터 양자화를 이용한 압축의 원리 2. 유전 알고리즘과 LBG 알고리즘을 이용한 벡터 양자화 2.1 벡터 양자화 : 원 영상을 mⅩm 크기의 블록들로 분할한 후, 그 블록들을 이용하여 적은 수의 대표 블록들을 생성하여 원 영상을 그 대표 블록들로 표현하는 방법 전북대학교 컴퓨터 비젼실
코드북 설계 1 2 매핑 원 영상 2 2 1 1 2 2 1 1 1 1 2 2 1 1 2 2 압축영상 그림2. 벡터 양자화 예 - 두 가지 주요 문제 •코드북 설계 •설계된 코드북으로 원영상을 가장 유사하게 표현 전북대학교 컴퓨터 비젼실
2.2 유전 알고리즘 (Genetic Algorithm) : 임의의 개체 집단이 세대를 거듭 하는 동안 교차와 돌연변이라는 유전 연산에 의해서 최적 해에 가깝도록 진화하는 알고리즘이다. 유전 알고리즘 { t 0; 초기 유전개체 집단 P(t) 생성; 초기 유전개체 집단 P(t) 평가; while ( not 종료조건 ) do { t t+1; // 다음 세대로 진화 P(t-1)에서 P(t) 선택; P(t) 변형; // 교차(crossover), 변이(mutation) 연산자 P(t) 평가; } } 전북대학교 컴퓨터 비젼실
코드북 1 2 3 1 2 3 3 3 1 1 2 1 2 2 2 유전개체1 평균 • • • • • • 원 영상 유전개체20 1 2 1 3 2 1 2 3 2 코드북 평가 코드북 평가 우수 유전개체 선택 교차와 돌연변이 세대증가 그림3. 유전알고리즘을 이용한 벡터 양자화 전북대학교 컴퓨터 비젼실
2.3 LBG (Linde-Buzo-Gray) 알고리즘 : suboptimal 해를 구하기 위한 대표적인 지역탐색 알고리즘 Algorithm LBG { 블럭들을 k개의 집합으로 분할한다; //초기 코드북 각 집합에 대응되는 블럭들의 평균값을 코드워드로 삼는다; do { 각 블럭을 가장 가까운 코드워드로 대응시킨다; 대응되는 블럭이 하나도 없는 코드워드 Ci가 존재하면 가장 많은 블럭이 대응되는 코드워드을 찾아 해당 블럭들을 두 그룹으로 나눈 다음 그 중 한 그룹을 Ci에 대응시킨다; 변화가 있는 코드워드들을 다시 계산한다; }while (종료 조건) } 전북대학교 컴퓨터 비젼실
코드북 1 2 3 1 2 3 3 3 1 1 2 1 2 2 2 1 2 1 3 2 1 3 1 2 유전개체 평균 원 영상 원 영상 유전 알고리즘 LBG 알고리즘 코드북 유전개체 그림4. 유전 알고리즘 후 LBG 알고리즘 적용 전북대학교 컴퓨터 비젼실
2.4 혼합형 유전 알고리즘 최적의 코드북 생성을 위해 Zheng-Julstrom-Cheng은 유전 알고리즘에 LBG 알고리즘을 적용하였다. 혼합형 유전 알고리즘 { t = 0; // 첫 세대 임의의 N개의 코드북 초기화; 코드북 평가; while( not 종료조건 ) do { t = t+1; // 다음 세대로 진화 우수 코드북 선택; // 다음세대 집단을 만든다. 코드북 변형; // 유전연산자 ( 교차, 돌연변이) LBG; // 최적의 코드북 탐색. 코드북 평가; } } 전북대학교 컴퓨터 비젼실
3. 문서 영상 압축을 위한 유전 알고리즘 3.1 부분 영상 코드북 설계 1) 문서 영상의 특성 - 획이라는 비교적 정형화된 패턴 요소들로 구성 2) 문서 영상의 특성을 이용한 벡터 양자화 - 부분 영상에서 코드북을 설계하고 전체 영상에 유사 블록 으로 매핑 그림2. 문서 영상의 벡터 양자화 과정 전북대학교 컴퓨터 비젼실
- 유전 알고리즘의 반복 횟수 : 100회 - 코드북 평가 함수 * MSE(Mean Square Error) : 원 영상과 압축 영상의 차이를 재는 함수 * PSNR : 원 영상과 왜곡 정도를 나타내는 측도 range-of-value : 원 영상에서 픽셀 값의 범위 전북대학교 컴퓨터 비젼실
코드워드 : 3Ⅹ3 코드북크기 : 64 부분 영상(120Ⅹ60) 코드북으로 표현한 압축 영상 (900Ⅹ1200) 원 영상(900Ⅹ1200) 3) 실험 결과 - 부분영상의 코드북으로 전체 영상 표현 전북대학교 컴퓨터 비젼실
3Ⅹ3 코드워드 크기 4Ⅹ4 5Ⅹ5 부분영상(120Ⅹ60) 코드북 작성 소요시간(초) 712.925 753.143 689.943 매칭 time Quality 43.152 전체영상(900Ⅹ1200)코드북 매칭 44.243 43.853 395.816 398.423 402.566 원 영상과압축된 영상 속의 부분 글자 비교 표 1. 코드워드 크기와 문서 영상 압축 - 코드워드 크기가 커질수록 압축률은 높으나 화질에 부정적인 영향을 준다. ( 코드북 크기 : 128 ) 전북대학교 컴퓨터 비젼실
128 코드북 크기 64 32 부분영상(120Ⅹ60) 코드북 작성 소요시간(초) 753.143 205.475 388.478 매칭 time Quality 12.478 23.103 전체영상(900Ⅹ1200)코드북 매칭 44.243 401.146 400.477 402.566 원 영상과압축된 영상 속의 부분 글자 비교 - 코드북 크기가 커질수록 화질은 개선되나 압축 시간이 길어지는 단점이 생긴다. ( 코드워드 크기 : 3Ⅹ3 ) 표 2. 코드북 크기와 문서 영상 압축 전북대학교 컴퓨터 비젼실
부분영상(120Ⅹ60) 코드북 생성소요시간(초) 전체영상(900Ⅹ1200)코드북 매칭소요시간(초) 753.143 44.243 388.478 23.103 205.475 12.478 • • • • • • 표 3. 부분 영상 코드북 설계 시간과 전체 영상 매핑 시간 - 부분영상 코드북 설계에 비해 전체 영상 매핑의 소요시간이 상대적으로 적다. -코드북 재사용성을 이용하면 많은 양의 문서 영상 압축에 효율적이다. 전북대학교 컴퓨터 비젼실
3.2 압축률 분석 예) 900Ⅹ1200 grayscale 문서영상을 크기 3Ⅹ3인 코드워드 32개로 표현하였다고 할 때 압축률 •원영상의 크기 8bitsⅩ900Ⅹ1200 = 1080,000bytes •코드북의 크기 3 Ⅹ3 Ⅹ 8bits Ⅹ 32 = 288bytes •압축영상의 크기 120,000 Ⅹ 5bits = 75,000bytes 따라서 압축률은 이다. 전북대학교 컴퓨터 비젼실
코드북 크기 128 64 32 코드워드 크기 10.17 11.92 14.34 3 Ⅹ 3 Gray 영상 (900Ⅹ1200)압축률 4 Ⅹ 4 17.67 20.91 25.29 표4. 코드워드 크기와 코드북 크기에 따른 압축률 5 Ⅹ 5 28.57 31.76 38.84 전북대학교 컴퓨터 비젼실
코드워드카운트 백분율(%) 102525 85.4 2850 2.3 2072 1.7 1476 1.2 1243 1.0 876 0.7 797 0.6 698 0.5 ... ... 그림5. 900Ⅹ1200 문서영상 표 5. 코드북 인덱스의 히스토그램 - 바탕면이 차지하는 비율이 매우 높다는 특성을 이용하여 허프만 코드 등을 사용한다면 압축률을 더 높일 수 있다. 전북대학교 컴퓨터 비젼실
4. 결론 1. 문서 영상의 벡터 양자화 기법을 구현 2. 부분 영상 코드북으로 전체 문서 영상 표현 3. 합리적인 코드워드 크기와 코드북의 크기 제시 전북대학교 컴퓨터 비젼실