2. 영상 부호화 방법
주요 영상 부호화 국제 표준 기법
표준 기구 표준(권고) 번호 표준화 내용 표준화 시기
T4, T6 이진영상 (facsimile) 부호화 1980/1984
T.81 (JPEG) 정지영상 부호화 1992
ITU-T T.82 (JBIG) 이진영상 부호화 1993
H.261 P64kbps 통신용 영상 부호화 1990
H.262 (MPEG-2) 고품질 영상 범용 부호화 1995
H.263 저속 통신용 영상 부호화 1995/1998(v2)
10918-1(JPEG) 정지영상 부호화 1992
11544(JBIG) 이진영상 부호화 1993
11172-2(MPEG-1) 저장 미디어용 영상 부호화 1993
ISO/IEC
13818-2(MPEG-2) 고품질 영상 범용 부호화 1994
영상 부호화 및 조작과
14496-2(MPEG-4) 1999
관련한 다양한 기능 제공
멀티미디어 정보를 검색하기
MPEG-7 2001
위한 표준화된 서술 방법
전 자 상 거 래 와 관 련 된 멀티 미디어
MPEG-21 콘텐츠의 제작부터 소비까지 전 2002
과정에 사용될 통합된 국제표준
3.1 Binary Image Compression
2
3. 팩시밀리를 위한 이진 영상 압축 방법
Facsimile Machine Principles
scanned
(digitized) image
팩시밀리를 위한 이진 영상 압축 방법
Scanning
horizontal scanning direction scanning line
vertical
scanning
direction
1728 bits
total bits =
B 1728 bits
1,978,560 1145 pixel data of the scan line from above
lines
black run black run
of 3 bits of 4 bits
white run white run white run
standard 8.5x11 document of 8 bits of 5 bits of 1708 bits
3
4. 팩시밀리를 위한 이진 영상 압축 방법
Facsimile 문서의 특징
Binary Image
• 0 과 1의 값을 갖는 pixel들로 구성되는 흑백 스캔된 영상
팩시밀리를 위한 ITU-T 영상 압축 표준 방법
T2 (Group 1) & T3 (Group 2) : Analog 방식
T4 (Group 3) & T6 (Group 4) : Digial 방식
References
• G3: ITU-T Recommendation T.4, “Standardization of Group 3
Facsimile Apparatus for Document Transmission,” 93. 3.
• G4: ITU-T Recommendation T.6, “Facsimile Coding Scheme and
Control Functions for Group 4 Facsimile Apparatus”.
팩시밀리를 위한 이진 영상 압축 방법
G3와 G4 Fax 방식의 차이점
G3 Fax
• 1차원 RLC(Run Length Coding) 기법 사용
• 2차원 RLC 기법 선택 적용
G4 Fax
• G3의 2차원 RLC 사용
• G3에서 사용하던 오류 제어를 위한 부가 정보를 줄임으로써 압축율을
30% 정도 개선함
– G4 Fax : ISDN과 같은 전송 오류가 적은 하부 통신 기반을
대상으로 함
– G3 Fax : 일반 전화망을 대상으로 함
4
5. G3 1차원 RLC (Run Length Coding) 방법
G3 1차원 RLC 개요
각 line 마다 독립적인 RLC 사용
매 line의 끝마다 EOL 추가
• 각 line을 독립적으로 복호화 가능
• 전송오류 발생시, 발생된 오류는 해당 line으로 국한됨
마지막 line의 끝에는 6개의 EOL 추가
• End-of-Line (EOL): ‘0000 0000 0001’
G3 1차원 RLC (Run Length Coding) 방법
G3 1차원 RLC 기본 알고리즘
If run-length < 64,
then
use Terminating code (modified Huffman code)
else
use largest possible makeup code (not exceeding the run-
length) and Terminating code (represents [run-length -
makeup code])
End-of-Line (EOL): ‘0000 0000 0001’
• EOL indicates to terminate each line
• EOL signals the first line of each new image (page)
• six consecutive EOLs indicate the end of a sequence of images (pages)
5
8. G3 1차원 RLC (Run Length Coding) 방법
Make-up Code 사용 예
흰색 pixel (white-run) 개수가 1708인 데이터의 코딩
• 1708 = 1664 + 44 이므로,
• 1664개의 white-run을 나타내는 make-up code: 011000
• 44개의 white-run을 나타내는 termination code: 00101101
• 부호화된 코드
01100000101101
FAX Process
Data Format
8
9. FAX Process
Summary
G3/G4 2차원 RLC
G3 1차원 RLC의 한계
영상은 일반적으로 수직/수평 상관성을 모두 갖춤
1차원 RLC는 수평 상관성만 활용 가능
G3/G4 2차원 RLC
수직/수평 상관성을 모두 활용하여 압축 효율을 높이고자 함
9
10. G4 Fax Encoding
Group 4 Fax
G3의 2차원 RLC 사용
전송 오류를 차단하기 위한 부가 정보의 제거를 통한 압축 효율
향상
• ISDN의 전송오류가 적은 환경을 대상으로 함
각 line의 끝을 나타내는 EOL을 전송하지 않음
JBIG
JBIG (Joing Bi-level Image Coding Group)
G3/G4 Fax 방식의 한계
• 흑백 영상에는 잘 적용되나, Half-tone을 갖는 영상에는 부적합
JBIG
• G3/G4 방식의 한계를 극복하기 위하여 제안됨
• 점진적(Progressive) 전송이 가능
– 먼저 낮은 해상도로 부호화하여 전송하고, 점차적으로 높은
해상도로 전송함
• Arithmetic Coding 방법에 기초함
• 컬러 영상의 경우 각 컬러 평면에 대하여 적용
• MPEG-4의 모양 정보 부호화 방식에 적용 (HW 구현이 용이)
JBIG2
• 압축율을 높이기 위하여 손실 부호화 방법을 적용
10
12. JPEG-특징
JPEG 개요
ISO/IEC JTC1에서 국제 표준으로 제정한 정지 화상 (still image)을
위한 압축/복원 알고리즘
• 1982년에 시작하여 1992년 표준으로 확정
4가지의 다른 압축 알고리즘 지원
• 순차적 부호화(Sequencial Encoding)
– 각각의 영상 요소가 스캔되는 순서대로 부호화
• 점진적 부호화(Progressive Encoding)
– 전송시간이 길 때 다중 스캔에 의해 대략적인 영상을 먼저 제공하고
점진적으로 세부적인 부호화 과정을 가진다
• 무손실 부호화(Lossless Encoding)
– 본래의 영상과 동일하게 영상을 복원할 수 있도록 부호화
• 계층적 부호화(Hierarchical Encoding)
– 영상을 사용자가 원하는 대로 지원할 수 있도록 여러 해상도로 부호화
JPEG -특징
순차적 부호화 (Sequential Encoding)
이미지가 스캔되는 순서에 따라 인코딩을 진행함
단순하고 효율적으로 대부분의 응용에서 적합하게 적용됨
12
13. JPEG -특징
점진적 부호화 (Progressive Encoding)
영상을 여러개의 스캔으로 부호화함
• 예) 영상을 저주파와 고주파수까지 여러단계로 인코딩함
• 스캔 횟수가 증가함에 따라 영상의 품질이 개선됨
대역폭이 제한된 채널을 통한 영상 전송시 유용
• 사용자는 개략적 윤곽을 먼저 보고, 더 자세히 보길 원할시에 더 나은
영상을 계속 선택적으로 볼 수 있음 DC
low
medium
high
JPEG -특징
계층적 부호화 (Hierarchical Encoding)
영상을 여러 해상도(resolution)으로 부호화 함
• 장비의 능력에 따라 낮은 해상도에서 고 해상도까지를 융통성 있게
제공 가능.
160x120 pixels
320x240 pixels
640x480 pixels
13
14. JPEG -특징
무손실 부호화(Lossless Encoding)
DCT 변환과는 무관한 공간적 예측방법을 사용
• 픽셀과 같은 한 데이터 단위의 값을 인접한 데이터 단위와의
차이정보로 나타냄
• 차이정보를 허프만코딩을 사용하여 부호화
2:1 정도의 압축률을 얻을수 있음
JPEG -특징
JPEG 부호화의 특징
Color Space
• RGB 또는 YCrCb 칼라 표현 방식 선택 가능
• Y와 (Cr, Cb) 에 각기 다른 양자화 테이블 사용.
• 4:4:4, 4:2:2, 4:2:0 칼라 샘플링 선택 가능
최대 화면 크기 : 65,536 pixels x 65,536 pixels
부호화
• DCT를 사용하여 압축.
– DC 성분에 대하여는 linear DPCM quantizer 사용
– AC 성분은 RLC 적용
• Modified-Huffman 방식을 사용하여 코드화함.
• progressive 또는 interlaced scanning 방식 지원
• 채널 오류 관리 기능
14
15. JPEG-특징
JPEG 방식의 분류
무손실 부호화 (lossless coding) 방식
• 압축, 복원의 과정을 거쳐도 원래의 정보를 보존 가능
• 압축률이 낮음
• 화면내의 공간적 예측부호화 (predictive coding) 방식을 사용함
손실 부호화 (lossy coding) 방식
• DCT 변환부호화 방법을 사용
• 복원시 왜곡이 생겨 원래데로 재생되지 않으나, 압축률이 높음
JPEG-특징
JPEG 손실부호화 방식의 분류
기본방식 (baseline)
• 픽셀의 색 성분당 8비트인 입력영상에 대하여 적용
• 순차적부호화 모드를 사용
• 부호화시에는 허프만부호화 방식을 사용
• 일반적으로 JPEG이라함은 기본 방식을 의미함
확장방식 (extended)
• 광범위한 응용에 적용
• 픽셀의 색 성분당 8비트 또는 12비트가 적용 가능
• 압축시에는 순차적부호화모드, 점진적부호화모드, 계츷적부호화
모드를 선택 적용 가능
• 엔트로피 부호화시에는 허프만부호 또는 산술부호중에서 응용에 따라
선택 가능
15
18. JPEG -부호화 (DCT DC 계수의 RLC)
DCT의 DC 계수의 부호화 테이블
범위 DC계수 총 코드 기본 Huffman Encoded
차이 범주 길이(bits) 코드 Value
0 0 3 010
-1,1 1 4 011 1=1, -1=0
-3,-2,2,3 2 5 100 2=10, 3=11,
-2=01, -3=00
-7, …,-4,4,…,7 3 6 00 4=100, 5=101, 6=110, 7=111
-4=011, -5=010, -6=001, -7=000
-15, …,-8,8,…,15 4 7 101
-31, …,-16,16,…,31 5 8 110
-63, …,-32,32,…,63 6 10 1110
-127, …,-64,64,…,127 7 12 11110
-255, …,-128,128,…,255 8 14 111110
-511, …,-256,256,…,511 9 16 1111110
-1023, …,-512,512,…,1023 A 18 11111110
-2047, …,-1024,1024,…,2047 B 20 111111110
JPEG -부호화 (DCT DC 계수의 RLC)
DCT의 DC 계수의 부호화
DC 신호는 linear DPCM 으로 양자화됨
example
…
12, 13, 11, 11, 10, … 양자화된 DCT DC 계수값들
12, 1, -2, 0, -1, … linear DPCM 변환된 값들
DC값 범주 기본코드 추가코드 총코드길이
12 4 101 1100 7
1 1 011 1 4
-2 2 100 01 5
0 0 010 3
-1 1 011 0 4
…
18
19. JPEG -부호화 (DCT DC 계수의 RLC)
Example (cont'd)
앞의 예에서 DC값이 12에 대한 부호화 값 1011100 을 구하는 과정
• DC 계수 부호화 테이블에서 12는 범주가 4에 속해있음
• 범주=4에 대하여는 총 비트를 7 비트 할당하는데
• 이 7 비트중 3개의 비트는 101 로 고정되어 있고
• 나머지 4 비트는 범위내의 값들을 구분함
– DC값을 이진수로 나타내었을때의 하위 4 비트로 나타냄
– 음수의 경우는 양수의 이진수의 0을 1로, 1을 0으로 바꾸어 표현 (one's
complement)
– 12는 이진수로 1100 이 됨 (참고로, -12는 0011 임)
• 따라서, 12의 부호화 결과는 101 1100 (총 7 비트) 가 됨.
범위 DC계수 총 코드 기본 Huffman Encoded Value
차이 범주 길이(bits) 코드
-15, …,-8,8,…,15 4 7 101 -15=0000, -14=0001, ...,-8=0111,
8=1000, 9=1001,...,12=1100, ...15=1111
JPEG -부호화 (DCT AC 계수의 RLC)
DCT AC 계수의 범주 테이블
AC 계수 범위 범주
0 N/A
-1,1 1
-3,-2,2,3 2
-7, …,-4,4,…,7 3
-15, …,-8,8,…,15 4
-31, …,-16,16,…,31 5
-63, …,-32,32,…,63 6
-127, …,-64,64,…,127 7
-255, …,-128,128,…,255 8
-511, …,-256,256,…,511 9
-1023, …,-512,512,…,1023 A
-2047, …,-1024,1024,…,2047 N/A
19
27. JPEG-Samples
* Uncompressed image
24 bits/pixel
* JPEG 영상의 품질은 양자화 Full Quality Medium Quality
테이블의 양자화 스텝 크기를 8.25 bits/pixel 1 bits/pixel
조정함으로써 가능해짐.
* 양자화 스텝 크기가 커지게
되면, DCT 계수값들중에서
값이 작아지면 0으로 되어,
고주파수 영역의 값들이
대부분 0으로 됨
* 고주파수 영역의 계수들이
무시되면, 영상의 윤곽선
부분이 많이 흐려지게 되고,
블록현상이 나타나게 됨
Low Quality Lowest Quality
0.75 bits/pixel 0.13 bits/pixel
참조) http://en.wikipedia.org/wiki/JPEG#cite_note-2
Motion-JPEG
Motion-JPEG
비표준 (non-standardized)의 동영상 압축 방법
동영상의 각 화면을 JPEG으로 부호화함.
• 압축율은 JPEG과 동일
• 시간적 중복성 제거 안함
– 개별 회사마다 독자적 '움직임 검출'로 보완하는 추세
• 프레임 단위로 편집 용이
– 비디오 편집용
– 보안 감시용
JPEG 부호화기에 버퍼를 추가하여 비트율을 조절.
독립된 JPEG 인코딩
27
28. JPEG2000 - JPEG의 한계
JPEG의 한계
저조한 압축 성능
• 0.25 bpp(bits per pixel)이하에서 unacceptable quality
Lossless와 Lossy 압축 방식이 단일화 되어 있지 않음
• Lossy JPEG (IS 10918-1)
• Lossles JPEG-LS (IS 14495-1)
64K x 64K 보다 작은 이미지만 압축 가능
single decompression 알고리즘을 갖고 있지 않음
• 44 application-specific modes of operation
잡음이 있는 채널 전송시에 발생 가능한 비트 에러에 대하여 고려하고
있지 않음
자연적인(natural) 영상을 주 대상으로 하고 있으며, 컴퓨터에서
인공으로 만들어진 영상들에는 최적화 되어있지 않음
Gray 또는 bi-level (흑백의 text)으로 작성된 compound document와
같은 이미지에 대하여는 부적합.
JPEG2000
JPEG2000 개요
정지영상 압축의 통합 기능 제공
• 기존의 JPEG에 다양한 기능을 종합한 차세대 정지 영상 규격
• ITU-R SG8과 ISO/IEC JTC1/SC29/WG1에서 공동으로 표준화를
수행하면서, License free로 추진
Unified New System for Still Images with
• different types (bi-level, gray-level, color)
– 2색조 영상에서 부터 컬러 영상까지 부호화 할수 있도록 각
컬러성분에 1비트에서 16비트까지 할당
• different characteristics (natural images, scientific, medical, remote
sensing imagery, text, rendered graphics)
– 자연영상을 비롯한 팩스, 의료, 영상등의 다양한 형태의 영상에 적용
• different imaging models (client/server, real-time transmission, image
library archival, limited buffer and bandwidth resources, etc.)
– 유/무선 통신환경에 적합하도록 전송오류에 강인한 특징 제공
기존의 표준화 방식들에 비하여 월등한 낮은 비트율(0.25
pbb이하) 에서의 향상된 성능을 보여줌
현재의 JPEG 표준과 호환
28
29. JPEG2000 - 응용 분야
JPEG2000의 응용 분야
Internet
Digital Photography
Medical Imaging
Wireless imaging
Document imaging
Pre-Press
Remote sensing and GIS
Cultural Heritage
Scientific and Industrial
Digital Cinema
Image archives and databases
Surveillance
Printing and scanning
Facsimile
JPEG2000 - 특징
JPEG2000 특징
High compression efficiency
Lossless colour transformations
Lossy and lossless coding in one algorithm
Embedded lossy to lossless coding
Progressive by resolution and quality
Static and dynamic Region-of-Interest (ROI)
Error resilience
Visual (fixed and progressive) coding
Multiple component images
Block and line based transforms
Compressed image manipulation methods
29
30. JPEG2000 - 개선된 기능 예
JPEG2000 Features : Region-of-Interest (ROI)
JPEG2000 - 기본 부호화 구조
Basic Coding Scheme
wavelet 기반의 부호화
• JPEG에서는 DCT를 사용하여 부호화함
Wavelet Scan Entropy
Quantizer
Transform Algorithm Coding
Rate
Allocation
30
31. JPEG2000 - 성능
성능비교
JPEG2000 - 표준 문서 구조
Structure of JPEG2000 Standard
Part 1, Core coding system
• intended as royalty and license-fee, NOT patent-free
Part 2, Extensions
• adds more features and sophistication to the core
Part 3, Motion JPEG 2000
Part 4, Conformance
Part 5, Reference software
• Java and C implementations are available
Part 6, Compound image file format
• document imaging, for pre-press and fax-like applications, etc.
31
32. JPEG2000 - 표준 문서 구조
Structure of JPEG2000 Standard (cont’d)
Part 7
• has been abandoned
Part 8, JPSEC (security aspects)
Part 9, JPIP (interactive protocols and API)
Part 10, JP3D (volumetric imaging)
Part 11, JPWL (wireless applications)
Part 12, ISO Base Media File Format (common with MPEG-4)
참조: http://www.jpeg.org/jpeg2000
질의/응답
32