데이터의 크기와 통신 기술
통신과정에서 전달하려는 데이터의 크기는 오리지널 아날로그 신호를 디지털 신호로 변환하는 시점에서 일차적으로 결정된다. 얼마나 자세하게 아날로그 신호로부터 디지털 신호를 추출해 내느냐에 따라 데이터의 크기가 결정된다. 물론, 데이터는 당시의 통신 기술로 무리 없이 전송 가능해야 한다
당시의 통신 기술이란 단순히 아날로그 신호를 디지털 신호로 변환하는 기술뿐만이 아니라 변환 정보를 저장하고, 전송하고, 그리고 출력할 수 있는 전체적인 기술을 가리킨다. 예를 들어, 현재의 기술로 8 K 영상을 만들 수는 있다. 하지만 변환한 데이터를 네트워크 통신으로 전송하고 이를 출력할 수 있는 디스플레이 장치를 찾을 수가 없기 때문에 8 K 데이터 변환은 의미없다고 할 수 있다. 즉, 전달하고자 하는 데이터의 양이 많을수록 통신은 고속화되어야 하며, 고대역폭을 제공해야 한다
아날로그 신호를 디지털 신호로 변환하는 기술은 오래전부터 존재해왔고, 이를 뒷받침하기 위한 변환 알고리즘이나, 압축 기술, 저장 기술들도 계속해서 발전해왔다. 그 결과, 원본의 아날로그와 디지털 사본 사이의 차이가 점차 줄어들고 있다. 이와 함께, 디지털 사본을 출력하고 전송하기 위한 통신 기술들도 함께 발전을 거듭하고 있다
이번 페이지에서는 아날로그 신호를 디지털 신호로 변환하는 과정을 살펴보려 한다. 아날로그 신호에는 문자와 숫자, 또는 이미지, 음성, 영상 등이 포함된다. 이 중에서 음성의 경우에 가장 많이 사용하는 변환 방식이 PCM(Pulse Code Modulation)이다
PCM은 표본화, 양자화, 부호화라는 3 개의 단계로 구성된다. 먼저, PCM의 이러한 3 단계를 거치기 전에 음성 신호는 MIC(마이크)를 통과하면서 전기적 신호로 변환된다. 전기적 신호로 변환됨으로써 우리가 이를 수치화하고, 분석하고, 그리고 다른 형태의 신호로 변환할 수 있게 된다
1. 표본화 (Sampling)
우선, 아날로그 신호를 일정 간격으로 표본화(Sampling, 샘플링)하여 PAM(Pulse Amplitude Modulation) 신호를 얻는다. 앞서 이야기하였던 데이터의 크기가 최초로 결정되는 시점이다. 표준화의 주기가 커질수록 데이터의 크기는 증가한다. 다시 말해, 아날로그 신호로부터 더 많은 표본을 추출함으로써 데이터의 크기가 더 커진다는 이야기이다
일반적으로 사용되는 표본화 주기(Sampling Rate, 샘플링 레이트)는 44.1 KHz이다. 이는 CD를 제작할 때에 일반적으로 사용되는 수치이다. 이러한 표본화 주기는 아날로그 신호의 최고 주파수 2배 크기로 표본화를 진행하면, 디지털 신호를 원래의 아날로그 신호를 손실없이 복원할 수 있다는 나이퀴스트 이론(Nyquist Theorem)에 의하여 결정된다
2, 양자화 (Quantization)
두번째로 데이터의 크기를 결정하는 시점이다. 표본화 과정으로 얻은 데이터는 전기적 신호의 크기이며 숫자의 형태로 존재한다. 그런데 이러한 값은 여전히 아날로그 형태를 가지고 있어서 측정장비에 따라 자연수 형태로, 또는 소수점의 형태로 표현된다. 이 값들을 그대로 디지털 신호 값으로 사용할 수도 있다. 하지만 아날로그 신호의 범위가 넓어질수록 이를 나타내기 위한 디지털 데이터의 크기도 커지게 된다. 디지털 신호는 0과 1의 비트로만 표현된다는 사실을 기억하자
아날로그 신호가 디지털 신호로 변환될 경우에 데이터의 크기는 이용하려는 통신 기술로 처리가능한 수준이어야 한다. 예를 들어, 16 비트(2 바이트)의 데이터까지 전달가능하다면, 디지털로 표현할 수 있는 신호는 2의 16승인 65,536 가지 뿐이다. 따라서 표본화로 읽혀진 값들은 0 부터 65,536 중의 하나의 값으로 매핑되어야 한다. 이러한 매핑 과정을 양자화라고 한다
참고로 양자화 과정을 통해서 버려지는 정보를 양자화 에러 또는 양자화 잡음(Quantizaiton Noise)라고 부른다. 예를 들어, 입력된 신호의 값이 1.23이었는데 16 비트 양자화의 결과로 1에 매핑이 되었다고 가정하자. 소수점 이하에 해당하는 0.23의 정보는 버려지게 된다. 이를 양자화 잡음이라고 한다
한편, 양자화는 고정형이냐, 가변형이냐에 따라 다시 분류된다. 또한 양자화는 입력 신호 값의 크기와 시간에 따른 구분으로 나눌 수 있다
먼저, 입력 신호 값이 작은 때에는 촘촘하게 양자화 간격을 작게 하고, 입력 신호 값이 클 때에는 듬성하게 양자화 간격을 크게 하는 방식을 비선형 양자화(Non-linear Quantizing, Logarithmic Quantizing), 비균일 양자화라고 하고, 입력 신호 값의 크기와 상관없이 일정한 간격으로 양자화가 이루어지면 선형 양자화(Linear Quantizing), 균등 양자화(Uniform Quantizing)라고 한다
그리고, 시간에 따라 양자화의 간격을 변화시키는 방식을 적응형 양자화 (Adaptive Quantizing)라고 하며, 시간의 변화와 상관없이 일정한 양자화 간격을 유지하는 방식을 고정형 양자화 (Fixed Quantizing)라고 한다
3. 부호화 (Encoding)
부호화는 양자화된 값을 실제 전송을 위한 이진 데이터로 변환하는 과정이다
전달하려는 데이터의 크기가 결정되면, 이제 단위 시간당 가능한 많은 데이터를 보낼 수 있는 방법을 찾아야 한다. 이 때, 통신에 사용되는 매체가 데이터 전송속도에 영향을 끼친다. 따라서 부호화 과정에서는 통신 매체의 특성까지 고려하여 데이터를 효율적으로 전송하기 위한 최적의 방식을 선택하여 사용하여야 한다
부호화는 소스 부호화, 채널 부호화, 라인 부호화로 분류할 수 있다. 데이터 처리순서도 이와 동일하다. 다시 말해, 전송하고자 하는 데이터의 양을 줄이는 압축과정에 해당하는 소스 부호화가 먼저 진행되고, 전송이 완료된 데이터에서 에러 검출이나 에러 교정을 수행할 수 있도록 추가정보를 포함시키는 채널 부호화가 다음으로 진행된다. 마지막으로는 통신 매체의 특성에 맞도록 전달하려는 데이터 배열을 통신에 적합한 데이터 배열로 변환하는 라인 부호화가 진행된다
참고로, 데이터를 수신하는 쪽에서는 부호화의 반대 순서로 복호화(Decoding)가 진행된다. 라인 복호화, 채널 복호화, 소스 복호화의 순서대로 진행됨으로써 원본 데이터가 복원된다. 다만, 부호화 과정 중에 손실 압축 방식이 채택되었다면, 소실된 정보는 복호화를 수행한다 해도 되돌릴 수 없다
소스 부호화(Source Encoding)와 비디오, 오디오, 텍스트 압축방식
다음 페이지 : https://blog.naver.com/cjsksk3113/222456059654
소스 부호화(Source Encoding)와 비디오, 오디오, 텍스트 압축방식
소스 부호화 소스 부호화는 전송하려는 데이터에서 필요하지 않은 정보를 제거하여 전체 데이터의 크기를 ...
채널 부호화(Channel Encoding) : 에러 검출 코드, 블록 코드, 길쌈 코드
다음 페이지 : https://blog.naver.com/cjsksk3113/222457061044
채널 부호화(Channel Encoding) : 에러 검출 코드, 블록 코드, 길쌈 코드
채널 부호화 채널 부호화는 송신단에서 전송하려는 데이터 비트열을 부호화하는 과정이다. 채널 부호화 과...
라인 부호화(Line Encoding) : 단극형, 극형, 양극형, Multi-Level, Multi-Transition
다음 페이지 : https://blog.naver.com/cjsksk3113/222457207038
라인 부호화(Line Encoding) : 단극형, 극형, 양극형, Multi-Level, Multi-Transition
라인 부호화 라인 부호화는 전송 부호화라고도 하며, 디지털 데이터 비트열을 네트워크 전송매체 특성에 맞...