[수학적인 질문입니다, 머리아프실수있음] 24/96khz는 충분한가요?
1줄요약) 24/48을 넘어서 32/48, 64/48, ... 처럼 충분히 많은 비트수만 있으면, 가청주파수 범위 (<20k)만 있는 음원을 공학적으로 오차가 없는 완벽한 DAC로 아날로그 변환하면 24/96, 24/192, ... 와 동일한 아날로그 결과가 나오는가?
의 증명이 궁금합니다. 뭔가 신호처리쪽 아주 기초 지식일것같은데 전 잘 몰라서요.
https://en.wikipedia.org/wiki/Nyquist%E2%80%93Shannon_sampling_theorem
그냥 이거 읽어보면 되나요?
----
예를 들어 96khz 샘플링 음원에서 16000Hz (이건 분명 가청주파수 안의 영역입니다)의 뭔가를 만든다고 생각해봅시다.
파형이 이렇게 나옵니다. 사각파처럼 생겼지만 사인파가 맞습니다. 이제 이 파형을 0.0001초만큼 뒤로 밀어봅시다 (9.6샘플)
// 간단하게 예시 제작하기 위해 38 / 384000 = 0.00009896 초만큼 뒤로 밀었습니다)
사인파 모양이 달라졌죠. 이제 좀 사인파같이 생겼습니다.
이걸 384k로 보면 이렇습니다.
훨씬 사인파 같죠. 샘플링이 늘어났으니까요.
직감적으로 384khz에서 보이는 16000hz론 사인파를 완벽하게 복구할 수 있어보입니다. 그런데 96k에서 보이는 16000hz는 1주기당 점 6개로 표현되는지라, 이걸로 사인파를 완벽하게 복구할 수 있을까? 의심이 됩니다. 극단적으로, 48000hz 파형은 1주기당 점 2개로 표현되는데, 이 점 2개로 아날로그 사인파를 완벽하게 복구할 수 있을까? 도 의심 됩니다.
----
Nyquist 이론에 따라 가청주파수 * 2 의 Hz만 쓰면 충분하다고 알고 있습니다. 그러면 대충 48k면 충분하다고 봐야 할텐데요, 1000hz 정도의 파형은 몰라도 16000khz같은 에어 사운드는 언뜻 PCM 파형만 보기엔 전혀 사인파처럼 나타나지 않습니다.
현대 DAC는 이 사각파스러운 파형을 오버샘플링 + LPF를 거쳐서 아날로그로 완벽하게 바꾸는 것으로 알고 있습니다. 그래서 제대로 만들어진 DAC라면 위에 나온 2개의 파형 (384k, 96k)는 동일한 아날로그 출력을 갖는다곤 알고 있습니다.
정말 그런지 좀 수학적인 설명을 알고 싶습니다.
- 16비트가 아니라 충분히 많은 비트수만 있으면, 48k에서도 24khz 미만의 모든 주파수에서 임의의 phase shift (여기선 0.0001초라고 했지만 아무 시간대나 골라서요) 를 표현할 수 있고 이걸 다시 아날로그로 복구할 수 있는가?
----
답변 감사합니다.
댓글 5
댓글 쓰기복구할 수 있습니다.
주어진 샘플값을 기초로 수학적 계산을 통해서 원래 파형을 복원하는게 바로 리니어 페이즈 디지털 필터가 하는 일입니다. 이 디지털 필터 덕분에 사각파처럼 생긴 샘플에서도 사인파형을 복구할 수 있고, 심지어 0,0,0,0,0만 찍은 샘플에서도 우렁찬 파동을 복원할 수 있습니다. 직관적으로는 이해하기 어렵지만요.
리니어 페이즈 필터는 위상 정보를 보존하기 위해서 샘플들 간의 관계를 시간축 전후로 대칭적으로 참조하면서 원래 파형을 복원합니다. 그래서 임펄스 샘플 앞뒤로 pre-ringing, post-ringing이 생기는데, 바로 이 ringing 구간이 0,0,0,0 샘플값에서 사인파형이 "복원"되는 예시입니다. pre-ringing이 자연계에 없는 digital artifact라고 생각해서 찝찝하게 여길 필요는 없습니다. 애초에 원본 아날로그 임펄스 자체가 자연계의 파동으로는 결코 존재할 수 없는 인공적인 electric artifact이기 때문입니다. 디지털 필터 입장에서는 이런 급작스러운 샘플이 들어오면 당연히 앞뒤로도 전조가 있을 것이라고 추론하는게 자연계의 파동현상에 대한 수학적으로 타당한 추론입니다. 그래서 pre-ringing도 이런 의미에서는 올바른 "복원"인 셈이지요.
참고로 미니멈 페이즈 필터와 아날로그 LPF는 원래 파형을 복원하지 않습니다. 컷오프 주파수에서 위상이 달라지니기 때문에 파형이 달라져요. (소리가 나쁘다는 의미가 결코 아닙니다.)
p.s. 본문에 언급하신 내용은 비트와는 무관하고 샘플링레이트하고만 관련된 내용입니다.
비트뎁스는 오직 청취만을 목적으로 한다면 16비트면 충분합니다만, 디지털 볼륨조절을 한다거나 DSP를 건다거나 이렇게 신호에다 무슨 가공을 하고자 한다면 16비트로는 절대적으로 부족합니다. 높으면 높을수록 좋은데, 기하급수로 효용이 증가하기 때문에 아주 막 큰 비트 수가 필요한건 아니지만요.
청감상인 이유로 minimum phase filter 쓰는 사람이 있다곤 들었는데, 일단 최저치로 perfect reconstruction가 가능한 상황에서 다른 취향 찍먹하는 개념으로 필터 바꾼다고 생각하니 안심이 되네요. 일단 수학적으로(?) 48k 음원으로도 전 만족할 수 있을 것 같습니다. 끽해야 96. 이런 명확한 답변이 필요했어요.