영상은 기본적으로 수많은 정지된 이미지(프레임)가 연속으로 재생되어 움직임을 표현하는 매체이다. ‘1초당 몇 개의 프레임을 사용하는가?’가 바로 프레임레이트(Frame Rate)인데, FPS(Frame Per Seocnd)라는 단위로 표현을 한다
단어의 어원
19세기 후반 사진술과 영화 필름이 발전됨에 따라, 촬영된 이미지를 담아두는 일련의 ‘칸(또는 구획)’을 지칭할 필요성이 증가하게 되었고 고정된 경계 안에 하나의 정지 이미지를 담다는다는 점에서, 기존에 쓰이던 ‘frame(액자, 틀)’ 이라는 말이 그대로 적용이 되기 시작했다.
기존에 사용되던 필름 (35mm 필름 등)에는 일정 간격으로 ‘스프로킷 홀(sprocket hole: 필름 양옆의 구멍)’이 뚫려 있는데, 이 구정들 사이마다 한장씩의 정지 화면이 기록된다. 이렇게 필름에 화면이 기록되는 모습을 보면 물리적으로 ‘Frame’이 구분되어 있는 것 이기에 영상에서 장 장면을 구성하는 가장 작은 단위로 ‘Frame(프레임)’ 이라는 단어가 자리매감 하게 되었다.
필름의 시대를 지나 디지털 시대로 넘어와서도 ‘Frame’이라는 단어는 아직 사용되고 FPS가 어떻게 구성되는지에 따라 영상이 매끄럽게 이어지게 된다
FPS의 정립
1890년대 말, 영화가 상영을 시작했을 때에는 16 – 20 fps를 사용하고 있었다.
1920년대 말, 영화에 소리가 도입되면서(‘토키’영화에 등장), 필름과 소리를 정확하게 동기화하기 위한 일정한 재생속도가 필요하게 되었다. 수많은 시도를 통해서 24fps가 안정성과 필름 소리 동기화 면에서 균형이 좋았기에 점차 표준으로 자리잡게 되었고, 결국 영화 업계 전반에서 24fps가 사실상 기본 값으로 굳어지게 되어 사용되고 있다.
사람은 최소 10 – 12fps 이상 되어야 움직이는 영상으로 인식을 하게 된다. 이보다 낮을 경우 영상이 끊긴다는 느낌을 받게 되고 반대로 60fps가 넘어가는 영상의 경우 슬로우 모션을 위해 사용되기도 한다. (고속 카메라의 경우 1000fps 이상). 반대로 사람은 일반적으로는 최대 120 – 240 fps(민감한 경우 500fps)가 넘어가는 영상에서는 영상의 부드러움에 대한 인지적 차이가 사라진다고 알려져 있다
FPS의 변화
아날로그 TV(흑백 TV)의 등장으로 전력 주파수인 60Hz를 기반으로 30fps가 사용되기 시작했다. 그러던 도중 컬러TV가 보급이 되고 사용중이던 흑백TV 수신기와의 호환을 유지하기 위해서(컬러 신호가 들어와도 흑백TV에서 정상적으로 작동하게 하기 위해) 컬러를 위한 별도의 주파수를 추가해야 했기에 이 주파수가 음성과 영상에 간섭되지 않도록 조정을 해야 했다. 결국 1953년 NTSC(National Television System Committee, 컬러 텔레비전 색상 인코딩 방식)로 인해 기존 TV에서 사용하던 30fps에서 0.1% 낮춰 29.97fps로 설정하게 되었다.
29.97fps는 북미와 일본 방송 표준(NTSC 컬러)에서 비롯되어, 현재도 미국 TV,케이블 방송등에서도 사용되고 있다.
29.97기반으로 콘텐츠를 제작할 경우 짧은 영상에서는 큰 문제가 되지 않지만 영상이 길어지게 되면 실제 재생시간과 타임코드간에 괴리가 발생하게 된다. 이렇게 실제 시간과 타임코드를 맞추기 위해서 드롭프레임(drop-frame)이라는 방식을 사용하는데 이 드롭프레임은 실제 프레임을 삭제하는 것이 아닌 특정 프레임을 건너뛰는 방식으로 30fps인 정수 기준 타임코드와의 오차를 줄이기 위한 기술적 조치이다.
30fps의 경우 타임코드와 실제 시간이 좀 더 단순하게 일치한다.
디지털 시대로 넘어오면서 콘텐츠의 목적(영화적 감성 & 사실적 표현)과 플랫폼의 특성(TV, 웹, 극장)에 따라 다른 fps를 사용하게 되었다.
- 24fps : 영화, 시네마 영상에 주로 사용
- 30fps : TV, 방송, 일반 유투브등 웹 영상
- 60fps 이상 : 스포츠 중계, 게임 영상, 더 부드러움을 원하는 콘텐츠