[신문과 놀자!/눈에 쏙쏙 디지털 이야기]손가락으로 셀 수 없는 데이터, 어떤 단위로 크기를 나타낼까요?

  • 동아일보
  • 입력 2022년 7월 29일 03시 00분


코멘트

디지털 저장 용량 단위 ‘SI 접두어’
10진수 기반의 과학계 표준 단위, 킬로-메가-기가 등으로 표현
컴퓨터는 2진수 기반 체계 갖춰 기존 단위와 미세한 차이 발생
일부선 “새로운 표기법 적용해야”

2025년 전 세계가 사용하는 디지털 데이터의 양은 175ZB(제타바이트)에 이를 정도로 늘어난다. 하지만 같은 용량이라도 
10진수인 일반적인 표기와 2진수인 컴퓨터 표기가 달라져 혼란이 생길 수 있다. 이 때문에 새로운 단일 디지털 데이터 용량 표기를
 도입하자는 주장이 나온다. 사진 출처 게티이미지코리아
2025년 전 세계가 사용하는 디지털 데이터의 양은 175ZB(제타바이트)에 이를 정도로 늘어난다. 하지만 같은 용량이라도 10진수인 일반적인 표기와 2진수인 컴퓨터 표기가 달라져 혼란이 생길 수 있다. 이 때문에 새로운 단일 디지털 데이터 용량 표기를 도입하자는 주장이 나온다. 사진 출처 게티이미지코리아
최근 신종 코로나바이러스 감염증(코로나19)의 영향으로 디지털 비대면 소통이 일상화되고 있습니다. 이로 인해 사용되는 디지털 데이터의 양 역시 엄청나게 늘어나는 추세입니다.


정보기술(IT) 부문 시장 분석기관인 IDC는 매년 디지털 콘텐츠를 생성, 캡처, 복사하는 등의 과정에서 발생하는 모든 데이터의 총량을 뜻하는 ‘글로벌 데이터스피어(Global Datasphere)’를 추정합니다. 이 집계는 매년 얼마나 새로운 데이터가 생성되고 소비되는지 나타내는 지표가 됩니다. IDC 예측에 따르면 2025년 전 세계에서 다루는 데이터의 양이 175ZB(제타바이트·zettabyte)에 이를 것으로 전망됩니다.

여기서 디지털 데이터의 단위로 사용된 제타바이트는 그 크기가 얼마나 될까요. 컴퓨터에서 디지털 데이터의 용량을 나타내는 데 사용하는 단위에 대해 알아보겠습니다.
○ SI 접두어로 표시하는 데이터
여러분이 사용하는 컴퓨터나 휴대전화의 저장 용량은 얼마인가요. 우리가 흔히 ‘512기가’ ‘1테라’라고 할 때 기가와 테라 또한 앞서 제타바이트처럼 GB(기가바이트·gigabyte)와 TB(테라바이트·terabyte)라는 디지털 데이터의 저장 용량 단위를 부르는 것입니다.


여기서 기가, 테라 등은 ‘SI 접두어’라고 하는데요, 국제적으로 사용하는 단위를 통일한 국제단위시스템(SI·International System Units)을 보다 쉽게 쓰고 쉽게 나타내기 위해 단위 앞에 붙이는 말입니다.

SI 접두어는 위에 있는 표와 같이 정의돼 있습니다. 각 명칭은 주로 그리스어나 라틴어에서 유래했다고 합니다.

킬로(kilo)는 천(1000)을 의미하는 그리스어 킬로(κιλ´o)에서 유래했습니다. 온도의 단위인 캘빈의 기호와 중복되지 않도록 소문자 k로 씁니다. 메가(mega)는 크다는 뜻의 그리스어 메가스(μ´εγα\)로부터 왔고, 기가(giga)는 거대하는 뜻의 기가스(γ´iγα\)에서, 그리고 테라(tera)는 괴물을 의미하는 테라스(Τ´ερα\)에서 파생됐습니다.

페타(peta)는 그리스어로 숫자 5를 뜻하는 페타(π´εντα)에서, 엑사(exa)는 6을 의미하는 엑사(´εξα)로부터 유래했습니다. 제타(zetta)는 이탈리아어 숫자 7을 뜻하는 세테(sette)에서, 그리고 요타(yotta)는 이탈리아어 숫자 8에 해당하는 오토(otto)로부터 왔습니다.
○ 표기보다 작은 노트북 용량, 이유는
SI 접두어는 과학계에서 사용하는 표준 단위로, 10의 거듭제곱의 형태로 정의된 10진수 기반의 단위 표기법입니다. 이러한 방식은 우리에게 익숙해 컴퓨터에서 데이터 저장용량 표기에도 SI 접두어를 사용하고 있습니다.

그러나 SI 체계는 단위 간 배수 관계가 10진수 기반이고, 컴퓨터는 2진수 기반이다 보니 차이가 발생합니다. 1TB의 하드디스크가 들어 있는 노트북을 샀는데, 윈도에서는 그보다 작은 용량으로 나타나는 경험을 하신 적 있으신가요? 이는 제조사에서 표기하는 저장용량 단위의 기준과 윈도에서 계산하는 단위의 기준이 다르기 때문입니다. 제조사는 10진법 표기 기준을 사용하고, 윈도에서는 2진법 기반으로 용량을 출력해 발생하는 문제로 디지털 저장장치 전반에서 나타나는 문제입니다.

예를 들어 SI 단위를 기준으로 하면 단위가 바뀔 때마다 1000배씩 증가하므로 ‘1KB=1000B’ ‘1MB=1000KB’ ‘1GB=1000MB’ ‘1TB=1000GB’와 같아야 합니다. 그러나 컴퓨터는 단위가 바뀔 때마다 1024배씩 증가합니다. 그래서 컴퓨터에서 단위를 나타낼 때는 ‘1KB=1024B’ ‘1MB=1024KB’ ‘1GB=1024MB’ ‘1TB=1024GB’와 같이 계산됩니다.

과거 디지털 저장장치 용량이 KB 단위였을 때는 1000과 1024의 차이가 미미해서 서로 다른 수치임에도 불구하고 같은 접두어를 사용했습니다. 하지만 저장장치 용량이 점점 커지면서 이제는 그 차이가 무시할 수 없는 수준이 된 것이죠.

이처럼 표기와 실제가 다른 문제가 발생하면서 국제전기기술위원회(IEC)에서는 SI 접두어 대신 새로운 IEC 접두어로 바꾸는 것을 추천하고 있습니다. 키비(kibi·2^10), 메비(mebi·2^20), 기비(gibi·2^30) 등입니다. 아직 많이 사용되지 않아 낯설기는 하지만, 한 해 생성되는 데이터의 양이 제타바이트 단위인 시대에 디지털 데이터 용량을 나타낼 때는 올바른 표기법을 이해하고 사용해야 하지 않을까요.

김학인 한성과학고 교사



#데이터#si 접두어#디지털 저장 용량 단위#글로벌 데이터스피어
  • 좋아요
    0
  • 슬퍼요
    0
  • 화나요
    0
  • 추천해요

댓글 0

지금 뜨는 뉴스