공유하기
입력 2003년 1월 9일 17시 50분
공유하기
글자크기 설정
국립국어연구원(원장 남기심·南基心)이 최근 ‘표준국어대사전’(1999년·국립국어연구원)에 수록된 50만9076개의 모든 어휘를 분석한 결과 품사별로는 명사가 가장 많았고 이어 동사 부사 형용사의 순으로 나타났다. 명사는 65.82%(33만5057개)로 압도적으로 많았고 동사 13.43%(6만8394개), 부사 3.52%(1만7895개), 형용사 3.41%(1만7361개)를 차지했다.
대명사 중에는 인칭대명사가 319개로 지시대명사 94개보다 훨씬 많았다. 인칭대명사는 지시대명사와는 달리 말하는 사람과 듣는 사람의 관계에 따라 같은 사람을 가리키는 표현이라도 다양하기 때문이다. 전체 대명사의 50% 이상을 차지하는 한자어가 대부분 인칭대명사라는 점도 이런 결과에 영향을 미쳤다. 고유어로 된 일인칭 대명사는 ‘나’ ‘저’ ‘우리’ ‘저희’ 등에 불과한 반면 한자어로 된 일인칭 대명사는 ‘소인(小人)’ ‘소생(小生)’ 등 128개에 이르고 있다.
접사의 경우에는 접미사가 456개로 접두사 200개보다 2배 이상 많았다. 접미사가 붙어서 파생되는 단어가 그만큼 더 많을 것이라는 예측이 가능하다.
자모별로는 ㅇ으로 시작하는 어휘가 가장 많았다. 모음으로 시작하는 모든 어휘가 ‘ㅇ’항목에 실려 있기 때문이다. 다음으로는 ‘ㄱ’ ‘ㅅ’‘ㅈ’ ‘ㅂ’ 등의 순으로 많았다. 가장 적은 것은 ‘ㅋ’으로 시작되는 어휘이고 그 다음으로 적은 것은 ‘ㄹ’로 시작되는 어휘다. 두음법칙이 적용되는 데도 ‘¤’로 시작되는 어휘가 ‘¤’으로 시작되는 어휘보다 많은 것은 두음법칙을 인정하지 않는 북한어가 상당수 올라와 있기 때문이다. ‘¤’로 시작되는 어휘 1만447개 중 북한어는 7032개로 67.3%를 차지했다. 북한어를 제외하면 ‘¤’로 시작되는 어휘가 가장 적게 나타난다.
음절수로는 2음절 어휘가 14만1765개(32.2%)로 가장 많았고 3음절 어휘, 4음절 어휘가 그 다음을 차지했다. 품사가 있는 어휘 중에서 가장 긴 것은 16음절로 된 ‘감지금니대방광불화엄경보현행원품’이었다.
동음이의어 중에서는 ‘장’이 가장 많은 46개의 동음이의어를 갖고 있는 것으로 나타났다. 그 다음으로는 ‘사’가 45개, ‘기’가 44개, ‘정’이 38개, ‘이’가 37개의 동음이의어가 있다. 두 음절 단어 중에서는 ‘조사’가 33개로 가장 많은 동음이의어를 갖고 있다.
‘표준국어대사전’의 가장 큰 특징은 북한어의 수록이다. 이 사전에 실린 북한어는 북한에서 발간한 ‘조선말대사전’(1992년·사회과학원)에 수록된 것 중 기존의 남한 국어사전에 실려있지 않은 어휘들이다. 북한어는 7만2063개로 전체 어휘 중 14.1%를 차지한다. 남북한 언어가 어휘면에서 상당한 차이가 생겼음을 단적으로 보여주는 결과다.
사투리 중에는 경상도 사투리가 5851개로 가장 많았고 평안도 제주도 함경도 강원도 전라도 충청도 경기도 황해도 등의 순이었다.
국립국어연구원 이운영 학예연구사는 “2000년 CD로 제작된 ‘표준국어대사전’을 마이크로소프트 액세스 등의 프로그램을 사용해 분석했다”고 말했다.
송평인기자 pisong@donga.com
댓글 0