본문으로 바로가기

학회/행사/기타 안내 상세보기

2021년 제5회 원내 연속토론회 후기

작성자 국립국어원 등록일 2021. 11. 18. 조회수 23874

2021년 제5회 원내 연속토론회 후기

2021년 11월 15일 / 국립국어원 어문연구과


  국립국어원에서는 2021년 제5회 원내 연속토론회를 다음과 같이 개최하였다.

주 제

한국어 기초 어휘와 말뭉치

발표자

서상규(연세대학교 문과대학 국어국문학과 교수)

일 시

 2021년 11월 15일(월) 9:00

장 소

온라인 동영상 강의



  올해 마지막으로 실시한 다섯 번째 원내 연속토론회는 ‘한국어 기초 어휘와 말뭉치’를 주제로 연세대학교 서상규 교수가 강의를 맡아 진행하였다.

  제1부 ‘기초/기본 어휘에 대한 기초적 이해’에서는 ‘기초 어휘’와 ‘기본 어휘’의 개념 구분, 기초 어휘의 선정 방법에 대해 개략적으로 살펴보았다.

  제2부는 2021년 국립국어원 교육연수과 연구 사업인 ‘기초 어휘 선정 및 어휘 등급화 연구’ 현황에 대해 알아보는 시간이었다. ‘기초 어휘 목록 선정 및 등급화 방법론 연구 팀’, ‘말뭉치 분석 방법론 연구 팀’, ‘기초 어휘에 대한 정성적 평정 및 활용 팀’에서 세부 과업을 진행하고 있으며 10월 말 현재 각 팀에서 이뤄진 성과 중 일부를 소개하였다.


  ‘기초 어휘 목록 선정 및 등급화 방법론 연구 팀’에서는 기초 어휘 목록 선정 단위를 ‘단어’ 단위로 선정하는 것으로 정하였고, 이번 과제에서 목표로 하는 기초 어휘 1등급(만 4세~만 6세 수준, 5000 어휘) 목록의 최종 결과물 형식을 제시하였다.


  ‘말뭉치 분석 방법론 연구 팀’에서는 2억 어절 ‘균형’ 말뭉치를 구성하여 어휘 목록을 추출하기로 결정하였다. 2억 어절 ‘균형’ 말뭉치는 ‘일상 구어에서 자주 쓰이는 말을 반영함’, ‘장르 간 균형 고려’, ‘어린아이들도 아는 어휘를 포착함’, ‘두루 많이 쓰이는 말을 찾아냄’, ‘시기적 균형을 고려하여 오랫동안 쓰여 온 말을 찾아냄’ 등의 특징이 있음을 제시하였다. 이러한 말뭉치 분석을 통해서 ‘빈도’, ‘범위’, ‘산포도’를 조사하고 종합·해석하여 기초 어휘 점수로 환산하는 시도를 하였다.


  ‘기초 어휘에 대한 정성적 평정 및 활용 팀’에서는 ‘빈도 순위로도 기초 어휘 점수로도 1등급에 속하는 낱말들(안정적인 어휘 목록)’을 가려낼 기준 외에도 ‘빈도는 높으나 쓰임의 폭이 좁은 말을 가려낼 기준’, ‘빈도는 낮으나 쓰임의 폭이 넓은 말을 가려낼 기준’이 필요함을 확인하였다. 연구의 최종 단계로서 기초 어휘에 대한 정성적 평정은 전문가 그룹, 사용자 그룹을 대상으로 조사하는 방법을 논의·모색하고 있다.


  마지막으로 기초 어휘 등급화 목록 활용 방안을 교과서 및 교육 자료, 사전 편찬, 언어 정책, 언어 평가 분야별로 제안하며 강의를 마무리하였다.



후기 게시 자료1_문화체육관광부 국립국어원, 국립국어원 개원 30주년 제5회 연속토론회, 한국어 기초 어휘와 말뭉치, 책 표지(외국인을 위한 한국어 학습 사전, 한국어 학습 사전, 교육용 기본 어휘 선정을 위한 기초 연구, 한국어 기본어휘 연구, 한국어 기본어휘 의미빈도 사전), 서상규(연세대학교 국어국문학과 교수)


후기 게시 자료2_'대략 받아들여지고 있는' 개념 구분, 기초 어휘 : - 인간 생활 영위에 가장 필수적이고 핵심적이고 일상적인 최소한의 어휘로, 시대나 사회의 변화에 영향을 덜 받고 형태적으로 파생이나 합성의 근간이 되는 필수 어휘, 기본 어휘 : - 어떤 목적과 특정 기준에 따라 선정된 주요 어휘로, 어휘 빈도 자료에 근거하여 목적 지향적으로 선정된 어휘, - 학습용 기본 어휘, 교육용 기본 어휘, 국어교육용 기본어휘 등


후기 게시 자료3_2017~2020년 과제에서의 '기초 어휘'란?, <표54> 어휘 등급화 (안), 2020년 국어 기초 어휘 선정 및 어휘 등급화 연구, 49쪽


후기 게시 자료4_기초 어휘 선정 및 어휘 등급화 연구(2021), 기초 어휘 수집 자료 예시


후기 게시 자료5_국립국어원 기초 어휘 선정 및 어휘 등급화 연구(2021), 말뭉치 구성과 특징 : 2억 어절 '균형' 말뭉치, 1. 매체간 균형을 맞춤(구어의 비율 최대로 확대 : 문어 : 구어 = 5 : 5)으로써, 일상 구어에서 자주 쓰이는 말을 반영함, 2. 장르간 균형 고려(18개): 이전 연구에서의 지나친 장르 세분화와 불균형의 문제를 해소, 3. 발달 단계 자료(모든 초등 교과서 포함/일부 준구어 자료 포함)를 수집하여 2.6 퍼센트 포함함으로써, 어린아이들도 아는 어휘를 포착함, 4. 최대한 많은 텍스트 포함을 위한 표본 추출('상상'과 '비상상-학술/교양'의 경우 5,000어절씩)을 통해서, 두루 많이 쓰이는 말을 찾아냄, 5. 시기적 균형: 비교적 일관된 어문 규범을 고려해 1945년 이후 자료로 구성하되, 연대별로 자료가 충분한 신문, 잡지, 소설, 학술 및 교양, 교과서, 국회회의록 등은 최대한 고른 분포로 구성함으로써, 오랜 동안 쓰여온 말을 찾아냄


후기 게시 자료6_3. 기초 어휘에 대한 정성적 평정 및 활용 팁, 빈도순위로는 1등급에 속하지 못하나, 점수(2018)에서는 1등급 후보가 되는 낱말들, 빈도는 낮으나 쓰임의 폭이 넓은 말을 가려낼 기준 필요