학회/행사/기타 안내 상세보기
2021년 제5회 원내 연속토론회 후기
2021년 제5회 원내 연속토론회 후기
주 제 |
한국어 기초 어휘와 말뭉치 |
발표자 |
서상규(연세대학교 문과대학 국어국문학과 교수) |
일 시 |
2021년 11월 15일(월) 9:00 |
장 소 |
온라인 동영상 강의 |
올해 마지막으로 실시한 다섯 번째 원내 연속토론회는 ‘한국어 기초 어휘와 말뭉치’를 주제로 연세대학교 서상규 교수가 강의를 맡아 진행하였다.
제1부 ‘기초/기본 어휘에 대한 기초적 이해’에서는 ‘기초 어휘’와 ‘기본 어휘’의 개념 구분, 기초 어휘의 선정 방법에 대해 개략적으로 살펴보았다.
제2부는 2021년 국립국어원 교육연수과 연구 사업인 ‘기초 어휘 선정 및 어휘 등급화 연구’ 현황에 대해 알아보는 시간이었다. ‘기초 어휘 목록 선정 및 등급화 방법론 연구 팀’, ‘말뭉치 분석 방법론 연구 팀’, ‘기초 어휘에 대한 정성적 평정 및 활용 팀’에서 세부 과업을 진행하고 있으며 10월 말 현재 각 팀에서 이뤄진 성과 중 일부를 소개하였다.
‘기초 어휘 목록 선정 및 등급화 방법론 연구 팀’에서는 기초 어휘 목록 선정 단위를 ‘단어’ 단위로 선정하는 것으로 정하였고, 이번 과제에서 목표로 하는 기초 어휘 1등급(만 4세~만 6세 수준, 5000 어휘) 목록의 최종 결과물 형식을 제시하였다.
‘말뭉치 분석 방법론 연구 팀’에서는 2억 어절 ‘균형’ 말뭉치를 구성하여 어휘 목록을 추출하기로 결정하였다. 2억 어절 ‘균형’ 말뭉치는 ‘일상 구어에서 자주 쓰이는 말을 반영함’, ‘장르 간 균형 고려’, ‘어린아이들도 아는 어휘를 포착함’, ‘두루 많이 쓰이는 말을 찾아냄’, ‘시기적 균형을 고려하여 오랫동안 쓰여 온 말을 찾아냄’ 등의 특징이 있음을 제시하였다. 이러한 말뭉치 분석을 통해서 ‘빈도’, ‘범위’, ‘산포도’를 조사하고 종합·해석하여 기초 어휘 점수로 환산하는 시도를 하였다.
‘기초 어휘에 대한 정성적 평정 및 활용 팀’에서는 ‘빈도 순위로도 기초 어휘 점수로도 1등급에 속하는 낱말들(안정적인 어휘 목록)’을 가려낼 기준 외에도 ‘빈도는 높으나 쓰임의 폭이 좁은 말을 가려낼 기준’, ‘빈도는 낮으나 쓰임의 폭이 넓은 말을 가려낼 기준’이 필요함을 확인하였다. 연구의 최종 단계로서 기초 어휘에 대한 정성적 평정은 전문가 그룹, 사용자 그룹을 대상으로 조사하는 방법을 논의·모색하고 있다.
마지막으로 기초 어휘 등급화 목록 활용 방안을 교과서 및 교육 자료, 사전 편찬, 언어 정책, 언어 평가 분야별로 제안하며 강의를 마무리하였다.