국어 정보화

한글 자모의 정렬 방식

이승재(李承宰) 국립국어연구원

우리는 학교의 출석부를 만들 때 보통 학생의 이름을 가나다순으로 정렬하여 번호를 매기고 학번을 정한다. 이렇게 하면 학생 이름을 출석부에서 쉽게 찾을 수 있다. 그런데 이것은 우리가 한글 자모의 배열 순서를 알고 있고 출석부가 ‘ㄱ’에서 ‘ㅎ’까지의 순서로 배열되어 있다는 것을 이미 알고 있기 때문에 가능한 것이다. 만일 학생 이름을 ‘ㅎ’에서 ‘ㄱ’까지의 순서로 배열하였다면 출석부에서 학생 이름을 찾는 속도가 달라질 수도 있는 것이다.

한글 자모를 정렬하는 방식에는 여러가지가 있다. 출석부와 같이 ‘ㄱ’에서 ‘ㅎ’까지 자모의 순서가 증가하는 오름차순(ascending) 방식으로 정렬을 할 수도 있고 반대로 ‘ㅎ’에서 ‘ㄱ’까지 자모의 배열 순서가 반대로 된 내림차순(descending)으로 정렬을 할 수도 있다. 전자를 보통 정순 정렬이라 하고 후자를 역순 정렬이라 한다.

정순 정렬역순 정렬

국가 행성
대한민국 태극기
애국가 애국가
태극기 대한민국
행성 국가

우리말은 어절 끝에 있는 문법적 요소를 잘 살펴야

출석부에서 학생 이름을 찾을 때 우리는 학생 이름을 사전과 같이 음절 단위로 비교하여 가나다순으로 찾는다. 지난 번에 우리가 ‘자라’와 ‘잔디’의 예에서 살펴보았듯이 우리말은 정렬하는 단위를 음절로 하느냐 자소로 하느냐에 따라서 정렬 결과가 달라진다. 위에 나온 정순 정렬과 역순 정렬의 예들은 모두 단어를 앞쪽에서 뒤쪽으로 배열하고 있다. 즉 순방향(forward)으로 정렬을 한 것이다. 순방향 정렬을 할 경우에는 한글 자모를 자소 단위로 비교하여 가나다순을 정할 필요가 거의 없다.

그런데 우리말은 ‘농구공, 야구공, 축구공’ 등과 같이 ‘공’이 붙은 복합어에서는 뒤에 있는 ‘공’이 전체 단어의 성격을 결정해 준다. 그런가 하면 ‘곰탕, 갈비탕’ 등에서는 접미사 ‘-탕’이 전체 단어의 성격을 결정해 주고 ‘미용사, 요리사’ 등에서는 접미사 ‘-사’가 전체 단어의 성격을 결정해 준다. 그래서 우리말은 단어나 어절 끝에 오는 요소들을 면밀히 검토할 필요가 있다.


우리말을 효과적으로 분류하기 위해서는 역방향 정렬이 필요해

그런데 사전은 단어를 순방향으로 앞에서부터 비교하여 정순 가나다순으로 배열했기 때문에 우리가 위에서 살펴본 ‘공’이 들어간 말이나 ‘-탕’으로 끝난 말들을 차례대로 사전에서 찾기가 쉽지 않다. 왜냐하면 이들 단어가 첫음절의 자모 순서에 따라 사전 전체에 퍼져 있기 때문이다. 예를 들어 사전에서 ‘갈대밭, 쑥대밭, 자갈밭, 잔디밭, 포도밭’과 같이 ‘밭’으로 끝난 단어들을 모두 찾아 보려면 각각 ‘ㄱ, ㅅ, ㅈ, ㅍ’ 항목을 모두 찾아보아야 한다. 그러나 이들 단어를 끝음절에서부터 가나다순으로 순서를 매겨 정순 역방향 정렬을 한 사전을 만든다면 이들 단어를 한군데로 모을 수 있다.


정순 순방향 정렬 정순 역방향 정렬

갈대밭 길갈자
쑥대밭 무나도포
자갈길 밭갈자
자갈밭 밭대갈
잔디밭 밭대쑥
포도나무 밭도포
포도밭 밭디잔

복합어 이외에 접미사가 붙은 단어들도 상황은 마찬가지이다. 사전에서 ‘구김새, 꾸밈새, 모양새, 생김새, 차림새’와 같이 접미사 ‘-새’가 붙은 단어들을 모두 찾아 보려면    각각 ‘ㄱ, ㅁ, ㅅ, ㅊ’ 항목을 모두 찾아보아야 한다. 접미사 ‘-새’가 붙은 말들의 특성을 살펴보려면 역시 정순 역방향 정렬을 한 사전이 필요하다.


정순 순방향 정렬 정순 역방향 정렬

구김새 새김구
꾸밈새 새김생
꾸밈음 새림차
모양새 새밈꾸
생김새 새양모
식료품 음밈꾸
차림새 품료식

위에서 오른쪽 예는 접미사 ‘-새’가 붙은 말을 음절 단위로 역방향 정렬을 한 것인데 이처럼 어절 끝에 오는 형태소별로 단어 목록을 정리하기 위해서는 정렬의 기준을 어절 끝으로 해야 한다. 그래서 단어를 끝음절에서 첫째 음절 쪽으로 역방향(backward) 정렬을 하면 어미나 조사, 접사와 같은 문법 요소별 정렬이 가능하게 된다. 이처럼 위에서 살펴보았던 복합어의 구성 요소인 ‘밭’이나 접미사 ‘-새’는 한 음절로 된 형태소이기 때문에 위와 같이 음절 단위로 정렬을 하여도 좋은 결과를 얻을 수 있다.