페이지

2015년 2월 13일 금요일

[박정호의 사람 풍경] 국어사전에 미친 사나이 김기형


http://article.joins.com/news/article/article.asp?Total_Id=16079209

[박정호의 사람 풍경] 국어사전에 미친 사나이 김기형

[중앙일보] 입력 2014.10.11 00:32 / 수정 2014.10.13 14:21

사업해 번 30억 쏟아 … 우리말 지키는 '낱말공장 공장장'

사전은 나의 운명-. ‘멋있다’의 유의어·반의어를 환등기로 김기형 대표의 몸에 비췄다. ‘미끈하다’ ‘잘나다’ 등이 보인다. [권혁재 사진전문기자]

다짜고짜 물었다. “왜 이렇게 힘든 일에 매달리죠. 돈이 될 것 같지도 않은데.” 그가 잠시 숨을 골랐다. “진짜 필요로 하는 사람을 만날 때 보람을 느껴요. 지난번엔 한국어를 배우는 베트남 유학생이 와서 고맙다고 하더라고요.” 재차 물었다. “그럼, 사명감 비슷한 건가요.” “아니요. 꿈도 꾼 적이 없어요. 하다 보니 운명처럼 됐네요.”

 그는 주식회사 낱말의 김기형(53) 대표다. 우리말을 모으고, 가르고, 묶어 여러 형태의 국어사전을 만들어왔다. 자칭 ‘낱말공장 공장장’이다. 클릭 한 번이면 어떤 단어도 척척 찾는 디지털 시대에 굳이 자기 호주머니를 털어가며 사전 제작에 전념해온 그를 한글날을 명분 삼아 만났다.

 8일 찾아간 서울 강남의 한 오피스텔. 김 대표가 자식과도 같은 사전을 책상에 쭉 펼쳤다. 200만 단어를 수록한 『우리말 유의어 대사전』(전 7권), 10만 어휘를 담은 『우리말 반의어 사전』, 13만 사투리를 챙긴 『우리말 방언 사전』이다.

하나같이 한국 최대 규모다. 『우리말 유의어 중사전』 『중고등학생을 위한 우리말 유의어 사전』 『초등학생을 위한 우리말 유의어 사전』도 있다. 인터넷·모바일 앱(App)으로도 서비스된다

 종이책으로 내지 못한 것도 많다. ‘우리말 의성의태어사전’ ‘우리말 역순 사전’ ‘우리말 한자 어휘집’은 앱 형태로만 제공된다. 온라인에 따로 구축한 ‘낱말창고(wordnet.co.kr)’에는 ‘한- 한(유의어)- 영 사전’ ‘영- 영- 한 사전’도 올라와 있다. 국어사전의 대형 백화점이다.

 - 국립국어원의 『표준국어대사전』이 있는데. 

김기형 대표의 친형인 고(故) 김광해 서울대 국어교육과 교수.
“그것은 뜻을 찾는 일반사전이다. 제가 낸 사전은 단어의 쓰임새를 알아보는 활용사전이다. 출발이 다르다. 『유의어 대사전』을 보면 표제어 10만 개를 중심으로 1차 유의어 28만 개, 2차 유의어 200만 개가 있다. 각 단어가 가지를 쳐 나간다.”

 - 예를 들자면 어떤 게 있나.

 “‘사랑’을 찾으면 1차 유의어로 애정·연애·그리움·연정·총애·굄 등이 쭉 뜬다. 이어 ‘애정’의 경우 우애·순정·연정·연심·염정 등 2차 유의어를 찾을 수 있다. 마인드 맵(mind map)이나 계통수(系統樹)처럼 단어 간 연관성을 알 수 있다. 그때그때 적확한 어휘를 고를 수 있다. 글 쓰는 사람에게 쓸모가 크다.”

 - 보통 품이 드는 일이 아니겠다.

 “2000년에 회사 낱말을 차렸다. 이후 서울대 등 각 대학 국어학자와 우리 회사 어휘정보처리연구원이 10년 동안 자료를 수집·분류해 『유의어 대사전』을 냈다. 이것을 모태로 방언·반의어 사전 등을 잇따라 선보였다. 한마디로 시간과의 싸움이었다.”

 - 남다른 계기가 있을 것 같다.

 “전공이 국어와 거리가 멀다. 성균관대 기계공학과 80학번이다. LG석유화학에서 6년간 일하고, 1994년 개인회사를 세워 지금까지 꾸려오고 있다. 석유화학공장·발전소 등 플랜트 컨설팅업이다. 삼성·현대·LG 등 대기업에 외국의 기술·기자재 등을 연결해준다. 이쪽 분야에서는 나름 이름이 났다. 그러다 2000년에 사전과 떼려야 뗄 수 없는 연을 맺게 됐다.”

 - 무슨 일이 있었나.

 “친형이 서울대 국어교육과 김광해 교수다. 저보다 꼭 열 살 위다. 형님이 87년과 90년에 각각 아담한 크기의 『유의어·반의어 사전』과 『반대말 사전』을 냈었는데 출판사가 부도나면서 두 책이 사라질 위기에 처했다. 2000년에 형이 ‘네가 사전 한번 만들어볼래’라며 반(半) 부탁, 반 강요로 말을 꺼낸 게 발단이 됐다.”

 - 그래도 냉큼 달려들 일은 아닌데.

 “87년 대학 여름방학 때 당시 강릉대 교수였던 형이 제자들과 함께 낱말카드를 하나하나 모아놓고 사전을 만드는 것을 본 적이 있다. 그때 흘린 땀이 물거품으로 끝나선 안 될 것으로 생각했다. 다행히 책을 만들 정도의 여력은 있었고…. 그러다 2002년에 제대로 해보자고 작정했다.”

 - 일이 꼬리에 꼬리를 물었나보다. 

 “그해 설날 형이 부르더니 ‘이런 책도 있다’며 5권짜리 『일본어 어휘대계』를 보여줬다. 출판사가 통신회사인 NTT도코모였다. 인간과 컴퓨터의 대화를 목적으로 일본어의 의미·단어·구문체계를 정리한 사전이다. 우리는 왜 이런 게 없지, 약이 올랐다. 그것에 버금가는 우리말 사전을 만들어야겠다는 욕심이 생겼다. 함께했던 형이 2005년 희귀병으로 타계하면서 유업(遺業)처럼 됐다.”

 - 경비가 만만치 않았을 텐데.

 “지금까지 연구비·인건비·제작비 등 최소 30억원은 들어갔다. 그 시간에 그 돈을 써서 그것밖에 못 했느냐고 하면 할 말이 없지만 사전이란 게 만만한 대상이 아니다. 본업이었던 플랜트 컨설팅으로 지탱할 수 있었다. 그래도 행운이라고 생각한다. 누군가는 해야 할 일이기 때문이다. 단지 제 순서가 왔을 뿐이다. 전공이 공학이고, 컴퓨터에도 익숙해 국어학자들을 뒷받침할 수 있었다.”

우리 말글의 쓰임새를 알알이 정리한 각종 국어사전. 한국문화의 밑바탕을 이루는 보물과 같다.
- 듣고 보니 국가 차원에서 추진할 일이다.

 “지금까지 지원금을 신청해본 적이 한 번도 없다. 정부 프로젝트는 대개 6개월 미만의 단기사업이 많다. 하지만 사전 편찬은 장기전이다. 15년째 우리 말글과 함께하다 보니 꽤 재미도 붙게 됐다. 틈나는 대로 컴퓨터를 켜고 단어 분류와 조합에 몰두한다. 국어학회·한국어학회·한국사전학회 임원으로도 활동 중이다.”

 - 그래도 국어학자는 아니다. 

 “유의어 사전을 영어로 시소러스(Thesaurus)라고 한다. 보물·보석·보고라는 뜻이다. 영어권에서는 일찍부터 발달했다. 대표적인 게 1852년 나온 『로제(Roget)의 시소러스』다. 그 사전을 만든 로제(1779~1869)도 언어학자는 아니었다. 내과의사였다. 과학·수학에 관심이 많은 박물학자였다. 87년 토박이말을 정리한 『우리말 분류사전』을 낸 남영신씨도 법학도 출신이다.”

 - 사업가와 사전편찬자, 헷갈리지 않나. 

 “처음에 그랬지만 지금은 금방 회로가 전환된다. 구슬이 서 말이라도 꿰어야 보배라고 했다. 옷에 비유하면 저는 창고지기쯤 되겠다. 직접 옷을 만들지 못하지만 창고는 관리할 수 있다. 한국어라는 보물서랍을 정리하는 것이다. 즐거운 일이다. 만족한다.”

 - 사람들은 보통 사전을 거들떠보지 않는데.

 “2007년 방한한 앨빈 토플러가 이런 말을 했다 ‘어린 시절 숙모가 건넨 유의서 사전을 읽고 작가를 꿈꿨고, 그때의 지식과 경험이 미래학자로서의 자산이 됐다’고. 유의서 사전은 세상의 계통과 구조를 파악하는 통로와 같다. 또 컴퓨터 시대의 가장 기초적인 데이터다. 말이 없는 세상을 상상할 수 있을까. 사전 없는 지식의 축적은 기대할 수 없다. 일은 고되도 제가 그만둘 수 없는 이유다.”

 - 그래도 수익이 있어야 하지 않을까.

 “컨설팅 사업이 잘되고 있다. 앞으로도 할 일이 많다. 많은 유의어를 비슷한 의미끼리 다시 묶는 ‘다의(多意) 유의어 사전’을 작업하고 있다. 예로 동사 ‘가다’만 해도 『표준국어대사전』에 나오는 뜻만 34개다. 『유의어 대사전』에도 ‘나가다’ ‘되다’ ‘변하다’ 등 36개의 유의어가 실려 있다. 이를 다시 비슷한 것끼리 묶는 일인데, 한 10년쯤 걸릴 것 같다. 필생의 숙원 프로젝트다. 사전 자체로도 운영이 됐으면 하는 바람이 있지만 아직은 요원하다. 그래도 어떤가. 학교에서 우등상은 못 탔지만 개근상은 탔다. 그렇게 꾸준히, 열심히 해갈 것이다. 은퇴 후에도 계속할 수 있는 일이라 좋다. 먼저 간 형이 흐뭇해한다면 더 바랄 게 없다.”

박정호 문화.스포츠.섹션 에디터 

[S BOX] ‘한국형 인공지능’ 개발에 유의어·반의어 등 데이터 활용

인공지능의 오늘을 상징하는 IBM 수퍼컴퓨터 왓슨. 퀴즈게임에서 사람을 이기는 수준까지 왔다.
심심풀이로 구글번역기를 돌려 봤다. ‘이 맛 정말 죽이는데’를 입력했더니 영어로 ‘The taste is really killing’이라고 뜬다. 컴퓨터가 ‘죽이다’의 뉘앙스를 제대로 알아채지 못했기 때문이다.

 엑소브레인(Exobrain) 프로젝트를 들어보셨는지? 사람의 말을 정확히, 즉 조건과 상황을 따져 가며 이해하는 소프트웨어를 개발하려는 초대형 국가 사업이다. 2023년까지 정부·민간 연구기관 26곳에 1000억원이 투입될 예정이다. 엑소브레인은 사람과 의사소통이 가능한 몸 바깥의 인공두뇌를 뜻한다.

 ‘아’ 다르고 ‘어’ 다른 게 우리말이다. 컴퓨터가 사람들과 대화할 수 있는, 즉 질의응답이 가능한 수준의 자연어 처리기술은 인공지능 분야에서도 최고의 난제로 꼽힌다. 우리말의 유의어·반의어 등에 대한 방대한 데이터가 필수적이다. 김기형 대표가 그간 축적해 온 언어자료가 엑소브레인 프로젝트의 기본 틀로 사용되고 있다.

 엑소브레인의 1차 목표는 컴퓨터가 ‘장학퀴즈’ 정도의 문제를 알아맞히는 원천기술을 개발하는 것이다. IBM 수퍼컴퓨터 왓슨이 3년 전 미국 TV 퀴즈쇼 ‘제퍼디’에서 사람을 물리치고 우승했던 수준의 기술이다.

 엑소브레인 프로젝트에 참여하는 한국전자통신연구원의 류법모 선임연구원은 “2017년까지 IBM 왓슨 컴퓨터를 따라잡을 계획”이라며 “그 정도면 컴퓨터의 인간 언어 이해도가 85%에 이르게 된다”고 설명했다. 김 대표는 “현재 중고생 수준의 데이터가 제공되고 있지만 향후 고난도 어휘를 추가하는 방안도 논의 중”이라며 “그간 만들어 온 사전이 인공지능 프로젝트에 사용될 줄은 전혀 예상하지 못했다”고 말했다.

댓글 없음:

댓글 쓰기