UCC세상

스킵 네비게이션

메인메뉴

통합검색

유토피아 메인 컨텐츠

HOME HOME 울산대학교 HOME 정보바다 HOME UCC세상
UCC세상:재미있는 UCC나 나만의 UCC를 올려주세요.울산대인들이 만든 일반 UCC를 감상해보세요.

게시물 읽기

일반|전기공학부 한국어처리연구실 한자 자동변환 프로그램 개발
첨부파일

                                                                                  - 12월 13일 울산MBC 뉴스데스크  


울산대학교는 13일 전기공학부 한국어처리연구실(지도교수 옥철영 교수) 신준철(27·박사과정)·김홍순(25·석사과정)·이용훈(24·석사과정) 팀이 한자 자동변환 프로그램으로 10월 문화체육관광부와 국립국어원이 공동 주최한 '2011 국어정보처리시스템 경진대회'에서 대상을 차지했다고 밝혔다.

울산대 팀의 출품작품은 'UTagger'로, 한국어 문장에 대한 품사 및 동형이의어(同形異義語) 분별 시스템.

이 시스템은 국립국어원이 우리말의 정보화·세계화·표준화를 위해 만든 '21세기 세종계획 말뭉치'로부터 수집한 정보를 바탕으로 우리말의 형태소와 의미를 분석하는 프로그램이다.

문장 상에서 한글 단어의 뜻에 맞는 한자(漢子)를 자동으로 변환한다는 점에서 획기적인 기술로 평가받았다. 즉 PC 상의 문서작성에서 한글 뜻에 맞는 한자를 하나하나 찾아 바꾸는 작업을 하지 않아도 모든 글자가 자동적으로 변환되기 때문에 문서작성 시간을 크게 단축할 수 있다.

한자 변환과정은 낱말 형태소 분석→동형이의어 분별→한자 적용으로 간단하다.

동형이의어 분별은 글자 모양은 같지만 뜻이 다른 글자가 문장위치 및 문맥에 따라 놓일 수 있는 확률을 분석하는 방식으로 이뤄진다.

이는 울산대 한국어처리연구실이 국립국어원의 '표준국어대사전'에 실린 45만개 단어 중 12만5490개의 동형이의어에 대해 문맥에 따른 쓰임새를 기계·통계적으로 학습했으며 28만9054개의 한자를 등록했기 때문에 가능하다.

이 프로그램은 사용자사전을 지원하도록 설계돼 누구나 신조어(新造語) 등을 등록할 수 있고 등록 즉시 분석이 가능해진다.
한국어처리연구실은 'UTagger'의 원천기술을 연구용으로 공개하면서 한국어처리연구자 누구나 자유롭게 사용할 수 있도록 해 연구의 선순환 효과도 기대된다.

울산대 한국어처리연구실 팀은 경진대회에서 옥철영 지도교수가 개발한 '동형이의어 분별 시스템'을 응용한 '세종말뭉치 검증 및 원시말뭉치 품사/동형이의어 태깅 시스템'으로 2009년 금상, '세종 형태 의미 말뭉치: 형태 분석 오류 수정 및 모든 동형이의어 태깅'으로 2010년 금상, 올해 대상을 차지함으로써 독보적인 연구업적을 쌓았다.

이번 한자 변환 원리를 ①몸을 얹다(ride) ②불이 붙다(burn) ③섞다(mix) 등 영어로는 형태가 다른 '타다'와 같은 낱말 등에 같은 방식으로 적용하면 한글-영어 번역도 더욱 정확해진다.

한국어처리연구실 옥철영 교수는 "이번 연구는 질의어에 해당되는 문서만을 찾아주는 단순 정보검색에서, '사망'을 검색어로 할 경우 '죽다, 별세하다, 돌아가다' 등 동일 의미의 문장까지 모두 찾을 수 있는 수준으로까지 발전할 수 있다"며 "컴퓨터가 백과사전에서 자동으로 지식을 구축하는 생물학적 사고(思考) 능력을 지닌 컴퓨터 프로그램 개발에 몰두할 계획"이라고 밝혔다.

(0)
리스트 인쇄 불량 게시물 신고하기

댓글 리스트

등록된 댓글이 없습니다.

본문 다시읽기

리뷰컨텐츠는 현재 페이지의 본문내용에 다시 접근할 수 있도록 링크를 제공합니다.

상위링크

리뷰 네비게이션


디자인 구성요소

디자인 구성요소는 일반 사용자에게 시각적인 효과를 제공하기 위한 의미가 포함되지 않은 이미지 요소들입니다.