웹 기반의 언어자원 객체화에 근거한 사전 개발 시스템
페이지 정보
작성일 23-04-14 19:38
본문
Download : .hwp
[7] 최용준, 황도삼, 최기선, “YDK : 한국어 통합정보사전 개발시스템의 설계 및 구현”, 한국정보과학회, 한국정보과학회 추계학술발표회논문집, 1998년 10월.
5. 결론 본 논문에서는 각기 다른 장소에 다양한 형태로 분산되어 있는 여러가지 언어자원들을 웹 기반에서 객체화시키는 모델을 제안한다. 제안한 모델의 적합성을 검증하기 위해 사전 개발 시스템 YDK2000를 설계하고 구현하였다.
4.3 사전간의 자료교환 지원 環境
[2] 이재성 외3, “텍스트 및 전자사전 관리시스템의 설계”, 한국정보과학회 & 한국인지과학회, 제8회 한국어 정보처리 학술대회 논문집, pp.408-414, 1996.
[4] 최병진 외3, “표준화를 위한 일반사전의 논리 구조”, 한국정보과학회&한국인지과학회, 제8회 한국어 정보처리 학술대회 논문집, pp.415-423, 1996.
설명
[3] 한국과학기술원, “텍스트코퍼스 및 전자사전 관리시스템(TDMS)”, 과학기술처, 통합 국어정보베이스 최종보고서, pp.17-150, 1996.
2.2 Internet을 기반으로 한 분산 언어자원 통합 모델
4.2 YDK2000의 구현
Download : .hwp( 44 )
통합정보사전 웹 기반의 언어자원 언어자원 객체화 / [1] 영남대학교, “심층 국어정보처리 품질관리 체계”, 한국과학기술원, 대용량 국어정보 심층처리 및 품질관리기술 개발 최종보고서, pp.56-68, 1998.
3. 웹 기반의 언어자원 객체화 모델
통합정보사전 웹 기반의 언어자원 언어자원 객체화
4.1 YDK2000의 설계
자연언어처리 시스템들은 대개 많은 양의 문법정보, 의미정보, 용례 등을 필요로 한다. YDK2000은 기존의 각종 사전의 다양한 사전정보를 통합할 수 있을 뿐만 아니라, 여러 자연언어처리 시스템들과 Internet 접속을 통해 언어처리를 위한 사전정보를 손쉽게 통합할 수 있어 고품질의 전자사전을 개발할 수 있는 자연언어처리 응용 시스템이다. CORBA는 복잡한 재개발과정을 없애주는 특징이 있어 많이 이용되지만 별도의 미들웨어를 설치해야하며, 사용이 어렵다는 단점이 있다. 웹 기반에서 객체화된 언어자원들은 다양한 응용 시스템 개발에 간단한 방법으로 이용되어 강력한 자연언어처리 응용 시스템을 구성할 수 있다. 개발한 YDK2000은 기존의 각종 사전의 여러가지 사전정보를 통합할 수 있을 뿐 아니라 여러 자연언어처리 시스템들과의 Internet 접속을 통해 언어처리를 위한 사전정보를 손쉽게 통합할 수 있어 고품질의 사전을 개발할 수 있다. 이러한 과정을 거쳐 개발된다 하더라도 실제로 사용하기 위해서는 매우 큰 저장 공간과 고성능의 시스템이 필요하므로 여러 면에서 비효율적이다.
순서
3.2 언어자원 객체화 모듈
[6] 황도삼 외2, “자연언어이해”, 홍릉과학출판사, 1999.





4.4 결과 및 고찰
3.1 웹 기반의 언어자원 객체화
3.3 익스트라넷(Extranet)
레포트 > 사회과학계열
[5] 황도삼 외2, “자연언어처리”, 홍릉과학출판사, 1998.
통합정보사전 웹 기반의 언어자원 언어자원 객체화 / [1] 영남대학교, “심층 국어정보처리 품질관리 체계”, 한국과학기술원, 대용량 국어정보 심층처리 및 품질관리기술 개발 최종보고서, pp.56-68, 1998. [2] 이재성 외3, “텍스트 및 전자사전 관리시스템의 설계”, 한국정보과학회 & 한국인지과학회, 제8회 한국어 정보처리 학술대회 논문집, pp.408-414, 1996. [3] 한국과학기술원, “텍스트코퍼스 및 전자사전 관리시스템(TDMS)”, 과학기술처, 통합 국어정보베이스 최종보고서, pp.17-150, 1996. [4] 최병진 외3, “표준화를 위한 일반사전의 논리 구조”, 한국정보과학회&한국인지과학회, 제8회 한국어 정보처리 학술대회 논문집, pp.415-423, 1996. [5] 황도삼 외2, “자연언어처리”, 홍릉과학출판사, 1998. [6] 황도삼 외2, “자연언어이해”, 홍릉과학출판사, 1999. [7] 최용준, 황도삼, 최기선, “YDK : 한국어 통합정보사전 개발시스템의 설계 및 구현”, 한국정보과학회, 한국정보과학회 추계학술발표회논문집, 1998년 10월. [8] 최용준, 황도삼, 최기선, “YDK-Term : 한국어용언의 다국어 통합정보사전”, 한국인지과학회&한국정보과학
2. 한국어 통합정보사전 개발 시스템
다. 이러한 정보는 전자사전을 통해 제공되며, 제공되는 정보의 양과 질에 따라 프로그램(program]) 의 성능도 influence을 많이 받는다[1].
전자사전을 구축하는 일은 노동집약적이면서도 전문지식을 필요로 하기 때문에 개발과정이 길고, 개발한 사전은 지속적으로 단어가 추가될 뿐만 아니라, 때로는 사전의 구조 자체도 변경되게 된다. 웹 기반에서 객체화된 언어자원들은 다양한 응용 시스템 개발에 간단한 방법으로 이용되어 강력한 자연언어처리 응용 시스템을 구성할 수 있다. 또한, 초기 개발 이후에 이루어진 각 언어자원들의 개량은 별도의 처리과정 없이 자동으로 각 응용 시스템에 반영되므로 효능적인 유지보수가 가능하다는 advantage이 있다. 제안한 모델의 적합성을 검증하기 위해 한국어 통합정보사전 개발시스템(YDK2000이라 부름.)을 설계하고 구현하였다.
[8] 최용준, 황도삼, 최기선, “YDK-Term : 한국어용언의 다국어 통합정보사전”, 한국인지과학회&한국정보과학
웹 기반의 언어자원 객체화에 근거한 사전 개발 시스템
4. YDK2000의 설계 및 구현
2.1 TDMS
2.3 YDK1
1. 서론
본 논문에서는 Internet의 기본 서비스인 웹(World Wide Web) 環境에서 분산된 언어자원들을 객체화시키는 방법을 제안한다. 이러한 전자사전을 기반으로 하여 개발되는 자연언어처리 시스템들은 사전의 變化(변화)에 influence을 받게 되며, 필요로 하는 전자사전들을 시스템 내에 모두 설치해두어야 하는 문제점(問題點)들을 갖고 있다[1-3]. 뿐만 아니라. 응용 시스템이 다른 자연언어처리 시스템들의 처리결과를 이용하고자 할 경우에는 별도의 복잡한 재개발과정을 거쳐 시스템 내에 그 시스템을 포함시켜 두어야만 한다.