문서 자동 요약 기술의 발전을 위한 학제적 접근의 필요성과 과제
서혁
이화여자대학교
Korea Business Review 39호 31-63 (2010)
초록
국어교육에서 학습자의 언어처리 과정에 대한 과학적 탐구는 기여할 수 있는 바가 크다. 컴퓨터 언어처리 모형의 기본 원리 역시 인간의 언어 처리 과정을 기반으로 하고 있는 측면이 많기 때문이다. 따라서 학습자의 국어 학습 과정, 이해와 표현 과정에서의 실수와 오류, 사실적․추론적․비판적 이해와 표현의 인지적 사고 발달 과정을 핵심으로 하는 국어교육의 연구 내용은 컴퓨터 언어 처리에 기여할 수 있는 바가 크다. 지금까지 언어와 관련하여 이루어져 온 음운, 어휘, 형태, 통사, 담화․텍스트 구조, 담화․텍스트의 이해와 처리 과정, 인지 언어학 등 모든 연구들이 문서 자동 요약 연구에만도 관련되지 않는 부분이 없을 정도이다. 그리고 생략, 지시, 대용 이론, 스키마와 개념망 이론 등이 완성될 때 문서 자동 요약을 비롯한 컴퓨터 언어 처리에 대한 과제가 좀 더 완전하게 해결될 수 있다는 시각이 일반적이다. 이는 인간의 언어이해와 표현의 정밀한 과정이 해결되어야만 문서 자동 요약은 물론 컴퓨터 언어 처리가 좀 더 완벽해질 수 있다는 뜻이다. 따라서 학습자의 언어 이해와 표현 과정에 대한 보다 정밀한 탐색과 연구는 국어교육은 물론 컴퓨터 정보 처리 연구에도 중요한 자산이 되며, 여기에 상호 학제적 연구의 필요성과 중요성이 존재한다. 지금까지 논의한 결과를 바탕으로 학제적 관점에서 문서 자동 요약이 주는 시사점을 간단히 제시하면 다음과 같다. 첫째, 맥락정보 기반 접근법 활용의 필요성과 가능성이다. 제목이나 문맥 단서뿐만 아니라 담화․텍스트의 상황맥락, 사회문화적 맥락 등의 맥락 정보 활용 가능성을 고려해야 할 것이다. 특히 발신자, 수신자, 더 나아가서는 의도, 목적, 메시지, 관련지식(스키마)을 종합적으로 고려할 수 있는 방안이 온톨로지의 구축과 함께 고려되어야 할 것이다. 둘째, 담화 표지와 텍스트의 구조를 좀 더 적극적으로 활용하는 방안이 모색되어야 할 것이다. 기존의 담화 표지에 대한 연구 성과의 반영도 아직은 미흡한 수준으로 보이며, 특히 텍스트의 구조(초구조, 거시구조, 담화․텍스트 차원의 수사적 호응 관계) 등은 아직도 거의 반영되지 못하고 있는 것으로 보인다. 특히 텍스트 전개 구조를 참조한 입체적 벡터의 개념(텍스트 전개 방향, 텍스트 부분의 중요도)이나 등간격 지향성의 원리(첫째, 둘째, 셋째 등)은 구체적으로 공동 연구가 필요한 부분으로 생각된다.
키워드
국어교육문서 자동 요약요약하기학제적 연구담화표지텍스트 구조
참고문헌
- [1] [학술대회논문] 강인수/문서 자동 요약의 현황과 과제. in: 국어교육과 디지털 리터러시/국어교육학회 제46회 전국학술대회발표대회 자료집/2010//~/국어교육학회
- [2] [학술지(정기간행물)] 고영중/문장 중요도를 이용한 자동 문서 범주화/정보과학회논문지 : 소프트웨어 및 응용/2002/29(6)/417~424/한국정보과학회/
- [3] [학위논문] 김건오/어휘 클러스터링을 이용한 주제어 판별 기반의 자동 문서 요약/석사/서강대 대학원//2002
- [4] [학술지(정기간행물)] 김건오/어휘 클러스터링을 이용한 자동 문서 요약/한국정보과학회 학술발표논문집/2002/29(1)/463~465//
- [5] [학술지(정기간행물)] 김계성/단락 자동 구분을 이용한 문서 요약 시스템/정보과학회논문지 : 소프트웨어 및 응용/2003/30(8)/681~686/한국정보과학회/
- [6] [학술지(정기간행물)] 김금영/질의기반 자동문서 요약/춘계학술발표논문집/2002/9(1)/~/한국정보처리학회/
- [7] [학술지(정기간행물)] 김봉순/설명적 텍스트의 중심내용 분석 원리/국어교육학연구/1999/(9)/~/국어교육학회/
- [8] [학술지(정기간행물)] 김재봉/문 주제 중심의 텍스트 요약과 거시규칙/텍스트언어학/1995/3/1~82/박이정/
- [9] [단행본] 텍스트 요약 전략에 대한 국어교육학적 연구/김재봉/집문당/1999/~///
- [10] [단행본] 검색/요약/필터링을 위한 텍스트 이해 모형 및 처리기술 개발/김태희/과학기술부 연구개발정보센터/1999/~///
- [11] [학위논문] 남기종/신문기사 명사-동사 공기패턴 정보를 이용한 문서 자동 요약/석사/전남대 대학원//2003
- [12] [학위논문] 류동원/2단계 문서분할을 통한 자동 문서요약 시스템/석사/포항공과대학교 대학원//2001
- [13] [학술지(정기간행물)] 박건숙/자연언어처리를 위한 구문?의미 정보 구축/한국어 의미학/2006/19/1~35/한국어의미학회/
- [14] [학술지(정기간행물)] 박진호/자연언어처리와 국어 연구/국어국문학/2006/9(143)/97~122/국어국문학회/
- [15] [단행본] 텍스트학/반 다이크/(주)민음사/1995/~///
- [16] [학술지(정기간행물)] 배희숙/문서 자동요약을 위한 말뭉치 기반 언어정보 추출:백과사전 인물 관련 항목의 계량언어학적 연구/계량언어학/2003/2/39~52//
- [17] [학술지(정기간행물)] 배희숙/정보검색 시스템의 성능 향상을 위한 복합어 전자사전/프랑스문화예술연구/1997/6/69~82/프랑스문화예술학회/
- [18] [학위논문] 서혁/단락, 문장의 중요도 파악과 단락의 주제문 작성 능력이 요약에 미치는 효과/석사/서울대학교 대학원//1991
- [19] [학술지(정기간행물)] 서혁/요약능력과 요약 규칙/국어교육학연구/1994/4/113~142/요약능력과/
- [20] [학술지(정기간행물)] 윤재민/육하원칙 활성화도를 이용한 신문기사 자동추출요약/정보과학회논문지 : 소프트웨어 및 응용/2004/31(4)/505~515/한국정보과학회/
- [21] [학술지(정기간행물)] 윤재민/확장된 6하원칙을 이용한 신문기사 자동요약/학술발표논문집/2002/29(1B)/466~468/한국정보과학회/
- [22] [학위논문] 이삼형/설명적 텍스트의 내용 구조 분석 방법과 교육적 적용 연구/박사/서울대학교 대학원//1994
- [23] [학위논문] 이수희/독자의 목적에 따른 요약하기 체계화 연구/석사/경인교육대학교 교육대학원//2005
- [24] [학술대회논문] 이유리/수사구조를 이용한 텍스트 자동요약/학술발표 논문집/1999//97~102/한국정보과학회 언어공학연구회
- [25] [학술지(정기간행물)] 이해윤/담화표지에 의한 텍스트 구조 분석/독어학/2007/(15)/289~312/한국독어학회/
- [26] [학위논문] 장철순/요약하기 실태 분석과 교수·학습 방안/석사/이화여자대학교 교육대학원//2008
- [27] [학위논문] 천한신/인지 발달에 따른 글 내용의 중요도 파악 능력의 발달에 관한 연구/석사/서울대학교 대학원//1987
- [28] [학위논문] 추교남/멀티미디어 XML 문서에 대한 의미 분석 기반의 지능적 자동 요약/박사/인천대학교 대학원//2007
- [29] [학위논문] 한경수/질의분해를 이용한 적합성 피드백 기반 자동 문서요약/석사/고려대학교 대학원//2000
- [30] [학술지(정기간행물)] 황금하/개념 및 관계 분류를 통한 분야 온톨로지 구축/정보과학회논문지 : 소프트웨어 및 응용/2008/35(9)/562~571/한국정보과학회/
- [31] [학술지(정기간행물)] Kintsch, W./Towards a model of text comprehension and production/Psychological Review/1978/85/363~394//
- [32] [학술지(정기간행물)] Marton, F./On qualitative differences in learning:I -Outcome and process/British Journal of Educational Psychology/1976/46/4~11//
- [33] [학술지(정기간행물)] New London Group/A Pedagogy of Multiliteracies:Designing social futures/Harvard Educational Review/1996/66/60~91//
- [34] [학술지(정기간행물)] Wittrock, M. C./Generative processes of comprehension/Educational Psychologist/1990/24(4)/345~376//
