Research Article
교사교육자와 생성형 AI의 쓰기 평가 비교 연구 — 대학 신문 사설을 중심으로
전북대학교
청주대학교
강원대학교
발행: 2025년 1월 · 60권 5호 · pp. 5-39
DOI: https://doi.org/10.20880/kler.2025.60.5.5
초록
본 연구는 예비교사의 글쓰기를 평가하는 과정에서 교사교육자(TEs)와 ChatGPT가 어떠한 평가 기준을 구성하여 채점하는지를 대학 신문 사설을 중심으로 탐구하였다. 이 연구에는 국어교육 전공 예비교사 19명이 참여하였다. 교사교육자 3인은 협의를 통해 평가 기준과 루브릭을 개발하여 텍스트를 평가하였으며, ChatGPT는 자체적으로 평가 기준과 루브릭을 생성한 뒤, 교사교육자가 개발한 루브릭을 적용하여 텍스트를 평가하였다. 교사교육자와 ChatGPT는 모두 사설 장르의 핵심 요소로 논리성과 설득력을 중시하였다. 그러나 교사교육자는 논증의 깊이와 독자 고려를 강조하는 내용 중심의 세분화된 평가 기준을 구성한 반면, ChatGPT는 명확성, 구조, 매체 적응성을 강조하는 통합적이고 형식 중심의 평가 기준을 제시하였다. 동일한 루브릭을 적용하여 채점한 결과, 교사교육자는 질적 민감성이 반영된 폭넓은 점수 분포를 보인 반면, ChatGPT는 중간 점수대에 수렴하는 점수 분포 양상을 보였다. 이러한 결과는 ChatGPT가 교사교육자가 개발한 루브릭을 비교적 일관되게 적용할 수 있으나, 맥락 고려나 해석에 따른 세밀한 의미 변화를 충분히 반영하는 데에는 한계가 있음을 시사한다. 또한 ChatGPT의 채점 결과는 점수의 변별력이 낮은 경향을 보였다. 그럼에도 불구하고 ChatGPT는 교사가 평가 기준과 루브릭 설계를 점검하거나 자신의 평가 실천을 검토할 때 보조적 도구로 활용될 가능성이 있어, 이는 글쓰기 평가에서 인간과 생성형 AI 간 협업 가능성을 시사한다.
