
한글 시험지(HWPX)를 완벽하게 뽑기까지 — PlanA AI 포맷 엔진의 도전
AI가 만든 문제를 수정 없이 인쇄하기까지, 생각보다 훨씬 복잡한 이야기
국내 학교 시험지의 표준은 여전히 한글(HWP)입니다. 이 사실은 AI가 아무리 정교한 문제를 만들어도, 선생님이 매일 여는 편집기에서 바로 열리지 않으면 실용적이지 않다는 것을 뜻합니다. PlanA AI가 HWPX 포맷 엔진을 자체 개발한 이유가 여기 있습니다 — 그리고 그 과정은 처음 예상보다 훨씬 복잡했습니다.
이 글은 시리즈 중 유일하게 개발 현장의 이야기를 솔직하게 꺼내는 글입니다. 기술적인 도전을 말씀드리되, 결론은 언제나 선생님께 돌아갑니다. "받아서 바로 인쇄할 수 있는 한글 파일 하나"라는 그 문장으로.
왜 굳이 한글 파일인가요?
PDF로 드리면 안 되냐는 질문을 가끔 받습니다. 충분히 그럴 만한 의문입니다.
그런데 선생님들이 실제로 시험지를 다루는 방식을 생각해 보면 답이 달라집니다. 선생님은 시험지를 받아서 그냥 인쇄하지 않습니다. 수업 일정에 맞게 문제를 한두 개 빼거나 추가하고, 학교 로고를 넣고, 반별로 순서를 바꾸기도 합니다. 이 모든 편집이 한글에서 이루어집니다. 20년 넘게 쌓인 학교 현장의 작업 방식입니다.
PDF는 열람용입니다. DOCX는 호환성이 불완전합니다. 선생님이 "한글 파일로 주세요"라고 하실 때, 그 말에는 "내가 익숙한 방식으로 수정할 수 있어야 한다"는 의미가 담겨 있습니다. 그래서 PlanA AI는 처음부터 한글(HWPX) 형식을 목표로 삼았습니다.
HWPX는 어떤 포맷인가요?
HWPX를 간단히 설명하면, 여러 파일을 한 봉투에 압축해 담은 구조입니다. 그 안에 문서의 내용, 글꼴 정보, 이미지, 스타일이 각각 별개의 파일로 들어가 있고, 한컴 고유의 방식으로 서로 맞물립니다.
문제는 이 규격이 공개 문서로 충분히 정리되어 있지 않다는 점입니다. 국제 표준 포맷인 DOCX와 달리, HWPX는 한컴이 독자적으로 정의한 규칙 위에서 동작합니다. 글꼴을 심는 방식도, 문단 스타일을 다루는 방법도, 표를 구성하는 구조도 HWPX만의 방식이 있습니다. 기존 라이브러리를 가져다 쓰는 것으로는 한계가 있었고, 결국 실제 파일을 분석해 가며 규격을 직접 파악하는 방향을 택했습니다.
HWPX는 '봉투 안에 여러 문서가 든 구조'입니다. 그 봉투를 여는 것은 어렵지 않지만, 안에 든 내용을 한컴의 방식대로 완벽하게 다시 만드는 것은 전혀 다른 문제였습니다.
가장 어려웠던 난관: 표(Table) 처리
시험지에서 표는 생각보다 자주 등장합니다. 객관식 선택지를 A·B·C 형태로 가로로 배열하거나, 본문과 보기를 나란히 놓거나, 요약을 시각적으로 정리할 때 모두 표 구조를 씁니다.
표를 HWPX로 렌더링하는 일 자체는 해결할 수 있었습니다. 진짜 문제는 그다음에 나타났습니다.
선생님들이 올리시는 시험지 이미지는 다양합니다. 깔끔하게 스캔된 파일도 있지만, 인쇄된 시험지를 카메라로 찍은 것도 있고, 수십 년 전 방식으로 만들어진 문서를 복사한 것도 있습니다. AI가 이를 구조화된 데이터로 분석하다 보면 표의 행과 열 정보가 어긋나는 경우가 생깁니다. 셀이 누락되거나, 병합 정보가 맞지 않거나, 행 수와 열 수가 틀어지는 형태입니다. 이를 '기형 표(malformed table)'라고 부릅니다.
이런 기형 표를 그대로 HWPX로 출력하면 한글 편집기에서 파일이 열리지 않거나, 열리더라도 레이아웃이 무너집니다. 선생님 입장에서는 "파일이 깨졌다"는 경험을 하게 됩니다. 이것은 어떤 이유로도 용납하기 어려운 결과였습니다.

시험지 변환 예시: 10쪽 PDF에서 첫 페이지 3문항 분리
실제 사용 패턴을 합성·익명화했고, 문항 텍스트는 식별되지 않도록 재구성했습니다.
완료된 HWPX 분석 흐름을 바탕으로 재구성해 보겠습니다. 영어 시험지 PDF를 업로드하면 페이지별 문항이 문제 단위로 분리되고, 각 문항은 질문, 지문, 선택지, 정답 해설의 구조로 정리되어 HWPX 출력의 재료가 됩니다.
- OCR 단계: 페이지 안의 문제 번호, 보기, 배점, 지문 요소를 추출합니다.
- 분리 단계: 요지 파악, 제목 추론 등 문항별 블록을 나눴습니다.
- 분석 단계: 정답 근거와 해설을 문항별로 저장했습니다.
이 구조화가 제대로 되어야 한글 파일도 깨지지 않습니다. HWPX 출력 품질은 마지막 버튼에서 결정되는 것이 아니라, OCR과 문항 분리 단계부터 이미 결정됩니다.
그래서 HWPX로 변환하기 전 단계에 유효성 검사 단계를 두었습니다. 선택지형 표인지, 요약형 표인지를 먼저 판별하고, 각 유형에 맞는 구조적 검증을 거친 뒤에야 변환이 진행됩니다. 문제가 발견되면 변환 자체를 시도하지 않고 안전한 대안 형식으로 처리합니다. 기형 표 때문에 파일이 열리지 않는 상황을 막기 위한 방어선입니다.
한컴 2018 버전 호환성 이슈도 있었습니다. 특정 표 구조가 최신 한글에서는 정상적으로 열리지만 2018 버전에서는 오류를 일으키는 경우를 확인했습니다. 이 문제는 이미 파악하고 해결한 상태입니다.
이미지 → 구조화 데이터 → HWPX: 세 단계의 여정
선생님이 시험지 이미지를 올리시면, PlanA AI 내부에서 세 단계의 변환이 순차적으로 일어납니다.
첫 단계는 분석입니다. 업로드된 시험지 이미지를 페이지 단위로 처리하면서, AI가 문제 번호·지문·선택지·배점 등의 요소를 인식합니다. PlanA AI는 이 단계에 Gemini와 같은 최신 멀티모달 모델을 써서 구조 인식의 정확도를 끌어올립니다.
두 번째 단계는 구조화입니다. 인식된 내용이 문제·선택지·정답·해설이 각각 제자리에 있는 정돈된 데이터로 변환됩니다. 이 데이터가 HWPX 생성의 원재료가 됩니다.
세 번째 단계가 HWPX 생성입니다. 구조화된 데이터를 바탕으로 한컴 포맷에 맞는 문서가 만들어지고, 교사용(해설 포함)과 학생용(정답 분리)이 동시에 출력됩니다. 파일명은 "연도_학교_학년_시험명" 형식으로 자동 생성되어, 따로 파일명을 정리하지 않아도 됩니다.
생성 엔진이 문제를 만드는 과정과 이 HWPX 변환 과정은 서로 연결되어 있습니다. 엔진이 만든 문제가 HWPX로 어떻게 정착하는지, 그 흐름을 이 글이 설명합니다.
출력 품질을 높이는 두 가지 기능
완성된 HWPX가 선생님께 닿기 전에 두 가지를 확인합니다.
하나는 글꼴입니다. 한글 편집기에서 파일을 열었을 때 글꼴이 깨져 보이면, 아무리 내용이 좋아도 그 시험지는 쓸 수 없습니다. 한국 교육 현장에서 표준적으로 쓰이는 글꼴이 정상적으로 표시되는 상태로 파일을 납품하는 것을 기준으로 삼고 있습니다.
다른 하나는 페이지 선택 출력 기능입니다. 분석된 시험지 전체가 아니라 필요한 페이지만 골라 HWPX로 뽑을 수 있습니다. 30쪽짜리 시험지에서 특정 단원만 추출해 다른 반 학생용 자료로 만들거나, 이번 수업에서 다룰 파트만 따로 출력할 때 유용합니다.
결국 선생님이 체감하는 것
기술 이야기를 길게 풀었지만, 결론은 간단합니다.
선생님이 파일을 받아 더블클릭합니다. 한글 편집기가 열리고, 레이아웃이 흐트러지지 않은 시험지가 나타납니다. 교사용과 학생용이 나뉘어 있고, 파일명에는 학교와 학년 정보가 이미 들어가 있습니다. 수정이 필요하면 해도 되고, 그대로 인쇄 버튼을 눌러도 됩니다.
"파일 받아서 수정 없이 인쇄" — 이 한 문장이 HWPX 포맷 엔진이 목표로 삼은 전부입니다.
다른 서비스와 비교했을 때 차이가 가장 크게 느껴지는 지점도 결국 출력 결과물입니다. 저희가 표 유효성 검사에 공을 들이고, 글꼴 호환성을 확인하고, 한컴 2018 이슈를 꼼꼼히 잡은 이유가 바로 그런 경험 차이에 있습니다.
다양한 학교 시험지를 테스트하며 대응한 엣지케이스들이 지금 이 순간에도 포맷 엔진 안에 쌓여 있습니다. 이런 예외 하나하나가 선생님에게 "파일이 왜 이래요?"라는 순간으로 이어지지 않도록 막는 일, 그것이 개발 팀의 역할입니다.
코너스톤 글에서 "한글 시험지 포맷이 의외로 가장 큰 벽"이라고 말씀드린 바 있습니다. 이 글이 그 벽을 어떻게 넘었는지에 대한 답입니다. 이 HWPX 출력 기능이 워크북이나 학교별 시험 범위 연동 기능과 어떻게 연결되는지는 다음 글에서 이어 다루겠습니다.
지금 학교 시험지를 업로드하시면, 편집 가능한 HWPX 파일로 바로 받아보실 수 있습니다. 가입하시면 3,000 크레딧을 무료로 드리니, 직접 선생님의 시험지 한 장을 올려 보시고 결과가 어떻게 다른지 확인해 보시기 바랍니다. 표 처리부터 교사용·학생용 동시 출력까지, 시스템이 어디까지 해 드리는지 눈으로 보시는 것이 가장 빠릅니다.
PlanA AI
AI가 만드는 맞춤형 영어 문제
수능·모의고사·EBS 지문으로 변형 문제와 워크북을 즉시 생성하세요. 수업 준비 시간을 90% 줄여줍니다.
3,000 크레딧으로 무료 체험 →