해야 할 평가는 못 하고, 수천 장 문서만 정리합니다
수작업 문서 분류에 매일 수십 시간을 쓰던 전문 평가 컨설팅 기업의 AI 기반 문서 자동 분류 이야기
평가는 못 하고, 문서만 정리합니다
전문가의 시간이 문서 분류에 매몰되는 구조적 병목
이 회사는 외부 기관들로부터 대량의 업무 파일을 넘겨받아 전문적인 평가 업무를 수행합니다. 문제는, 평가 업무를 시작하기도 전에 수백 장의 문서를 수작업으로 분류하고 정리하는 데 막대한 시간이 소모된다는 것이었습니다. 여러 요청처에서 넘어오는 PDF와 압축 파일 속 문서들은 뒤죽박죽 섞여 있었고, 이걸 유형별로 분리해서 정해진 폴더 구조에 정리하는 것만으로도 실무자 한 명이 하루 종일 매달려야 했습니다.
구체적인 어려움
- •여러 요청처에서 넘어오는 PDF, ZIP 파일 속 문서들이 뒤죽박죽 혼합되어 도착
- •수백 장의 문서를 한 장씩 눈으로 확인하며 유형을 판별하는 수작업 (건당 수 시간 소요)
- •분류된 문서를 정해진 폴더 구조에 맞춰 파일명을 변경하고 이동하는 반복 작업
- •사람이 하다 보니 분류 실수, 파일 누락, 잘못된 폴더에 저장하는 일이 빈번
- •평가 건수가 늘어날수록 문서 정리에 투입해야 하는 인력과 시간이 비례하여 증가
- •정작 전문가가 해야 할 평가 분석 업무에 투입할 시간이 부족
- •문서 분류 기준이 사람마다 달라 일관성이 떨어지고, 인수인계도 어려움
- •급하게 처리할수록 오류가 늘어나는 악순환
“평가 업무를 잘하려고 채용한 전문가들이 하루 종일 PDF 파일만 분류하고 있더라고요. 건수가 늘수록 야근이 늘고, 실수도 늘고. 문서 정리는 중요하지만, 이걸 사람이 계속 하는 건 맞지 않다고 느꼈습니다.”
— 고객사 팀장
AI가 문서를 읽고, 분류하고, 정리합니다
Vision AI 기반 문서 자동 분류 및 폴더 구조화 시스템
단순 분류가 목표가 아니었습니다. 수백 장이 뒤섞인 PDF를 업로드하면, AI가 페이지 한 장 한 장을 분석해서 문서 유형을 판별하고, 연속된 페이지를 하나의 문서로 묶어서 분할하고, 정해진 규칙에 맞춰 폴더 구조를 자동 생성하는 엔드투엔드 파이프라인을 만들었습니다.
가장 먼저 해야 했던 건, 실무자가 문서를 어떻게 분류하는지 이해하는 것이었습니다. 사무실에서 직접 작업 과정을 관찰했습니다. 파일을 하나 열고, 페이지를 넘기면서 '이건 A 유형', '이건 B 유형'하고 머릿속으로 판단하고, 해당 페이지 범위를 메모한 뒤 PDF를 쪼개고 폴더에 넣는 과정. 숙련된 실무자도 수백 장짜리 파일 하나를 처리하는 데 서너 시간이 걸렸습니다. '이 판단을 AI가 대신할 수 있겠다'는 확신이 들었습니다.
핵심은 Vision AI였습니다. 문서의 각 페이지를 이미지로 변환한 뒤 상용 Vision API에 보내서, 해당 페이지가 어떤 유형의 문서인지 판별하게 했습니다. 단순 OCR이 아닙니다. 문서의 레이아웃, 표 구조, 제목 패턴, 인장과 서명 위치까지 시각적 특징을 종합적으로 분석해서 분류합니다. 한 가지 모델에만 의존하지 않고, 규칙 기반 분류와 AI 분류를 결합한 하이브리드 방식을 적용해 정확도를 끌어올렸습니다.
복잡한 비즈니스 로직을 체계화한 최저가 자동 계산 알고리즘
연속된 같은 유형의 페이지를 하나의 문서로 묶는 그룹화 알고리즘도 중요했습니다. AI가 1페이지부터 5페이지까지를 'A 유형'으로, 6페이지부터 12페이지까지를 'B 유형'으로 판별하면, 이를 자동으로 두 개의 독립된 문서로 분할합니다. 같은 유형이 연속되다가 중간에 다른 유형이 끼어 있으면, 문맥을 고려해 합칠지 분리할지를 결정합니다. 실무자의 판단 기준을 알고리즘으로 옮겨놓은 것입니다.
분류된 문서들은 정해진 규칙에 따라 폴더 구조가 자동 생성됩니다. 요청처별, 대상자별, 관리번호별로 체계적인 폴더가 만들어지고, 파일명도 '번호_대상자명_유형' 형식으로 자동 변환됩니다. 동시에 전체 처리 결과를 담은 JSON 메타데이터 파일이 생성되어, 이후 분석 파이프라인에서 바로 활용할 수 있습니다. 단순히 파일을 정리하는 게 아니라, 다음 업무 단계까지 연결되는 구조를 만든 것입니다.

웹 기반 문서 자동 분류 시스템 - ZIP 업로드부터 결과 다운로드까지 한 번에
이 모든 과정을 웹에서 할 수 있게 만들었습니다. 실무자가 웹 페이지에 접속해서 ZIP 파일을 업로드하면, 진행 상황이 실시간으로 표시되고, 완료되면 정리된 결과를 ZIP으로 다운로드할 수 있습니다. 서버에서 자동으로 처리되기 때문에 실무자는 업로드 후 다른 업무를 하다가 결과만 받으면 됩니다. 기존에 서너 시간 걸리던 작업이, 업로드 한 번이면 끝나는 구조가 됐습니다.
만들어진 시스템의 핵심
Vision AI 기반 자동 분류
각 페이지를 이미지로 변환하여 Vision AI가 문서 유형을 자동 판별합니다. 레이아웃, 표 구조, 시각적 특징을 종합 분석하여 98%의 정확도를 달성했습니다.
하이브리드 분류 엔진
규칙 기반 분류와 AI 분류를 결합한 하이브리드 방식으로 정확도를 극대화했습니다. AI가 확신이 낮은 경우 규칙 기반 로직이 보완합니다.
자동 폴더 구조 생성
분류된 문서를 정해진 규칙에 따라 체계적인 폴더 구조로 자동 정리합니다. 파일명 규칙도 자동 적용되어 일관된 결과물이 나옵니다.
웹 기반 원클릭 처리
ZIP 파일 업로드 한 번이면 전체 파이프라인이 자동 실행됩니다. 진행률 실시간 확인, 완료 후 결과 ZIP 다운로드까지 웹에서 한 번에.
메타데이터 자동 생성
처리 결과를 JSON 메타데이터로 자동 생성하여, 후속 분석 파이프라인에서 바로 활용할 수 있는 구조화된 데이터를 제공합니다.
확장 가능한 분류 체계
새로운 문서 유형이 추가되면 분류 규칙과 AI 프롬프트만 수정하면 됩니다. 전체 시스템을 건드리지 않고 유연하게 확장 가능합니다.
이제 문서가 아닌 본업에 집중합니다
문서 분류 병목이 사라지자, 팀 전체가 달라졌습니다
시스템 도입 후, 실무자들이 체감한 변화는 극적이었습니다. 매일 아침 문서 분류부터 시작하던 일과가, 업로드 한 번으로 대체됐습니다. 수백 장짜리 PDF 파일이 몇 분 만에 분류되고 정리됩니다. 그 시간에 실무자들은 원래 해야 할 전문 평가 업무에 집중하게 됐습니다. 분류 실수도 사라졌고, 인수인계 문제도 해결됐습니다.
실제로 달라진 것들
실무자가 전문 업무에 집중하게 됐습니다
하루의 절반을 문서 분류에 쓰던 실무자들이 이제 전문 평가 분석 업무에 온전히 집중합니다. 처리할 수 있는 평가 건수가 체감할 수 있을 만큼 늘었고, 야근도 눈에 띄게 줄었습니다.
분류 실수가 사라졌습니다
사람이 수백 장을 넘기다 보면 실수가 날 수밖에 없었습니다. 잘못된 폴더에 넣거나, 파일을 빠뜨리거나, 분류를 잘못하거나. 시스템이 일관된 기준으로 처리하면서 이런 실수가 완전히 사라졌습니다.
업무량이 늘어도 걱정이 없어졌습니다
예전에는 평가 건수가 늘어나면 문서 정리 인력을 추가로 투입해야 했습니다. 이제는 건수가 2배로 늘어도 시스템이 처리하니까 추가 인력 없이 운영 가능합니다. 성장이 곧 비용 증가가 아니게 된 것입니다.
인수인계가 간단해졌습니다
기존에는 문서 분류 기준을 사람이 머릿속에 갖고 있었습니다. 담당자가 바뀌면 분류 기준이 달라지고, 교육에도 시간이 걸렸죠. 이제는 시스템이 일관된 기준으로 처리하니 인수인계 부담이 사라졌습니다.
“솔직히 처음엔 AI가 우리 문서를 제대로 분류할 수 있을까 반신반의했어요. 업종 특성상 문서 유형이 다양하고 미묘한 차이도 있거든요. 근데 OTOworks가 직접 와서 우리 업무를 보고, 하나씩 맞춰나가더라고요. 지금은? 아침에 파일 올리고 커피 한 잔 마시면 다 정리돼 있어요. 예전에 이걸 어떻게 손으로 했나 싶을 정도입니다.”
고객사 실무 팀장전문 평가 컨설팅 기업