AI 프로젝트 견적서 읽는 법
견적서의 숫자가 크다고 좋은 프로젝트가 아닙니다. AI 프로젝트 견적서의 항목별 의미, 거품을 걸러내는 법, 비교와 협상의 기준을 알려드립니다.
견적서의 숫자가 크다고 좋은 프로젝트가 아닙니다. 숫자의 의미를 읽을 수 있어야 좋은 판단이 가능합니다.
견적서 앞에서 무력해지는 순간
AI 프로젝트 견적서를 처음 받으면, 대부분의 의사결정자가 같은 경험을 합니다. 항목은 많고, 용어는 낯설고, 금액은 큰데 — 이게 비싼 건지 싼 건지, 필요한 건지 불필요한 건지 판단할 기준이 없습니다.
그래서 두 가지 극단 중 하나에 빠집니다. 벤더를 믿고 그대로 승인하거나, 감으로 깎거나. 둘 다 좋은 판단이 아닙니다.
이 글은 AI 프로젝트 견적서에 흔히 등장하는 항목들을 해부하고, 어디에 돈이 실제로 드는지, 어디가 협상 가능한지를 알려드립니다.
견적서의 기본 구조
AI 프로젝트 견적서는 규모와 관계없이 대체로 비슷한 구조를 따릅니다.
① 컨설팅/분석: 현황 파악, 요구사항 정의, 데이터 분석
② 개발/구축: 모델 개발, 시스템 구축, 연동 작업
③ 데이터: 데이터 수집, 정제, 라벨링
④ 인프라: 서버, 클라우드, API 비용
⑤ 테스트/검증: 성능 테스트, 사용자 테스트
⑥ 유지보수: 운영, 모니터링, 업데이트
각 항목이 전체 비용에서 차지하는 비중과 의미를 알면, 견적서가 읽히기 시작합니다.
항목별 해부
컨설팅/분석 — 비싸 보이지만 아끼면 안 되는 것
전체 비용의 10~20%를 차지하는 경우가 많습니다. "회의만 하는데 왜 이렇게 비싸?"라는 반응이 나오기 쉬운 항목입니다.
하지만 이 단계를 생략하거나 축소하면, 뒤에서 훨씬 큰 비용이 발생합니다. 잘못 정의된 요구사항 → 잘못된 개발 → 전면 재작업. 이 패턴의 비용은 컨설팅비의 몇 배가 됩니다.
체크 포인트: 이 단계의 산출물이 명확한가? "현황 분석 보고서", "데이터 진단 결과", "기능 요구사항 문서" 등 구체적인 결과물이 정의되어 있어야 합니다. "분석 및 기획"이라고만 적혀 있으면 물어보세요.
개발/구축 — 가장 큰 덩어리, 가장 흐린 항목
전체 비용의 30~50%를 차지합니다. 그리고 가장 파악하기 어려운 항목이기도 합니다.
주의할 점은 "개발"이라는 이름 아래 다양한 작업이 뭉뚱그려져 있다는 것입니다. AI 모델 자체를 만드는 것, 그 모델을 기존 시스템에 연결하는 것, 사용자 화면을 만드는 것 — 이 세 가지는 성격과 난이도가 다릅니다.
체크 포인트: 개발 항목을 세부적으로 분리해달라고 요청하세요. 모델 개발, 시스템 연동, UI 개발이 각각 얼마인지. 그리고 "범용 모델을 쓰는 건지, 처음부터 새로 만드는 건지"를 확인하세요. 처음부터 만드는 모델은 비용이 수배에서 수십 배까지 차이 납니다.
데이터 — 과소평가되는 비용의 블랙홀
견적서에서 비중이 작아 보이지만, 실제 프로젝트에서 예산을 초과하는 가장 흔한 원인입니다.
데이터가 깨끗하게 존재하면 비용이 적지만, 현실에서는 데이터 수집, 정제, 형식 통일, 라벨링(AI가 학습할 수 있도록 사람이 분류하는 작업)에 예상치 못한 시간과 비용이 들어갑니다.
체크 포인트: "데이터 비용 추정의 전제 조건"을 확인하세요. "데이터가 정제된 상태를 가정합니다"라는 단서가 달려 있다면, 정제 비용이 별도로 발생한다는 의미입니다. 그리고 그 정제를 누가 하는지 — 벤더인지 우리인지 — 를 명확히 하세요.
인프라 — 초기에 작지만 운영에서 커지는 것
클라우드 서버 비용, GPU 사용료, API 호출 비용 등입니다. 초기 구축 때는 크지 않아 보이지만, 운영 단계에서 사용량에 따라 급격히 늘어날 수 있습니다.
특히 생성형 AI는 API 호출당 비용이 발생하는 구조가 많습니다. 사용자가 10명일 때와 1,000명일 때의 월 비용이 크게 다릅니다.
체크 포인트: "예상 사용량 기준 월 운영 비용"을 산출해달라고 요청하세요. 그리고 사용량이 2배, 5배, 10배가 되면 비용이 어떻게 변하는지 시나리오를 받으세요.
테스트/검증 — 없으면 위험한 항목
견적서에 이 항목이 아예 없다면 경고 신호입니다. "개발에 포함되어 있습니다"라고 말할 수 있지만, 별도 항목으로 빠져 있어야 충분한 시간과 자원이 배정됩니다.
체크 포인트: 테스트 범위(기능, 성능, 보안), 테스트 주체(벤더, 우리, 제3자), 테스트 기간이 명시되어 있는지 확인하세요.
유지보수 — 이걸 안 물어보면 나중에 아프다
AI는 한 번 만들면 끝이 아닙니다. 모델 성능이 시간이 지나면서 떨어지고(데이터 분포가 변하므로), 새로운 요구사항이 생기고, 시스템 환경이 바뀝니다.
유지보수 비용은 보통 초기 구축 비용의 15~25%가 연간으로 발생합니다. 이걸 초기 견적에서 빠뜨리면, 1년 뒤 "추가 비용"이라는 이름으로 다시 나타납니다.
체크 포인트: 유지보수 범위(모니터링, 재학습, 장애 대응), 반응 시간, 비용 구조가 계약에 포함되어 있는지 확인하세요.
견적서에서 자주 발견되는 거품
모든 항목이 필요한 건 아닙니다. 과잉 포함되기 쉬운 부분들입니다.
과도한 커스터마이징: 범용 모델 + RAG로 충분한 문제에 파인튜닝이나 자체 모델 개발이 포함되어 있을 수 있습니다. 앞선 글에서 다룬 것처럼, 대부분의 기업은 2단계(RAG)에서 충분합니다.
불필요한 대시보드: 멋진 시각화 대시보드가 포함되어 있지만, 실제로 매일 보는 사람이 있는지 생각해보세요. 기존 스프레드시트나 BI 도구로 충분할 수 있습니다.
과잉 인프라: 초기부터 대규모 트래픽을 가정한 서버 구성이 포함된 경우. 작게 시작하고 필요에 따라 확장하는 게 클라우드 시대의 장점입니다.
견적을 비교하는 실용적 방법
여러 벤더의 견적을 비교할 때, 총액만 보면 판단을 그르칩니다.
항목 기준으로 비교하세요. A 벤더는 7,000만 원, B 벤더는 5,000만 원인데, A에는 데이터 정제와 유지보수가 포함되어 있고 B에는 빠져 있을 수 있습니다. 포함 범위를 맞춰놓고 비교해야 의미가 있습니다.
"빠진 항목"에 주목하세요. 가격이 낮은 견적에서 빠져 있는 항목이 뭔지 확인하세요. 빠진 항목은 나중에 추가 비용으로 돌아옵니다.
총 소유 비용(TCO)으로 계산하세요. 초기 구축 비용만이 아니라, 3년간의 운영·유지보수·인프라 비용을 합산해서 비교하세요. 초기 비용이 낮지만 운영 비용이 높은 구조도 있습니다.
견적서를 읽을 수 있으면, 협상도 된다
견적서의 각 항목이 무엇을 의미하는지 이해하면, 협상의 언어가 바뀝니다.
"좀 깎아주세요"가 아니라, "데이터 정제는 우리가 내부에서 하겠으니 이 항목을 빼주세요", "파일럿 단계에서는 이 인프라 규모가 필요 없으니 축소하겠습니다", "유지보수 SLA를 이 수준으로 하면 비용이 어떻게 바뀌나요?"
이런 대화가 가능해집니다. 그리고 이런 대화가 가능한 고객에게 벤더도 더 솔직해집니다.