코드를 안 보고도 소프트웨어를 만든다? — AI 소프트웨어 팩토리의 현실

“코드는 사람이 쓰면 안 된다”

최근 StrongDM이라는 회사의 AI 팀 운영 방식이 화제입니다. Simon Willison이 소개한 이 사례의 핵심 규칙은 충격적일 정도로 단순합니다.

코드는 사람이 작성하지 않는다. 코드는 사람이 검토하지 않는다.

사양(Spec)과 시나리오만 정의하면, AI 에이전트가 코드 작성 → 테스트 실행 → 결과 통합까지 전부 처리합니다. 사람은 코드를 한 줄도 안 봅니다.

이걸 듣고 드는 첫 번째 반응은 보통 이겁니다: “진짜 되나?”

StrongDM의 실험에서 엔지니어 1명이 하루에 소비하는 토큰 비용은 $1,000입니다. 월로 환산하면 $20,000.

한국 시니어 개발자 월급보다 비쌉니다.

물론 이건 현재 시점의 비용입니다. AI 모델 가격은 매년 급격히 떨어지고 있고, 1년 전에 $100이던 작업이 지금은 $5에 가능한 경우도 많죠. 하지만 오늘 당장 이 방식을 도입하려면, 이 비용을 감당할 수 있는 비즈니스 모델이 있어야 합니다.

여기서 재밌는 질문이 생깁니다.

AI가 몇 시간 만에 기능을 복제할 수 있는 세상을 상상해보세요.

당신이 3개월 동안 공들여 만든 SaaS 기능을 경쟁사가 에이전트 돌려서 하룻밤 만에 따라 만듭니다. 코드 자체는 더 이상 경쟁 우위가 아닌 겁니다.

그러면 뭐가 남을까요?

결국 “무엇을 만들 것인가”를 정하는 능력이 **“어떻게 만들 것인가”**보다 압도적으로 중요해집니다.

StrongDM 방식의 핵심 전제는 이겁니다:

AI가 만든 코드를 사람이 검토하지 않아도 된다. 대신 AI가 코드가 올바르다는 것을 증명한다.

이건 테스트 커버리지와 사양 기반 검증으로 달성합니다. 사람 눈 대신 자동화된 검증 체계가 품질을 보장하는 구조죠.

솔직히 말하면, 이건 이미 우리가 하고 있는 일의 극단적 확장입니다.

AI 소프트웨어 팩토리는 이 자동화의 범위를 코드 작성 자체까지 넓힌 것뿐입니다.

코딩 실력보다 요구사항을 명확하게 정의하는 능력이 중요해집니다. “이거 만들어줘”가 아니라 “이런 입력에 이런 출력이 나와야 하고, 이런 엣지케이스를 처리해야 해”라고 말할 수 있어야 합니다.

$1,000/일은 과합니다. 같은 결과를 $50/일에 달성할 방법을 찾는 게 진짜 실력입니다. 모델 선택, 프롬프트 최적화, 캐싱 전략 — 이게 새로운 “성능 최적화”입니다.

코드를 AI가 쓰든 사람이 쓰든, 올바르게 작동하는지 증명하는 시스템이 핵심입니다. 테스트, 모니터링, 롤백 — 이 인프라에 투자하는 게 코딩보다 가치 있어집니다.

“AI가 코드를 전부 쓰는 시대”는 이미 시작됐습니다.

다만 아직은 비용 문제로 소수의 잘 설계된 팀에서만 작동합니다. 모델 비용이 1/10로 떨어지는 순간 — 아마 1-2년 안에 — 이 방식은 표준이 될 겁니다.

준비할 건 명확합니다: 코드를 잘 쓰는 것보다 문제를 잘 정의하는 것, 검증 체계를 잘 만드는 것, 그리고 AI를 효율적으로 운용하는 것.

키보드를 내려놓고, 펜을 들 시간입니다.

참고: