코드를 안 보고도 소프트웨어를 만든다? — AI 소프트웨어 팩토리의 현실
StrongDM이 공개한 AI 소프트웨어 팩토리 실험. 사람이 코드를 작성하지도, 검토하지도 않는 개발 방식은 현실적인가? 비용, 해자, 그리고 우리에게 주는 교훈.
Photo by Steve Johnson on Unsplash
“코드는 사람이 쓰면 안 된다”
최근 StrongDM이라는 회사의 AI 팀 운영 방식이 화제입니다. Simon Willison이 소개한 이 사례의 핵심 규칙은 충격적일 정도로 단순합니다.
코드는 사람이 작성하지 않는다. 코드는 사람이 검토하지 않는다.
사양(Spec)과 시나리오만 정의하면, AI 에이전트가 코드 작성 → 테스트 실행 → 결과 통합까지 전부 처리합니다. 사람은 코드를 한 줄도 안 봅니다.
이걸 듣고 드는 첫 번째 반응은 보통 이겁니다: “진짜 되나?”
되긴 되는데, 비용이 문제다
StrongDM의 실험에서 엔지니어 1명이 하루에 소비하는 토큰 비용은 $1,000입니다. 월로 환산하면 $20,000.
한국 시니어 개발자 월급보다 비쌉니다.
물론 이건 현재 시점의 비용입니다. AI 모델 가격은 매년 급격히 떨어지고 있고, 1년 전에 $100이던 작업이 지금은 $5에 가능한 경우도 많죠. 하지만 오늘 당장 이 방식을 도입하려면, 이 비용을 감당할 수 있는 비즈니스 모델이 있어야 합니다.
여기서 재밌는 질문이 생깁니다.
코드가 무료가 되면, 해자는 어디에 있는가?
AI가 몇 시간 만에 기능을 복제할 수 있는 세상을 상상해보세요.
당신이 3개월 동안 공들여 만든 SaaS 기능을 경쟁사가 에이전트 돌려서 하룻밤 만에 따라 만듭니다. 코드 자체는 더 이상 경쟁 우위가 아닌 겁니다.
그러면 뭐가 남을까요?
- 데이터 — 축적된 사용자 데이터는 복제 불가
- 네트워크 효과 — 이미 확보한 사용자 생태계
- 브랜드 신뢰 — “이 회사 제품이니까 쓴다”
- 도메인 전문성 — 코드가 아니라 문제 정의 능력
결국 “무엇을 만들 것인가”를 정하는 능력이 **“어떻게 만들 것인가”**보다 압도적으로 중요해집니다.
진짜 질문: 검토 없이 신뢰할 수 있는가?
StrongDM 방식의 핵심 전제는 이겁니다:
AI가 만든 코드를 사람이 검토하지 않아도 된다. 대신 AI가 코드가 올바르다는 것을 증명한다.
이건 테스트 커버리지와 사양 기반 검증으로 달성합니다. 사람 눈 대신 자동화된 검증 체계가 품질을 보장하는 구조죠.
솔직히 말하면, 이건 이미 우리가 하고 있는 일의 극단적 확장입니다.
- CI/CD에서 테스트 통과하면 자동 배포하죠? → 이미 “코드 안 보고 배포”
- 린터와 포맷터가 스타일을 강제하죠? → 이미 “사람 판단 없이 품질 관리”
AI 소프트웨어 팩토리는 이 자동화의 범위를 코드 작성 자체까지 넓힌 것뿐입니다.
우리에게 주는 교훈 3가지
1. Spec을 잘 쓰는 능력이 핵심 역량이 된다
코딩 실력보다 요구사항을 명확하게 정의하는 능력이 중요해집니다. “이거 만들어줘”가 아니라 “이런 입력에 이런 출력이 나와야 하고, 이런 엣지케이스를 처리해야 해”라고 말할 수 있어야 합니다.
2. 비용 최적화가 새로운 엔지니어링이다
$1,000/일은 과합니다. 같은 결과를 $50/일에 달성할 방법을 찾는 게 진짜 실력입니다. 모델 선택, 프롬프트 최적화, 캐싱 전략 — 이게 새로운 “성능 최적화”입니다.
3. 검증 체계가 코드보다 중요하다
코드를 AI가 쓰든 사람이 쓰든, 올바르게 작동하는지 증명하는 시스템이 핵심입니다. 테스트, 모니터링, 롤백 — 이 인프라에 투자하는 게 코딩보다 가치 있어집니다.
이건 미래가 아니라 현재다
“AI가 코드를 전부 쓰는 시대”는 이미 시작됐습니다.
다만 아직은 비용 문제로 소수의 잘 설계된 팀에서만 작동합니다. 모델 비용이 1/10로 떨어지는 순간 — 아마 1-2년 안에 — 이 방식은 표준이 될 겁니다.
준비할 건 명확합니다: 코드를 잘 쓰는 것보다 문제를 잘 정의하는 것, 검증 체계를 잘 만드는 것, 그리고 AI를 효율적으로 운용하는 것.
키보드를 내려놓고, 펜을 들 시간입니다.
참고: