실전 데이터로 보는 게임 개발자의 AI 활용법 - 2,165 메시지의 기록
- 47일간 305세션, 2,165메시지 — 게임 개발자가 AI 코딩 에이전트를 실무에 투입한 실제 데이터 공개
- Claude Code를 '페어 프로그래머'가 아닌 '기술 분석관'으로 활용하면 메모리 누수 조사, Gap Analysis 같은 조사·분석 업무에서 압도적 효율을 보인다
- 멀티 에이전트 팀 위임, JetBrains MCP 통합 등 고급 워크플로우의 성과와 한계를 데이터로 정리했다
들어가며
2026년 1월 5일, Unity 모바일 게임 프로젝트에 Claude Code를 본격 도입했다. “AI가 코드를 짜준다”는 마케팅 문구가 아니라, 실제로 프로덕션 코드베이스에서 47일간 사용한 정량적 데이터를 공유한다.
대부분의 AI 활용기는 “편하더라”, “신기하더라” 같은 주관적 감상에 그친다. 이 글은 Anthropic이 제공하는 Claude Code Insights — 실제 세션 로그를 분석한 리포트 — 를 기반으로, 숫자가 말해주는 이야기를 풀어본다.
이 포스트의 모든 수치는 Claude Code Insights 리포트(2월 13일자, 2월 20일자)에서 직접 추출한 것이다.
1. 47일의 숫자 요약
전체 사용량 추이
두 시점의 인사이트 리포트를 비교하면, 사용 패턴의 변화가 명확히 보인다.
| 지표 | 2/13 (26일차) | 2/20 (33일차) | 증가율 |
|---|---|---|---|
| 총 메시지 | 1,246 | 2,165 | +74% |
| 세션 수 | 172 | 305 | +77% |
| 코드 라인 추가 | +28,556 | +56,323 | +97% |
| 코드 라인 삭제 | -1,792 | -2,729 | +52% |
| 수정 파일 수 | 188 | 396 | +111% |
| 일 평균 메시지 | 47.9 | 65.6 | +37% |
7일 만에 메시지 수가 74% 증가했다. 단순히 “더 많이 썼다”가 아니라, 일 평균 메시지가 47.9에서 65.6으로 올랐다는 점이 중요하다. 도구에 익숙해지면서 활용 밀도 자체가 높아진 것이다.
내가 요청한 작업 유형
| 작업 유형 | 2/13 | 2/20 |
|---|---|---|
| 버그 수정 | 5 | 14 |
| 코드 구현 | 10 | 11 |
| 디버깅 | 7 | 10 |
| 코드 분석 | 7 | 10 |
| 기능 구현 | - | 9 |
| 코드 조사 | 6 | 6 |
초반에는 코드 구현 요청이 많았지만, 후반으로 갈수록 버그 수정과 디버깅 비중이 크게 증가했다. 이는 프로젝트가 개발 단계에서 안정화 단계로 넘어가는 자연스러운 흐름을 반영한다.
2. 어디에 가장 많이 썼나
프로젝트별 세션 분포
1
2
3
4
5
Unity Skill Studio Editor Tooling ████████████████████████████████████ 35 sessions
Unity Runtime Bug Fixes & Debugging ████████████████████ 20 sessions
Unity Memory Leak & Crash Investigation ██████████████████ 18 sessions
Technical Documentation & Content Writing ███████████████ 15 sessions
iOS Build & Platform Issues █████ 5 sessions
에디터 도구 개발이 압도적 1위다. Unity Editor용 Skill Studio 도구를 만들면서 레시피 시스템, 드래그앤드롭 그래프 뷰어, 로컬라이제이션, CSV 내보내기, 무기 비교 도구 등 다양한 기능을 구현했다. 단일 세션에서 22개 파일을 동시에 수정한 적도 있다.
두 번째로 많은 것이 런타임 버그 수정이다. 보스 HP 바 UI 타이밍 이슈, 가상 스크롤 셀 onClick 리스너 누적, 오브젝트 풀 오버플로우 전략, Galaxy A41 프리징 등 실제 모바일 게임에서 발생하는 까다로운 버그들을 추적했다.
가장 많이 사용한 도구 Top 6
| 도구 | 호출 횟수 | 용도 |
|---|---|---|
| Read | 1,716 | 파일 읽기 및 코드 분석 |
| Bash | 1,206 | 커맨드 실행, git 이력 조사 |
| JetBrains get_file_text | 1,153 | IDE 통합 파일 읽기 |
| JetBrains replace_text | 897 | IDE 통합 코드 수정 |
| Edit | 888 | 직접 파일 편집 |
| JetBrains search_in_files | 870 | 프로젝트 전체 검색 |
여기서 주목할 점은 Read(1,716)가 Edit(888)의 거의 2배라는 것이다. 코드를 쓰는 것보다 읽는 데 훨씬 많은 시간을 쓴다. 이건 내가 Claude Code를 활용하는 핵심 패턴과 직결된다.
3. 핵심 발견: “페어 프로그래머”가 아닌 “기술 분석관”
Claude Code Insights가 분석한 내 사용 패턴의 핵심은 이것이다:
“You operate as a technical team lead who assigns Claude structured investigation and implementation tasks with formal reporting, intervening decisively when approaches diverge from your specific expectations.”
나는 Claude를 “같이 코딩하는 동료”로 쓰지 않는다. 구조화된 조사·분석 업무를 위임하고, 보고받는 팀 리드 역할을 한다. 305개 세션에서 커밋은 단 9개뿐이다. 대부분의 시간은 Claude가 수십 개의 파일을 읽고, 분석하고, 구조화된 리포트를 만드는 데 쓰인다.
이 패턴이 효과적인 이유
1. 메모리 누수 조사가 대표적이다
DOTween 시퀀스 누수, UniRx 구독 정리, Addressable 에셋 처분, delegate/closure 보존 패턴을 체계적으로 조사했다. Claude는 수십 개의 파일을 순회하며 누수 경로를 추적하고, 우선순위별 구조화된 리포트를 만들어냈다.
사람이 이 작업을 하면? GameResultLayer 하나의 생명주기를 추적하는 데만 반나절이 걸린다. Claude는 관련 파일 전체를 읽고 .AddTo() 호출 누락, OnDestroy 정리 미흡 같은 크리티컬 이슈를 세션 하나에서 잡아냈다.
2. Gap Analysis를 품질 게이트로 활용했다
Plan 문서 대비 실제 구현의 완성도를 비교하는 Gap Analysis를 반복적으로 수행했다. 최소 7개 세션에서 동일한 패턴으로:
- Plan 문서 읽기
- 커밋/구현 파일 전체 읽기
- 요구사항별 Completed / Partial / Missing 분류
- 구조화된 리포트 출력
이 워크플로우 덕분에 구현 누락을 초기에 잡아낼 수 있었다.
3. 멀티 에이전트 팀 오케스트레이션
Claude Code의 에이전트 팀 기능을 활용해 복잡한 멀티 파일 작업을 병렬로 처리했다. 4개 태스크 영역에서 22개 파일을 동시에 수정하거나, DOTween/UniRx/메모리 누수 조사를 여러 에이전트에게 동시 위임했다.
| 지표 | 2/13 | 2/20 |
|---|---|---|
| 병렬 세션 오버랩 이벤트 | 57 | 92 |
| 관여 세션 수 | 56 | 111 |
| 전체 메시지 중 비중 | 15% | 15% |
4. 성과: 숫자가 말해주는 것
달성률 변화
| 결과 | 2/13 (50세션) | 2/20 (98세션) |
|---|---|---|
| 완전 달성 (Fully Achieved) | 32 (64%) | 58 (59%) |
| 대부분 달성 (Mostly Achieved) | 7 (14%) | 19 (19%) |
| 부분 달성 (Partially Achieved) | 7 (14%) | 15 (15%) |
| 미달성 (Not Achieved) | 2 (4%) | 5 (5%) |
완전 달성률이 약 60%, 대부분 달성까지 포함하면 약 78%다. 어떤 프로그래머를 고용해도 이 정도면 충분히 생산적인 수치다.
Claude가 가장 잘하는 것
| 능력 | 횟수 |
|---|---|
| 멀티 파일 동시 변경 | 36 |
| 좋은 설명/분석 | 21 |
| 디버깅 | 20 |
| 빠르고 정확한 검색 | 10 |
| 정확한 코드 수정 | 4 |
멀티 파일 변경이 압도적 1위다. 이건 사람이 하면 실수하기 쉬운 작업이다. 10개 파일에서 enum 값을 바꾸거나, 네임스페이스를 리팩토링하거나, 로컬라이제이션 키를 일괄 교체하는 작업에서 Claude는 진가를 발휘한다.
5. 한계: 솔직한 이야기
데이터는 장점만 보여주지 않는다. Claude Code Insights의 “Where Things Go Wrong” 섹션은 상당히 솔직하다.
Friction 유형 분석
| 마찰 유형 | 2/13 | 2/20 |
|---|---|---|
| 잘못된 접근 방식 (Wrong Approach) | 11 | 21 |
| 버그가 있는 코드 (Buggy Code) | - | 9 |
| 사용자 거부 (User Rejected) | 6 | 7 |
| 과도한 변경 (Excessive Changes) | 2 | 6 |
| 요청 오해 (Misunderstood) | 3 | 5 |
| 무응답 (Unresponsive) | 3 | 3 |
“잘못된 접근 방식”이 21건으로 최다 마찰 원인이다. 구체적으로:
사례 1: 코드 리뷰어의 비판에 동조하는 Claude
오브젝트 풀 오버플로우 전략에 대한 코드 리뷰어의 코멘트를 평가해달라고 했다. Claude는 리뷰어 편을 들며 내 fallback 로직이 문제라고 했다. 하지만 그 디자인은 의도된 것이었고, 내가 Claude에게 “그 코드는 내가 일부러 그렇게 짠 거다”라고 설명해야 했다.
AI가 코드를 작성한 사람보다 그 코드를 더 잘 안다고 착각하는 순간이 있다.
사례 2: 보스 HP 바 null 리턴 값 변경
보스 HP 바 수정 중 Claude가 null 리턴을 0f에서 1f로 바꿨다. 이대로 나갔으면 보스가 죽을 때 HP가 꽉 찬 채로 표시되는 리그레션이 발생했을 것이다. 코드 리뷰에서 잡았기에 망정이지, Claude의 첫 번째 수정은 종종 논리적 오류를 포함한다.
사례 3: 클라이언트만 보면 되는데 서버까지 조사
게임 재개(resume) 기능 분석을 요청했을 때, Claude가 서버 사이드 코드까지 조사하기 시작했다. 두 번이나 “클라이언트만 봐라”라고 리디렉션해야 했다. 명시적인 스코프 제약을 주지 않으면 불필요한 탐색에 시간을 낭비한다.
멀티 에이전트 팀의 현실
데이터에서 가장 실망스러운 부분이다:
- 에이전트가 idle 루프에 빠져 무응답 상태가 됨 → 대체 에이전트를 새로 생성해야 함
- 에이전트가 생성한 코드에 namespace import 누락 → 직접 컴파일 에러를 보고하고 수정 요청
- 팀 리드로서 상태 보고 요청에 에이전트가 응답하지 않음 → 반복 에스컬레이션 필요
싱글 에이전트 세션의 성공률(40개 중 32개 완전 달성)에 비해, 멀티 에이전트 세션은 눈에 띄게 불안정했다. 현재로서는 큰 작업을 순차적 서브태스크로 분할하는 것이 병렬 에이전트 팀보다 안정적이다.
만족도 변화
| 만족도 | 2/13 | 2/20 |
|---|---|---|
| 좌절 (Frustrated) | 2 | 2 |
| 불만족 (Dissatisfied) | 11 | 19 |
| 대체로 만족 (Likely Satisfied) | 56 | 95 |
| 만족 (Satisfied) | 5 | 9 |
대체로 만족 이상이 83%다. 하지만 불만족도 19건으로 적지 않다. 이건 AI 도구의 현실이다 — 잘될 때는 정말 잘 되지만, 잘못될 때의 수습 비용이 만만치 않다.
6. 사용 패턴 심층 분석
시간대별 사용량
1
2
3
4
Morning (06-12) ████████████████████ 564
Afternoon(12-18) █████████████████████████████████████████████ 1,268
Evening (18-24) ████████████ 333
Night (00-06) 0
오후 시간대에 집중적으로 사용한다. 새벽 코딩은 없다 — 오전에 방향을 잡고, 오후에 Claude와 집중적으로 작업하는 패턴이다.
응답 시간 분포
| 구간 | 횟수 | 비고 |
|---|---|---|
| 2-10초 | 102 | 빠른 확인/승인 |
| 10-30초 | 181 | 짧은 지시 |
| 30초-1분 | 163 | 결과 검토 후 피드백 |
| 1-2분 | 157 | 상세 검토 |
| 2-5분 | 160 | 깊은 분석 결과 검토 |
| 5-15분 | 162 | 다른 작업 병행 |
| 15분+ | 91 | 장시간 분석 대기 |
응답 중앙값 81.2초, 평균 292.6초. 10초 이내 응답이 아닌, 1-5분대 응답이 가장 많은 것은 Claude의 출력을 꼼꼼히 검토하고 피드백하는 패턴을 보여준다. 맹목적으로 수용하지 않는다는 증거다.
언어별 작업 분포
| 언어 | 파일 수 | 비고 |
|---|---|---|
| Markdown | 897 | 문서, 플랜, 블로그 |
| HTML | 136 | Jekyll 템플릿 |
| JSON | 61 | 설정 파일 |
| YAML | 33 | Front matter, CI/CD |
| Python | 18 | 스크립트 |
| Shell | 9 | 자동화 |
Markdown이 압도적인 이유는 기술 문서, Plan 문서, Gap Analysis 리포트 때문이다. 실제 Unity C# 코드 작업은 JetBrains MCP를 통해 IDE 내에서 직접 수정하므로 별도 언어 카운트에 잡히지 않는다.
7. 나만의 워크플로우: 이렇게 쓰면 효과적이다
47일간의 시행착오로 정립한 패턴을 정리한다.
패턴 1: 조사 → 리포트 → 실행 (3단계 분리)
1
2
3
4
5
6
7
8
9
10
세션 1: 조사 및 분석 (Claude가 코드베이스 전체를 읽고 리포트 작성)
└─ 출력: 구조화된 리포트 (우선순위별 이슈 목록)
세션 2: 리포트 기반 구현 (특정 이슈 수정)
└─ 입력: 세션 1의 리포트
└─ 출력: 코드 변경 + 컴파일 확인
세션 3: Gap Analysis (Plan 대비 구현 완성도 검증)
└─ 입력: Plan 문서 + 최신 커밋
└─ 출력: Completed/Partial/Missing 리포트
한 세션에서 조사부터 구현까지 다 하려고 하면 Claude가 방향을 잃기 쉽다. 역할을 명확히 분리하는 것이 핵심이다.
패턴 2: 명시적 스코프 제약
1
2
3
4
❌ "GameResultLayer의 메모리 누수를 분석해줘"
✅ "GameResultLayer.cs 파일의 클라이언트 코드만 분석해줘.
서버 코드는 무시해. DOTween Kill() 누락과 UniRx AddTo()
누락에 집중해서 P0/P1/P2로 분류해줘"
이 한 줄의 차이가 불필요한 서버 코드 탐색 30분을 절약한다. Insights 데이터에서 “Wrong Approach” 21건의 상당수가 스코프 미지정에서 비롯되었다.
패턴 3: JetBrains MCP 통합 활용
Claude Code + JetBrains IDE를 MCP(Model Context Protocol)로 연결하면:
replace_text_in_file(897회) — IDE 내에서 직접 코드 수정get_file_problems(671회) — 수정 직후 컴파일 에러 확인search_in_files(870회) — 프로젝트 전체를 인덱스 기반 검색
터미널에서 grep을 쓰는 것과는 차원이 다른 경험이다. IDE의 코드 분석 엔진을 Claude가 직접 활용하므로 네임스페이스 누락, 타입 불일치 같은 컴파일 에러를 실시간으로 잡을 수 있다.
8. 앞으로의 방향: Insights가 제안하는 것들
Claude Code Insights는 단순 통계를 넘어 개선 방향까지 제시한다.
자율 Gap-Analysis-to-Implementation 파이프라인
현재는 “Gap Analysis → 사람이 리포트 확인 → 구현 세션 시작”의 수동 핸드오프가 있다. 이걸 하나의 자율 워크플로우로 합칠 수 있다:
1
2
커밋 분석 → Gap 식별 → 우선순위 태스크 리스트 생성
→ 에이전트가 자동 수정 → 컴파일 검증 → 반복
Self-Healing 멀티 에이전트 팀
에이전트 무응답 문제를 해결하기 위한 Watchdog 패턴:
- 각 에이전트의 응답 타임아웃 감시
- 무응답 시 자동 교체 에이전트 생성
- 컴파일 검증을 게이트로 사용
지속적 메모리 누수 스캔 에이전트
10회 이상의 메모리 누수 조사 세션에서 쌓인 패턴(DOTween Kill 누락, UniRx AddTo 누락, OnDestroy 미정리)을 코드화해서, PR마다 자동으로 스캔하는 에이전트를 만들 수 있다.
9. 게임 개발자에게 전하는 실용 조언
47일간의 데이터에서 뽑아낸 실용적 조언이다.
Claude Code가 특히 강한 영역
- 메모리 누수/크래시 조사 — 수십 개 파일을 순회하며 누수 경로를 추적하는 조사 작업
- 멀티 파일 리팩토링 — enum 변경, 네임스페이스 정리, 로컬라이제이션 키 교체
- Gap Analysis — 계획서 대비 구현 완성도를 체계적으로 검증
- 코드 분석/설명 — 복잡한 레거시 코드의 동작을 파악하고 구조화된 설명 생성
Claude Code가 약한 영역
- 첫 번째 수정의 정확도 — 논리적 오류, 잘못된 실행 순서, 엣지 케이스 누락이 빈번
- 멀티 에이전트 안정성 — 무응답, idle 루프, import 누락 등 불안정
- 스코프 판단 — 명시적 제약 없이는 불필요한 영역까지 탐색
- 도메인 의도 파악 — 의도적 디자인 결정을 “버그”로 오인하는 경우
도입 전 체크리스트
- 코드 리뷰는 필수 — Claude의 출력을 무검증으로 머지하지 마라
- 스코프를 명시하라 — “클라이언트만”, “이 파일만”, “이 패턴에 집중” 등 구체적 제약
- 조사·분석 업무에 먼저 활용하라 — 코드 작성보다 코드 분석에서 ROI가 높다
- JetBrains MCP 통합을 활용하라 — IDE의 코드 분석 엔진 연결이 생산성을 크게 높인다
- 세션을 역할별로 분리하라 — 조사 / 구현 / 검증을 한 세션에 몰아넣지 마라
마치며
2,165개의 메시지, 305개의 세션, 56,323줄의 코드 추가. 이 숫자들이 말해주는 건 단순하다 — AI 코딩 에이전트는 이미 실무에서 유의미한 생산성을 제공하지만, “마법”은 아니다.
60%의 완전 달성률과 21건의 잘못된 접근 방식은 공존한다. Claude를 “코드를 짜주는 마법사”가 아니라 “체계적으로 관리해야 하는 유능한 주니어 분석가”로 바라보면, 기대치와 현실 사이의 간극이 줄어든다.
게임 개발에서 AI 도구의 미래는 밝다. 다만 그 밝은 미래는 “AI가 알아서 다 해줄 것”이 아니라, “개발자가 AI를 효과적으로 지휘하는 방법을 익히는 것”에 달려 있다.
다음 47일 후에 또 다른 인사이트를 공유하겠다.
이 포스트에 사용된 데이터는 Claude Code Insights 기능에서 생성된 리포트를 기반으로 합니다. Claude Code는 Anthropic의 CLI 기반 AI 코딩 에이전트입니다.
