[태그:] Claude Code

Claude Code와 AI 코딩, 개발 생산성, 에이전트형 개발도구를 다룬 글 모음입니다. 개발 워크플로 변화와 활용 포인트를 정리합니다.

AI 코딩의 본질은 모델이 아니라 하네스다: Matt Pocock의 에이전틱 엔지니어링
Matt Pocock의 에이전틱 엔지니어링 워크플로우를 다룬 Tech Bridge 영상 썸네일

AI 코딩 이야기를 하면 대부분 먼저 모델 이름을 꺼냅니다. Claude가 낫다, Codex가 빨라졌다, Gemini CLI가 어디까지 한다더라. 물론 모델은 중요합니다. 그런데 Matt Pocock은 이 영상에서 조금 다른 곳을 보라고 말합니다. 진짜 차이는 모델이 아니라 하네스(harness)에서 난다는 것입니다.

하네스는 모델을 둘러싼 작업 환경입니다. 프롬프트, skill, 코드베이스 구조, 테스트, 문서, 샌드박스, GitHub Actions, 리뷰 흐름까지 모두 포함합니다. 자동차로 치면 엔진만 보는 것이 아니라 섀시, 공기역학, 피트 크루, 트랙 운영까지 보는 셈입니다.

이 관점은 AI 코딩을 처음 쓰는 사람에게도, 이미 Claude Code나 Codex를 업무에 붙이고 있는 팀에게도 중요합니다. 왜냐하면 모델 성능은 우리가 직접 통제하기 어렵지만, 하네스는 우리가 설계할 수 있기 때문입니다.

AI는 전술적 프로그래밍을 먹어치웠다

Matt Pocock은 John Ousterhout의 표현을 빌려 프로그래밍을 두 층으로 나눕니다. 하나는 전술적 프로그래밍입니다. 코드를 쓰고, 버그를 고치고, 커밋을 만들고, 문법을 맞추는 일입니다. 다른 하나는 전략적 프로그래밍입니다. 어떤 구조가 유지보수에 좋은지, 작업을 어떻게 쪼개야 하는지, 코드베이스가 앞으로 어떤 방향으로 가야 하는지 판단하는 일입니다.

AI는 이미 전술적 프로그래밍을 상당 부분 먹어치웠습니다. 작은 기능 구현, 테스트 추가, 리팩터링 초안, 문서 수정은 이제 사람이 직접 붙잡고 있어야만 하는 일이 아닙니다. 문제는 여기서부터입니다. 전술을 AI가 맡을수록 인간의 가치는 전략으로 이동합니다.

그래서 AI 시대의 개발자는 단순히 “프롬프트를 잘 쓰는 사람”이 아니라 “좋은 위임을 설계하는 사람”이 되어야 합니다. 목표를 명확히 쓰고, 범위를 좁히고, 완료 기준을 정하고, 테스트 방법을 붙여야 합니다. AI가 코드를 많이 만들수록, 인간은 더 선명하게 판단해야 합니다.

최신 모델보다 중요한 것은 작업 환경이다

영상에서 가장 강한 문장은 이것입니다. “모두가 모델에 집착하지만, 더 관심을 가져야 할 것은 하네스다.” 모델은 유용하지만 하네스도 그만큼 중요하고, 우리는 모델보다 하네스를 훨씬 더 많이 통제할 수 있습니다.

예를 들어 토큰 비용을 줄이고 싶다고 해보겠습니다. 흔한 답은 더 짧은 프롬프트를 쓰거나 더 싼 모델을 고르는 것입니다. Matt의 답은 다릅니다. 변경하기 쉬운 코드베이스를 가져라. 코드 구조가 명확하고, 테스트가 있고, 문서가 최신이면 AI는 적은 맥락으로도 더 정확히 움직입니다. 반대로 코드베이스가 엉켜 있으면 비싼 모델도 오래 헤맵니다.

이 말은 한국 개발팀에도 그대로 적용됩니다. AI 도입을 “어떤 구독제를 쓸까”에서 시작하면 효과가 작습니다. “우리 저장소는 에이전트가 일하기 쉬운가?”에서 시작해야 합니다.

Skill은 많이 붙이는 것이 아니라 절차로 관리해야 한다

영상에는 Matt이 사용하는 skill 이야기가 자주 나옵니다. skill은 반복되는 사고 절차나 작업 방식을 AI가 다시 사용할 수 있도록 만든 지시 묶음입니다. 예를 들어 학습 코치를 만들거나, 설계를 공격적으로 검토하게 하거나, 특정 방식으로 PR을 리뷰하게 할 수 있습니다.

흥미로운 점은 Matt이 skill을 무조건 많이 붙이라고 말하지 않는다는 것입니다. 오히려 모든 skill, plugin, MCP server, Claude.md, agents.md를 지우고 빈 상태에서 시작해보라고 권합니다. 먼저 AI가 기본 상태에서 어떻게 행동하는지 관찰하고, 정말 필요한 것만 다시 추가하라는 뜻입니다.

여기에는 중요한 이유가 있습니다. 너무 많은 지시와 skill 설명은 컨텍스트 창을 오염시킵니다. 모델은 더 많은 정보를 받았지만 오히려 더 혼란스러워질 수 있습니다. 그래서 Matt은 모델이 알아서 호출하는 능력형 skill보다, 사용자가 필요할 때 명시적으로 부르는 절차형 skill을 더 선호합니다. 핸들은 사람이 잡고 있어야 한다는 관점입니다.

AFK 에이전트는 ‘무한 루프’보다 ‘큐’에 가깝다

요즘 agentic loop라는 표현이 자주 나옵니다. 에이전트가 계속 생각하고, 실행하고, 관찰하고, 다시 실행하는 구조입니다. 멋있게 들리지만 실무에서는 조금 위험하게 느껴질 때도 있습니다. 범위가 흐려지고, 비용이 커지고, 검토 지점이 사라질 수 있기 때문입니다.

Matt은 여기서 “loop보다 queue”라는 관점을 제안합니다. GitHub issue나 Jira ticket처럼 작업을 큐에 쌓고, 에이전트가 하나씩 가져가 처리하게 하는 방식입니다. 조사하고, 수정하고, 테스트하고, PR을 만들고, 마지막에는 사람이 확인합니다.

이 방식은 낯설지 않습니다. 개발팀은 원래 큐로 일해왔습니다. 백로그, 이슈, PR, 리뷰가 모두 큐 기반입니다. AI 에이전트는 그 흐름에 새로운 작업자 노드로 들어오는 것입니다. 그래서 처음부터 완전 자동화를 꿈꾸기보다, 작은 큐부터 맡기는 편이 안전합니다.

예를 들면 이런 작업이 좋습니다.
- 실패한 테스트 원인 조사
- 문서와 README 업데이트
- 단순 리팩터링 후보 제안
- PR 리뷰 초안 작성
- 보안 점검 체크리스트 실행
- 오래된 이슈의 재현 가능성 확인
핵심은 사람이 옆에서 매 초 개입하지 않아도 되는 단위로 작업을 쪼개는 것입니다. 그리고 결과는 반드시 리뷰합니다.

AX: 이제는 Agent Experience도 설계해야 한다

개발팀은 오랫동안 DX, 즉 Developer Experience를 이야기해왔습니다. 개발자가 설치하고, 실행하고, 테스트하고, 배포하기 쉬운 환경을 만드는 일입니다. Matt은 여기서 한 단계 더 나아가 AX, 즉 Agent Experience를 말합니다.

AX는 에이전트가 코드베이스에서 일하기 쉬운 정도입니다. 좋은 AX를 가진 저장소는 이런 특징을 가집니다.
- 폴더 구조가 예측 가능하다.
- 테스트 실행 명령이 명확하다.
- 타입체크와 린트가 자동화되어 있다.
- README와 개발 문서가 최신이다.
- 모듈 경계가 비교적 분명하다.
- 작은 변경을 안전하게 검증할 수 있다.
- 샌드박스에서 실행해도 필요한 정보가 충분하다.
흥미로운 점은 좋은 AX가 좋은 DX와 크게 겹친다는 것입니다. 사람에게 좋은 코드베이스는 AI에게도 좋습니다. 다만 AI 시대에는 이 기준이 더 날카로워집니다. 사람이 눈치로 넘어가던 빈틈을 에이전트는 자주 놓칩니다. 그래서 문서, 테스트, 명령어, 경계가 더 중요해집니다.

AI가 발견한 문제는 시스템 개선으로 바꿔야 한다

최신 모델이 보안 버그를 찾아냈다고 합시다. 여기서 “이 모델 정말 좋다”로 끝나면 절반만 배운 것입니다. 더 중요한 질문은 따로 있습니다. 왜 이 버그가 지금까지 남아 있었을까? 기존 테스트가 왜 잡지 못했을까? 비슷한 문제가 더 있을까? 다음에는 자동으로 찾게 만들 수 있을까?

Matt의 관점에서 AI가 준 결과는 단발성 산출물이 아니라 하네스를 개선할 신호입니다. 버그 하나를 고치는 데서 멈추지 않고, 테스트를 추가하고, 리뷰 기준을 바꾸고, 보안 점검 skill을 만들고, CI에 넣을 수 있는 검사를 찾는 방식입니다.

이것이 AI 코딩을 일회성 생산성 도구가 아니라 조직의 학습 시스템으로 쓰는 방법입니다. AI가 코드를 더 빨리 쓰게 하는 것보다, AI가 발견한 패턴을 다음 작업 환경에 반영하는 것이 더 오래갑니다.

제품과 비즈니스 판단은 여전히 인간의 몫이다

영상 후반부에서 SaaS가 죽었는지, AI 스타트업은 어떻게 해야 하는지에 대한 이야기도 나옵니다. Matt의 답은 의외로 담백합니다. 고객과 이야기하고, 실제 문제를 찾고, 프로토타입을 만들고, 해결책을 검증하라는 것입니다.

AI는 구현 속도를 높입니다. 그러나 무엇을 만들지, 왜 만들어야 하는지, 어떤 기능을 빼야 하는지는 자동으로 해결하지 못합니다. 오히려 구현이 쉬워질수록 더 많은 기능을 넣고 싶은 유혹이 커집니다. 이때 필요한 질문은 “무엇을 더 만들까?”가 아니라 “무엇을 줄이면 더 명확해질까?”일 수 있습니다.

AI 시대에도 제품의 중심은 고객의 문제입니다. 에이전트는 그 문제를 빠르게 실험하게 해주는 도구입니다. 문제 정의 자체를 대신해주는 존재는 아닙니다.

한국 개발자와 조직이 바로 해볼 7가지

첫째, 저장소의 README를 에이전트 기준으로 다시 읽어보세요. 처음 들어온 AI가 설치, 실행, 테스트를 이해할 수 있는지 확인합니다.

둘째, 자주 반복하는 요청을 skill이나 템플릿으로 만드세요. 단, 너무 많이 만들지 말고 실제로 반복되는 절차부터 시작합니다.

셋째, 이슈를 AI에게 줄 수 있는 크기로 쪼개세요. “관리자 페이지 개선”보다 “필터 컴포넌트에 빈 상태 메시지 추가, 기존 테스트 통과”가 낫습니다.

넷째, 테스트 명령과 완료 기준을 작업 지시에 포함하세요. AI에게 맡긴 뒤 사람이 다시 처음부터 확인하는 시간을 줄일 수 있습니다.

다섯째, AFK 작업은 샌드박스와 권한 제한 안에서 시작하세요. API key, 배포 권한, 운영 DB 접근은 특히 조심해야 합니다.

여섯째, AI가 만든 PR을 코드만 보지 말고 실패 패턴까지 보세요. 어디서 헷갈렸는지 알면 문서와 하네스를 개선할 수 있습니다.

일곱째, 최신 모델 뉴스는 따라가되, 팀의 기본기를 더 자주 점검하세요. 구조, 테스트, 문서, 리뷰 흐름이 약하면 어떤 모델도 오래 버티지 못합니다.

함께 읽으면 좋은 글
FAQ

AI 코딩에서 하네스란 무엇인가요?

하네스는 모델이 일하는 전체 환경입니다. 프롬프트, skill, 코드베이스 구조, 테스트, 문서, 샌드박스, CI, 리뷰 흐름까지 포함합니다. 모델 자체보다 우리가 직접 설계하고 개선할 수 있는 영역입니다.

왜 최신 모델보다 코드베이스 구조가 중요하다고 하나요?

좋은 구조와 테스트가 있으면 AI가 적은 맥락으로도 안전하게 변경할 수 있습니다. 반대로 구조가 복잡하고 문서가 낡았으면 비싼 모델도 헤맵니다. 그래서 토큰 비용을 줄이는 방법은 프롬프트 최적화만이 아니라 변경하기 쉬운 코드베이스를 만드는 것입니다.

Agentic loop와 queue 방식은 어떻게 다른가요?

Agentic loop는 에이전트가 계속 실행과 관찰을 반복하는 구조에 가깝습니다. Queue 방식은 사람이 정의한 작업 목록을 에이전트가 하나씩 처리하고, 결과를 리뷰하는 방식입니다. 실무에서는 queue 방식이 범위와 책임을 관리하기 쉽습니다.

AX는 기존 DX와 무엇이 다른가요?

DX는 사람이 개발하기 쉬운 경험이고, AX는 AI 에이전트가 작업하기 쉬운 경험입니다. 둘은 많이 겹칩니다. 명확한 문서, 예측 가능한 구조, 자동화된 테스트는 사람에게도 좋고 에이전트에게도 좋습니다.

AI에게 코딩을 맡길 때 가장 먼저 준비할 것은 무엇인가요?

작업 범위와 완료 기준입니다. 무엇을 바꿀지, 바꾸지 말아야 할 것은 무엇인지, 어떤 테스트를 통과해야 하는지 적어야 합니다. 그 다음에 샌드박스, 권한 제한, 리뷰 흐름을 붙이면 더 안전합니다.

참고자료
AI 코딩의 다음 단계는 더 많은 도구를 켜는 일이 아닐 수 있습니다. 오히려 잠시 멈추고, AI가 일하는 환경을 보는 일입니다. 어떤 문서가 부족한지, 어떤 테스트가 불안한지, 어떤 작업을 큐로 넘길 수 있는지 확인하는 것. 그 작은 정리가 최신 모델 하나를 더 구독하는 것보다 큰 차이를 만들 수 있습니다.
2026년 06월 25일

하네스 엔지니어링이 온다: AI 에이전트를 제대로 일하게 만드는 법

하네스 엔지니어링은 앞으로 AI 에이전트와 함께 일하는 사람에게 중요한 개념이 될 가능성이 높습니다. 지금까지 많은 사람은 “AI에게 어떻게 더 잘 말할 것인가”에 집중했습니다. 하지만 AI가 실제 코드를 만들고, 테스트하고, 수정하고, 보고하는 단계로 들어오면 질문이 달라집니다.

이제 중요한 것은 “AI에게 무엇을 말할 것인가”만이 아닙니다. AI가 제대로 일할 수밖에 없는 환경을 어떻게 만들 것인가입니다.

하네스 엔지니어링 도입부: 바이브 코딩에서 에이전틱 코딩으로 — 출처: Jay Choi | 인디해커 라이프 유튜브 영상 캡처

Read in English: This article is also available in English for global readers.

이 글은 Jay Choi | 인디해커 라이프의 영상 「하네스 엔지니어링: 바이브 코딩에서 에이전틱 코딩으로」를 바탕으로, 바이브 코딩 이후 개발자가 어떤 방식으로 AI 에이전트를 다뤄야 하는지 정리한 글입니다. 관련 흐름은 이전 글 「에이전틱 엔지니어링: 안드레이 카파시가 말한 바이브 코딩 이후의 개발 방식」과 함께 읽으면 더 잘 연결됩니다.

하네스 엔지니어링이란 무엇인가

하네스 엔지니어링은 AI 모델이나 에이전트가 움직이는 작업 환경 전체를 설계하는 일입니다. 여기서 말하는 환경은 단순한 채팅창이 아닙니다. 프로젝트 폴더 구조, 규칙 문서, 테스트 명령, 도구 목록, MCP, 스킬, 훅, 리뷰 절차, 자동 검증 흐름까지 포함합니다.

프롬프트 엔지니어링이 “모델에게 잘해 달라고 말하는 기술”에 가깝다면, 하네스 엔지니어링은 “모델이 잘할 수밖에 없는 구조를 만드는 기술”에 가깝습니다.

부탁이 아니라 구조를 만드는 일

AI에게 “테스트까지 확인해 줘”라고 말할 수는 있습니다. 하지만 에이전트가 실제로 테스트를 실행했는지, 실패를 어떻게 해석했는지, 결과를 기준에 맞게 보고했는지는 별개의 문제입니다.

하네스 엔지니어링은 이 지점을 구조로 해결하려고 합니다. 예를 들면 이렇게 볼 수 있습니다.

작업이 끝나면 반드시 테스트 명령을 실행하게 한다.
변경된 파일과 테스트 결과를 보고 양식에 맞춰 남기게 한다.
위험한 명령은 실행 전 확인 절차를 거치게 한다.
너무 많은 도구를 주지 않고, 작업 목적에 맞는 도구만 제공한다.
프로젝트 규칙을 문서화해 에이전트가 항상 읽을 수 있게 한다.

이런 구조가 있으면 매번 사람이 프롬프트로 잔소리하지 않아도 됩니다. 에이전트가 그 환경 안에서 자연스럽게 올바른 절차를 따르게 됩니다.

바이브 코딩은 바닥을 올리고, 하네스 엔지니어링은 천장을 올린다

영상의 핵심 표현 중 하나는 “바이브 코딩은 바닥을 올리고, 에이전틱 엔지니어링은 천장을 올린다”는 말입니다.

바이브 코딩은 개발 경험이 적은 사람도 앱을 만들 수 있게 해 주었습니다. 자연어로 요구사항을 말하면 AI가 코드를 제안하고, 화면을 만들고, 오류를 고쳐 줍니다. 이 변화는 분명히 진입 장벽을 낮췄습니다.

하지만 진입 장벽이 낮아졌다고 해서 좋은 소프트웨어가 자동으로 만들어지는 것은 아닙니다. 실제 서비스에서는 보안, 결제, 예외 처리, 유지보수, 테스트, 배포, 사용자 경험이 모두 더 봐야 합니다.

하네스 엔지니어링이 중요한 이유와 2026년 AI 에이전트 흐름 — 출처: Jay Choi | 인디해커 라이프 유튜브 영상 캡처

코드 생성보다 검증이 더 어려워진다

AI가 코드를 빠르게 만드는 시대에는 “코드를 작성하는 능력”보다 “코드가 쓸 만한지 판단하는 능력”이 더 더 봐야 합니다. AI가 그럴듯한 코드를 만들 수는 있지만, 그 코드가 실제 요구사항을 만족하는지 확인하는 책임은 여전히 사람과 시스템에 남습니다.

하네스 엔지니어링은 바로 이 검증 문제를 다룹니다. 에이전트가 작업을 완료했다고 말할 때, 그 말만 믿지 않고 실제 실행 결과와 테스트 결과를 확인하게 만드는 것입니다.

프롬프트를 더 길게 쓰는 것으로는 부족하다

많은 사용자는 AI 결과가 마음에 들지 않으면 프롬프트를 더 자세히 씁니다. 역할을 부여하고, 예시를 넣고, “실수하지 말라”고 지시합니다. 물론 이런 방식도 도움이 됩니다.

하지만 매번 사람이 개입해야 한다면 한계가 있습니다. 같은 유형의 실수를 반복해서 고쳐야 하고, 작업이 길어질수록 맥락이 흐려지며, 에이전트가 실제로 무엇을 했는지 확인하기 어렵습니다.

하네스 엔지니어링은 프롬프트보다 실행 환경을 설계하는 접근 — 출처: Jay Choi | 인디해커 라이프 유튜브 영상 캡처

좋은 프롬프트보다 좋은 작업장

영상에서는 프로젝트 전체가 하나의 거대한 프롬프트가 된다고 설명합니다. 에이전트는 채팅창의 문장만 읽는 것이 아닙니다. 폴더 구조, 파일 이름, README, 규칙 문서, 기존 코드 스타일, 테스트 파일, 설정 파일을 모두 참고합니다.

정리된 프로젝트에서는 에이전트도 정리된 방식으로 일할 가능성이 높습니다. 반대로 프로젝트가 어지럽고 규칙이 없으면, 에이전트도 어지러운 결과를 만들기 쉽습니다.

그래서 하네스 엔지니어링의 첫걸음은 거창한 자동화가 아닐 수 있습니다. 오히려 프로젝트를 정리하고, 규칙을 문서화하고, 반복 작업을 스크립트로 만들고, 검증 절차를 명확히 하는 것에서 시작됩니다.

도구는 많을수록 좋은 것이 아니다

AI 에이전트에게 많은 도구를 연결하면 더 강력해 보입니다. 검색, 터미널, 브라우저, 파일 편집, 배포, 데이터베이스, 메신저까지 모두 붙이면 무엇이든 할 수 있을 것처럼 느껴집니다.

하지만 실제로는 도구가 너무 많으면 에이전트가 어떤 도구를 써야 할지 판단하는 데 에너지를 씁니다. 사람도 선택지가 많을수록 결정을 미루듯, AI도 불필요한 선택지 앞에서 흔들릴 수 있습니다.

하네스 엔지니어링에서 도구 선택과 검증 구조의 중요성 — 출처: Jay Choi | 인디해커 라이프 유튜브 영상 캡처

작업별로 좁고 정확한 도구를 준다

좋은 하네스는 모든 도구를 한꺼번에 열어 주지 않습니다. 작업 목적에 맞춰 필요한 도구만 제공합니다.

예를 들어 코드 리뷰 에이전트라면 파일 읽기, diff 확인, 테스트 로그 분석이 더 봐야 합니다. 반면 배포 권한이나 외부 메시지 전송 권한은 필요하지 않을 수 있습니다. 데이터 수집 에이전트라면 웹 검색과 저장 도구는 필요하지만, 운영 서버 명령 권한은 제한하는 편이 안전합니다.

도구를 줄이는 것은 성능을 낮추는 일이 아닙니다. 오히려 에이전트가 더 빠르게 판단하고, 실수할 표면을 줄이며, 사람이 신뢰할 수 있는 결과를 만드는 방법입니다.

하네스 엔지니어링의 실무 체크리스트

개발자는 AI 팀 리더가 된다

하네스 엔지니어링을 실제 업무에 적용하려면 다음 항목부터 점검해 볼 수 있습니다.

점검 항목	질문	예시
목표 정의	에이전트가 끝내야 할 작업이 명확한가?	“로그인 오류 수정”보다 “재현 절차 확인 후 테스트 통과까지”
도구 제한	이 작업에 꼭 필요한 도구만 열려 있는가?	코드 수정 에이전트에 배포 권한 제외
규칙 문서	프로젝트 규칙을 에이전트가 읽을 수 있는가?	README, AGENTS.md, CLAUDE.md, 테스트 가이드
검증 루프	작업 후 자동으로 확인하는 절차가 있는가?	lint, unit test, build, smoke test
보고 형식	결과를 사람이 판단하기 쉽게 남기는가?	변경 파일, 실행 명령, 실패/성공 로그 요약
인간 판단	AI가 결정하면 안 되는 영역이 분리되어 있는가?	결제 정책, 환불 기준, 보안 예외, UX 우선순위

이 표에서 중요한 것은 자동화 자체가 아닙니다. AI에게 맡길 일과 사람이 판단할 일을 분리하는 것입니다.

영상의 마지막 메시지는 강합니다. 생각은 AI에게 아웃소싱할 수 있지만, 이해는 아웃소싱할 수 없다는 것입니다.

코드 작성, 분석, 리뷰 초안 작성은 AI가 점점 더 잘하게 됩니다. 하지만 왜 이 기능이 필요한지, 어떤 예외를 고려해야 하는지, 어떤 구조가 장기적으로 유지보수에 유리한지는 사람이 이해해야 합니다.

하네스 엔지니어링 시대 개발자는 AI 팀 리더가 된다 — 출처: Jay Choi | 인디해커 라이프 유튜브 영상 캡처

직접 코딩하는 사람에서 작업 환경을 설계하는 사람으로

앞으로 개발자의 역할은 “모든 코드를 직접 치는 사람”에서 “AI 에이전트 팀이 제대로 일하도록 환경을 만드는 사람”으로 이동할 가능성이 높습니다.

이 변화는 개발자에게만 해당하지 않습니다. 기획자, 창업자, PM, 데이터 분석가도 마찬가지입니다. AI에게 일을 맡기려면 작업 기준, 검증 방법, 보고 방식, 권한 범위를 설계해야 합니다.

결국 하네스 엔지니어링은 AI 시대의 협업 설계입니다. AI가 잘하는 실행은 AI에게 맡기되, 사람이 이해하고 책임져야 할 부분은 구조 안에 남겨 두는 방식입니다.

결론: AI에게 “해줘”라고 말하는 시대의 다음 단계

바이브 코딩은 많은 사람에게 만들기의 문을 열었습니다. 하지만 실제 결과물을 안정적으로 운영하려면 다음 단계가 해야 합니다. 그 단계가 하네스 엔지니어링입니다.

좋은 하네스는 에이전트에게 자유를 주되, 방향과 경계를 함께 제공합니다. 필요한 도구만 주고, 프로젝트 규칙을 읽게 하며, 작업 후에는 테스트와 리뷰를 통과하게 만듭니다. 사람은 모든 중간 과정을 붙잡는 대신 최종 판단과 중요한 설계에 집중합니다.

AI에게 “해줘”라고 말하는 것만으로는 충분하지 않습니다. 이제는 AI가 제대로 해낼 수 있는 환경을 설계해야 합니다. 하네스 엔지니어링은 바로 그 환경을 만드는 일입니다.

참고자료

Jay Choi | 인디해커 라이프, 「하네스 엔지니어링: 바이브 코딩에서 에이전틱 코딩으로」

함께 읽으면 좋은 글

이 주제와 함께 읽으면 맥락을 넓히는 데 도움이 되는 thinknote.co.kr의 관련 글입니다.

2026년 05월 21일

에이전틱 엔지니어링: 안드레이 카파시가 말한 바이브 코딩 이후의 개발 방식
에이전틱 엔지니어링은 바이브 코딩의 다음 단계입니다. 안드레이 카파시는 Sequoia Capital의 AI Ascent 2026 대담에서, 최신 AI 코딩 도구가 단순한 자동완성 수준을 넘어 개발자의 역할 자체를 바꾸고 있다고 설명합니다. 이제 중요한 질문은 “AI가 코드를 얼마나 빨리 쓰는가”가 아니라, “사람이 에이전트를 어떻게 지휘하고 검증할 것인가”입니다.

Read in English: Agentic Engineering: What Comes After Vibe Coding?

출처: 스테이지5 유튜브 「안드레이 카파시: 바이브 코딩에서 에이전틱 엔지니어링으로」 화면 캡처. 안드레이 카파시가 대담을 시작하는 장면입니다.

왜 에이전틱 엔지니어링이 중요해졌나

카파시는 자신이 “프로그래머로서 가장 뒤처진 느낌을 받았다”고 말합니다. 놀라운 말입니다. 그는 OpenAI 공동창업자였고, Tesla Autopilot 개발에도 참여한 인물입니다. 그런 개발자조차 최신 AI 코딩 도구의 변화 속도 앞에서 기존 감각이 흔들렸다고 말한 것입니다.

2025년 말 이후의 전환점

그가 짚은 전환점은 2025년 말입니다. 이전의 에이전트 도구는 코드 조각을 제안해 주는 보조 도구에 가까웠습니다. 사람이 자주 고쳐야 했고, 결과를 완전히 믿기는 어려웠습니다.

하지만 어느 순간부터 최신 모델은 더 긴 코드 덩어리도 꽤 안정적으로 만들기 시작했습니다. 개발자는 직접 타이핑하는 시간을 줄이고, 요구사항을 설명하고, 결과를 검토하는 쪽으로 이동합니다. 이것이 바이브 코딩의 출발점입니다.

Software 3.0은 무엇인가

카파시는 이 변화를 Software 3.0이라는 개념으로 설명합니다. Software 1.0은 사람이 직접 작성한 코드입니다. Software 2.0은 데이터셋과 신경망 학습으로 만들어진 모델입니다. Software 3.0은 LLM이라는 인터프리터를 프롬프트와 컨텍스트로 조종하는 방식입니다.

출처: 스테이지5 유튜브 화면 캡처. Software 3.0과 프롬프트 기반 프로그래밍을 설명하는 구간입니다.

코드는 파일에만 있지 않다

Software 3.0에서는 코드만이 프로그램이 아닙니다. 프롬프트, 문서, 테스트, 예시, 오류 로그, 저장소 구조, 컨텍스트 윈도우까지 모두 프로그램의 일부가 됩니다. 개발자는 LLM이 해석할 수 있는 환경을 설계해야 합니다.

이 관점에서는 “좋은 프롬프트”보다 “좋은 작업 맥락”이 더 더 봐야 합니다. 에이전트가 문제를 이해하고, 스스로 탐색하고, 실행 결과를 확인할 수 있어야 하기 때문입니다.

바이브 코딩은 누구나 만들게 하지만, 실무는 다르다

바이브 코딩은 아이디어를 빠르게 제품 형태로 바꾸는 방식입니다. 말로 요구사항을 설명하고, AI가 코드를 작성하게 하며, 결과물을 보면서 계속 수정합니다. 이 방식은 진입 장벽을 크게 낮춥니다.

MenuGen 사례가 보여준 것

카파시는 메뉴판 사진을 찍으면 음식 이미지를 붙여 보여주는 MenuGen 앱을 바이브 코딩으로 만들었습니다. 그런데 나중에는 Gemini와 이미지 생성 모델에 메뉴판 사진을 주고 바로 오버레이를 요청하는 방식이 더 자연스럽다는 점을 깨달았다고 말합니다.

출처: 스테이지5 유튜브 화면 캡처. MenuGen 사례를 통해 기존 앱 구조가 Software 3.0 방식으로 바뀔 수 있음을 설명하는 장면입니다.

이 사례는 중요한 질문을 던집니다. 앞으로 어떤 앱은 더 잘 만들어지는 것이 아니라, 아예 필요 없어질 수 있습니다. 사용자가 원하는 결과를 LLM과 생성 모델이 직접 만들어낸다면, 중간에 있던 많은 소프트웨어 계층이 사라질 수 있습니다.

에이전틱 엔지니어링은 스펙과 검증의 기술이다

카파시는 바이브 코딩과 에이전틱 엔지니어링을 구분합니다. 바이브 코딩이 빠른 구현의 감각이라면, 에이전틱 엔지니어링은 실무 시스템을 안전하게 만들기 위한 설계 방식입니다.

사람이 여전히 책임져야 하는 영역

AI 에이전트는 놀라운 속도로 코드를 작성하지만, 이상한 설계 실수도 합니다. 카파시는 결제 크레딧을 사용자 계정과 연결하는 예시를 듭니다. 에이전트가 Stripe 이메일과 Google 이메일을 그냥 맞춰 자금을 연결하려 했다는 것입니다.

겉보기에는 그럴듯하지만, 실제 서비스에서는 치명적인 설계입니다. 사용자는 결제 이메일과 로그인 이메일을 다르게 쓸 수 있습니다. 이런 문제는 코드 문법이 아니라 도메인 이해, 데이터 모델, 보안, 제품 판단의 문제입니다.

출처: 스테이지5 유튜브 화면 캡처. 바이브 코딩에서 에이전틱 엔지니어링으로 넘어가는 차이를 설명하는 구간입니다.

그래서 사람은 스펙, 계획, 판단 기준, 테스트 전략을 책임져야 합니다. 에이전트는 구현을 많이 맡을 수 있지만, 무엇을 만들지와 왜 그렇게 만들어야 하는지는 사람이 설계해야 합니다.

검증 가능한 환경이 AI 제품의 핵심 기회다

카파시는 검증 가능성을 매우 중요하게 봅니다. 코드가 AI에 잘 맞는 이유도 여기에 있습니다. 실행해 볼 수 있고, 테스트할 수 있고, 오류 메시지를 받을 수 있습니다. 즉, 모델이 스스로 개선할 수 있는 피드백 루프가 있습니다.

창업자는 무엇을 봐야 할까

창업자에게 중요한 질문은 “AI로 무엇을 자동화할 수 있나”보다 더 구체적이어야 합니다. “검증 가능한 환경을 어떻게 만들 수 있나”가 핵심입니다. 정답 여부를 측정할 수 있고, 실패를 감지할 수 있으며, 개선 데이터를 쌓을 수 있는 영역이 강력한 기회가 됩니다.

예를 들어 테스트 자동화, 보안 점검, 문서 검증, 데이터 정합성 검사, 운영 절차 자동화 같은 영역은 에이전트와 잘 맞습니다. 반대로 결과가 맞는지 판단하기 어렵고, 책임 소재가 불분명한 영역은 더 조심해야 합니다.

AI 네이티브 개발자의 차이는 어디서 생기나

AI 네이티브 개발자는 그냥 ChatGPT를 자주 쓰는 사람이 아닙니다. Claude Code, Codex, OpenClaw 같은 도구를 자기 작업 흐름에 맞게 세팅하고, 에이전트가 읽을 수 있는 문서와 구조를 준비합니다.

생산성 차이는 타이핑 속도가 아니다

이제 생산성 차이는 코드를 빨리 치는 능력에서만 나오지 않습니다. 문제를 잘게 나누는 능력, 좋은 스펙을 쓰는 능력, 테스트를 설계하는 능력, 결과물을 검증하는 능력에서 차이가 커집니다.

카파시는 뛰어난 개발자가 AI 도구를 잡으면 10배를 넘어서는 생산성 차이가 날 수 있다고 봅니다. 이유는 간단합니다. 좋은 개발자는 에이전트가 놓치기 쉬운 맥락을 알고, 잘못된 방향을 빠르게 감지하며, 더 좋은 작업 환경을 설계할 수 있기 때문입니다.

에이전트 퍼스트 인프라가 필요하다

현재 많은 에이전트는 사람용 웹페이지와 설정 화면을 억지로 조작합니다. 버튼을 누르고, URL을 열고, 메뉴를 찾아갑니다. 카파시는 이런 방식이 비효율적이라고 지적합니다.

출처: 스테이지5 유튜브 화면 캡처. 에이전트가 사용하기 쉬운 인프라와 데이터 구조의 필요성을 설명하는 장면입니다.

사람용 UI와 에이전트용 인터페이스는 다르다

앞으로 서비스는 사람에게 보기 좋은 UI뿐 아니라, 에이전트가 이해하고 실행하기 쉬운 인터페이스를 제공해야 합니다. 명확한 API, 기계가 읽기 쉬운 문서, 구조화된 설정, 자동 검증 가능한 작업 단위가 더 봐야 합니다.

이 변화는 개발 도구에만 국한되지 않습니다. 클라우드, 결제, 데이터베이스, 배포, 보안, 고객지원 도구까지 모두 에이전트 친화적으로 재설계될 가능성이 높습니다.

결론: 개발자는 사라지는 것이 아니라 역할이 올라간다

카파시의 메시지는 개발자의 종말론과 다릅니다. 그는 사람이 여전히 이해와 판단을 담당한다고 봅니다. 주의할 점은 직접 코드를 쓰는 비중은 줄고, 에이전트를 지휘하고 검증하는 비중이 커집니다.

에이전틱 엔지니어링 시대의 개발자는 구현자이면서 동시에 감독자입니다. 좋은 개발자는 코드를 많이 쓰는 사람에서, 좋은 문제 정의와 검증 가능한 환경을 설계하는 사람으로 이동합니다.

지금 필요한 준비는 거창하지 않습니다. 작은 프로젝트부터 에이전트에게 맡길 수 있는 작업과 사람이 직접 판단해야 하는 작업을 구분해 보아야 합니다. 그리고 문서, 테스트, 스펙, 배포 절차를 에이전트가 이해할 수 있게 정리해야 합니다. 그것이 바이브 코딩 이후의 실무 경쟁력입니다.

FAQ

에이전틱 엔지니어링은 바이브 코딩과 무엇이 다른가요?

바이브 코딩은 AI와 대화하며 빠르게 구현하는 방식에 가깝습니다. 에이전틱 엔지니어링은 실무 시스템을 만들기 위해 스펙, 테스트, 보안, 검증, 운영까지 포함해 에이전트를 지휘하는 방식입니다.

Software 3.0은 코딩을 대체한다는 뜻인가요?

완전한 대체라기보다 코딩의 단위가 바뀐다는 뜻에 가깝습니다. 코드뿐 아니라 프롬프트, 문서, 컨텍스트, 테스트가 개발의 핵심 재료가 됩니다.

개발자는 무엇을 준비해야 하나요?

AI 도구 사용법만 익히는 것으로는 부족합니다. 요구사항을 명확히 쓰는 능력, 테스트를 설계하는 능력, 결과를 검증하는 능력, 에이전트가 이해하기 쉬운 문서를 만드는 능력을 함께 길러야 합니다.

참고자료
- – 스테이지5 유튜브: 안드레이 카파시: 바이브 코딩에서 에이전틱 엔지니어링으로
- – 스테이지5 유튜브 채널
함께 읽으면 좋은 글
2026년 05월 20일

Anthropic이 던진 질문: 당신의 개발 조직은 AI 에이전트를 운영할 준비가 됐나

Claude Code London 2026 오프닝 장면 — 출처: Claude YouTube 공식 영상 캡처. 리뷰·해설 목적의 인용 이미지입니다.

Read in English: This article is also available in English for global readers.

Claude Code London 2026 오프닝 키노트는 Anthropic이 지금 AI 개발 도구를 어떻게 바라보는지 보여주는 발표였다. 먼저 볼 부분은 단순하다. 과거에는 개발자가 아이디어를 코드로 옮기기까지 긴 설정과 검증 과정을 지나야 했다. 이제는 모델, 플랫폼, 개발 도구가 결합되면서 그 거리가 빠르게 짧아지고 있다.

이번 발표는 “AI가 코드를 잘 쓴다”는 수준을 넘어선다. Anthropic은 Claude 모델의 판단력, Claude Platform의 에이전트 인프라, Claude Code의 비동기 자동화 기능을 하나의 흐름으로 묶었다. 개발자는 더 이상 한 번의 프롬프트만 잘 쓰는 사람이 아니라, AI가 반복적으로 일하고 검증하도록 작업 환경을 설계하는 사람이 되고 있다.

Claude Code London 2026이 말한 변화의 핵심

키노트의 첫 메시지는 개발 경험의 회귀였다. 발표자는 어린 시절 계산기와 HTML을 만지며 느꼈던 “만들면 바로 작동한다”는 감각을 이야기했다. 이후 개발은 빌드 시스템, 패키지 매니저, 설정 파일, 테스트 환경 때문에 복잡해졌다. 하지만 Claude Code London 2026은 AI 코딩 에이전트가 이 복잡성을 다시 낮추고 있다고 설명한다.

아이디어에서 실행까지의 거리 단축

발표에서 반복된 표현은 “gap”이다. 아이디어와 실행 사이의 간격, 모델 능력과 실제 업무 적용 사이의 간격, 개인 개발자의 작업과 조직 전체의 자동화 사이의 간격이 모두 줄어들고 있다는 뜻이다.

Anthropic은 Spotify가 Claude Code를 활용해 대규모 저장소 마이그레이션을 처리하고, 매달 1,000개 이상의 PR을 병합하는 사례를 소개했다. 또한 Binti가 Claude API로 복지 현장의 행정 시간을 줄이고, 위탁가정 승인 과정에서 20일을 단축한 사례도 언급했다. 이 사례들은 AI 코딩 도구가 단순 생산성 도구를 넘어 실제 업무 병목을 줄이는 방향으로 이동하고 있음을 보여준다.

선형 도입과 지수적 모델 발전의 충돌

키노트는 모델 능력이 지수적으로 발전하지만, 조직의 AI 도입은 여전히 선형적으로 진행된다고 지적했다. 이 간격이 커질수록 개발자의 역할은 더 중요해진다. 모델이 할 수 있는 일과 실제 제품·업무 안에서 작동하는 일 사이를 연결하는 사람이 개발자이기 때문이다.

Claude 모델 로드맵: 더 긴 작업, 더 높은 판단력

Claude Code London 2026 Claude 모델 발전과 작업 지속 시간 설명 장면 — 출처: Claude YouTube 공식 영상 캡처. 리뷰·해설 목적의 인용 이미지입니다.

Anthropic은 Claude 모델의 발전 방향을 “더 좋은 벤치마크 점수”보다 “이전에는 못 하던 일을 할 수 있게 되는 변화”로 설명했다. 발표에서는 Opus 4.7과 Mythos preview가 언급됐고, Claude가 더 긴 작업을 유지하며 모호한 목표도 끝까지 처리하는 방향으로 이동하고 있다고 말했다.

작업 지속 시간, 즉 task horizon의 확대

중요한 개념은 task horizon이다. 이는 모델이 흐름을 잃지 않고 얼마나 오래 일할 수 있는지를 뜻한다. 과거 모델이 몇 분 단위 작업을 안정적으로 처리했다면, 현재는 몇 시간 동안 실행되는 에이전트가 보편화되고 있다. Anthropic은 향후 Claude가 지속적으로 실행되는 에이전트가 될 것으로 전망했다.

예를 들어 “프로젝트 업데이트를 작성해줘”가 아니라 “이번 주 프로젝트가 계획대로 진행되게 관리해줘”라고 맡기는 식이다. “재무 전망을 만들어줘”가 아니라 “전망을 계속 갱신해서 정확하게 유지해줘”가 되는 변화다.

스캐폴딩은 줄고, 일반 도구의 중요성은 커진다

발표에서는 에이전트의 루프, 지시문, 도구 같은 모델 외부 구성요소를 scaffolding이라고 불렀다. 흥미로운 지점은 모델이 똑똑해질수록 과한 스캐폴딩이 오히려 방해가 될 수 있다는 설명이다. 더 강한 모델은 파일 시스템, 샌드박스 실행 환경처럼 범용적인 도구를 가지고도 더 멀리 갈 수 있다.

개발팀 입장에서는 프롬프트를 늘리는 것보다 평가 체계와 제품 프로토타입을 더 어렵게 만드는 일이 중요해진다. 예전에는 실패하던 작업이 새 모델에서 통과되기 시작하면, 그때가 새 기능을 제품화할 신호다.

Claude Platform: 에이전트를 제품 수준으로 운영하는 인프라

Claude Code London 2026 Claude Managed Agents와 MCP 터널 설명 장면 — 출처: Claude YouTube 공식 영상 캡처. 리뷰·해설 목적의 인용 이미지입니다.

Claude Code London 2026의 중간 파트는 Claude Platform에 집중했다. 여기서 Anthropic은 기업이 에이전트를 실제 업무에 쓰기 어려운 이유를 두 가지로 정리했다. 첫째, 원하는 결과를 안정적으로 얻는 것이 어렵다. 둘째, 빠르게 출시하면서도 확장성과 품질을 함께 확보해야 한다.

Advisor strategy: 고성능과 비용의 균형

Anthropic은 advisor strategy를 소개했다. 실행은 작은 모델이 맡고, 어려운 순간에는 더 큰 모델이 조언하는 구조다. 발표에서는 Haiku 또는 Sonnet급 모델이 실행자로 일하고 Opus가 조언자로 참여하는 식의 패턴을 설명했다.

이 구조는 고성능 모델만 계속 쓰는 방식보다 비용을 낮출 수 있다. 동시에 작은 모델이 막히는 지점에서 큰 모델의 판단을 빌릴 수 있다. 대량의 에이전트 워크로드를 운영하는 기업에게는 비용과 품질을 동시에 관리하는 현실적인 설계다.

Claude Managed Agents, self-hosted sandbox, MCP tunnels

또 다른 먼저 볼 부분은 Claude Managed Agents였다. Anthropic은 이를 에이전트 하네스와 운영 인프라가 결합된 형태로 설명했다. 발표에서는 self-hosted sandbox와 MCP tunnels가 새 기능으로 소개됐다.

self-hosted sandbox는 에이전트가 코드를 실행할 때 Anthropic의 기본 샌드박스 대신 기업이 관리하는 서버나 클라우드 환경을 사용할 수 있게 한다. MCP tunnels는 내부 네트워크 뒤에 있는 MCP 서버를 외부에 직접 노출하지 않고 Claude Managed Agents가 접근할 수 있게 해준다. 보안과 내부 시스템 연동이 중요한 기업에게 특히 중요한 변화다.

Claude Code: 프롬프트하는 개발자에서 자동화를 설계하는 개발자로

Claude Code London 2026 Claude Code와 개발자 생산성 사례 설명 장면 — 출처: Claude YouTube 공식 영상 캡처. 리뷰·해설 목적의 인용 이미지입니다.

후반부는 Claude Code의 변화에 초점을 맞췄다. 발표자는 CLI, IDE, 데스크톱 앱, 클라우드 에이전트 뷰가 서로 다른 개발자 작업 방식을 지원한다고 설명했다. 특히 여러 Claude Code 세션을 동시에 운영하는 “multi-clauding” 흐름이 강조됐다.

비동기 코딩과 검증의 중요성

Claude Code가 그냥 코드를 작성하는 도구라면 개발자는 모든 변경을 실시간으로 감시해야 한다. 하지만 발표의 방향은 다르다. Claude가 테스트하고, 브라우저에서 동작을 확인하고, 실패 원인을 추적한 뒤 다시 수정하는 흐름을 보여줬다.

이 지점에서 검증은 핵심 기능이 된다. AI가 스스로 작업을 확인할 수 있으면 개발자는 에이전트를 실행해 두고 다른 일을 할 수 있다. 결과적으로 동기식 페어 프로그래밍보다 비동기식 작업 위임의 비중이 커진다.

Routines: Claude가 Claude Code를 프롬프트하는 구조

Claude Code London 2026 Claude Code Routines와 자동화 설명 장면 — 출처: Claude YouTube 공식 영상 캡처. 리뷰·해설 목적의 인용 이미지입니다.

가장 상징적인 기능은 Routines였다. 발표자는 이를 “higher order prompt”라고 설명했다. 개발자가 매번 Claude Code에 작업을 지시하는 것이 아니라, 특정 조건이나 일정에 따라 Claude Code가 자동으로 실행되도록 루틴을 만든다는 뜻이다.

예를 들어 GitHub 이슈가 새로 생기면 루틴이 이를 감지하고 작업 세션을 시작한다. CI가 실패하면 autofix가 원인을 분석하고 수정한다. 코드 리뷰나 보안 리뷰 코멘트도 자동으로 처리 대상이 된다. 발표자는 “기본값이 ‘내가 Claude Code를 프롬프트한다’에서 ‘Claude가 Claude Code를 프롬프트하게 한다’로 바뀌고 있다”고 정리했다.

개발자와 기업이 지금 준비해야 할 것

Claude Code London 2026의 메시지는 낙관적이지만, 무작정 AI 도구를 붙이라는 이야기는 아니다. 오히려 모델 업그레이드를 흡수할 수 있는 구조를 미리 만들어야 한다는 조언에 가깝다.

평가와 아키텍처를 먼저 준비해야 한다

모델 성능은 계속 바뀐다. 그래서 오늘 되는 작업만 기준으로 제품을 설계하면 다음 모델의 능력을 제대로 활용하기 어렵다. 개발팀은 평가 자동화, 회귀 테스트, 에이전트 권한 설계, 샌드박스 정책을 함께 준비해야 한다.

특히 기업 환경에서는 내부 도구 접근 권한, 코드 실행 범위, 감사 로그, 보안 리뷰가 중요하다. Claude Managed Agents의 self-hosted sandbox와 MCP tunnels가 강조된 이유도 여기에 있다.

AI 코딩 도구는 개인 생산성에서 조직 운영으로 이동한다

발표에서 Shopify, Mercado Libre 같은 조직 사례가 언급된 것도 의미가 있다. AI 코딩은 개인 개발자의 자동완성 경험에서 출발했지만, 이제는 조직의 PR 처리, 기술부채 정리, CI 대응, 보안 점검까지 넓어지고 있다.

국내 기업도 이 흐름을 그냥 “개발자가 편해지는 도구”로만 보면 부족하다. 실제 경쟁력은 에이전트가 안전하게 반복 작업을 맡고, 사람은 우선순위와 품질 판단에 집중하는 운영 구조에서 나온다.

Claude Code London 2026 요약 체크리스트

구분	발표 내용	실무적 의미
모델	Claude의 작업 지속 시간과 판단력 확대	긴 업무를 맡길 수 있는 에이전트 설계 필요
플랫폼	Managed Agents, advisor strategy, MCP tunnels	비용·보안·확장성을 고려한 운영 구조 필요
개발 도구	Claude Code Desktop, Agent View, Routines	비동기 코딩과 다중 에이전트 관리가 중요
조직 적용	PR 자동화, CI autofix, 기술부채 정리	개인 생산성을 넘어 엔지니어링 운영 자동화로 확장
준비 과제	평가 자동화와 권한 설계	모델 업그레이드를 빠르게 흡수하는 아키텍처 필요

결론: AI 개발 도구의 다음 단계는 ‘대화’보다 ‘운영’이다

Claude Code London 2026 키노트의 먼저 볼 부분은 AI와 대화하는 경험이 끝났다는 뜻이 아니다. 대화는 여전히 시작점이다. 주의할 점은 다음 단계는 대화를 반복 가능한 운영 구조로 바꾸는 일이다.

개발자는 좋은 프롬프트를 쓰는 사람에서 좋은 루틴, 평가, 권한, 샌드박스를 설계하는 사람으로 이동하고 있다. 기업은 AI 도구를 도입하는 수준을 넘어, 모델 능력이 올라갈 때마다 업무 방식도 함께 업데이트할 수 있는 구조를 만들어야 한다.

이번 키노트는 Anthropic의 제품 발표이면서 동시에 개발 조직을 향한 질문이다. “모델은 이미 더 오래, 더 복잡한 일을 하기 시작했다. 당신의 개발 환경은 그 능력을 받아들일 준비가 되어 있는가?”

FAQ

Claude Code London 2026에서 가장 중요한 발표는 무엇인가요?

가장 중요한 메시지는 Claude 모델, Claude Platform, Claude Code가 하나의 에이전트 실행 환경으로 연결되고 있다는 점입니다. 특히 Routines, Claude Managed Agents, MCP tunnels는 AI 코딩이 개인 도구에서 조직 운영 도구로 확장되고 있음을 보입니다.

Routines는 일반 자동화와 무엇이 다른가요?

일반 자동화는 정해진 스크립트를 반복 실행하는 경우가 많습니다. Routines는 Claude Code가 특정 이벤트나 일정에 따라 작업을 시작하고, 상황을 해석하며, 필요한 코딩 작업을 수행하도록 만드는 구조에 가깝습니다.

국내 개발팀은 무엇부터 준비해야 하나요?

먼저 AI가 작업해도 되는 범위, 코드 실행 환경, 검증 기준, 보안 정책을 정해야 합니다. 이후 반복적인 PR 처리, 테스트 실패 대응, 문서 업데이트, 기술부채 정리처럼 결과를 검증하기 쉬운 작업부터 적용하는 것이 현실적입니다.

참고자료

Code with Claude London 2026: Opening Keynote — Claude YouTube 공식 영상
Claude 공식 YouTube 채널
Anthropic Claude Code 문서
Think Note: AI agent 변화 — OpenClaw가 보여주는 실행형 AI의 다음 단계
Think Note: AI와 일의 미래

함께 읽으면 좋은 글

2026년 05월 20일

[태그:] Claude Code

AI 코딩의 본질은 모델이 아니라 하네스다: Matt Pocock의 에이전틱 엔지니어링

AI는 전술적 프로그래밍을 먹어치웠다

최신 모델보다 중요한 것은 작업 환경이다

Skill은 많이 붙이는 것이 아니라 절차로 관리해야 한다

AFK 에이전트는 ‘무한 루프’보다 ‘큐’에 가깝다

AX: 이제는 Agent Experience도 설계해야 한다

AI가 발견한 문제는 시스템 개선으로 바꿔야 한다

제품과 비즈니스 판단은 여전히 인간의 몫이다

한국 개발자와 조직이 바로 해볼 7가지

함께 읽으면 좋은 글

FAQ

AI 코딩에서 하네스란 무엇인가요?

왜 최신 모델보다 코드베이스 구조가 중요하다고 하나요?

Agentic loop와 queue 방식은 어떻게 다른가요?

AX는 기존 DX와 무엇이 다른가요?

AI에게 코딩을 맡길 때 가장 먼저 준비할 것은 무엇인가요?

참고자료

하네스 엔지니어링이 온다: AI 에이전트를 제대로 일하게 만드는 법

하네스 엔지니어링이란 무엇인가

부탁이 아니라 구조를 만드는 일

바이브 코딩은 바닥을 올리고, 하네스 엔지니어링은 천장을 올린다

코드 생성보다 검증이 더 어려워진다

프롬프트를 더 길게 쓰는 것으로는 부족하다

좋은 프롬프트보다 좋은 작업장

도구는 많을수록 좋은 것이 아니다

작업별로 좁고 정확한 도구를 준다

하네스 엔지니어링의 실무 체크리스트

개발자는 AI 팀 리더가 된다

직접 코딩하는 사람에서 작업 환경을 설계하는 사람으로

결론: AI에게 “해줘”라고 말하는 시대의 다음 단계

참고자료

함께 읽으면 좋은 글

에이전틱 엔지니어링: 안드레이 카파시가 말한 바이브 코딩 이후의 개발 방식

왜 에이전틱 엔지니어링이 중요해졌나

2025년 말 이후의 전환점

Software 3.0은 무엇인가

코드는 파일에만 있지 않다

바이브 코딩은 누구나 만들게 하지만, 실무는 다르다

MenuGen 사례가 보여준 것

에이전틱 엔지니어링은 스펙과 검증의 기술이다

사람이 여전히 책임져야 하는 영역

검증 가능한 환경이 AI 제품의 핵심 기회다

창업자는 무엇을 봐야 할까

AI 네이티브 개발자의 차이는 어디서 생기나

생산성 차이는 타이핑 속도가 아니다

에이전트 퍼스트 인프라가 필요하다

사람용 UI와 에이전트용 인터페이스는 다르다

결론: 개발자는 사라지는 것이 아니라 역할이 올라간다

FAQ

에이전틱 엔지니어링은 바이브 코딩과 무엇이 다른가요?

Software 3.0은 코딩을 대체한다는 뜻인가요?

개발자는 무엇을 준비해야 하나요?

참고자료

함께 읽으면 좋은 글

Anthropic이 던진 질문: 당신의 개발 조직은 AI 에이전트를 운영할 준비가 됐나

Claude Code London 2026이 말한 변화의 핵심

아이디어에서 실행까지의 거리 단축

선형 도입과 지수적 모델 발전의 충돌

Claude 모델 로드맵: 더 긴 작업, 더 높은 판단력

작업 지속 시간, 즉 task horizon의 확대

스캐폴딩은 줄고, 일반 도구의 중요성은 커진다

Claude Platform: 에이전트를 제품 수준으로 운영하는 인프라

Advisor strategy: 고성능과 비용의 균형

Claude Managed Agents, self-hosted sandbox, MCP tunnels

Claude Code: 프롬프트하는 개발자에서 자동화를 설계하는 개발자로

비동기 코딩과 검증의 중요성

Routines: Claude가 Claude Code를 프롬프트하는 구조

개발자와 기업이 지금 준비해야 할 것

평가와 아키텍처를 먼저 준비해야 한다

AI 코딩 도구는 개인 생산성에서 조직 운영으로 이동한다

Claude Code London 2026 요약 체크리스트

결론: AI 개발 도구의 다음 단계는 ‘대화’보다 ‘운영’이다

FAQ

Claude Code London 2026에서 가장 중요한 발표는 무엇인가요?

Routines는 일반 자동화와 무엇이 다른가요?

국내 개발팀은 무엇부터 준비해야 하나요?

참고자료

함께 읽으면 좋은 글

환영합니다!