[태그:] Claude Code

Claude Code와 AI 코딩, 개발 생산성, 에이전트형 개발도구를 다룬 글 모음입니다. 개발 워크플로 변화와 활용 포인트를 정리합니다.

  • 하네스 엔지니어링이 온다: AI 에이전트를 제대로 일하게 만드는 법

    하네스 엔지니어링이 온다: AI 에이전트를 제대로 일하게 만드는 법

    하네스 엔지니어링은 앞으로 AI 에이전트와 함께 일하는 사람에게 중요한 개념이 될 가능성이 높습니다. 지금까지 많은 사람은 “AI에게 어떻게 더 잘 말할 것인가”에 집중했습니다. 하지만 AI가 실제 코드를 만들고, 테스트하고, 수정하고, 보고하는 단계로 들어오면 질문이 달라집니다.

    이제 중요한 것은 “AI에게 무엇을 말할 것인가”만이 아닙니다. AI가 제대로 일할 수밖에 없는 환경을 어떻게 만들 것인가입니다.

    하네스 엔지니어링 도입부: 바이브 코딩에서 에이전틱 코딩으로
    출처: Jay Choi | 인디해커 라이프 유튜브 영상 캡처

    Read in English: This article is also available in English for global readers.

    이 글은 Jay Choi | 인디해커 라이프의 영상 「하네스 엔지니어링: 바이브 코딩에서 에이전틱 코딩으로」를 바탕으로, 바이브 코딩 이후 개발자가 어떤 방식으로 AI 에이전트를 다뤄야 하는지 정리한 글입니다. 관련 흐름은 이전 글 「에이전틱 엔지니어링: 안드레이 카파시가 말한 바이브 코딩 이후의 개발 방식」과 함께 읽으면 더 잘 연결됩니다.

    하네스 엔지니어링이란 무엇인가

    하네스 엔지니어링은 AI 모델이나 에이전트가 움직이는 작업 환경 전체를 설계하는 일입니다. 여기서 말하는 환경은 단순한 채팅창이 아닙니다. 프로젝트 폴더 구조, 규칙 문서, 테스트 명령, 도구 목록, MCP, 스킬, 훅, 리뷰 절차, 자동 검증 흐름까지 포함합니다.

    프롬프트 엔지니어링이 “모델에게 잘해 달라고 말하는 기술”에 가깝다면, 하네스 엔지니어링은 “모델이 잘할 수밖에 없는 구조를 만드는 기술”에 가깝습니다.

    부탁이 아니라 구조를 만드는 일

    AI에게 “테스트까지 확인해 줘”라고 말할 수는 있습니다. 하지만 에이전트가 실제로 테스트를 실행했는지, 실패를 어떻게 해석했는지, 결과를 기준에 맞게 보고했는지는 별개의 문제입니다.

    하네스 엔지니어링은 이 지점을 구조로 해결하려고 합니다. 예를 들면 이렇게 볼 수 있습니다.

    • 작업이 끝나면 반드시 테스트 명령을 실행하게 한다.
    • 변경된 파일과 테스트 결과를 보고 양식에 맞춰 남기게 한다.
    • 위험한 명령은 실행 전 확인 절차를 거치게 한다.
    • 너무 많은 도구를 주지 않고, 작업 목적에 맞는 도구만 제공한다.
    • 프로젝트 규칙을 문서화해 에이전트가 항상 읽을 수 있게 한다.

    이런 구조가 있으면 매번 사람이 프롬프트로 잔소리하지 않아도 됩니다. 에이전트가 그 환경 안에서 자연스럽게 올바른 절차를 따르게 됩니다.

    바이브 코딩은 바닥을 올리고, 하네스 엔지니어링은 천장을 올린다

    영상의 핵심 표현 중 하나는 “바이브 코딩은 바닥을 올리고, 에이전틱 엔지니어링은 천장을 올린다”는 말입니다.

    바이브 코딩은 개발 경험이 적은 사람도 앱을 만들 수 있게 해 주었습니다. 자연어로 요구사항을 말하면 AI가 코드를 제안하고, 화면을 만들고, 오류를 고쳐 줍니다. 이 변화는 분명히 진입 장벽을 낮췄습니다.

    하지만 진입 장벽이 낮아졌다고 해서 좋은 소프트웨어가 자동으로 만들어지는 것은 아닙니다. 실제 서비스에서는 보안, 결제, 예외 처리, 유지보수, 테스트, 배포, 사용자 경험이 모두 더 봐야 합니다.

    하네스 엔지니어링이 중요한 이유와 2026년 AI 에이전트 흐름
    출처: Jay Choi | 인디해커 라이프 유튜브 영상 캡처

    코드 생성보다 검증이 더 어려워진다

    AI가 코드를 빠르게 만드는 시대에는 “코드를 작성하는 능력”보다 “코드가 쓸 만한지 판단하는 능력”이 더 더 봐야 합니다. AI가 그럴듯한 코드를 만들 수는 있지만, 그 코드가 실제 요구사항을 만족하는지 확인하는 책임은 여전히 사람과 시스템에 남습니다.

    하네스 엔지니어링은 바로 이 검증 문제를 다룹니다. 에이전트가 작업을 완료했다고 말할 때, 그 말만 믿지 않고 실제 실행 결과와 테스트 결과를 확인하게 만드는 것입니다.

    프롬프트를 더 길게 쓰는 것으로는 부족하다

    많은 사용자는 AI 결과가 마음에 들지 않으면 프롬프트를 더 자세히 씁니다. 역할을 부여하고, 예시를 넣고, “실수하지 말라”고 지시합니다. 물론 이런 방식도 도움이 됩니다.

    하지만 매번 사람이 개입해야 한다면 한계가 있습니다. 같은 유형의 실수를 반복해서 고쳐야 하고, 작업이 길어질수록 맥락이 흐려지며, 에이전트가 실제로 무엇을 했는지 확인하기 어렵습니다.

    하네스 엔지니어링은 프롬프트보다 실행 환경을 설계하는 접근
    출처: Jay Choi | 인디해커 라이프 유튜브 영상 캡처

    좋은 프롬프트보다 좋은 작업장

    영상에서는 프로젝트 전체가 하나의 거대한 프롬프트가 된다고 설명합니다. 에이전트는 채팅창의 문장만 읽는 것이 아닙니다. 폴더 구조, 파일 이름, README, 규칙 문서, 기존 코드 스타일, 테스트 파일, 설정 파일을 모두 참고합니다.

    정리된 프로젝트에서는 에이전트도 정리된 방식으로 일할 가능성이 높습니다. 반대로 프로젝트가 어지럽고 규칙이 없으면, 에이전트도 어지러운 결과를 만들기 쉽습니다.

    그래서 하네스 엔지니어링의 첫걸음은 거창한 자동화가 아닐 수 있습니다. 오히려 프로젝트를 정리하고, 규칙을 문서화하고, 반복 작업을 스크립트로 만들고, 검증 절차를 명확히 하는 것에서 시작됩니다.

    도구는 많을수록 좋은 것이 아니다

    AI 에이전트에게 많은 도구를 연결하면 더 강력해 보입니다. 검색, 터미널, 브라우저, 파일 편집, 배포, 데이터베이스, 메신저까지 모두 붙이면 무엇이든 할 수 있을 것처럼 느껴집니다.

    하지만 실제로는 도구가 너무 많으면 에이전트가 어떤 도구를 써야 할지 판단하는 데 에너지를 씁니다. 사람도 선택지가 많을수록 결정을 미루듯, AI도 불필요한 선택지 앞에서 흔들릴 수 있습니다.

    하네스 엔지니어링에서 도구 선택과 검증 구조의 중요성
    출처: Jay Choi | 인디해커 라이프 유튜브 영상 캡처

    작업별로 좁고 정확한 도구를 준다

    좋은 하네스는 모든 도구를 한꺼번에 열어 주지 않습니다. 작업 목적에 맞춰 필요한 도구만 제공합니다.

    예를 들어 코드 리뷰 에이전트라면 파일 읽기, diff 확인, 테스트 로그 분석이 더 봐야 합니다. 반면 배포 권한이나 외부 메시지 전송 권한은 필요하지 않을 수 있습니다. 데이터 수집 에이전트라면 웹 검색과 저장 도구는 필요하지만, 운영 서버 명령 권한은 제한하는 편이 안전합니다.

    도구를 줄이는 것은 성능을 낮추는 일이 아닙니다. 오히려 에이전트가 더 빠르게 판단하고, 실수할 표면을 줄이며, 사람이 신뢰할 수 있는 결과를 만드는 방법입니다.

    하네스 엔지니어링의 실무 체크리스트

    개발자는 AI 팀 리더가 된다

    하네스 엔지니어링을 실제 업무에 적용하려면 다음 항목부터 점검해 볼 수 있습니다.

    점검 항목 질문 예시
    목표 정의 에이전트가 끝내야 할 작업이 명확한가? “로그인 오류 수정”보다 “재현 절차 확인 후 테스트 통과까지”
    도구 제한 이 작업에 꼭 필요한 도구만 열려 있는가? 코드 수정 에이전트에 배포 권한 제외
    규칙 문서 프로젝트 규칙을 에이전트가 읽을 수 있는가? README, AGENTS.md, CLAUDE.md, 테스트 가이드
    검증 루프 작업 후 자동으로 확인하는 절차가 있는가? lint, unit test, build, smoke test
    보고 형식 결과를 사람이 판단하기 쉽게 남기는가? 변경 파일, 실행 명령, 실패/성공 로그 요약
    인간 판단 AI가 결정하면 안 되는 영역이 분리되어 있는가? 결제 정책, 환불 기준, 보안 예외, UX 우선순위

    이 표에서 중요한 것은 자동화 자체가 아닙니다. AI에게 맡길 일과 사람이 판단할 일을 분리하는 것입니다.

    영상의 마지막 메시지는 강합니다. 생각은 AI에게 아웃소싱할 수 있지만, 이해는 아웃소싱할 수 없다는 것입니다.

    코드 작성, 분석, 리뷰 초안 작성은 AI가 점점 더 잘하게 됩니다. 하지만 왜 이 기능이 필요한지, 어떤 예외를 고려해야 하는지, 어떤 구조가 장기적으로 유지보수에 유리한지는 사람이 이해해야 합니다.

    하네스 엔지니어링 시대 개발자는 AI 팀 리더가 된다
    출처: Jay Choi | 인디해커 라이프 유튜브 영상 캡처

    직접 코딩하는 사람에서 작업 환경을 설계하는 사람으로

    앞으로 개발자의 역할은 “모든 코드를 직접 치는 사람”에서 “AI 에이전트 팀이 제대로 일하도록 환경을 만드는 사람”으로 이동할 가능성이 높습니다.

    이 변화는 개발자에게만 해당하지 않습니다. 기획자, 창업자, PM, 데이터 분석가도 마찬가지입니다. AI에게 일을 맡기려면 작업 기준, 검증 방법, 보고 방식, 권한 범위를 설계해야 합니다.

    결국 하네스 엔지니어링은 AI 시대의 협업 설계입니다. AI가 잘하는 실행은 AI에게 맡기되, 사람이 이해하고 책임져야 할 부분은 구조 안에 남겨 두는 방식입니다.

    결론: AI에게 “해줘”라고 말하는 시대의 다음 단계

    바이브 코딩은 많은 사람에게 만들기의 문을 열었습니다. 하지만 실제 결과물을 안정적으로 운영하려면 다음 단계가 해야 합니다. 그 단계가 하네스 엔지니어링입니다.

    좋은 하네스는 에이전트에게 자유를 주되, 방향과 경계를 함께 제공합니다. 필요한 도구만 주고, 프로젝트 규칙을 읽게 하며, 작업 후에는 테스트와 리뷰를 통과하게 만듭니다. 사람은 모든 중간 과정을 붙잡는 대신 최종 판단과 중요한 설계에 집중합니다.

    AI에게 “해줘”라고 말하는 것만으로는 충분하지 않습니다. 이제는 AI가 제대로 해낼 수 있는 환경을 설계해야 합니다. 하네스 엔지니어링은 바로 그 환경을 만드는 일입니다.

    참고자료

  • 에이전틱 엔지니어링: 안드레이 카파시가 말한 바이브 코딩 이후의 개발 방식

    에이전틱 엔지니어링: 안드레이 카파시가 말한 바이브 코딩 이후의 개발 방식

    에이전틱 엔지니어링은 바이브 코딩의 다음 단계입니다. 안드레이 카파시는 Sequoia Capital의 AI Ascent 2026 대담에서, 최신 AI 코딩 도구가 단순한 자동완성 수준을 넘어 개발자의 역할 자체를 바꾸고 있다고 설명합니다. 이제 중요한 질문은 “AI가 코드를 얼마나 빨리 쓰는가”가 아니라, “사람이 에이전트를 어떻게 지휘하고 검증할 것인가”입니다.

    에이전틱 엔지니어링 - 안드레이 카파시 대담 소개
    출처: 스테이지5 유튜브 「안드레이 카파시: 바이브 코딩에서 에이전틱 엔지니어링으로」 화면 캡처. 안드레이 카파시가 대담을 시작하는 장면입니다.

    왜 에이전틱 엔지니어링이 중요해졌나

    카파시는 자신이 “프로그래머로서 가장 뒤처진 느낌을 받았다”고 말합니다. 놀라운 말입니다. 그는 OpenAI 공동창업자였고, Tesla Autopilot 개발에도 참여한 인물입니다. 그런 개발자조차 최신 AI 코딩 도구의 변화 속도 앞에서 기존 감각이 흔들렸다고 말한 것입니다.

    2025년 말 이후의 전환점

    그가 짚은 전환점은 2025년 말입니다. 이전의 에이전트 도구는 코드 조각을 제안해 주는 보조 도구에 가까웠습니다. 사람이 자주 고쳐야 했고, 결과를 완전히 믿기는 어려웠습니다.

    하지만 어느 순간부터 최신 모델은 더 긴 코드 덩어리도 꽤 안정적으로 만들기 시작했습니다. 개발자는 직접 타이핑하는 시간을 줄이고, 요구사항을 설명하고, 결과를 검토하는 쪽으로 이동합니다. 이것이 바이브 코딩의 출발점입니다.

    Software 3.0은 무엇인가

    카파시는 이 변화를 Software 3.0이라는 개념으로 설명합니다. Software 1.0은 사람이 직접 작성한 코드입니다. Software 2.0은 데이터셋과 신경망 학습으로 만들어진 모델입니다. Software 3.0은 LLM이라는 인터프리터를 프롬프트와 컨텍스트로 조종하는 방식입니다.

    에이전틱 엔지니어링 - Software 3.0 설명
    출처: 스테이지5 유튜브 화면 캡처. Software 3.0과 프롬프트 기반 프로그래밍을 설명하는 구간입니다.

    코드는 파일에만 있지 않다

    Software 3.0에서는 코드만이 프로그램이 아닙니다. 프롬프트, 문서, 테스트, 예시, 오류 로그, 저장소 구조, 컨텍스트 윈도우까지 모두 프로그램의 일부가 됩니다. 개발자는 LLM이 해석할 수 있는 환경을 설계해야 합니다.

    이 관점에서는 “좋은 프롬프트”보다 “좋은 작업 맥락”이 더 더 봐야 합니다. 에이전트가 문제를 이해하고, 스스로 탐색하고, 실행 결과를 확인할 수 있어야 하기 때문입니다.

    바이브 코딩은 누구나 만들게 하지만, 실무는 다르다

    바이브 코딩은 아이디어를 빠르게 제품 형태로 바꾸는 방식입니다. 말로 요구사항을 설명하고, AI가 코드를 작성하게 하며, 결과물을 보면서 계속 수정합니다. 이 방식은 진입 장벽을 크게 낮춥니다.

    MenuGen 사례가 보여준 것

    카파시는 메뉴판 사진을 찍으면 음식 이미지를 붙여 보여주는 MenuGen 앱을 바이브 코딩으로 만들었습니다. 그런데 나중에는 Gemini와 이미지 생성 모델에 메뉴판 사진을 주고 바로 오버레이를 요청하는 방식이 더 자연스럽다는 점을 깨달았다고 말합니다.

    에이전틱 엔지니어링 - MenuGen 사례
    출처: 스테이지5 유튜브 화면 캡처. MenuGen 사례를 통해 기존 앱 구조가 Software 3.0 방식으로 바뀔 수 있음을 설명하는 장면입니다.

    이 사례는 중요한 질문을 던집니다. 앞으로 어떤 앱은 더 잘 만들어지는 것이 아니라, 아예 필요 없어질 수 있습니다. 사용자가 원하는 결과를 LLM과 생성 모델이 직접 만들어낸다면, 중간에 있던 많은 소프트웨어 계층이 사라질 수 있습니다.

    에이전틱 엔지니어링은 스펙과 검증의 기술이다

    카파시는 바이브 코딩과 에이전틱 엔지니어링을 구분합니다. 바이브 코딩이 빠른 구현의 감각이라면, 에이전틱 엔지니어링은 실무 시스템을 안전하게 만들기 위한 설계 방식입니다.

    사람이 여전히 책임져야 하는 영역

    AI 에이전트는 놀라운 속도로 코드를 작성하지만, 이상한 설계 실수도 합니다. 카파시는 결제 크레딧을 사용자 계정과 연결하는 예시를 듭니다. 에이전트가 Stripe 이메일과 Google 이메일을 그냥 맞춰 자금을 연결하려 했다는 것입니다.

    겉보기에는 그럴듯하지만, 실제 서비스에서는 치명적인 설계입니다. 사용자는 결제 이메일과 로그인 이메일을 다르게 쓸 수 있습니다. 이런 문제는 코드 문법이 아니라 도메인 이해, 데이터 모델, 보안, 제품 판단의 문제입니다.

    에이전틱 엔지니어링 - 바이브 코딩 이후의 실무 전환
    출처: 스테이지5 유튜브 화면 캡처. 바이브 코딩에서 에이전틱 엔지니어링으로 넘어가는 차이를 설명하는 구간입니다.

    그래서 사람은 스펙, 계획, 판단 기준, 테스트 전략을 책임져야 합니다. 에이전트는 구현을 많이 맡을 수 있지만, 무엇을 만들지와 왜 그렇게 만들어야 하는지는 사람이 설계해야 합니다.

    검증 가능한 환경이 AI 제품의 핵심 기회다

    카파시는 검증 가능성을 매우 중요하게 봅니다. 코드가 AI에 잘 맞는 이유도 여기에 있습니다. 실행해 볼 수 있고, 테스트할 수 있고, 오류 메시지를 받을 수 있습니다. 즉, 모델이 스스로 개선할 수 있는 피드백 루프가 있습니다.

    창업자는 무엇을 봐야 할까

    창업자에게 중요한 질문은 “AI로 무엇을 자동화할 수 있나”보다 더 구체적이어야 합니다. “검증 가능한 환경을 어떻게 만들 수 있나”가 핵심입니다. 정답 여부를 측정할 수 있고, 실패를 감지할 수 있으며, 개선 데이터를 쌓을 수 있는 영역이 강력한 기회가 됩니다.

    예를 들어 테스트 자동화, 보안 점검, 문서 검증, 데이터 정합성 검사, 운영 절차 자동화 같은 영역은 에이전트와 잘 맞습니다. 반대로 결과가 맞는지 판단하기 어렵고, 책임 소재가 불분명한 영역은 더 조심해야 합니다.

    AI 네이티브 개발자의 차이는 어디서 생기나

    AI 네이티브 개발자는 그냥 ChatGPT를 자주 쓰는 사람이 아닙니다. Claude Code, Codex, OpenClaw 같은 도구를 자기 작업 흐름에 맞게 세팅하고, 에이전트가 읽을 수 있는 문서와 구조를 준비합니다.

    생산성 차이는 타이핑 속도가 아니다

    이제 생산성 차이는 코드를 빨리 치는 능력에서만 나오지 않습니다. 문제를 잘게 나누는 능력, 좋은 스펙을 쓰는 능력, 테스트를 설계하는 능력, 결과물을 검증하는 능력에서 차이가 커집니다.

    카파시는 뛰어난 개발자가 AI 도구를 잡으면 10배를 넘어서는 생산성 차이가 날 수 있다고 봅니다. 이유는 간단합니다. 좋은 개발자는 에이전트가 놓치기 쉬운 맥락을 알고, 잘못된 방향을 빠르게 감지하며, 더 좋은 작업 환경을 설계할 수 있기 때문입니다.

    에이전트 퍼스트 인프라가 필요하다

    현재 많은 에이전트는 사람용 웹페이지와 설정 화면을 억지로 조작합니다. 버튼을 누르고, URL을 열고, 메뉴를 찾아갑니다. 카파시는 이런 방식이 비효율적이라고 지적합니다.

    에이전틱 엔지니어링 - 에이전트 퍼스트 인프라
    출처: 스테이지5 유튜브 화면 캡처. 에이전트가 사용하기 쉬운 인프라와 데이터 구조의 필요성을 설명하는 장면입니다.

    사람용 UI와 에이전트용 인터페이스는 다르다

    앞으로 서비스는 사람에게 보기 좋은 UI뿐 아니라, 에이전트가 이해하고 실행하기 쉬운 인터페이스를 제공해야 합니다. 명확한 API, 기계가 읽기 쉬운 문서, 구조화된 설정, 자동 검증 가능한 작업 단위가 더 봐야 합니다.

    이 변화는 개발 도구에만 국한되지 않습니다. 클라우드, 결제, 데이터베이스, 배포, 보안, 고객지원 도구까지 모두 에이전트 친화적으로 재설계될 가능성이 높습니다.

    결론: 개발자는 사라지는 것이 아니라 역할이 올라간다

    카파시의 메시지는 개발자의 종말론과 다릅니다. 그는 사람이 여전히 이해와 판단을 담당한다고 봅니다. 주의할 점은 직접 코드를 쓰는 비중은 줄고, 에이전트를 지휘하고 검증하는 비중이 커집니다.

    에이전틱 엔지니어링 시대의 개발자는 구현자이면서 동시에 감독자입니다. 좋은 개발자는 코드를 많이 쓰는 사람에서, 좋은 문제 정의와 검증 가능한 환경을 설계하는 사람으로 이동합니다.

    지금 필요한 준비는 거창하지 않습니다. 작은 프로젝트부터 에이전트에게 맡길 수 있는 작업과 사람이 직접 판단해야 하는 작업을 구분해 보아야 합니다. 그리고 문서, 테스트, 스펙, 배포 절차를 에이전트가 이해할 수 있게 정리해야 합니다. 그것이 바이브 코딩 이후의 실무 경쟁력입니다.

    FAQ

    에이전틱 엔지니어링은 바이브 코딩과 무엇이 다른가요?

    바이브 코딩은 AI와 대화하며 빠르게 구현하는 방식에 가깝습니다. 에이전틱 엔지니어링은 실무 시스템을 만들기 위해 스펙, 테스트, 보안, 검증, 운영까지 포함해 에이전트를 지휘하는 방식입니다.

    Software 3.0은 코딩을 대체한다는 뜻인가요?

    완전한 대체라기보다 코딩의 단위가 바뀐다는 뜻에 가깝습니다. 코드뿐 아니라 프롬프트, 문서, 컨텍스트, 테스트가 개발의 핵심 재료가 됩니다.

    개발자는 무엇을 준비해야 하나요?

    AI 도구 사용법만 익히는 것으로는 부족합니다. 요구사항을 명확히 쓰는 능력, 테스트를 설계하는 능력, 결과를 검증하는 능력, 에이전트가 이해하기 쉬운 문서를 만드는 능력을 함께 길러야 합니다.

    참고자료

    함께 읽으면 좋은 글

  • Anthropic이 던진 질문: 당신의 개발 조직은 AI 에이전트를 운영할 준비가 됐나

    Anthropic이 던진 질문: 당신의 개발 조직은 AI 에이전트를 운영할 준비가 됐나

    Claude Code London 2026 오프닝 장면
    출처: Claude YouTube 공식 영상 캡처. 리뷰·해설 목적의 인용 이미지입니다.

    Read in English: This article is also available in English for global readers.

    Claude Code London 2026 오프닝 키노트는 Anthropic이 지금 AI 개발 도구를 어떻게 바라보는지 보여주는 발표였다. 먼저 볼 부분은 단순하다. 과거에는 개발자가 아이디어를 코드로 옮기기까지 긴 설정과 검증 과정을 지나야 했다. 이제는 모델, 플랫폼, 개발 도구가 결합되면서 그 거리가 빠르게 짧아지고 있다.

    이번 발표는 “AI가 코드를 잘 쓴다”는 수준을 넘어선다. Anthropic은 Claude 모델의 판단력, Claude Platform의 에이전트 인프라, Claude Code의 비동기 자동화 기능을 하나의 흐름으로 묶었다. 개발자는 더 이상 한 번의 프롬프트만 잘 쓰는 사람이 아니라, AI가 반복적으로 일하고 검증하도록 작업 환경을 설계하는 사람이 되고 있다.

    Claude Code London 2026이 말한 변화의 핵심

    키노트의 첫 메시지는 개발 경험의 회귀였다. 발표자는 어린 시절 계산기와 HTML을 만지며 느꼈던 “만들면 바로 작동한다”는 감각을 이야기했다. 이후 개발은 빌드 시스템, 패키지 매니저, 설정 파일, 테스트 환경 때문에 복잡해졌다. 하지만 Claude Code London 2026은 AI 코딩 에이전트가 이 복잡성을 다시 낮추고 있다고 설명한다.

    아이디어에서 실행까지의 거리 단축

    발표에서 반복된 표현은 “gap”이다. 아이디어와 실행 사이의 간격, 모델 능력과 실제 업무 적용 사이의 간격, 개인 개발자의 작업과 조직 전체의 자동화 사이의 간격이 모두 줄어들고 있다는 뜻이다.

    Anthropic은 Spotify가 Claude Code를 활용해 대규모 저장소 마이그레이션을 처리하고, 매달 1,000개 이상의 PR을 병합하는 사례를 소개했다. 또한 Binti가 Claude API로 복지 현장의 행정 시간을 줄이고, 위탁가정 승인 과정에서 20일을 단축한 사례도 언급했다. 이 사례들은 AI 코딩 도구가 단순 생산성 도구를 넘어 실제 업무 병목을 줄이는 방향으로 이동하고 있음을 보여준다.

    선형 도입과 지수적 모델 발전의 충돌

    키노트는 모델 능력이 지수적으로 발전하지만, 조직의 AI 도입은 여전히 선형적으로 진행된다고 지적했다. 이 간격이 커질수록 개발자의 역할은 더 중요해진다. 모델이 할 수 있는 일과 실제 제품·업무 안에서 작동하는 일 사이를 연결하는 사람이 개발자이기 때문이다.

    Claude 모델 로드맵: 더 긴 작업, 더 높은 판단력

    Claude Code London 2026 Claude 모델 발전과 작업 지속 시간 설명 장면
    출처: Claude YouTube 공식 영상 캡처. 리뷰·해설 목적의 인용 이미지입니다.

    Anthropic은 Claude 모델의 발전 방향을 “더 좋은 벤치마크 점수”보다 “이전에는 못 하던 일을 할 수 있게 되는 변화”로 설명했다. 발표에서는 Opus 4.7과 Mythos preview가 언급됐고, Claude가 더 긴 작업을 유지하며 모호한 목표도 끝까지 처리하는 방향으로 이동하고 있다고 말했다.

    작업 지속 시간, 즉 task horizon의 확대

    중요한 개념은 task horizon이다. 이는 모델이 흐름을 잃지 않고 얼마나 오래 일할 수 있는지를 뜻한다. 과거 모델이 몇 분 단위 작업을 안정적으로 처리했다면, 현재는 몇 시간 동안 실행되는 에이전트가 보편화되고 있다. Anthropic은 향후 Claude가 지속적으로 실행되는 에이전트가 될 것으로 전망했다.

    예를 들어 “프로젝트 업데이트를 작성해줘”가 아니라 “이번 주 프로젝트가 계획대로 진행되게 관리해줘”라고 맡기는 식이다. “재무 전망을 만들어줘”가 아니라 “전망을 계속 갱신해서 정확하게 유지해줘”가 되는 변화다.

    스캐폴딩은 줄고, 일반 도구의 중요성은 커진다

    발표에서는 에이전트의 루프, 지시문, 도구 같은 모델 외부 구성요소를 scaffolding이라고 불렀다. 흥미로운 지점은 모델이 똑똑해질수록 과한 스캐폴딩이 오히려 방해가 될 수 있다는 설명이다. 더 강한 모델은 파일 시스템, 샌드박스 실행 환경처럼 범용적인 도구를 가지고도 더 멀리 갈 수 있다.

    개발팀 입장에서는 프롬프트를 늘리는 것보다 평가 체계와 제품 프로토타입을 더 어렵게 만드는 일이 중요해진다. 예전에는 실패하던 작업이 새 모델에서 통과되기 시작하면, 그때가 새 기능을 제품화할 신호다.

    Claude Platform: 에이전트를 제품 수준으로 운영하는 인프라

    Claude Code London 2026 Claude Managed Agents와 MCP 터널 설명 장면
    출처: Claude YouTube 공식 영상 캡처. 리뷰·해설 목적의 인용 이미지입니다.

    Claude Code London 2026의 중간 파트는 Claude Platform에 집중했다. 여기서 Anthropic은 기업이 에이전트를 실제 업무에 쓰기 어려운 이유를 두 가지로 정리했다. 첫째, 원하는 결과를 안정적으로 얻는 것이 어렵다. 둘째, 빠르게 출시하면서도 확장성과 품질을 함께 확보해야 한다.

    Advisor strategy: 고성능과 비용의 균형

    Anthropic은 advisor strategy를 소개했다. 실행은 작은 모델이 맡고, 어려운 순간에는 더 큰 모델이 조언하는 구조다. 발표에서는 Haiku 또는 Sonnet급 모델이 실행자로 일하고 Opus가 조언자로 참여하는 식의 패턴을 설명했다.

    이 구조는 고성능 모델만 계속 쓰는 방식보다 비용을 낮출 수 있다. 동시에 작은 모델이 막히는 지점에서 큰 모델의 판단을 빌릴 수 있다. 대량의 에이전트 워크로드를 운영하는 기업에게는 비용과 품질을 동시에 관리하는 현실적인 설계다.

    Claude Managed Agents, self-hosted sandbox, MCP tunnels

    또 다른 먼저 볼 부분은 Claude Managed Agents였다. Anthropic은 이를 에이전트 하네스와 운영 인프라가 결합된 형태로 설명했다. 발표에서는 self-hosted sandbox와 MCP tunnels가 새 기능으로 소개됐다.

    self-hosted sandbox는 에이전트가 코드를 실행할 때 Anthropic의 기본 샌드박스 대신 기업이 관리하는 서버나 클라우드 환경을 사용할 수 있게 한다. MCP tunnels는 내부 네트워크 뒤에 있는 MCP 서버를 외부에 직접 노출하지 않고 Claude Managed Agents가 접근할 수 있게 해준다. 보안과 내부 시스템 연동이 중요한 기업에게 특히 중요한 변화다.

    Claude Code: 프롬프트하는 개발자에서 자동화를 설계하는 개발자로

    Claude Code London 2026 Claude Code와 개발자 생산성 사례 설명 장면
    출처: Claude YouTube 공식 영상 캡처. 리뷰·해설 목적의 인용 이미지입니다.

    후반부는 Claude Code의 변화에 초점을 맞췄다. 발표자는 CLI, IDE, 데스크톱 앱, 클라우드 에이전트 뷰가 서로 다른 개발자 작업 방식을 지원한다고 설명했다. 특히 여러 Claude Code 세션을 동시에 운영하는 “multi-clauding” 흐름이 강조됐다.

    비동기 코딩과 검증의 중요성

    Claude Code가 그냥 코드를 작성하는 도구라면 개발자는 모든 변경을 실시간으로 감시해야 한다. 하지만 발표의 방향은 다르다. Claude가 테스트하고, 브라우저에서 동작을 확인하고, 실패 원인을 추적한 뒤 다시 수정하는 흐름을 보여줬다.

    이 지점에서 검증은 핵심 기능이 된다. AI가 스스로 작업을 확인할 수 있으면 개발자는 에이전트를 실행해 두고 다른 일을 할 수 있다. 결과적으로 동기식 페어 프로그래밍보다 비동기식 작업 위임의 비중이 커진다.

    Routines: Claude가 Claude Code를 프롬프트하는 구조

    Claude Code London 2026 Claude Code Routines와 자동화 설명 장면
    출처: Claude YouTube 공식 영상 캡처. 리뷰·해설 목적의 인용 이미지입니다.

    가장 상징적인 기능은 Routines였다. 발표자는 이를 “higher order prompt”라고 설명했다. 개발자가 매번 Claude Code에 작업을 지시하는 것이 아니라, 특정 조건이나 일정에 따라 Claude Code가 자동으로 실행되도록 루틴을 만든다는 뜻이다.

    예를 들어 GitHub 이슈가 새로 생기면 루틴이 이를 감지하고 작업 세션을 시작한다. CI가 실패하면 autofix가 원인을 분석하고 수정한다. 코드 리뷰나 보안 리뷰 코멘트도 자동으로 처리 대상이 된다. 발표자는 “기본값이 ‘내가 Claude Code를 프롬프트한다’에서 ‘Claude가 Claude Code를 프롬프트하게 한다’로 바뀌고 있다”고 정리했다.

    개발자와 기업이 지금 준비해야 할 것

    Claude Code London 2026의 메시지는 낙관적이지만, 무작정 AI 도구를 붙이라는 이야기는 아니다. 오히려 모델 업그레이드를 흡수할 수 있는 구조를 미리 만들어야 한다는 조언에 가깝다.

    평가와 아키텍처를 먼저 준비해야 한다

    모델 성능은 계속 바뀐다. 그래서 오늘 되는 작업만 기준으로 제품을 설계하면 다음 모델의 능력을 제대로 활용하기 어렵다. 개발팀은 평가 자동화, 회귀 테스트, 에이전트 권한 설계, 샌드박스 정책을 함께 준비해야 한다.

    특히 기업 환경에서는 내부 도구 접근 권한, 코드 실행 범위, 감사 로그, 보안 리뷰가 중요하다. Claude Managed Agents의 self-hosted sandbox와 MCP tunnels가 강조된 이유도 여기에 있다.

    AI 코딩 도구는 개인 생산성에서 조직 운영으로 이동한다

    발표에서 Shopify, Mercado Libre 같은 조직 사례가 언급된 것도 의미가 있다. AI 코딩은 개인 개발자의 자동완성 경험에서 출발했지만, 이제는 조직의 PR 처리, 기술부채 정리, CI 대응, 보안 점검까지 넓어지고 있다.

    국내 기업도 이 흐름을 그냥 “개발자가 편해지는 도구”로만 보면 부족하다. 실제 경쟁력은 에이전트가 안전하게 반복 작업을 맡고, 사람은 우선순위와 품질 판단에 집중하는 운영 구조에서 나온다.

    Claude Code London 2026 요약 체크리스트

    구분 발표 내용 실무적 의미
    모델 Claude의 작업 지속 시간과 판단력 확대 긴 업무를 맡길 수 있는 에이전트 설계 필요
    플랫폼 Managed Agents, advisor strategy, MCP tunnels 비용·보안·확장성을 고려한 운영 구조 필요
    개발 도구 Claude Code Desktop, Agent View, Routines 비동기 코딩과 다중 에이전트 관리가 중요
    조직 적용 PR 자동화, CI autofix, 기술부채 정리 개인 생산성을 넘어 엔지니어링 운영 자동화로 확장
    준비 과제 평가 자동화와 권한 설계 모델 업그레이드를 빠르게 흡수하는 아키텍처 필요

    결론: AI 개발 도구의 다음 단계는 ‘대화’보다 ‘운영’이다

    Claude Code London 2026 키노트의 먼저 볼 부분은 AI와 대화하는 경험이 끝났다는 뜻이 아니다. 대화는 여전히 시작점이다. 주의할 점은 다음 단계는 대화를 반복 가능한 운영 구조로 바꾸는 일이다.

    개발자는 좋은 프롬프트를 쓰는 사람에서 좋은 루틴, 평가, 권한, 샌드박스를 설계하는 사람으로 이동하고 있다. 기업은 AI 도구를 도입하는 수준을 넘어, 모델 능력이 올라갈 때마다 업무 방식도 함께 업데이트할 수 있는 구조를 만들어야 한다.

    이번 키노트는 Anthropic의 제품 발표이면서 동시에 개발 조직을 향한 질문이다. “모델은 이미 더 오래, 더 복잡한 일을 하기 시작했다. 당신의 개발 환경은 그 능력을 받아들일 준비가 되어 있는가?”

    FAQ

    Claude Code London 2026에서 가장 중요한 발표는 무엇인가요?

    가장 중요한 메시지는 Claude 모델, Claude Platform, Claude Code가 하나의 에이전트 실행 환경으로 연결되고 있다는 점입니다. 특히 Routines, Claude Managed Agents, MCP tunnels는 AI 코딩이 개인 도구에서 조직 운영 도구로 확장되고 있음을 보입니다.

    Routines는 일반 자동화와 무엇이 다른가요?

    일반 자동화는 정해진 스크립트를 반복 실행하는 경우가 많습니다. Routines는 Claude Code가 특정 이벤트나 일정에 따라 작업을 시작하고, 상황을 해석하며, 필요한 코딩 작업을 수행하도록 만드는 구조에 가깝습니다.

    국내 개발팀은 무엇부터 준비해야 하나요?

    먼저 AI가 작업해도 되는 범위, 코드 실행 환경, 검증 기준, 보안 정책을 정해야 합니다. 이후 반복적인 PR 처리, 테스트 실패 대응, 문서 업데이트, 기술부채 정리처럼 결과를 검증하기 쉬운 작업부터 적용하는 것이 현실적입니다.

    참고자료

    함께 읽으면 좋은 글