[태그:] 휴머노이드

  • AI 에이전트와 피지컬 AI, 이제 ‘행동하는 AI’가 온다

    AI 에이전트와 피지컬 AI, 이제 ‘행동하는 AI’가 온다

    AI가 빨라졌다는 말은 이제 너무 익숙합니다. 하지만 최근 변화의 핵심은 “더 똑똑한 답변을 한다”가 아닙니다. AI가 스마트폰, 노트북, 로봇, 안경, 주방 기계, 콘텐츠 편집 도구 안으로 들어가 실제 행동을 대신하기 시작했다는 점입니다.

    와이스트릿 영상에서 김은석 작가는 Figure 휴머노이드, 구글 AI 에이전트, 중국 영상 AI, 로봇 마라톤, AI 의료 보조, Canva 매직 레이어, 스마트 글래스 사례를 통해 이 변화를 설명합니다. 여러 사례가 흩어져 보이지만, 한 문장으로 정리하면 이렇습니다.

    AI는 이제 ‘말하는 도구’에서 ‘상황을 보고, 판단하고, 실행하는 도구’로 이동하고 있습니다.

    이 변화는 개인의 생산성뿐 아니라 일자리, 콘텐츠 제작, 교육, 자영업, 제조업까지 연결됩니다.

    AI 에이전트와 피지컬 AI 변화를 설명하는 와이스트릿 영상 도입 장면

    출처: 와이스트릿 유튜브 「AI 한 달 만에 또 말도 안 되는 발전 속도 벌써 현실이 됐습니다 / 김은석 작가 풀버전」 화면 캡처. 리뷰와 설명 목적으로 사용했습니다.

    AI 에이전트는 앱을 대신 열어 주는 비서가 된다

    영상에서 가장 먼저 눈에 띄는 흐름은 구글 AI 에이전트입니다. 예전에는 사용자가 직접 앱을 열고 검색하고 결제하고 일정을 등록해야 했습니다. 콘서트에 가려면 포스터를 보고, 검색창에 공연 정보를 찾고, 예매 사이트에 들어가 좌석을 고르고, 결제까지 해야 했습니다.

    하지만 구글이 보여 준 방향은 다릅니다. AI가 대화의 맥락을 이해합니다. 친구와 “이 콘서트 같이 갈래?”라고 이야기하면, AI가 공연 일정과 티켓 예매 가능성을 확인하고, 결제 단계까지 연결해 줍니다. 데이트 약속 중 “언제 도착해?”라는 메시지가 오면 지도와 현재 이동 상황을 연결해 예상 도착 시간을 제안합니다.

    구글 AI 에이전트와 개인 비서 기능을 설명하는 장면

    핵심은 AI가 단순히 질문에 답하는 것이 아니라는 점입니다. 사용자가 하려는 일을 추론하고, 필요한 앱과 서비스를 묶어 다음 행동을 제안합니다.

    이런 변화가 본격화되면 스마트폰 사용 방식도 달라집니다. 지금은 사람이 앱을 찾아 들어갑니다. 앞으로는 AI가 상황을 읽고 필요한 기능을 앞으로 가져올 가능성이 큽니다.

    비슷한 흐름은 이전에 정리한 AI agent 변화: OpenClaw가 보여주는 실행형 AI의 다음 단계에서도 확인할 수 있습니다. 챗봇이 답변하는 단계를 넘어 브라우저, 도구, 메모리, 보안까지 연결되는 실행형 AI 구조가 중요해지고 있습니다.

    피지컬 AI는 로봇을 ‘깡통 기계’에서 ‘판단하는 노동자’로 바꾼다

    영상 초반에 소개된 Figure 휴머노이드 사례는 피지컬 AI의 방향을 잘 보여 줍니다. 피지컬 AI는 말 그대로 물리적 세계에서 움직이는 AI입니다. 챗봇이 텍스트 안에서 답을 만든다면, 피지컬 AI는 로봇 몸을 통해 물건을 집고, 분류하고, 청소하고, 이동합니다.

    Figure 로봇은 택배 분류 작업을 수행합니다. 단순히 팔을 반복해서 움직이는 수준이 아니라, 송장의 방향과 물건의 위치를 인식하고 분류 작업을 이어 갑니다. 더 중요한 것은 교대 구조입니다. 한 로봇이 충전하러 가면 다른 로봇이 이어받아 24시간 운영될 수 있습니다.

    사람이 더 빠를 수 있는 순간은 있습니다. 그러나 장시간 반복 업무에서는 휴식, 식사, 피로, 교대 비용이 발생합니다. 로봇은 속도가 조금 느려도 지속 시간이 길어지면 효율성이 달라집니다.

    또 하나 중요한 점은 로봇 두뇌입니다. 영상에서는 Figure의 Helix, 구글 딥마인드가 결합된 보스턴다이내믹스 Spot 사례도 언급됩니다. 로봇이 문을 보고 “문이 열려 있다”는 상황을 이해하고, 계기판을 읽고, 화이트보드에 적힌 할 일을 수행하는 방향입니다.

    이제 경쟁은 로봇의 팔과 다리만이 아닙니다. 하드웨어, 배터리, 센서, 로봇 두뇌, 부품 생태계가 함께 경쟁합니다.

    중국의 로봇·영상 AI 생태계는 속도로 압박한다

    영상 중반부에서는 중국 AI와 로봇 생태계가 여러 번 등장합니다. 비두의 영상 생성 모델, 바이트댄스 계열 영상 AI, 유니트리 로봇, 로봇 마라톤, 로봇 손 부품 시장 등이 사례입니다.

    중국 영상 생성 AI와 로봇 생태계 경쟁을 설명하는 장면

    여기서 주목할 점은 “중국 기술이 좋다”는 단순 평가가 아닙니다. 더 중요한 것은 속도와 생태계입니다. 영상에서는 로봇 마라톤에서 넘어지고 부서지는 장면까지 공개하는 문화가 언급됩니다. 실패를 숨기기보다 드러내고, 다음 버전에서 얼마나 개선됐는지 보여 주는 방식입니다.

    로봇 손 전문 기업만 수십 개가 있고, 관절·손·센서 같은 부품을 모듈처럼 조달할 수 있는 시장이 만들어지면 개발 속도는 빨라집니다. 휴머노이드 전체를 한 회사가 모두 만들지 않아도, 부품 생태계가 성장하면 조립과 커스터마이징이 쉬워집니다.

    한국 제조업에도 시사점이 있습니다. 완제품 로봇만 바라볼 필요는 없습니다. 로봇 손, 관절, 센서, 배터리, 정밀 가공, 산업용 소프트웨어처럼 특정 부품과 공정에서 기회가 생길 수 있습니다.

    콘텐츠 제작은 ‘기술자’보다 ‘아이디어를 가진 사람’에게 유리해진다

    영상 후반부는 콘텐츠와 디자인 도구의 변화를 다룹니다. AI가 영상 후킹을 예측하고, 영화 명장면에 새로운 인물을 합성하고, 김홍도 그림을 영상처럼 움직이게 만드는 사례가 나옵니다.

    과거에는 이런 작업에 촬영팀, 배우, 세트, CG, 편집 인력이 필요했습니다. 이제는 기존 영상과 몇 줄의 프롬프트만으로 비슷한 결과를 만들 수 있는 방향으로 가고 있습니다.

    그렇다고 인간의 역할이 사라지는 것은 아닙니다. 영상에서도 강조되듯 아직 중요한 것은 기획입니다. 어떤 장면을 고를지, 어떤 문화적 맥락을 붙일지, 무엇을 웃음 포인트로 만들지, 어떤 메시지를 전달할지는 여전히 사람의 판단이 필요합니다.

    다만 실행 비용은 급격히 낮아집니다. 그래서 앞으로 콘텐츠 경쟁력은 “툴을 다룰 줄 아는가”보다 “어떤 관점과 아이디어를 갖고 있는가”로 더 이동할 가능성이 큽니다.

    이 지점은 AI 시대의 승자는 무엇을 준비할까?에서 다룬 변화 대응력과도 연결됩니다. 도구 자체보다 문제를 정의하고, 판단하고, 실행으로 옮기는 역량이 더 중요해지고 있습니다.

    의료·디자인·주방 업무에서도 AI는 보조자 역할을 넓힌다

    의료 영역에서는 AI 코클리니션이 소개됩니다. 여기서 중요한 표현은 ‘코(co)’입니다. 의사를 대체한다기보다 환자와 의사 사이에서 정보를 정리하는 보조자에 가깝습니다.

    의료와 디자인 영역으로 확장되는 AI 활용 사례 설명 장면

    환자는 병원에 가기 전 증상과 질문을 정리할 수 있고, 진료 후에는 의사의 설명을 다시 확인할 수 있습니다. 실제 의료 판단은 전문가가 하더라도, AI가 정보 정리와 기억 보조를 맡으면 환자의 이해도는 높아질 수 있습니다.

    디자인에서는 Canva의 매직 레이어 같은 기능이 언급됩니다. 복잡한 이미지에서 요소를 분리해 텍스트, 인물, 배경을 따로 편집할 수 있다면 비전문가도 디자인 수정이 쉬워집니다.

    주방 자동화도 흥미롭습니다. 웍질, 고기 굽기, 마이야르 반응처럼 숙련자의 감에 의존하던 부분이 데이터화되고 있습니다. 로봇이 표면 온도와 색을 보고 적절한 시점에 고기를 뒤집는다면, 일정한 맛을 반복 생산할 수 있습니다. 자영업자 입장에서는 인건비와 품질 균일성 측면에서 새로운 선택지가 생깁니다.

    스마트 글래스와 AI 시험 부정행위는 교육의 변화를 요구한다

    마지막 사례는 스마트 글래스입니다. 메타 스마트 글래스처럼 카메라와 AI가 결합된 장치는 사용자가 보는 것을 AI가 함께 인식하게 만듭니다. 음식 사진을 보고 칼로리를 추정하거나, 손동작을 인식해 입력을 보조하는 식입니다.

    스마트 글래스와 AI 글래스 활용 사례를 설명하는 장면

    하지만 중국에서 AI 글래스를 이용한 시험 부정행위 논란도 소개됩니다. 문제를 보면 AI가 답을 알려 줄 수 있는 환경에서는, 단순 암기형 시험의 신뢰성이 흔들립니다.

    이 문제는 “기술을 금지하자”만으로 해결하기 어렵습니다. 계산기, 인터넷, 검색, 챗GPT가 그랬듯 도구는 계속 들어옵니다. 그렇다면 교육은 암기 확인에서 토론, 발표, 적용, 구현, 비판적 사고 평가로 이동해야 합니다. AI를 못 쓰게 하는 시험과 AI를 잘 쓰게 하는 교육 사이에서 균형을 찾아야 합니다.

    지금 확인해야 할 세 가지 변화

    첫째, AI 에이전트는 앱 사용 방식을 바꿉니다. 검색·예약·결제·일정·지도 같은 기능이 대화 속에서 연결됩니다.

    둘째, 피지컬 AI는 로봇 산업을 다시 보게 만듭니다. 로봇은 더 이상 정해진 동작만 반복하는 장비가 아니라, 주변을 보고 판단하는 노동·돌봄·보조 인프라가 될 수 있습니다.

    셋째, AI 도구는 콘텐츠와 업무의 실행 비용을 낮춥니다. 하지만 그만큼 기획력, 윤리 기준, 교육 방식, 일자리 전환 논의가 더 중요해집니다.

    관련해서 AI와 일의 미래는 일자리 대체보다 먼저 봐야 할 일의 의미와 커리어 전략을 다룹니다. 개발·업무 자동화 관점에서는 에이전틱 엔지니어링 글도 함께 보면 흐름을 이해하기 쉽습니다.

    마무리: 놀라움은 곧 일상이 된다

    영상의 마지막 메시지는 분명합니다. 지금은 놀라운 기술처럼 보이지만, 시간이 지나면 당연한 일상이 됩니다. 로봇 커피가 처음에는 신기했지만 이제는 크게 놀라지 않는 것처럼, AI 에이전트와 피지컬 AI도 비슷한 과정을 거칠 가능성이 큽니다.

    중요한 것은 모든 신기술을 무조건 따라가는 것이 아닙니다. 내 일과 생활에서 어떤 부분이 자동화될 수 있는지, 어떤 역량을 더 키워야 하는지, 어떤 윤리적 기준을 세워야 하는지를 미리 생각하는 것입니다.

    AI가 답을 잘하는 시대는 이미 시작됐습니다. 이제는 AI가 행동하는 시대를 준비해야 합니다.

    원본 영상은 와이스트릿의 AI 한 달 만에 또 말도 안 되는 발전 속도 벌써 현실이 됐습니다 / 김은석 작가 풀버전에서 확인할 수 있습니다.

    FAQ

    AI 에이전트는 기존 챗봇과 무엇이 다른가요?

    챗봇은 주로 질문에 답합니다. AI 에이전트는 사용자의 의도를 파악하고 검색, 예약, 결제, 일정 등록처럼 여러 행동을 연결해 수행하거나 제안하는 방향으로 발전하고 있습니다.

    피지컬 AI란 무엇인가요?

    피지컬 AI는 물리적 세계에서 작동하는 AI를 말합니다. 로봇이 카메라와 센서로 주변을 인식하고, 물건을 집거나 이동하거나 작업을 수행하는 형태가 대표적입니다.

    휴머노이드 로봇은 바로 일자리를 대체할까요?

    모든 일자리를 단기간에 대체한다고 보기는 어렵습니다. 다만 반복 작업, 위험 작업, 장시간 운영이 필요한 업무에서는 로봇 도입 압력이 커질 수 있습니다.

    AI 영상 제작 도구가 많아지면 사람 크리에이터의 역할은 줄어드나요?

    실행 비용은 줄어들지만 기획, 맥락, 취향, 편집 판단의 중요성은 더 커질 수 있습니다. 도구를 잘 쓰는 사람보다 좋은 아이디어를 빠르게 구현하는 사람이 유리해질 가능성이 큽니다.

    AI 글래스가 보급되면 교육은 어떻게 바뀌어야 하나요?

    단순 암기형 평가는 점점 취약해질 수 있습니다. 토론, 발표, 문제 해결 과정, 실제 구현, AI 도구 활용 능력을 함께 평가하는 방식으로 이동할 필요가 있습니다.