AI News

Google의 Gemini 진화: 안드로이드에 자율 작업 실행 도입

모바일 인공지능의 획기적인 순간(watershed moment)으로, Google은 이제 Gemini AI 어시스턴트가 안드로이드(Android) 기기에서 복잡하고 여러 단계로 이루어진 작업을 자율적으로 실행할 수 있다고 공식 발표했습니다. 2026년 2월 25일에 공개된 이 주요 업데이트는 모바일 AI가 수동적인 정보 검색에서 능동적인 "에이전트(Agentic)" 참여로 전환됨을 의미합니다. 음식 배달 주문 및 차량 호출 서비스의 엔드 투 엔드(end-to-end) 처리를 포함하는 새로운 기능은 광범위한 출시에 앞서 새로 출시된 삼성 갤럭시(Samsung Galaxy) S26 시리즈와 Google의 자체 픽셀(Pixel) 10 라인업에서 초기 프리뷰로 독점 데뷔할 예정입니다.

이러한 발전은 Google의 "프로젝트 자비스(Project Jarvis)" 및 "프로젝트 아스트라(Project Astra)" 이니셔티브의 정점으로, 진정으로 도움이 되고 능동적인 디지털 에이전트를 소비자들의 주머니 속에 제공하겠다는 약속을 마침내 실현한 것입니다. Gemini는 고급 시각 처리 및 심층 운영 체제 통합을 활용하여 인간 사용자와 매우 유사하게 서드파티 애플리케이션 인터페이스를 탐색할 수 있으며, 의도와 행동 사이의 격차를 효과적으로 메웁니다.

챗봇에서 에이전트로: "에이전트(Agentic)"로의 전환

수년 동안 업계는 단순히 "아는 것"이 아니라 "실행하는" AI를 약속해 왔습니다. 이번 업데이트를 통해 Google은 그 약속을 이행하고 있습니다. 새로운 기능을 통해 사용자는 "DoorDash에서 평소 먹던 금요일 밤 저녁 식사를 주문해줘" 또는 "공항까지 갈 두 명분 차량을 예약해줘"와 같이 광범위하고 높은 수준의 명령을 내릴 수 있습니다.

단순히 앱을 열거나 링크를 제공하는 대신, Gemini는 이제 다음 작업을 자율적으로 수행합니다:

  1. 앱 실행 및 탐색: 보안이 유지되는 백그라운드 가상 창에서 관련 애플리케이션(예: Uber, GrubHub 또는 DoorDash)을 엽니다.
  2. 맥락적 상호작용: 컴퓨터 비전과 화면 분석을 사용하여 버튼, 메뉴 및 텍스트 필드를 식별합니다.
  3. 의사 결정: 사용자 기록이나 특정 음성 지침을 기반으로 항목을 선택하고, 결제 흐름을 탐색하며, 결제 수단을 선택합니다.
  4. 인간 확인: 결정적으로, 최종 확인 화면에서 일시 중지하여 사용자에게 최종 "승인" 탭을 위한 요약 알림을 제시함으로써 승인되지 않은 거래가 발생하지 않도록 보장합니다.

이 "휴먼 인 더 루프(Human-in-the-loop)" 설계 철학은 에이전트 AI(Agentic AI)를 둘러싼 주요 우려 사항인 통제력 상실 문제를 해결합니다. 지루한 탐색은 처리하면서 최종 결정권은 사용자에게 남겨둠으로써, Google은 편의성과 보안 사이의 균형을 유지합니다.

삼성 갤럭시 S26 및 픽셀 10: 출시의 주역

Google과 삼성의 전략적 파트너십은 계속 심화되고 있으며, 갤럭시 S26 시리즈는 이러한 고급 기능의 주요 출시 수단 역할을 합니다. 삼성 언팩(Samsung Unpacked) 2026 행사에서 경영진은 갤럭시 S26의 NPU(Neural Processing Unit)가 Gemini의 클라우드 기반 추론과 협력하여 최소한의 지연 시간으로 실시간 앱 탐색을 처리하는 통합의 유연성을 시연했습니다.

Google 대변인은 "이것은 단순한 앱 업데이트가 아니라 운영 체제가 사용자를 지원하는 방식에 대한 근본적인 재구상입니다"라며, "삼성의 뛰어난 하드웨어와 당사의 Gemini 3.0 Pro 모델을 결합함으로써 기존 앱 생태계 위에 자리 잡은 'AI OS' 계층을 구축하고 있습니다"라고 밝혔습니다.

이 기능은 픽셀 10에서도 동시에 출시되지만, 갤럭시 S26에 대한 강조는 에이전트 행동의 주류 채택을 이끌기 위해 삼성의 방대한 사용자 기반에 의존하는 Google의 전략을 잘 보여줍니다.

기술적 분석: 작동 원리

이러한 혁신의 근간이 되는 기술은 거대 행동 모델(Large Action Models, LAMs)과 비주얼 그라운딩(Visual Grounding)의 결합에 의존합니다. 개발자가 AI를 위한 특정 "후크(hooks)"를 구축해야 하는 기존 API 통합과 달리, Gemini의 새로운 기능은 시각 우선(visual-first) 방식입니다. 즉, 화면을 "봅니다".

"가상 창(Virtual Window)" 아키텍처:
AI가 사용자의 활성 화면을 가로채는 것을 방지하기 위해 자동화는 백그라운드에서 실행되는 샌드박스 환경인 "가상 창"에서 발생합니다. 사용자는 Gemini가 보이지 않게 Uber 앱을 탐색하는 동안 Instagram을 계속 스크롤하거나 이메일을 확인할 수 있습니다. 화면 상단의 다이내믹 알림 아일랜드는 사용자에게 에이전트의 진행 상황(예: "차량 선택 중...", "장바구니 검토 중...")을 계속 알려줍니다.

지원 서비스:
출시 시점에 다단계 자동화는 주로 온디맨드 경제 분야의 일부 고빈도 앱에 최적화되어 있습니다:

  • 차량 호출: Uber, Lyft
  • 음식 배달: DoorDash, GrubHub, Uber Eats
  • 식료품: Instacart (베타)

Google은 2026년 3분기까지 이 호환성을 여행 예약 및 캘린더 관리로 확장하겠다고 약속했습니다.

개인정보 보호 및 보안 영향

자신의 앱 제어권과 구매력을 AI에게 넘겨주는 데는 막대한 신뢰가 필요합니다. Google은 위험을 완화하기 위해 여러 보안 계층을 구현했습니다. "가상 창"은 나머지 OS와 격리되어 AI가 당면한 특정 작업 이외의 데이터에 접근하는 것을 방지합니다. 또한, AI는 사용자의 명시적인 생체 인식 인증(지문 또는 얼굴 인식) 없이는 결제를 완료할 수 없습니다.

그러나 비판론자들은 이러한 시각적 접근 방식이 사용자의 비공개 앱 스크린샷을 분석하는 AI를 수반한다고 지적합니다. Google은 고급 로컬 처리 기능 덕분에 갤럭시 S26 및 픽셀 10의 경우 이 처리가 주로 온디바이스(on-device)에서 수행되며, 익명화된 행동 토큰만 클라우드에서 확인된다고 보장합니다.

경쟁 환경: "슈퍼 에이전트"를 향한 경주

이번 발표로 Google은 소비자용 에이전트 AI를 배포하기 위한 경쟁에서 경쟁자들보다 확실히 앞서 나가게 되었습니다. OpenAI가 데스크톱 모델에서 유사한 "컴퓨터 사용" 기능을 시연했지만, 모바일 구현은 아직 초기 단계에 머물러 있습니다. 마찬가지로 Apple의 애플 인텔리전스(Apple Intelligence)는 개발자의 채택이 필요한 API(App Intents)를 통한 심층 Siri 통합에 집중해 왔습니다. Google의 시각적 접근 방식을 사용하면 개발자별 업데이트가 필요하지 않아 잠재적으로 더 넓은 범위의 레거시 앱과 더 빠르게 호환될 수 있습니다.

비교: 전통적인 어시스턴트 vs 에이전트 Gemini

이러한 변화의 규모를 이해하기 위해 이전 세대 어시스턴트와 새로운 에이전트 Gemini의 워크플로우를 비교해 볼 수 있습니다.

기능 비교: 워크플로우 효율성

작업 전통적인 음성 어시스턴트 (2024) 에이전트 Gemini (2026)
명령 "Thai Spice에서 음식 주문해줘" "DoorDash의 Thai Spice에서 평소 먹던 팟타이 주문해줘."
작업 DoorDash 앱을 열거나 Google 검색을 수행합니다. 백그라운드에서 DoorDash를 열고 메뉴를 탐색하며 장바구니에 항목을 추가합니다.
사용자 노력 높음: 사용자가 수동으로 스크롤하고 항목을 선택하고 결제해야 합니다. 낮음: 사용자는 알림을 기다리고 요약을 검토한 후 "확인"을 누릅니다.
상호작용성 음성-텍스트 변환만 가능합니다. 시각적 탐색, 버튼 클릭, 양식 작성이 가능합니다.
멀티태스킹 상호작용 중에 화면을 차단합니다. 백그라운드에서 실행되며 사용자는 다른 작업을 계속할 수 있습니다.
결제 사용자가 앱 내에서 수동으로 인증합니다. 사전에 준비된 장바구니를 생체 인식으로 승인합니다.

향후 전망

2026년이 지나면서 "스마트폰"의 정의는 "지능형 동반자"로 바뀌고 있습니다. 저녁 식사를 주문하거나 차량을 호출하는 것과 같은 일상적인 물류를 자동화하는 Gemini의 능력은 단지 시작에 불과합니다. 업계 분석가들은 올해 말까지 이 기술이 "데이트 밤 계획해줘"와 같은 복잡한 앱 간 워크플로우로 확장될 것이라고 예측합니다. 이 경우 AI는 OpenTable을 통해 식당 테이블을 자율적으로 예약하고, Fandango를 통해 영화 티켓을 구매하며, 시간에 맞춰 이동할 차량을 예약하게 될 것입니다.

현재 갤럭시 S26 및 픽셀 10을 사용하는 안드로이드 사용자들은 사용자가 전화를 위해 일하는 것이 아니라 전화가 사용자를 위해 일하는 미래를 가장 먼저 맛보고 있습니다.

추천
ThumbnailCreator.com
AI 기반 도구로 빠르고 쉽게 멋지고 전문적인 YouTube 썸네일을 제작하세요.
Video Watermark Remover
AI Video Watermark Remover – Clean Sora 2 & Any Video Watermarks!
AirMusic
AirMusic.ai는 텍스트 프롬프트로부터 스타일·무드 커스터마이즈와 스템(stems) 내보내기를 지원하는 고품질 AI 음악 트랙을 생성합니다.
AdsCreator.com
어떤 웹사이트 URL에서든 Meta, Google 및 Stories용 브랜드 일치형 고급 광고 크리에이티브를 즉시 생성합니다.
Refly.ai
Refly.AI는 비기술 창작자가 자연어와 시각적 캔버스를 사용해 워크플로를 자동화할 수 있도록 지원합니다.
VoxDeck
시각 혁명을 선도하는 AI 프레젠테이션 제작기
BGRemover
SharkFoto BGRemover를 사용하여 온라인에서 이미지 배경을 쉽게 제거하세요.
FineVoice
텍스트를 감정으로 바꾸세요 — 몇 초 만에 표현력 있는 AI 보이스를 복제하고 디자인하며 생성하세요.
Qoder
Qoder는 소프트웨어 프로젝트의 계획, 코딩 및 테스트를 자동화하는 AI 기반 코딩 어시스턴트입니다.
Skywork.ai
Skywork AI는 AI를 사용하여 생산성을 향상시키기 위한 혁신적인 도구입니다.
Flowith
Flowith는 무료 🍌Nano Banana Pro 및 기타 효과적인 모델을 제공하는 캔버스 기반 에이전트 워크스페이스입니다...
FixArt AI
FixArt AI는 가입 없이 이미지 및 동영상 생성을 위한 무료·무제한 AI 도구를 제공합니다.
Elser AI
텍스트와 이미지를 애니메 스타일 아트, 캐릭터, 음성 및 단편 영화로 변환하는 올인원 웹 스튜디오입니다.
Pippit
Pippit의 강력한 AI 도구로 콘텐츠 제작을 향상시키세요!
SharkFoto
SharkFoto는 영상, 이미지, 음악을 효율적으로 제작 및 편집할 수 있는 올인원 AI 기반 플랫폼입니다.
Funy AI
상상을 영상으로! 이미지나 텍스트로 AI 비키니, 키스 영상을 만드세요. AI 옷 체인저 기능도 체험해보세요. 가입 없이 무료!
KiloClaw
호스티드 OpenClaw 에이전트: 원클릭 배포, 500개 이상의 모델, 보안 인프라 및 팀과 개발자를 위한 자동화된 에이전트 관리.
Diagrimo
Diagrimo는 텍스트를 즉시 맞춤형 AI 생성 다이어그램 및 시각 자료로 변환합니다.
SuperMaker AI Video Generator
SuperMaker와 함께 멋진 동영상, 음악 및 이미지를 손쉽게 만들 수 있습니다.
AI Clothes Changer by SharkFoto
SharkFoto의 AI Clothes Changer는 사실적인 핏, 질감 및 조명으로 의상을 즉시 가상으로 착용해볼 수 있게 해줍니다.
Yollo AI
AI 파트너와 대화하고 창작하세요. 이미지 투 비디오(Img2Vid), AI 이미지 생성 기능.
AnimeShorts
최첨단 AI 기술로 놀라운 애니메이션 짧은 영상을 쉽게 만드세요.
Anijam AI
Anijam은 아이디어를 에이전트형 비디오 제작을 통해 세련된 스토리로 바꾸는 AI 네이티브 애니메이션 플랫폼입니다.
HappyHorseAIStudio
텍스트, 이미지, 참고자료, 비디오 편집을 위한 브라우저 기반 AI 비디오 생성기.
InstantChapters
Instant Chapters로 책의 매력적인 장을 즉시 생성하세요.
NerdyTips
전 세계 리그의 경기 팁을 데이터 기반으로 제공하는 AI 축구 예측 플랫폼입니다.
insmelo AI Music Generator
프롬프트, 가사 또는 업로드된 파일을 약 1분 내에 다듬어진 로열티 프리 곡으로 바꿔주는 AI 기반 음악 생성기입니다.
WhatsApp AI Sales
WABot은 실시간 스크립트, 번역 및 의도 감지를 제공하는 WhatsApp AI 영업 코파일럿입니다.
happy horse AI
텍스트나 이미지로부터 동기화된 비디오와 오디오를 생성하는 오픈소스 AI 비디오 생성기입니다.
AI Video API: Seedance 2.0 Here
하나의 키로 최상위 생성 모델을 더 낮은 비용으로 제공하는 통합 AI 비디오 API입니다.
wan 2.7-image
정확한 얼굴, 팔레트, 텍스트, 시각적 연속성을 위한 제어 가능한 AI 이미지 생성기입니다.
BeatMV
노래를 영화 같은 뮤직비디오로 바꾸고 AI로 음악을 만드는 웹 기반 AI 플랫폼입니다.
Kirkify
Kirkify AI는 밈 제작자를 위해 시그니처 네온 글리치 미학을 적용한 얼굴 교체 바이럴 밈을 즉시 생성합니다.
Text to Music
텍스트나 가사를 AI가 생성한 보컬, 악기 및 멀티트랙 내보내기와 함께 전체 스튜디오 품질의 곡으로 변환하세요.
UNI-1 AI
UNI-1은 시각적 추론과 고충실도 이미지 합성을 결합한 통합 이미지 생성 모델입니다.
Wan 2.7
전문가 수준의 AI 비디오 모델로 정밀한 모션 제어와 다중 뷰 일관성을 제공합니다.
Iara Chat
Iara Chat: AI 기반의 생산성과 커뮤니케이션 도우미.
Tome AI PPT
AI 기반 프레젠테이션 제작기: 몇 분 만에 전문적인 슬라이드 데크를 생성, 미화 및 내보냅니다.
Lyria3 AI
텍스트 프롬프트, 가사, 스타일로부터 고품질의 완전 제작된 곡을 즉시 생성하는 AI 음악 생성기.
kinovi - Seedance 2.0 - Real Man AI Video
사실적인 사람 결과물을 제공하는 무료 AI 영상 생성기, 워터마크 없음, 전체 상업적 사용 권한 포함.
Video Sora 2
Sora 2 AI는 텍스트나 이미지를 몇 분 안에 짧고 물리학적으로 정확한 소셜 및 전자상거래용 비디오로 변환합니다.
Atoms
AI 기반 플랫폼으로 다중 에이전트 자동화를 사용해 코드 없이 몇 분 만에 풀스택 앱과 웹사이트를 구축합니다.
AI Pet Video Generator
AI 기반 템플릿과 즉시 HD 내보내기를 사용하여 사진으로부터 소셜 플랫폼용 바이럴하고 공유 가능한 반려동물 영상을 만듭니다.
Ampere.SH
무료 관리형 OpenClaw 호스팅. $500 Claude 크레딧으로 60초 내에 AI 에이전트를 배포하세요.
Paper Banana
AI 기반 도구로 학술 텍스트를 즉시 게시용 방법도와 정밀한 통계 플롯으로 변환합니다.
Hitem3D
Hitem3D는 단일 이미지를 AI로 고해상도 제작-ready 3D 모델로 변환합니다.
HookTide
사용자의 목소리를 학습해 콘텐츠를 만들고 참여를 유도하며 성과를 분석하는 AI 기반 LinkedIn 성장 플랫폼입니다.
Create WhatsApp Link
분석, 브랜드 링크, 라우팅 및 다중 에이전트 채팅 기능을 갖춘 무료 WhatsApp 링크 및 QR 생성기.
GenPPT.AI
AI 기반 PPT 제작 도구로, 몇 분 안에 발표자 노트와 차트가 포함된 전문적인 PowerPoint 프레젠테이션을 생성, 미화 및 내보낼 수 있습니다.
Palix AI
크리에이터를 위한 올인원 AI 플랫폼으로, 통합 크레딧으로 이미지, 동영상 및 음악을 생성합니다.
Gobii
Gobii는 팀이 24/7 자율 디지털 워커를 생성하여 웹 조사 및 일상 업무를 자동화할 수 있게 합니다.
Seedance 20 Video
Seedance 2는 일관된 캐릭터, 멀티샷 스토리텔링 및 2K 네이티브 오디오를 제공하는 멀티모달 AI 비디오 생성기입니다.
Veemo - AI Video Generator
Veemo AI는 텍스트나 이미지로부터 고품질의 비디오와 이미지를 빠르게 생성하는 올인원 플랫폼입니다.
AI FIRST
자연어를 통해 연구, 브라우저 작업, 웹 스크래핑 및 파일 관리를 자동화하는 대화형 AI 어시스턴트입니다.
WhatsApp Warmup Tool
AI 기반 WhatsApp 워밍업 도구는 계정 차단을 방지하면서 대량 메시지 전송을 자동화합니다.
GLM Image
GLM Image는 자기회귀(autoregressive) 모델과 확산(diffusion) 모델을 결합한 하이브리드 방식을 통해 뛰어난 텍스트 렌더링을 갖춘 고충실도 AI 이미지를 생성합니다.
Manga Translator AI
AI Manga Translator는 만화 이미지를 온라인에서 즉시 여러 언어로 번역합니다.
TextToHuman
AI 텍스트를 즉시 자연스럽고 인간다운 글로 재작성하는 무료 AI 휴머니라이저. 가입 필요 없음.
ainanobanana2
Nano Banana 2는 정밀한 텍스트 렌더링과 피사체 일관성을 유지하면서 4–6초 내에 프로 품질의 4K 이미지를 생성합니다.
Remy - Newsletter Summarizer
Remy는 이메일을 이해하기 쉬운 인사이트로 요약하여 뉴스레터 관리를 자동화합니다.
Free AI Video Maker & Generator
무료 AI 비디오 메이커 & 생성기 – 무제한, 가입 필요 없음

Gemini AI가 이제 안드로이드에서 음식 주문 및 차량 호출을 포함한 다단계 작업을 자동화할 수 있습니다

구글은 안드로이드용 Gemini가 음식 배달 주문과 차량 호출 같은 복잡한 다단계 작업을 이제 자율적으로 처리할 수 있으며, 먼저 삼성 갤럭시 S26 기기에서 출시된 후 더 넓게 롤아웃될 것이라고 발표했습니다.