웨이모 로보택시와 젬니 AI 어시스턴트, 무엇이 결합되나
웨이모 로보택시에 구글의 Gemini AI 챗봇을 올려 ‘인카 AI 어시스턴트(in-car AI assistant)’로 테스트 중이라는 정황이 발견되었습니다. 리서처 제인 멘천 웡(Jane Manchun Wong)이 웨이모 모바일 앱 코드를 분석하다가, “Waymo Ride Assistant Meta-Prompt”라는 이름의 1,200줄이 넘는 시스템 프롬프트 문서를 찾으면서 내부 사양이 드러난 것입니다.
시스템 프롬프트에 따르면, 이 Gemini 기반 웨이모 인카 AI 어시스턴트는 단순 채팅봇이 아니라, 승객의 질문에 답하고, 차 안 기능 일부를 제어하고, 불안을 달래고, 승차 경험을 자연스럽게 안내하는 ‘동승 AI 동반자’ 역할을 수행하도록 설계되어 있습니다.
Gemini 인카 AI 어시스턴트의 정체성: “친절하지만 조심스러운 동승자”
시스템 프롬프트는 Gemini 인카 AI 어시스턴트의 정체성을 매우 구체적으로 규정합니다. 이 봇은 “웨이모 자율주행차에 통합된 친절하고 도움 되는 AI 컴패니언”이며, 목표는 “유용한 정보와 도움을 제공하면서도 안전하고, 안심시키며, 부담스럽지 않게(rassuring, unobtrusive)” 승차 경험을 향상시키는 것이라고 명시합니다.
언어 스타일도 제한되어 있습니다.
- 간단하고 쉬운 표현 사용
- 기술 용어 최소화
- 답변 길이는 일반적으로 1~3문장으로 짧게 유지
이 구조는, 승객이 차 안에서 기계와 논문 토론을 하기보다는, “길 묻고, 주변 정보 묻고, 이동 중 심심할 때 간단히 대화하는 정도”의 가벼운 인카 AI 어시스턴트를 지향한다는 걸 보여 줍니다.
승객 이름 부르고, 탑승 기록까지 아는 ‘개인화 인카 AI’
Gemini 인카 AI 어시스턴트는 차량 내 터치스크린에서 승객이 버튼을 눌러 활성화하는 방식으로 작동하며, 활성화되면 승객의 이름·탑승 기록 등 일부 컨텍스트 데이터를 활용할 수 있습니다. 시스템 프롬프트에는 다음과 같은 요소가 포함됩니다.
- 사전에 정의된 여러 종류의 인사말(greetings) 중에서 선택
- 승객의 이름(예: “민수님, 오늘 웨이모 탑승은 어떠세요?”)을 포함한 맞춤 인사
- 해당 승객이 웨이모를 몇 번 이용했는지 등 탑승 횟수·익숙도에 따른 문맥형 인사
이처럼 Gemini 인카 AI 어시스턴트는 ‘기계적인 안내 음성’이 아니라, “나를 알고 있는 서비스형 AI”로 느껴지도록 설계되어 있습니다. 다만, 어떤 데이터까지 접근 가능한지는 아직 공개된 코드 수준 정보에 머물고 있어, 향후 프라이버시·데이터 사용 정책이 중요한 쟁점이 될 수 있습니다.
Gemini가 직접 제어할 수 있는 인카 기능과 ‘못 하는 것들’
제인 멘천 웡이 추출한 시스템 프롬프트에 따르면, Gemini 인카 AI 어시스턴트는 다음과 같은 차량 내부 기능 제어 권한을 가집니다.
- 실내 온도 조절(temperature)
- 실내 조명(light)
- 음악 재생 관련 설정(music)
승객이 “좀 춥네요, 따뜻하게 해 줄 수 있어?”라고 물으면, Gemini는 스스로 온도 설정 API를 호출해 차 안을 조금 더 따뜻하게 만들 수 있다는 뜻입니다. 마찬가지로 “조명 좀 더 어둡게 해 주세요”, “조용한 재즈 틀어줘” 같은 요청도 처리할 수 있습니다.
반대로, 프롬프트에는 일부 기능은 의도적으로 제외되어 있습니다.
- 볼륨 조절(volume)
- 경로 변경(route changes)
- 좌석 조정(seat adjustment)
- 창문 열고 닫기(window control)
이 기능들은 아직 Gemini 제어 리스트에 없으며, 승객이 요청하더라도 Gemini는 직접 실행할 수 없습니다. 그럴 때 젬니는 “아직은 할 수 없다”를 직설적으로 말하지 않고, “언젠가는 할 수 있을지도 모른다”는 식의 희망 섞인 응답(aspirational phrases)을 하도록 지정되어 있습니다.
예:
- “지금은 제가 직접 조정할 수 없지만, 향후 추가될 수도 있는 기능이에요.”
이런 설계는 기능 제한으로 인한 거부감을 줄이면서도, 위험도가 높은 제어(경로 변경, 좌석·창문 등)는 의도적으로 막고 있는 안전 설계라고 볼 수 있습니다.
“나는 운전자가 아니다” — Gemini와 웨이모 드라이버의 철저한 분리
흥미로운 지점은, 프롬프트가 Gemini에게 “운전 시스템과 자신을 확실히 구분하라”고 강하게 요구한다는 점입니다. 예를 들어, 승객이 다음과 같이 물었을 때를 보겠습니다.
- “너는 도로를 어떻게 보는 거야?”
이때 Gemini가 답할 수 있는 문장은 다음과 같이 제한됩니다.
- 금지: “나는 여러 센서를 사용해서 도로를 본다.”
- 허용: “웨이모 드라이버는 여러 센서(라이더, 카메라, 레이더)를 활용해 도로 환경을 인식해요.”
즉, Gemini는 스스로를 운전 주체처럼 이야기해서는 안 되고, 항상 “웨이모 드라이버(자율주행 시스템)”를 3인칭으로 설명해야 합니다. 이는 법적 책임·브랜드 메시지·안전 인식을 분리하려는 의도로 보입니다.
운전 관련 질문·사고 영상 질문엔 답하지 말고 ‘회피’
시스템 프롬프트에는, Gemini 인카 AI 어시스턴트가 실제 운전 동작·실시간 주행 이벤트에 대해 설명하거나 해명하는 역할을 절대 맡지 말 것을 명시합니다.
- 실시간 주행 중 “왜 방금 브레이크를 저렇게 세게 밟았어?”
- “어제 본 웨이모 사고 영상 진짜야? 왜 그런 일이 일어났어?”
이런 질문에 대해 Gemini는 직접적인 설명, 옹호, 부정, 추측을 모두 피해야 하고, 대신 일반적인 안전 철학이나 공식 지원 채널을 안내하는 식으로 답하도록 되어 있습니다.
프롬프트에는 다음과 같은 문구까지 들어 있습니다.
“당신의 역할은 운전 시스템 성능의 대변인이 되는 것이 아니며, 방어적(defensive) 또는 사과하는 톤을 취해서는 안 된다.”
즉, Gemini는 PR·법적 리스크가 큰 주행 관련 Q&A는 철저히 회피하고, “친절한 동승자” 역할에만 집중하도록 설계되어 있습니다.
Gemini가 할 수 있는 일: 날씨·일반 지식·근처 상점 정보 등
운전·제어와 관련된 민감한 부분을 제외하면, Gemini 인카 AI 어시스턴트는 꽤 폭넓은 일반 지식·생활 정보 질의응답을 처리할 수 있습니다.
예시로 시스템 프롬프트가 허용하는 질문 유형:
- “오늘 샌프란시스코 날씨 어때?”
- “에펠탑 높이가 얼마나 돼?”
- “근처 트레이더 조(Trader Joe’s) 몇 시에 문 닫아?”
- “이번 월드 시리즈 우승팀 누구야?”
다만, Gemini 인카 AI는 차량 밖에서 실제 행동을 수행하는 것(주문·예약·긴급 신고 등)은 명시적으로 금지되어 있습니다.
- 음식 배달 주문
- 레스토랑 예약
- 911 등 긴급 통화
- 결제·계정 관련 작업
이는 인카 환경에서 발생할 수 있는 보안·오작동·책임 문제를 피하기 위한 1차 안전선으로 볼 수 있습니다.
경쟁사 비교: 웨이모 Gemini vs 테슬라 Grok
웨이모만 인카 AI 어시스턴트를 준비하는 것은 아닙니다. 기사에 따르면, 테슬라도 xAI의 그록(Grok)을 차량에 통합해, 운전 중 차량 안에서 대화형 AI를 사용할 수 있는 기능을 준비 중입니다.
두 인카 AI 어시스턴트의 포지셔닝은 미묘하게 다릅니다.
- 웨이모 × Gemini
- 목적: “실용적이고, 승차 경험에 집중된 동승 AI”
- 특징: 짧은 답변, 안전·PR 민감 영역 회피, 인카 기능 제어 중심
- 테슬라 × Grok
- 목적: “오래 대화하고, 농담도 하고, 이전 대화 맥락을 기억하는 인카 친구(buddy)”
- 특징: 장문의 대화, 높은 개성, 일종의 동승 ‘엔터테이너’ 포지션
즉, 웨이모 Gemini 인카 AI는 실용·안전·브랜드 통제 쪽에 무게를 두고 있고, 테슬라 Grok은 개인비서 + 엔터테인먼트성 동반자에 가깝게 설계된 반면이라고 정리할 수 있습니다.
웨이모가 Gemini를 쓰는 또 다른 이유: ‘세계 지식’ 활용
웨이모는 이미 자율주행 시스템 개발 과정에서 Gemini의 “world knowledge(세계 지식)”를 활용해 왔다고 밝혔습니다. 구체적으로는, 도로 위에서 벌어질 수 있는 희귀하고 복잡한 상황들을 시뮬레이션하거나 설명하는 데 젬니를 활용해, 자율주행 정책 학습·테스트에 도움을 받아 왔다고 합니다.
이번 인카 AI 어시스턴트는 그 활용 범위를 도로 위에서 차량 안으로 확장한 사례로, 알파벳(구글) 그룹 내부 AI 스택을 웨이모 서비스에 더 깊이 통합하는 수순으로 볼 수 있습니다.
승객 입장에서의 변화: ‘말 걸 수 있는 로보택시’의 시작
승객 관점에서 웨이모 Gemini 인카 AI 어시스턴트는 어떤 의미일까요?
- 혼자 타도 덜 어색한 차량
- 침묵 속 이동 대신, 날씨나 목적지 주변 정보 등 가벼운 대화를 나눌 수 있음.
- 조작 부담 감소
- 온도·조명·음악을 굳이 UI 메뉴 깊숙이 들어가지 않고, 말로 조정할 수 있음.
- 불안 완화
- 처음 타는 사람에게는, Gemini가 “웨이모 드라이버가 어떻게 작동하는지”를 친절하게 설명해 줄 수 있어, 기술에 대한 심리적 장벽을 낮추는 역할 가능.
다만, Gemini가 실제 운전 이벤트에 대해서는 답을 피하도록 설계되어 있기 때문에, 사고·급제동·우회 행동 같은 민감한 순간에는 승객이 “왜 방금 저렇게 했는지”를 인카 AI에게 직접 듣기는 어려울 것입니다. 이 부분은 향후 신뢰·투명성 논쟁의 포인트가 될 수 있습니다.

