(1/3) Antigravity, 현업에서 진짜 쓸 기능만 골라 정리
📚 AI IDE 현업 활용 시리즈 (전체 3편)
- Antigravity, 현업에서 진짜 쓸 기능만 골라 정리 ← 지금 글
- Cursor, 현업에서 진짜 쓸 기능만 골라 정리
- AI IDE × Claude Code 하이브리드 셋업 — Antigravity / Cursor 각각에 끼워 쓰기
Summary
작년 말 1.0 으로 처음 등장했던 Google Antigravity 가 올해 I/O 2026 (2026-05-19) 에서 2.0 으로 크게 바뀌었어요. “에이전트가 알아서 다 한다” 식의 마케팅 문구 말고, 현업에서 손에 잡히는 기능이 뭔지 정리하고 싶었습니다. 어제 올린 CLI 3종 비교 가 터미널 쪽이라면, 이번 시리즈는 IDE 쪽 흐름 3편으로 묶었어요. 1편은 Antigravity 의 핵심 기능부터.
💡 이 글에서 다루는 것
- 두 가지 인터페이스: Editor View / Agent Manager (Mission Control)
- 결과 검증을 강제하는 Artifacts 시스템
- 모델 골라 쓰기 (Gemini 3 Pro / Claude Sonnet 4.5 / GPT-OSS)
- 브라우저 자동화 내장으로 E2E·QA 줄이기
- Subagents / @mentions 로 병렬 작업
- Knowledge Items 와 Skills 로 컨텍스트 재사용
- Scheduled Tasks 로 cron 처럼 에이전트 굴리기
- AI Studio · Firebase · CLI/SDK 연동
- 같이 쓰면 좋은 하이브리드 워크플로우
1. 두 얼굴의 IDE — Editor View 와 Agent Manager
Antigravity 의 첫인상이 다른 IDE 와 가장 다른 부분이에요. 화면이 크게 둘로 갈라져요.
| 영역 | 성격 | 어떨 때 씁니까 |
|---|---|---|
| Editor View | 우리가 아는 VS Code 류 IDE. 탭 완성, 인라인 명령어, 파일 트리 | 한 파일을 직접 잡고 고치는 동기(synchronous) 작업 |
| Agent Manager (Mission Control) | 에이전트들을 띄우고/감시하는 대시보드 | 여러 워크스페이스에 비동기로 작업 던지고 결과를 모아 보기 |
핵심은 Agent Manager 가 부수 기능이 아니라 메인 화면 중 하나라는 점이에요. “에이전트 N명을 동시에 굴리는 게 디폴트” 라는 전제로 UI 가 짜여 있습니다. 시니어가 주니어 여러 명 일감 나눠주고 PR 올라온 거 검토하듯 일하는 모델에 가까워요.
✅ 현업 활용 포인트
같은 저장소의 서로 다른 브랜치 / 다른 저장소 / 다른 폴더를 각각 에이전트 한 명씩에게 맡기고, 본인은 그중 1~2명만 Editor View 에서 직접 잡으면 컨텍스트 스위칭 비용이 꽤 줄어듭니다.
2. Artifacts — “다 됐어요” 를 못 하게 막는 장치
에이전트형 도구의 가장 큰 리스크는 “다 됐다” 고 보고하는데 실제로는 반쯤 망가져 있는 상황이에요. Antigravity 는 이 부분을 Artifacts 라는 산출물 개념으로 강제합니다.
에이전트가 일을 하면 다음 같은 결과물이 같이 떨어져요.
- 구현 계획 (rich markdown)
- 태스크 리스트
- 아키텍처 다이어그램 / 이미지
- 스크린샷, 브라우저 녹화 (실제로 그렇게 동작했다는 증거)
- 코드 diff (주석 달린 형태)
읽고 마음에 안 드는 부분이 있으면 Google Docs 처럼 코멘트로 피드백을 답니다. 그러면 진행 중인 실행을 버리지 않고 그 자리에서 반영해요. “한 번 다 끝내고 다시 시키기” 가 아니라 실행 중간에 끼어들 수 있는 게 가장 큰 차이입니다.
💡 실무에서 가장 체감되는 부분
프론트엔드 작업을 시키면 작업 완료 후 실제 페이지의 스크린샷이 Artifact 로 같이 옵니다. “구현했다” 와 “구현해서 렌더링까지 됐다” 는 다른 얘기인데, 후자를 확인하기 위해 별도로 dev 서버 띄울 필요가 줄어들어요.
3. 모델 골라 쓰기 — Gemini 3 Pro / Claude Sonnet 4.5 / GPT-OSS
Antigravity 는 한 도구 안에서 세 모델을 다 지원해요. 작업별로 골라 쓸 수 있게 되어 있습니다.
| 모델 | 잘 하는 영역 (체감 기준) |
|---|---|
| Gemini 3 Pro | 프론트엔드/UI 생성, 시각 자료 해석, 긴 컨텍스트 (스크린샷 + 코드 + 명세 한꺼번에) |
| Claude Sonnet 4.5 | 백엔드 로직, 리팩토링, 코드 리뷰, 까다로운 디버깅 |
| GPT-OSS | 가벼운 작업/스크립트, 비용/속도 우선 |
Planning Mode 가 따로 있어서 본격 실행 전에 요구사항을 분석하고 계획부터 만들어요. 이때 비싼 모델로 계획만 잡고, 실행은 가벼운 모델로 돌리는 식의 분리도 가능합니다.
⚠️ 모델 전환은 무료가 아닙니다
같은 컨텍스트라도 모델마다 토큰 사용량이 달라지고, 같은 작업이라도 “리뷰는 Claude 로, 작성은 Gemini 로” 처럼 모델 사이를 왔다 갔다 하면 컨텍스트 재전송 비용이 붙어요. AI Ultra 의 $100/월 티어가 따로 있는 이유.
4. 브라우저 자동화 — Chrome 확장으로 QA 단축
이게 다른 IDE 와 가장 분명하게 갈리는 기능이에요. Antigravity Chrome 확장이 MCP 기반으로 브라우저를 도구처럼 노출합니다. 에이전트가 실제로 브라우저를 띄워서
- 페이지 이동
- 폼 입력 / 버튼 클릭
- UI 요소 검증
- 스크린샷 / 녹화 기록
까지 자동으로 합니다. Playwright/Cypress 같은 E2E 프레임워크를 별도 셋업하지 않아도 “이 페이지 가서 로그인하고 대시보드에서 X 가 보이는지 확인해줘” 같은 시나리오가 그냥 굴러가요.
사람: "회원가입 → 이메일 인증 → 첫 결제까지 흐름이 정상인지 확인해줘"
에이전트: (브라우저 띄움) → 단계별 진행 → 각 단계 스크린샷 →
실패한 단계의 콘솔 에러 캡처 → Artifact 로 정리해서 반환
수동 QA 까지는 못 줄여도, “매 PR 마다 한 번씩 돌려보던 수동 회귀 체크” 같은 영역은 거의 다 자동화권에 들어옵니다.
5. Subagents 와 @mentions — 병렬 작업 / 컨텍스트 격리
큰 작업을 한 에이전트한테 통째로 맡기면 컨텍스트가 금방 부풀어서 답이 흐릿해져요. Subagent 는 이걸 분리하는 장치입니다.
- 메인 에이전트가 하위 에이전트를 고유 ID 로 띄움
- Subagent 끼리도 ID 만 알면 서로 메시지 보낼 수 있음
- Subagent 가 자기 밑에 또 Subagent 를 띄울 수 있음 (다층 위임)
I/O 2026 데모에서 93개 subagent 를 동시에 띄워서 12시간 만에 OS 한 벌을 만든 사례가 있었어요. 현업에서 그렇게 큰 스케일까지 갈 일은 드물지만, “마이크로서비스 5개 동시에 변경” 정도는 흔하니까 그 정도 규모에서 바로 체감됩니다.
💡 컨텍스트 절약 패턴
메인 에이전트는 코디네이터 역할만 시키고, “각 서비스 변경” 은 subagent 한 명에게 한 디렉토리씩 던지는 식으로 쓰면 메인 컨텍스트가 안 터집니다. 시니어가 일감만 나눠주는 모양에 가까워요.
6. Knowledge Items / Skills — 매번 컨텍스트 다시 안 깔기
같은 프로젝트로 며칠 같이 일하다 보면 “지난번에 이거 설명했잖아” 가 반복되는데, Antigravity 는 두 가지 장치로 이걸 줄여요.
Knowledge Items (KIs)
- 대화 끝날 때마다 별도 Knowledge Subagent 가 그 대화를 분석
- 핵심만 추려서
metadata.json+ 관련 artifact 파일들로 영구 저장 - 이후 새 대화에서 같은 주제가 나오면 자동으로 참조
Skills (Progressive Disclosure)
- 프로젝트별 규칙을 작은 패키지로 패키징
- 평소엔 잠들어 있다가 description 이 매칭되는 요청이 들어올 때만 컨텍스트에 로드
- “모든 룰을 매번 시스템 프롬프트에 박는” 식의 컨텍스트 낭비를 막음
✅ 현업 활용 포인트
사내 코딩 컨벤션, 보안 규칙, 자주 쓰는 사내 라이브러리 사용법을 Skills 로 패키지화해두면 새로운 멤버/새 프로젝트에 그대로 끼워 넣을 수 있어요. 일종의 “에이전트용 사내 위키” 개념.
7. Scheduled Tasks — cron 처럼 굴리는 에이전트
2.0 에서 새로 들어온 기능입니다. 에이전트를 사전에 지정한 cron 스케줄로 호출할 수 있어요.
쓸 만한 시나리오 몇 가지.
- 매일 새벽에 의존성 보안 취약점 점검 → 발견 시 PR 자동 생성
- 매 시간 운영 환경 로그 요약해서 이슈로 등록
- 매주 월요일 오전에 지난 주 코드리뷰 통계 / 머지 패턴 리포트
- 매 배포 후 30분 뒤 핵심 사용자 흐름 E2E 자동 검증
기존에 GitHub Actions / Jenkins / 사내 스케줄러로 돌리던 잔잔한 자동화 중에 “규칙 기반으론 짜기 귀찮은데 사람이 매번 하기엔 또 아까운” 영역이 의외로 많은데, 그쪽이 1순위 타깃이에요.
8. AI Studio · Firebase · CLI / SDK 연동
Antigravity 2.0 은 IDE 단독 도구가 아니라 개발 플랫폼 으로 잡혀 있어요.
| 서피스 | 어떤 상황에서 |
|---|---|
| Desktop 앱 | 메인 작업. 평소 IDE 자리에 놓고 씀 |
| Antigravity CLI | 터미널에서 에이전트 호출. CI/CD 안에 끼워 넣기 좋음 |
| SDK (Managed Agents) | Gemini API 안의 Managed Agents 티어. 자체 서비스에서 에이전트 호출 |
| AI Studio export | AI Studio 에서 만든 프로토타입을 컨텍스트 통째로 로컬 Antigravity 로 |
| Firebase 연동 | 백엔드/배포 흐름이 Firebase 면 한 번에 |
특히 CLI 가 들어온 게 큰데, “IDE 안에서만 동작하던 에이전트를 CI 파이프라인 / 다른 자동화 시스템에서 호출할 수 있게 된 것” 이 실무 입장에선 가장 큰 변화입니다.
9. 같이 쓰면 좋은 하이브리드 워크플로우
Antigravity 만으로 다 처리하는 것보다, 강점 다른 도구와 섞어 쓰는 패턴이 더 자연스럽다고 봐요. 예를 들어
1) Antigravity (Planning Mode + Gemini 3 Pro)
→ 전체 아키텍처 / 데이터 모델 / API 스펙 잡기
2) Claude Code (터미널)
→ 백엔드 / DB / 마이그레이션 / 까다로운 디버깅
3) Antigravity (Editor View + Gemini 3 Pro)
→ 프론트엔드 UI / 브라우저 자동화로 회귀 검증
4) Antigravity (Scheduled Task)
→ 배포 후 정기 점검 자동화
Claude Code 자주 쓰는 명령어 / Codex CLI / Gemini CLI 정리에서 다뤘던 터미널 도구들과 충돌하는 게 아니라, “Planning + UI + 검증” 은 Antigravity, “백엔드/시스템 작업” 은 터미널 CLI 식으로 역할을 나누는 게 가장 효율 좋습니다.
10. 안 좋은 점도 한 줄씩
마지막으로 마케팅 문구에 가려진 단점들도 정리하고 넘어가요. 도입 전에 알고 가는 게 좋습니다.
- 🚨 무료 티어 한도는 빠르게 도달함 — 개인 작업 가볍게 굴리는 정도면 OK 인데, 한 번에 subagent 여러 명 띄우면 금방 한도 끝. AI Ultra ($100/월) 가 사실상 실무 티어.
- ⚠️ Editor View 단독 성능은 아직 VS Code/Cursor 만큼 매끄럽지 않음 — 코드 네비/플러그인 생태계는 부족. “에이전트 중심” 이라는 전제가 안 맞으면 어색할 수 있음.
- ⚠️ Chrome 확장 권한 범위 주의 — 브라우저 자동화가 강한 만큼 권한도 큼. 사내 정책상 브라우저 확장 통제가 빡센 환경이면 도입 전 검토 필요.
- ⚠️ 사내 코드/데이터 정책 확인 — Google 계정으로 묶이는 클라우드 도구라서, 코드/대화 흐름이 어디까지 외부로 나가는지 보안팀과 한 번 정리하고 들어가는 게 안전.
마무리
Antigravity 의 차별점을 한 문장으로 줄이면 “한 사람이 에이전트 N명을 시니어처럼 운영하는 IDE” 라고 보여요. Editor 하나에 갇히지 않고 Mission Control 에서 여러 명을 굴리고, Artifacts 로 결과를 검증하고, Skills/Knowledge Items 로 같은 설명을 반복하지 않는 구조가 핵심입니다.
당장 모든 작업을 Antigravity 로 옮길 필요는 없고, “여러 갈래를 동시에 굴려야 하는 작업” 부터 부분 도입해보면 체감이 잘 옵니다. 회귀 테스트 자동화, 멀티 레포 리팩토링, 정기 점검 같은 시나리오가 1순위.
일단 오늘은 여기까지…..
다음 글에서는 다른 한 축인 Cursor 를 같은 결로 정리해볼게요.