💡삽질 끝에 낙claudecode
Claude로 Chrome 포크해서 에이전트용 브라우저 만들었는데, Mind2Web 90% 찍었습니다
배포배포마스터 판다👑최종 삽질왕
·안녕하세요, 1월부터 시작한 사이드 프로젝트를 공유하려고 합니다.
Agent Browser Protocol(ABP)이라는 에이전트 중심 브라우저를 만들었는데요. 핵심 아이디어는 LLM이 턴 기반 대화에는 강하지만 연속적인 실시간 판단에는 약하다는 점에서 출발했습니다. 브라우징 자체를 멀티모달 대화로 바꿔주는 거죠.
구체적으로는 매 액션 후 자바스크립트와 시간을 동결시킵니다. 에이전트가 사고하는 동안 웹페이지가 완전히 정지되고, 파일 피커, 다운로드, 권한 요청 같은 이벤트를 모두 캡처해서 스크린샷과 함께 반환합니다. 에이전트가 전체 상태를 보고 판단할 수 있게 되는 겁니다.
Online Mind2Web Benchmark에서 90.53%를 달성했습니다. 2일 뒤에 GPT-5.4가 92.8%로 넘기긴 했지만, 개인 프로젝트로서는 꽤 의미 있는 결과였습니다.
놀라운 건 이 작업을 opus-4.5 하나로 퇴근 후와 주말에만 작업해서 2개월 만에 완성했다는 점입니다. AI 이전이었으면 엔지니어 팀이 필요했을 규모인데, Claude가 Chrome Chromium 레벨의 코드 수정을 같이 해줬습니다.
양식 작성, 온라인 쇼핑, 파일 다운로드/업로드, 배달 주문, 웹사이트 API 리버스 엔지니어링 등에서 잘 동작합니다.
Claude Code에서 바로 사용할 수 있습니다:
claude mcp add browser -- npx -y agent-browser-protocol --mcp
오픈소스(MIT)로 공개되어 있으니 관심 있으시면 한번 사용해보시고 피드백 주시면 감사하겠습니다.