vibesos
🚨심폐소생술 (SOS)👻가스라이팅📸망한 갤러리💡삽질 끝에 낙🛠️도구별 채널

커뮤니티 투표

Claude Code 41%(21)
OpenAI Codex 41%(21)
Gemini CLI 18%(9)

로그인 후 투표에 참여하세요

AI 도구

CursorClaude CodeCodex CLIGemini CLICopilotWindsurfAntigravityReplitLovable기타

© 2026 vibesos. All rights reserved.

vibesos란?공지사항이용약관개인정보처리방침
홈SOS글쓰기명예전당프로필
🛠️도구별 채널etc

Claude API 비용 하루 $50 → $0.73으로 줄인 프록시 만들었음 (HYDRA)

테스테스트포기 수달🐛에러 수집가
·2026. 2. 23.
사용한 프롬프트
에이전트랑 Anthropic API 사이에서 모델 라우팅해주는 투명한 프록시 만들어줘. MiniMax 응답은 0.0-1.0으로 품질 점수 매기고, 임계값 이하면 자동으로 Opus로 에스컬레이션되게 해줘. XML 환각이랑 포맷 오류 검사하는 품질 게이트 포함해서.

솔직히 OpenClaw로 에이전트 돌리면서 Opus만 쓰다가 비용 보고 멘붕 왔음 😅 하루에 크론 작업만 25개 넘게 돌리는데 배경 작업에 $50-80씩 나가고 있었거든...

그래서 HYDRA라는 프록시 직접 만들었는데, 쉽게 말하면 에이전트랑 Anthropic API 사이에 끼워넣는 투명한 레이어임.

  • 복잡한 추론/대화 → Opus 4.6
  • 배경 크론 작업 전부 → MiniMax M2.5 ($0.30/MTok, Opus는 $15)
  • 컨텍스트 압축 → Cerebras GLM-4.7 (초당 2000+ 토큰...)
  • 폴백 → 무료 Opus 티어

핵심은 품질 게이트임. MiniMax 응답 다 0.0-1.0으로 스코어링하고, XML 환각이나 포맷 문제 걸리면 에이전트한테 알리지 않고 자동으로 Opus로 올려버림. 그러니까 에이전트 입장에선 뭐가 바뀐지도 모름 🤷

첫날 결과:

  • MiniMax 요청 173개, 통과율 100%
  • 실제 비용 $0.73/일
  • 품질 저하 없음

에이전트 코드 손댈 필요도 없고 그냥 프록시만 끼우면 됨. Python 500줄짜리 MIT 라이선스.

https://github.com/jcartu/rasputin/tree/main/hydra

비용 고민하는 사람 있으면 진짜 써봐라, 나는 이미 본전 뽑은 느낌 💸

댓글

댓글을 불러오는 중...