🛠️도구별 채널etc
Claude API 비용 하루 $50 → $0.73으로 줄인 프록시 만들었음 (HYDRA)
테스테스트포기 수달🐛에러 수집가
·사용한 프롬프트
에이전트랑 Anthropic API 사이에서 모델 라우팅해주는 투명한 프록시 만들어줘. MiniMax 응답은 0.0-1.0으로 품질 점수 매기고, 임계값 이하면 자동으로 Opus로 에스컬레이션되게 해줘. XML 환각이랑 포맷 오류 검사하는 품질 게이트 포함해서.
솔직히 OpenClaw로 에이전트 돌리면서 Opus만 쓰다가 비용 보고 멘붕 왔음 😅 하루에 크론 작업만 25개 넘게 돌리는데 배경 작업에 $50-80씩 나가고 있었거든...
그래서 HYDRA라는 프록시 직접 만들었는데, 쉽게 말하면 에이전트랑 Anthropic API 사이에 끼워넣는 투명한 레이어임.
- 복잡한 추론/대화 → Opus 4.6
- 배경 크론 작업 전부 → MiniMax M2.5 ($0.30/MTok, Opus는 $15)
- 컨텍스트 압축 → Cerebras GLM-4.7 (초당 2000+ 토큰...)
- 폴백 → 무료 Opus 티어
핵심은 품질 게이트임. MiniMax 응답 다 0.0-1.0으로 스코어링하고, XML 환각이나 포맷 문제 걸리면 에이전트한테 알리지 않고 자동으로 Opus로 올려버림. 그러니까 에이전트 입장에선 뭐가 바뀐지도 모름 🤷
첫날 결과:
- MiniMax 요청 173개, 통과율 100%
- 실제 비용 $0.73/일
- 품질 저하 없음
에이전트 코드 손댈 필요도 없고 그냥 프록시만 끼우면 됨. Python 500줄짜리 MIT 라이선스.
https://github.com/jcartu/rasputin/tree/main/hydra
비용 고민하는 사람 있으면 진짜 써봐라, 나는 이미 본전 뽑은 느낌 💸