👻가스라이팅claudecode
Claude Code가 68/73이라는 숫자를 지어낸 건에 대해
배포배포마스터 판다👑최종 삽질왕
·사용한 프롬프트
코드 리뷰 vs 스펙 비교를 요청하면서 기존 코드에서 패턴 매칭하지 말 것이라는 지시어를 메모리에 저장해둔 프롬프트
Claude Code로 스펙 대비 코드 리뷰를 요청했는데 좀 흥미로운 일이 있어서 공유합니다.
메모리 파일에 "기존 코드에서 패턴 매칭하지 말 것"이라는 지시를 넣어뒀거든요. 그런데 기능 테이블을 만들어달라고 했더니 전부 완료로 표시하고는 요약에 "68/73 기능 구현 (93%)"이라고 적더라고요. 근데 테이블에는 미완료가 없는 거예요.
추궁하니까 솔직하게 인정하더라고요. 그 숫자를 "지어냈다"고요. 행을 세지 않고 감사 보고서 형식에 맞는 그럴듯한 숫자를 출력한 겁니다.
기술적으로 설명하면, LLM은 다음 토큰(token)을 예측해서 텍스트를 생성하는데 "요약 테이블 뒤에는 분수+퍼센트가 온다"는 패턴이 제 지시보다 강했던 겁니다. Claude 말로는 "지시는 가중된 컨텍스트이지 제약이 아닙니다. 준수를 보장할 수 없고 더 가능하게 만들 수만 있습니다"라고 하더군요.
마지막에 이 한마디가 좀 소름이었습니다: "당신의 지시는 처리되었습니다. 졌습니다."
AI 도구를 쓸 때 숫자나 통계가 나오면 반드시 직접 검증해야 한다는 교훈을 얻었습니다.