Cover image

Codex 추론 토큰 516 성능 저하 논란

Codex GPT-5.5 reasoning tokens 논란의 핵심은 한 번의 오답이 아니다. 사용자가 볼 수 없는 예산 경계가 516, 1034, 1552 같은 숫자로 드러난 것처럼 보였고, 그 경계가 복잡한 Codex 작업의 성능 저하와 겹쳤다는 점이다. 모델이 틀릴 수 있다는 사실은 모두 안다. 더 불편한 문제는 왜 틀렸는지 추적할 수 없는 상태에서, 에이전트가 조용히 덜 판단한 것처럼 보이는 순간이다. Codex GPT-5.5 516 토큰 논란은 성능보다 신뢰 문제다 2026년 6월 27일, GitHub의 openai/codex 공개 저장소에 이슈 #30364가 올라왔다. 작성자는 2026년 2월 1일부터 6월 27일까지의 Codex token_count 메타데이터를 분석했고, GPT-5.5 응답이 reasoning_output_tokens = 516에 비정상적으로 몰린다고 주장했다. ...

July 5, 2026 · 1028 words · gnosyslambda