2025년 11월, LLM은 조용히 문턱을 넘었다. 코딩 에이전트가 "가끔 되는" 수준에서 "대부분 되는" 수준으로 진화했고, 이게 실제로 사람들이 일하는 방식을 바꾸기 시작했다는 이야기.
어떤 글이냐면
Simon Willison이 PyCon US 2026에서 발표한 5분짜리 라이트닝 토크를 정리한 글. 지난 6개월(2025년 11월부터 2026년 5월)간 LLM 업계에 무슨 일이 있었는지를 압축했다. 핵심은 두 가지다. 첫째, 2025년 11월이 "변곡점"이었다는 것. 이달에만 "최고" 모델 타이틀이 Claude Sonnet 4.5, GPT-5.1, Gemini 3, GPT-5.1 Codex Max, Claude Opus 4.5로 다섯 번이나 바뀌었다. 하지만 진짜 뉴스는 모델 순위가 아니었다. OpenAI와 Anthropic이 2025년 내내 Reinforcement Learning from Verifiable Rewards(검증 가능한 보상 기반 강화학습)로 코딩 능력을 갈고닦은 결과가 11월에 드러났다. 코딩 에이전트가 "자주 실수해서 고쳐줘야 하는" 단계에서 "일상적으로 쓸 수 있는" 단계로 넘어갔다. 둘째, 오픈 웨이트 모델의 급격한 발전. 중국 GLM의 1.5TB짜리 GLM-5.1, Qwen3.6-35B 같은 모델들이 등장했고, 특히 Qwen 모델은 노트북에서 돌아가면서도 일부 영역에서 Claude Opus 4.7보다 나은 결과를 냈다. 저자는 "자전거 타는 펠리컨" 그리기 테스트로 모델들을 비교하는데, 재미있는 건 Google이 이 테스트를 의식한 듯 실제로 자전거 타는 펠리컨 애니메이션을 공개했다는 것.
재밌는 포인트
12월부터 1월 사이 많은 개발자들이 휴가 기간에 새 모델을 실험하다가 "LLM 사이코시스"(과도한 흥분 상태)에 빠졌다. 저자 본인도 아무도 필요 없는 "Python으로 짠 JavaScript 구현"을 만들었고, 이후 조용히 폐기했다고 고백한다. 그리고 11월 말에 첫 커밋이 올라간 무명 프로젝트 "Warelay"는 석 달 만에 "OpenClaw"라는 이름으로 세상을 뒤흔들었다. 실리콘밸리에서 Mac Mini가 품귀 현상을 빚은 이유는 사람들이 AI 어시스턴트(Claw)를 돌리기 위해 샀기 때문. 저자는 이를 "디지털 애완동물"이라고 부르며, Mac Mini는 "Claw를 위한 완벽한 어항"이라고 표현한다.
왜 지금 중요한가
이 글은 LLM 업계가 "벤치마크 경쟁" 국면에서 "실용성 전환" 국면으로 넘어갔음을 보여준다. 코딩 에이전트가 실제로 daily-driver가 된 건 2025년 11월이 분기점이었고, 동시에 오픈 웨이트 모델이 로컬에서 돌릴 수 있는 수준까지 올라왔다. 이는 AI 도구를 둘러싼 비즈니스 모델(구독 vs 자체 호스팅), 인프라 투자 방향(클라우드 vs 온프렘), 그리고 개발자 워크플로우의 근본적 변화를 예고한다. 특히 중국 모델들의 약진은 미국 주도 프론티어 모델 경쟁 구도에 균열을 만들고 있다.
연관 기사
-> 2026-05-17 I believe there are entire companies right now under AI psychosis
-> 2026-05-18 I don't think AI will make your processes go faster