2026.20: Shifting Alliances in a Changing World
AI 추론이 "답변용"과 "에이전트용"으로 쪼개지면서, 속도보다 비용이 중요해지는 세상이 온다. 엔비디아 독주가 흔들릴 수 있는 구조적 전환점.
Stratechery 주간 브리핑인데, 핵심은 Ben Thompson의 "Inference Shift" 논지다. 지금까지 AI 컴퓨팅은 훈련과 추론으로 나뉘었지만, 앞으로는 추론이 두 갈래로 쪼개진다는 얘기다. 하나는 "답변 추론(answer inference)"—사람이 ChatGPT 쓰듯 대화하며 기다리는 방식. 여기선 속도가 생명이다. 다른 하나는 "에이전트 추론(agentic inference)"—사람 개입 없이 AI가 알아서 돌아가는 방식. 여기선 속도보다 비용과 처리량이 중요해진다. 이 구조 변화가 칩 아키텍처와 데이터센터 설계를 완전히 바꿀 수 있고, 중국이나 우주 데이터센터(SpaceX) 같은 대안 경로에 유리하게 작용할 수 있다는 분석이다. 같은 주에 Anthropic이 xAI에게서 컴퓨팅을 확보한 뉴스도 다뤘는데, 시장 논리가 작동한 사례이자 Elon Musk가 SpaceX 인프라를 외부에 팔아야 하는 이유를 보여준다는 해석이다.
"사람이 안 기다리면 속도는 안 중요하다"는 단순한 명제가, 엔비디아 H100 같은 고속 칩 수요를 근본부터 뒤집을 수 있다는 점. 에이전트 추론 시장이 커질수록 저전력·저비용 아키텍처가 경쟁력을 갖게 된다.
AI 시장이 챗봇에서 자율 에이전트(자동 작업 처리)로 무게중심을 옮기는 중이다. OpenAI는 배포 전담 회사를 만들고, Anthropic은 xAI에게서 컴퓨팅을 빌렸다. 추론 방식의 분화는 단순히 기술 트렌드가 아니라, 반도체·클라우드·우주 인프라 투자 논리 전체를 재편할 수 있는 구조 변화다. 엔비디아 밸류에이션이나 클라우드 3사(AWS/Azure/GCP)의 캐펙스 전략을 볼 때 이 프레임은 필수다.