Morning Insight Digest

모닝 인사이트 다이제스트

2026년 4월 26일 일

01 RSS/Doomberg

To Spite Its Face

우크라이나가 러시아 석유 수출항을 계속 공격하고 있는데, 정작 그 타격을 가장 크게 받을 건 우크라이나를 지원하는 유럽 자신일 수 있다.

어떤 글이냐면

우크라이나가 4월 초 러시아 최대 석유 수출항인 노보로시스크를 드론으로 다시 공격했다. 이 항구는 러시아 석유 수출의 30% 이상을 처리하는 곳이고, 하루 220만 배럴 규모다. 문제는 3월 이란이 호르무즈 해협을 봉쇄하면서 이미 글로벌 석유 위기가 진행 중이라는 점이다. 미 국무부는 이례적으로 우크라이나 대사를 불러 경고까지 했지만, 공격은 계속됐다. 더 아이러니한 건 노보로시스크가 카자흐스탄 석유 수출의 80%를 처리하는 항구이기도 한데, 카자흐스탄은 현재 EU의 두 번째로 큰 석유 수입원이라는 것. 유럽이 우크라이나의 군사비와 예산을 대주면서, 동시에 자기들 석유 공급망을 스스로 타격하고 있는 셈이다.

재밌는 포인트

독일 총리가 우크라이나 대통령을 만나 드론 생산 지원을 약속한 게 노보로시스크 공격 일주일 후였다. 그 드론들이 결국 같은 용도로 쓰일 게 뻔한데도.

왜 지금 중요한가

전쟁에서 전술적 승리와 전략적 자해가 겹치는 순간을 보여준다. 호르무즈 봉쇄로 이미 에너지 시장이 긴장 상태인데, 유럽이 자기 발등을 찍는 공격을 묵인하거나 오히려 지원하고 있다. 카자흐스탄 루트까지 막히면 유럽의 석유 수급은 더 악화될 수밖에 없고, 이건 결국 유럽 경제 전체의 문제가 된다.

연관 기사
더 읽기 접기
02 HackerNews

DeepSeek v4

DeepSeek가 100만 토큰 컨텍스트를 기본으로 제공하는 V4를 오픈소스로 공개했다. 가격은 낮추고 성능은 GPT-4급으로 올렸다.

어떤 글이냐면

DeepSeek가 V4 모델 두 종류를 동시 출시했다. V4-Pro는 총 1.6T 파라미터에 49B만 활성화하는 MoE 구조로, 수학/코딩/추론에서 최상위 클로즈드 모델과 경쟁한다. V4-Flash는 284B 토큰에 13B 활성화로 더 빠르고 저렴하지만 Pro급 추론 능력을 유지한다. 핵심은 100만 토큰 컨텍스트를 표준으로 제공하면서도 메모리와 연산 비용을 획기적으로 줄인 새로운 어텐션 메커니즘(DSA)이다. API는 OpenAI/Anthropic 포맷과 호환되며, 기존 deepseek-chat 모델은 2026년 7월 완전 종료 예정이다. 에이전트 코딩 벤치마크에서 오픈소스 SOTA를 달성했고, Claude Code나 OpenClaw 같은 주요 AI 에이전트와 통합됐다.

재밌는 포인트

100만 토큰이 이제 "표준"이라는 선언. 단순히 지원하는 게 아니라 모든 공식 서비스에서 기본값으로 제공한다는 건, 컨텍스트 전쟁에서 새로운 기준선을 그은 셈이다.

왜 지금 중요한가

OpenAI가 GPT-5.5를 발표한 직후 DeepSeek가 오픈소스로 맞불을 놓았다. 중국 기업이 최상위 클로즈드 모델과 맞서는 오픈소스 모델을 내놓으면서, AI 경쟁 구도가 "클로즈드 vs 오픈소스"에서 "미국 vs 중국"으로도 읽힌다. 특히 100만 토큰을 저렴하게 제공하면서 에이전트 역량까지 강화한 건, 장문 처리가 필수인 코딩/연구 에이전트 시장을 노린 전략적 움직임이다.

연관 기사
더 읽기 접기
03 HackerNews

There Will Be a Scientific Theory of Deep Learning

딥러닝이 드디어 "물리학처럼" 이론으로 설명될 수 있다는 주장. 경험적 직관이 아니라, 예측 가능한 법칙이 보이기 시작했다.

어떤 글이냐면

14명의 연구자가 쓴 41페이지짜리 논문으로, 딥러닝에 대한 과학적 이론이 이제 실제로 형성되고 있다고 주장한다. 이들이 말하는 "이론"은 단순히 모델이 잘 작동하는 이유를 설명하는 걸 넘어서, 학습 과정의 동역학, 은닉층 표현, 최종 가중치, 성능을 정량적으로 예측할 수 있는 틀이다. 논문은 다섯 가지 연구 흐름을 정리하는데: (a) 이상화된 설정에서 학습 동역학 해석, (b) 극한 상황에서 드러나는 근본 현상, (c) 거시적 관측치를 포착하는 수학 법칙, (d) 하이퍼파라미터를 분리해 시스템을 단순화하는 이론, (e) 다양한 시스템에서 공통적으로 나타나는 보편적 행동 패턴. 이들은 이 이론을 "학습 역학(learning mechanics)"이라 부르자고 제안하며, 뉴턴역학처럼 시스템의 거시적 통계를 기술하는 것이 목표라고 본다. 통계학이나 정보이론적 접근과도 연결되지만, 특히 mechanistic interpretability와 상호보완적 관계가 될 것으로 예상한다.

재밌는 포인트

"이론이 불가능하다"는 회의론에 정면으로 반박하며, 실제로 falsifiable한(반증 가능한) 정량적 예측을 하는 연구들이 이미 쌓이고 있다는 점을 강조한다. 단순히 철학적 논의가 아니라 실험으로 검증 가능한 법칙들이다.

왜 지금 중요한가

AI가 "블랙박스"라는 인식이 여전히 강한 시점에, 이론적 기반이 생긴다는 건 두 가지 의미가 있다. 첫째, 모델 설계와 학습을 경험칙이 아니라 원리 기반으로 할 수 있게 되고, 둘째, AI 안전성과 해석 가능성 연구에 단단한 토대를 제공한다. GPT-5.5, DeepSeek v4 같은 거대 모델들이 쏟아지는 지금, "왜 이렇게 작동하는가"에 대한 이론적 이해는 다음 세대 AI 설계의 핵심 차별화 요소가 될 수 있다.

연관 기사
더 읽기 접기
04 RSS/Marginal Revolution

The Pernicious Trade Account

무역수지 적자가 나쁘다고? 그건 회계 방식이 만든 착시일 뿐이다. 국가가 거래하는 게 아니라 사람이 거래하는데, 우리는 통계를 잘못 읽고 있다.

어떤 글이냐면

Tyler Cowen이 무역 통계의 근본적 오류를 지적하는 글이다. 무역수지를 "적자"라고 부르는 순간부터 이미 프레이밍이 잘못됐는데, 더 큰 문제는 개인과 기업 간 수백만 건의 자발적 거래를 "미국 대 중국"처럼 국가 간 관계로 포장한다는 것. Don Boudreaux의 예시가 핵심인데: 외국인이 휴스턴에 레스토랑을 사서 수익을 내면, 회계상으로는 "미국이 외국에 돈을 지불"한 것처럼 보인다. 하지만 실제로는 그 외국인 소유주가 스스로 창출한 새 부를 본국으로 가져가는 것일 뿐, 미국인이 지불한 게 아니다. 지리적 위치(where)를 경제 주체(who)로 착각하는 범주 오류가 무역 통계의 본질이다.

재밌는 포인트

외국인이 미국 내 투자로 번 돈을 본국에 송금하면, 회계상 "미국의 지불"로 기록되지만 실제로는 아무도 손해 본 미국인이 없다. 그냥 달러가 국경을 넘었을 뿐인데 말이다.

왜 지금 중요한가

이 통계가 정부 보고서 뒷페이지에만 있었다면 문제없었을 텐데, 실제로는 1면 헤드라인이 되고 정책을 만들고 협상을 틀짓는다. "우리가 중국에 5000억 달러를 잃었다"는 식의 수사는 이 잘못된 회계에서 나온다. 나쁜 회계가 나쁜 정책을 만드는 셈이다. 관세 정책부터 통상 협상까지, 무역 통계에 대한 오해가 실물 경제를 흔들고 있다.

더 읽기 접기
05 HackerNews

OpenAI releases GPT-5.5 and GPT-5.5 Pro in the API

OpenAI가 GPT-5.5와 GPT-5.5 Pro를 API로 공개했다. 100만 토큰 컨텍스트, 컴퓨터 제어, 웹검색까지 기본 탑재한 "프로페셔널 작업용" 모델이라는 게 핵심.

어떤 글이냐면

OpenAI의 공식 API 체인지로그인데, 4월 24일자로 GPT-5.5 시리즈가 출시됐다는 내용이다. GPT-5.5는 "복잡한 전문 작업"을 위한 프론티어 모델로, 100만 토큰 컨텍스트 창을 지원하고 이미지 입력, 구조화된 출력, 함수 호출, 프롬프트 캐싱, 배치 처리, 툴 검색까지 가능하다. 특히 컴퓨터 제어(computer use), 호스팅 셸, 패치 적용, Skills, MCP, 웹검색이 내장돼 있다. 더 어려운 문제엔 GPT-5.5 Pro를 쓸 수 있고, 추론 노력(reasoning effort)은 이제 기본값이 'medium'이다. 같은 날 GPT Image 2도 공개됐고, 3월엔 GPT-5.4/5.4 Pro, GPT-5.4 mini/nano가 나왔다. 툴 검색, 컴팩션(대화 압축), 1M 토큰 창이 5.4부터 지원되기 시작했고, 12월엔 GPT-5.2가, 11월엔 GPT-5.1이 나왔다. 결국 2025년 말부터 2026년 4월까지 GPT-5 계열이 폭발적으로 업데이트됐다는 이야기다.

재밌는 포인트

GPT-5.5에 컴퓨터 제어(computer use)와 호스팅 셸이 기본 탑재됐다는 점. 이제 API로 호출만 하면 모델이 직접 화면을 보고 클릭하거나 셸 명령어를 실행할 수 있다는 뜻이다. Anthropic의 Claude가 선보인 기능을 OpenAI가 정식 API에 통합한 셈.

왜 지금 중요한가

"에이전트 시대"가 API 레벨에서 현실화되고 있다는 신호다. 단순 텍스트 생성을 넘어 툴 검색, 컴퓨터 제어, 100만 토큰 컨텍스트, 대화 압축까지 지원하면서, 모델이 장시간 실행되는 복잡한 워크플로우를 직접 수행할 수 있는 인프라가 갖춰지고 있다. 이제 개발자들은 GPT-5.5를 "프로그램 가능한 전문가"처럼 쓸 수 있게 됐고, 이게 SaaS 구조를 근본적으로 바꿀 가능성이 크다.

연관 기사
더 읽기 접기
06 HackerNews

I cancelled Claude: Token issues, declining quality, and poor support

Claude 유료 구독자가 토큰 관리 혼란과 품질 저하로 구독을 취소했다. AI 서비스의 성장통이 실제 사용자 경험으로 드러나는 순간.

어떤 글이냐면

개발자 Nicky Reinert가 Claude Code 구독을 취소한 이유를 상세히 기록한 글이다. 초기엔 만족스러웠지만, 3주 전부터 문제가 시작됐다. 간단한 질문 두 개로 토큰이 100% 소진되는 이상한 상황이 발생했고, 고객지원은 자동 응답과 문서 복붙으로 일관했다. 품질도 떨어졌다. Claude Opus가 슬라이더 리팩토링을 요청받고 "모든 range input에 자동으로 값 표시를 주입하는 generic initializer를 만들겠다"는 lazy한 workaround를 제안했다. 이 실수로 5시간 토큰 한도의 50%가 날아갔다. 게다가 캐시가 주기적으로 리셋되면서 같은 코드베이스를 반복 로딩하느라 토큰을 이중 지불하는 구조다. 설정에 없는 "월간 사용량 제한" 경고도 갑자기 뜨더니 2시간 후 사라지는 등 일관성 없는 UX가 계속됐다.

재밌는 포인트

저자가 Claude Haiku에게 "고객 문의와 지원팀 답변을 보고 제대로 답변했는지 평가해달라"고 물었다는 점. AI로 AI 고객지원의 품질을 검증하려 한 셈이다.

왜 지금 중요한가

AI 서비스의 핵심 문제가 모델 성능이 아니라 토큰 경제학과 운영 안정성이라는 걸 보여준다. Anthropic은 급성장하며 수요를 감당 못하는 듯하고, 캐시 정책과 토큰 제한이 사용자 경험을 직접 해친다. "inference를 팔면 고객이 늘수록 컴퓨팅 비용도 선형 증가한다(curse of incremental costs)"는 저자의 지적은 AI 기업의 구조적 한계를 꿰뚫는다.

연관 기사
더 읽기 접기
07 HackerNews

DeepSeek-V4: Towards Highly Efficient Million-Token Context Intelligence

DeepSeek이 100만 토큰 컨텍스트를 지원하는 V4 시리즈를 공개했다. V3 대비 추론 연산량 27%, KV 캐시 10% 수준으로 떨어뜨리면서도 성능은 GPT-5.4, Claude Opus 4.6와 어깨를 나란히 한다.

어떤 글이냐면

DeepSeek이 1.6T 파라미터(49B 활성화)의 V4-Pro와 284B 파라미터(13B 활성화)의 V4-Flash를 공개했다. 핵심은 Compressed Sparse Attention과 Heavily Compressed Attention을 결합한 하이브리드 아키텍처인데, 이걸로 100만 토큰 컨텍스트에서 V3 대비 단일 토큰 추론 비용을 73%나 줄였다. 32T 토큰으로 사전학습 후 2단계 포스트트레이닝을 거쳤고, 특히 V4-Pro-Max 모드는 코딩, 수학, 에이전틱 벤치마크에서 GPT-5.4, Claude Opus 4.6, Gemini 3.1 Pro와 경쟁 가능한 수준에 도달했다. Codeforces 레이팅 3206, SWE-bench Verified 80.6% 해결률, MMLU-Pro 87.5% 같은 숫자가 이를 뒷받침한다. MIT 라이선스로 공개되어 있고, Hugging Face에서 한 달간 다운로드가 7만 8천 건을 넘겼다.

재밌는 포인트

V4-Flash-Max는 Pro 버전 대비 파라미터가 1/6 수준인데도, 충분한 thinking budget을 주면 추론 성능에서 거의 비슷한 결과를 낸다. 작은 모델이 더 오래 생각하면 큰 모델을 따라잡는 셈이다.

왜 지금 중요한가

오픈소스 모델이 클로즈드 프론티어 모델과의 격차를 빠르게 좁히고 있다는 걸 보여주는 사례다. 특히 100만 토큰 컨텍스트를 10%의 메모리로 처리하는 효율성은 실용적 배포 관점에서 게임 체인저다. MIT 라이선스라는 점도 중요한데, 이제 기업들이 자체 인프라에서 GPT-5급 성능을 돌릴 수 있는 선택지가 생긴 것이다.

연관 기사
더 읽기 접기
08 HackerNews

TorchTPU: Running PyTorch Natively on TPUs at Google Scale

구글이 PyTorch를 TPU에서 네이티브로 돌리는 TorchTPU를 공개했다. PyTorch 개발자들이 코드 수정 없이 TPU 슈퍼컴퓨팅 성능을 쓸 수 있게 만드는 야심찬 프로젝트다.

어떤 글이냐면

구글이 자사 TPU 하드웨어에서 PyTorch를 완전히 지원하는 TorchTPU 시스템을 발표했다. 핵심은 PyTorch 개발자들이 익숙한 코드와 API(DDP, FSDP, DTensor 등)를 그대로 쓰면서 TPU의 극한 성능을 뽑아낼 수 있다는 것. Eager 모드부터 torch.compile을 통한 정적 컴파일까지 지원하며, XLA와 StableHLO를 백엔드로 사용해 TPU 토폴로지에 최적화된 바이너리를 생성한다. 특히 기존 PyTorch/XLA의 한계였던 SPMD(순수 병렬) 제약을 넘어 MPMD(랭크별 다른 코드 실행)도 지원해 실제 프로덕션 코드 패턴을 그대로 수용한다. 2026년 내내 동적 shape 지원 강화, vLLM·TorchTitan 통합, 풀 Pod 규모 검증 등을 계획 중이다.

재밌는 포인트

TPU는 어텐션 헤드 차원을 64 대신 128이나 256으로 설정했을 때 피크 성능이 나온다. 하드웨어 특성상 모델 아키텍처를 살짝 바꾸는 것만으로도 효율이 크게 달라진다는 얘기다.

왜 지금 중요한가

PyTorch는 사실상 AI 연구·개발의 표준 프레임워크인데, 구글 TPU는 그동안 JAX 중심이었다. TorchTPU는 PyTorch 생태계를 TPU 인프라로 끌어들이려는 구글의 전략적 베팅이다. 엔비디아 GPU 외에 실질적 대안이 될 TPU 접근성을 높여, 클라우드 AI 인프라 경쟁 구도를 흔들 수 있다.

연관 기사
더 읽기 접기
09 RSS/Noahpinion

Why shoplifting is bad

Noah Smith가 만취한 억만장자 가게털이범을 비판하며 쓴 글. 사실 그 피해는 결국 가난한 동네 직원들 몫이라는 이야기.

어떤 글이냐면

Noah Smith는 이제 Walgreens에서 치약을 사지 않는다. 플라스틱 케이스에 잠겨 있어서 직원을 불러야 하는 게 너무 귀찮아 Amazon에서 대량 구매로 갈아탔다. 샌프란시스코 같은 곳에서 좀도둑이 줄었다는 통계가 나와도, 소매점들이 실제로 막대한 비용을 들여 도난방지 장치를 설치하고 있다는 사실 자체가 문제의 심각성을 증명한다. Numerator 조사에 따르면 쇼핑객 61%가 지난 1년간 잠금장치가 늘었다고 답했고, 27%는 물건이 잠겨 있으면 아예 구매를 포기하거나 다른 매장으로 간다. 결국 좀도둑 때문에 발생하는 비용은 누가 부담하나? Jeff Bezos나 CEO 주머니가 아니라, 해고되는 직원들, 가격 인상을 떠안는 서민 소비자들, 폐점당하는 가난한 동네 상점들이 대부분 감당한다. 최근 NYT 좌담에서 좌파 논객 Hasan Piker와 New Yorker 작가 Jia Tolentino가 "대기업에서 훔치는 건 괜찮다"며 "microlooting"을 옹호했는데, 이들은 경제가 어떻게 작동하는지 모르면서 순간순간 '사회적 비용'을 계산해 법을 어겨도 된다는 위험한 개인주의적 도덕론을 펼친다. Tolentino는 심지어 파이프라인 폭파는 괜찮지만 플라스틱 컵에 아이스커피 담는 건 부도덕하다고 말한다. 하지만 인간은 그런 복잡한 외부효과를 정확히 계산할 능력이 없고, 그래서 우리에겐 사회계약—즉 규칙—이 필요하다.

재밌는 포인트

Whole Foods에서 2천만 달러 손실이 생기면, Bezos 몫 500만 달러는 그에게 '반올림 오차'지만, 점포 폐쇄로 인한 500만 달러 절감은 직원 약 100명의 일자리 소멸을 의미한다. 좀도둑의 실제 피해자는 부자가 아니라 서민이다.

왜 지금 중요한가

AI/테크 업계에서도 비슷한 '개인적 판단주의'가 종종 등장한다. "규칙을 어겨도 더 큰 선을 위한 거라면 괜찮다"는 논리는 Sam Altman의 merge 논란이나, 데이터 스크래핑 정당화, "move fast and break things" 문화와도 맥락이 닿아 있다. 결국 복잡한 시스템에서 개인이 모든 외부효과를 계산할 수 없기에, 사회계약과 규칙이 존재한다는 Smith의 주장은 테크 윤리 논쟁에도 적용된다.

연관 기사
더 읽기 접기
10 RSS/Marginal Revolution

That was then, this is now

"해적"이 경제학 논문이 아니라 페르시아만 역사책에 나온다는 게 신기한데, Tyler Cowen이 오늘 던진 건 그냥 역사 에세이다.

어떤 글이냐면

Tyler Cowen이 Allen James Fromherz의 『The Center of the World: A Global History of the Persian Gulf』를 읽고 흥미로운 대목을 공유한 것. 16세기 포르투갈이 호르무즈 해협을 지배할 때, Nakhilu(Banu Hula) 같은 "해적" 집단이 페르시아만 연안 곳곳의 숨겨진 항구에서 지하 경제를 만들어 포르투갈 수입에 큰 타격을 줬다는 내용. 여기에 보너스로, 밀턴이 『실낙원』에서 Ormus(호르무즈)를 사탄의 왕좌를 묘사하는 데 썼다는 문학적 사실도 덧붙였다.

재밌는 포인트

17세기 영국 시인 밀턴이 사탄의 화려함을 표현하면서 "Ormus(호르무즈)와 인도의 부"를 비유로 썼을 정도로, 당시 유럽인에게 페르시아만은 엄청난 부의 상징이었다.

왜 지금 중요한가

이 글 자체는 역사 에피소드지만, 호르무즈 해협은 지금도 전 세계 석유 수송의 핵심 병목이고, 중동 지정학 리스크의 진원지다. "해적"이 국가 통제 밖 경제 행위자로서 글로벌 무역에 미치는 영향은 16세기나 지금이나 크게 다르지 않다는 점에서, 역사적 통찰이 현재에도 유효하다.

더 읽기 접기