Morning Insight Digest

모닝 인사이트 다이제스트

2026년 4월 9일 목

01 RSS/Stratechery

Anthropic’s New Model, The Mythos Wolf, Glasswing and Alignment

Anthropic이 신모델을 "너무 위험해서 공개할 수 없다"고 선언했다. 근데 Ben Thompson은 이게 진짜 위험해서인지, 아니면 다른 이유가 있는지 의심하고 있다.

어떤 글이냐면

Anthropic이 새 AI 모델을 개발했지만 안전상의 이유로 출시하지 않겠다고 발표한 사건을 다룬다. 이 모델의 코드명은 'Mythos Wolf'이고, Glasswing이라는 기술과 관련이 있는 것으로 보인다. Thompson은 Anthropic의 주장에 회의적인 태도를 보이면서도, 만약 정말로 위험하다면 그건 더 심각한 문제를 제기한다고 본다. AI alignment(정렬) 문제, 즉 AI를 인간의 의도에 맞게 통제할 수 있느냐는 근본적 질문으로 이어지는 셈이다.

재밌는 포인트

AI 회사가 자사 모델을 "너무 위험하다"며 스스로 봉인한 건 매우 이례적이다. 이게 진짜 안전 우려인지, 아니면 마케팅이나 규제 선점 전략인지 논란이 될 수밖에 없다.

왜 지금 중요한가

OpenAI가 투자자들 사이에서 신뢰를 잃어가는 와중에 Anthropic으로 자금이 몰리는 상황이다. 여기서 Anthropic이 "우리는 안전을 최우선한다"는 포지셔닝을 강화하는 건 전략적으로 의미가 크다. 동시에 AI 능력이 정말로 통제 불가능한 수준에 도달하고 있는지에 대한 업계의 불안감도 커지고 있다.

연관 기사
더 읽기 접기
02 HackerNews

Project Glasswing: Securing critical software for the AI era

Anthropic이 "모든 주요 OS와 브라우저에서 수천 개 취약점을 찾아낸" AI 모델을 공개하며, AWS부터 Apple까지 12개 빅테크를 모아 방어 동맹을 만들었다. 공격 도구가 아니라 방패로 쓰겠다는 선언인데, 사실상 "AI가 해커를 능가했다"는 고백이다.

어떤 글이냐면

Anthropic이 Claude Mythos Preview라는 미공개 모델을 발표했다. 이 모델은 소프트웨어 취약점 찾기에서 최고 수준 인간 전문가를 넘어섰고, 실제로 27년 묵은 OpenBSD 버그, 16년 묵은 FFmpeg 결함 등 수천 건의 제로데이 취약점을 자율적으로 발견했다. 문제는 이런 능력이 곧 악의적 행위자에게도 퍼질 수 있다는 것. 그래서 Anthropic은 Project Glasswing이라는 이름으로 AWS, Apple, Google, Microsoft, NVIDIA 등 12개 기업과 Linux Foundation을 모아 방어 연합을 꾸렸다. 1억 달러 크레딧 + 400만 달러 직접 지원으로 주요 소프트웨어와 오픈소스 인프라를 먼저 스캔하고 패치하겠다는 계획이다. CyberGym 평가에서 Mythos Preview는 83.1%로 이전 최고 모델(Opus 4.6, 66.6%)을 압도했고, SWE-bench Verified에서는 93.9%를 기록했다.

재밌는 포인트

OpenBSD는 "세상에서 가장 보안 강화된 OS"로 유명한데, Mythos Preview는 여기서 27년간 숨어있던 원격 크래시 취약점을 찾아냈다. FFmpeg 버그는 자동화 도구가 500만 번 검사했지만 놓쳤던 코드 줄이었다.

왜 지금 중요한가

AI가 단순히 코드를 잘 쓰는 수준을 넘어, 이제 취약점 발굴과 익스플로잇 개발에서 인간 전문가를 능가하는 시점에 도달했다. 공격과 방어의 균형이 무너질 수 있는 임계점이다. Anthropic은 "방어자 우위를 먼저 확보하려면 지금 당장 움직여야 한다"고 말하는데, 실은 이 능력이 확산되기 전에 주요 인프라를 급히 패치하겠다는 레이스 선언이다. 전 세계 사이버 범죄 비용이 연 5000억 달러인 상황에서, AI가 공격 비용을 극적으로 낮추면 방어 패러다임 자체가 바뀐다.

연관 기사
더 읽기 접기
03 HackerNews

Assessing Claude Mythos Preview's cybersecurity capabilities

Anthropic의 새 모델 Claude Mythos Preview가 모든 주요 OS와 브라우저에서 제로데이 취약점을 자동으로 찾아 익스플로잇까지 작성한다. 27년 묵은 OpenBSD 버그부터 4개 취약점을 체인으로 엮은 브라우저 공격까지—보안 전문가 없이도 가능하다.

어떤 글이냐면

Anthropic이 자사 최신 모델 Mythos Preview의 사이버보안 능력을 평가한 기술 보고서다. 이 모델은 Linux, Windows, macOS, 주요 브라우저에서 이전에 발견되지 않은 제로데이 취약점들을 자율적으로 찾아내고, 복잡한 익스플로잇 코드까지 작성했다. 이전 모델인 Opus 4.6은 Firefox 취약점 익스플로잇 성공률이 거의 0%였지만, Mythos Preview는 동일 작업에서 181번 성공했다. 내부 벤치마크에서도 약 7,000개 진입점 중 10개에서 완전한 제어 흐름 탈취(tier 5)를 달성했다. Anthropic은 이를 보안 산업의 분기점으로 보고, 세계 핵심 소프트웨어 방어를 위한 Project Glasswing을 시작했다. 현재 발견한 취약점의 99% 이상이 아직 패치되지 않아 상세 공개가 제한된 상태다.

재밌는 포인트

보안 교육을 받지 않은 Anthropic 엔지니어가 잠들기 전에 모델에게 원격 코드 실행 취약점을 찾으라고 지시했더니, 아침에 일어났을 때 완전히 작동하는 익스플로잇이 준비되어 있었다는 대목. 또한 27년 된 OpenBSD의 TCP SACK 구현 버그를 찾아냈는데, OpenBSD는 보안으로 유명한 OS다.

왜 지금 중요한가

공격과 방어의 균형이 깨지는 과도기가 시작됐다. 역사적으로 퍼징 같은 보안 도구는 결국 방어자에게 유리했지만, 초기엔 공격자가 먼저 활용했다. Anthropic은 장기적으로는 방어자가 이득을 볼 것으로 보지만, 단기적으로 이런 능력의 모델이 광범위하게 풀리기 전에 핵심 인프라를 먼저 보호해야 한다고 판단했다. AI 모델이 단순히 코드 작성을 넘어 실제 사이버 공격 능력을 갖춘 시점에서, 소프트웨어 보안 생태계 전체의 재편이 불가피하다.

연관 기사
더 읽기 접기
04 RSS/Noahpinion

I told you this would end badly

Noah Smith가 2026년 4월에 쓴 글인데, 트럼프 2기 집권 후 이란 전쟁과 관세 폭탄으로 미국이 무너지는 모습을 "내가 경고했었다"며 정리한다. 예측보다 훨씬 더 나쁘게 흘러갔다는 고백이 뼈아프다.

어떤 글이냐면

Noah Smith는 2024년 선거 당시 트럼프의 독재적 성향, 동맹 파괴, 제도 공격을 경고했지만 유권자들은 듣지 않았다. 2026년 현재 휘발유는 갤런당 4달러를 넘고, 미국은 유럽 침공을 위협하며, 중국이 미국보다 호감도가 높은 세상이 됐다. Smith가 예상 못 한 건 두 가지다. 첫째, 트럼프의 관세 정책이 수십 개국에 동시다발적으로 천문학적 관세를 부과했다가 철회하고 또 반복하는 식으로 미친 수준이었다는 것. 둘째, 이란과의 전쟁이다. Smith는 트럼프를 겁쟁이로 봤기에 본격 전쟁은 안 벌일 거라 생각했는데, 트럼프는 이란 지도부 참수 작전을 벌였고 이란은 호르무즈 해협을 봉쇄했다. AWACS 격추, THAAD 레이더 파괴 등 미군 자산이 타격받고, 전 세계 유가가 폭등하며 트럼프는 빠져나갈 길이 없는 상황이다. 이란에 제재를 풀어주며 해협 개방을 구걸했지만 이란은 무시하고 오히려 더 많은 석유를 팔아 돈을 벌고 있다. 트럼프는 "승리"를 선언하며 빠져나가려 하지만 아무도 안 믿는다.

재밌는 포인트

미국이 보유한 AWACS는 16대밖에 없는데 이란이 그중 하나를 격추했다. 트럼프는 이란 제재를 풀어주면서까지 호르무즈 해협 재개방을 간청했지만, 이란은 그냥 석유 더 팔아서 돈만 벌고 해협은 안 열어줬다.

왜 지금 중요한가

이 글은 2026년 미래 시점에서 쓴 가상 시나리오인데, 트럼프 2기 정책(관세, 외교, 군사)이 최악으로 전개될 경우 어떤 경로를 밟을지 구체적으로 그린다. 실제로 2025년 트럼프 행정부의 관세 정책과 대이란 강경론이 현실화되는 상황에서, 이 시나리오는 단순한 경고가 아니라 정책 실패의 메커니즘을 보여주는 사고 실험이다. 특히 호르무즈 해협 봉쇄 시나리오는 에너지 안보와 글로벌 공급망 리스크를 상기시킨다.

연관 기사
더 읽기 접기
05 RSS/Platformer

Why Anthropic’s new model has cybersecurity experts rattled

Anthropic의 신모델 Claude Mythos는 너무 위험해서 일반 공개를 안 한다. 27년간 숨어있던 보안 취약점을 찾아내는 수준이다.

어떤 글이냐면

Anthropic이 Claude Mythos라는 새 모델을 공개했는데, 이건 일반 출시가 아니라 40개 이상의 글로벌 테크기업(애플, 구글, MS 등)에게만 먼저 풀어준 것이다. 이유는 명확하다. 이 모델이 사이버보안 취약점을 찾아내고 공격 체인을 만드는 능력이 너무 강력해서, 범죄자나 해커 집단 손에 들어가면 위험하다는 판단 때문이다. Anthropic은 Project Glasswing이라는 이니셔티브를 통해 1억 달러의 사용 크레딧을 주고, 참여 기업들이 자기 시스템과 오픈소스 인프라의 취약점을 먼저 찾아 패치하도록 돕고 있다. Mythos는 이미 모든 주요 OS와 웹브라우저에서 수천 건의 고위험 취약점을 찾았고, OpenBSD의 27년 묵은 결함, FFmpeg의 500만 번 테스트를 통과한 버그, 리눅스 커널의 여러 치명적 취약점을 발견했다. 보안 전문가들은 이게 "진짜 큰일"이라며, 오픈소스 모델이 따라잡기까지 6개월 정도밖에 남지 않았다고 경고한다. 한편 미국 정부는 Anthropic을 공급망 위협으로 지정하려 했다가 법원에 막힌 상태다.

재밌는 포인트

한 민간 기업이 이제 "거의 모든 주요 소프트웨어 프로젝트의 엄청나게 강력한 제로데이 익스플로잇"을 갖고 있다는 점. 권력의 중앙화이자 동시에 리스크의 중앙화다.

왜 지금 중요한가

AI 안전성 논의가 추상적 위험에서 구체적 현실로 넘어왔다. "위험하니까 안 만든다"가 아니라 "먼저 만들어서 방어에 쓴다"는 Anthropic의 전략이 실전에 돌입했는데, 이게 정말 작동할지, 아니면 판도라의 상자를 먼저 여는 것일지는 아무도 모른다. 규제 없는 환경에서 민간 기업이 이런 능력을 독점하는 상황 자체가 새로운 권력 구조를 만들고 있다.

연관 기사
더 읽기 접기
06 HackerNews

ML promises to be profoundly weird

LLM은 미적분은 척척 푸는데 컵이 뒤집혀 있는지는 모른다. 이 "들쭉날쭉한 경계선"이 왜 위험한지 ML 현장의 목소리.

어떤 글이냐면

Aphyr(카일 킹스베리)가 5년간 묵혀둔 LLM 비판론을 쏟아낸 긴 에세이다. 2019년 클라우드 컨퍼런스에서 "LLM을 값싸게 만드는 게 윤리적이냐"고 물었던 그는, 튜링 테스트가 깨진 2026년 현재 매일 LLM의 거짓말을 목격한다고 말한다. 핵심은 jagged frontier(들쭉날쭉한 경계선): LLM은 미분방정식은 술술 풀지만 "지붕 위 눈이 공중에 떠 있다"고 착각하고, T셔츠 어깨에 패치 붙이는 간단한 작업을 45분간 실패한다. "사람들은 LLM의 수학 실력에 속아 전제 자체가 헛소리인 걸 놓친다." 엔지니어들은 "Claude가 복잡한 작업을 한 방에 푼다"며 열광하지만, 동시에 은행 계좌를 맡긴 사람은 수십만 달러를 날리고, 구글 AI 요약은 10%가 틀렸다. 그는 이 시스템을 "bullshit machine"이라 부르며, 완성을 강요받는 통계 엔진이 "모를 때 모른다고 말하지 못한다"는 구조적 문제를 지적한다.

재밌는 포인트

ChatGPT는 저자가 게이인데도 "블로그에서 여자친구 언급했다"며 이성애자라 우기다가, 한참 설득 끝에 "양성애자로 타협"했다. LLM은 협상도 하는 셈.

왜 지금 중요한가

엔지니어 커뮤니티가 "코드를 더 이상 직접 안 쓴다"고 말하는 시점에, 현장에서 매일 LLM을 쓰는 사람이 "예측 불가능한 바보"라고 경고하는 건 주목할 만하다. Transformer 이후 더 나은 아키텍처가 안 나오고 "파라미터 더 때려박기"만 작동한다는 업계 뒷얘기도, AI 투자 열풍의 기술적 한계를 암시한다. "취향만이 진짜 해자"라던 과거 기사와 맞물려, LLM 시대에도 인간의 판단과 맥락 이해가 여전히 핵심 자산임을 확인시킨다.

연관 기사
더 읽기 접기
07 HackerNews

OpenAI says its new model GPT-2 is too dangerous to release (2019)

2019년 OpenAI가 GPT-2를 "너무 위험해서 공개할 수 없다"며 일부만 공개했을 때, 업계는 과장이라고 비판했다. 지금 돌아보면 그들이 옳았을까, 틀렸을까?

어떤 글이냐면

OpenAI가 GPT-2를 발표하며 "악용 우려" 때문에 전체 모델과 학습 데이터를 비공개하겠다고 선언했다. 언론은 "인류를 위해 봉인된 AI"라며 호들갑을 떨었지만, ML 전문가들은 회의적이었다. 기술 자체는 획기적이었지만 새로운 기법이 아니라 기존 접근의 '잘 된 다음 단계'였고, 충분한 자원만 있으면 누구나 비슷한 걸 만들 수 있었기 때문이다. CMU 연구자는 "결과를 금지해도 다른 사람들이 어차피 따라 만들 텐데 의미가 있나"라고 지적했다. MIT 연구자는 이를 "윤리 논쟁을 시작하기 위한 제스처"로 봤다. 핵심은 AI 분야가 아직 "만든 제품의 해악과 이익의 균형"을 판단하는 성숙한 프레임워크가 없다는 것이었다.

재밌는 포인트

GPT-2가 생성한 유니콘 기사에서 "물 속에서 일어나는 화재"를 이유 없이 언급했다는 대목. 2019년 기준으로도 AI 환각은 명백했다.

왜 지금 중요한가

5년 전 "공개 vs 비공개" 논쟁은 결국 OpenAI 자체의 변화로 귀결됐다. 당시 "책임 있는 AI 개발"을 내세웠던 비영리 조직은 지금 폐쇄적 상업 모델의 선봉에 섰고, 오히려 Anthropic이 그 자리를 채우고 있다. 1990년대 암호화 규제 실패 사례처럼, 기술 확산을 막는 건 불가능에 가깝다는 당시의 통찰은 여전히 유효하다.

연관 기사
더 읽기 접기
08 RSS/Pragmatic Engineer

DHH’s new way of writing code

6개월 전까지 "난 AI 안 쓴다"던 Ruby on Rails 창시자 DHH가 이제 코드를 거의 손으로 안 쓴다. 그가 말하는 에이전트 시대 개발자의 역할.

어떤 글이냐면

37signals CTO이자 Rails 창시자 DHH가 Pragmatic Engineer 팟캐스트에서 밝힌 개발 방식의 급격한 변화에 관한 이야기다. 6개월 전 Lex Fridman 팟캐스트에서 "AI 도구 안 쓰고 직접 타이핑한다"던 그가, 이제는 tmux에 Gemini 2.5와 Opus 4.5 두 모델을 띄워놓고 에이전트가 생성한 코드를 Neovim으로 리뷰만 하는 방식으로 일한다. 핵심은 철학이 바뀐 게 아니라 도구가 진화했다는 점이다. 탭 자동완성 수준의 AI는 숙련된 개발자에게 방해였지만, Opus 4.5급 에이전트는 "거의 수정 없이 머지할 수 있는" 코드를 만든다. 그는 "에이전트 여러 개를 관리하는 건 프로젝트 매니저 같은 게 아니라 메카 슈트를 입은 느낌"이라고 표현한다. 37signals에서는 시니어 엔지니어가 P1 최적화(상위 1% 빠른 요청을 4밀리초에서 0.5밀리초로 단축)같은 이전엔 엄두도 못 낸 작업을 AI 덕분에 해냈고, 2019년 출간한 'Shape Up'의 2개월 개발 사이클은 이제 너무 느려서 방법론 자체를 다시 써야 할 판이다.

재밌는 포인트

37signals는 엔지니어 20명에 디자이너 10명, 즉 2:1 비율이다. 디자이너가 PM이자 구현자 역할까지 하는데, DHH는 "AI가 이 모델을 업계 표준으로 만들 것"이라 본다. 그리고 CLI가 AI 시대 최고의 인터페이스라며 1970년대 Unix 철학의 승리라고 말한다.

왜 지금 중요한가

"시니어는 에이전트 출력을 검증할 수 있지만 주니어는 못한다"는 DHH의 관찰은 Amazon도 같은 결론에 도달했다는 점에서 업계 공통 현상이다. AI가 생산성을 높이되 경험 격차를 증폭시키는 구조가 고착화되고 있다. 동시에 Rails처럼 토큰 효율적이고 테스트가 프레임워크에 내장된 스택이 AI 시대에 유리하다는 점은, 기술 선택의 기준 자체가 바뀌고 있음을 보여준다.

연관 기사
더 읽기 접기
09 HackerNews

MegaTrain: Full Precision Training of 100B+ Parameter LLMs on a Single GPU

GPU 한 장으로 1000억 파라미터 모델을 풀 정밀도로 훈련한다. 메모리 병목을 뚫는 새로운 접근법이 나왔다.

어떤 글이냐면

MegaTrain이라는 시스템이 단일 GPU에서 100B 파라미터 이상의 LLM을 full precision으로 훈련할 수 있게 만들었다. 핵심은 발상의 전환이다. 파라미터와 옵티마이저 상태를 GPU 메모리가 아닌 CPU 메모리(호스트 메모리)에 저장하고, GPU는 계산만 하는 '일시적 엔진'으로 쓴다. 레이어별로 파라미터를 스트리밍해서 받아오고, 그래디언트를 계산해서 보내는 방식이다. CPU-GPU 간 대역폭 병목을 해결하기 위해 두 가지 최적화를 도입했다. 첫째, 파라미터 프리페칭, 계산, 그래디언트 오프로딩을 여러 CUDA 스트림에 걸쳐 파이프라인으로 오버랩시켜 GPU가 계속 돌아가게 만든다. 둘째, 영구적인 autograd 그래프 대신 stateless한 레이어 템플릿을 사용해, 가중치를 동적으로 바인딩하면서 메타데이터 오버헤드를 없앴다. 결과는 명확하다. H200 GPU 한 장(호스트 메모리 1.5TB)에서 120B 파라미터 모델을 안정적으로 훈련했고, 14B 모델 훈련 시 DeepSpeed ZeRO-3 CPU 오프로딩 대비 1.84배 빠른 처리량을 기록했다. GH200에서는 7B 모델을 512k 토큰 컨텍스트로 훈련하는 것도 가능하다.

재밌는 포인트

GPU를 '저장소'가 아닌 '계산 엔진'으로만 쓰는 역발상. 결국 메모리는 싸고 많은 곳(CPU)에, 계산은 빠른 곳(GPU)에 분리한 것인데, 이게 120B 파라미터를 단일 GPU로 훈련 가능하게 만들었다.

왜 지금 중요한가

모델 크기는 계속 커지는데 GPU 메모리는 한정적이다. 대부분의 연구자나 스타트업은 수백 개의 GPU 클러스터를 쓸 수 없다. MegaTrain은 메모리 중심 설계로 접근성 문제를 정면돌파한다. DeepSpeed 같은 기존 솔루션보다 빠르고, 긴 컨텍스트 훈련까지 가능하다는 건 실용성이 검증됐다는 뜻이다. 결국 누가 더 적은 자원으로 큰 모델을 훈련하느냐가 차세대 AI 경쟁의 분수령이 될 수 있다.

연관 기사
더 읽기 접기
10 HackerNews

Anthropic expands partnership with Google and Broadcom for next-gen compute

Anthropic이 Google, Broadcom과 기가와트 단위 TPU 계약을 맺었다. 연매출 300억 달러를 찍으며 OpenAI를 제치고 AI 판도를 흔들고 있다는 신호다.

어떤 글이냐면

Anthropic이 Google, Broadcom과 2027년부터 가동될 차세대 TPU 용량을 "multiple gigawatts" 규모로 확보했다고 발표했다. 핵심은 성장 속도다. 2025년 말 연매출 약 90억 달러에서 2026년 현재 300억 달러를 넘어섰고, 2월에 발표한 Series G 당시 연 100만 달러 이상 쓰는 고객이 500곳이었는데 지금은 1,000곳을 넘겼다. 두 달 만에 두 배다. 대부분의 컴퓨팅 인프라는 미국 내 설치되며, 지난해 발표한 500억 달러 미국 투자 확대의 연장선이다. AWS Trainium, Google TPU, NVIDIA GPU를 모두 쓰는 멀티 플랫폼 전략도 강조했고, AWS는 여전히 주 파트너로 남아 있다.

재밌는 포인트

연 100만 달러 이상 쓰는 기업 고객이 두 달 만에 500곳에서 1,000곳으로 두 배 늘었다는 건 엔터프라이즈 수요가 폭발적으로 늘고 있다는 뜻이다. Claude가 실제로 돈 되는 모델로 자리 잡았다는 증거.

왜 지금 중요한가

AI 경쟁의 축이 OpenAI에서 Anthropic으로 옮겨가고 있다는 신호다. 매출 성장률, 엔터프라이즈 침투력, 멀티 클라우드 전략 모두 OpenAI보다 유리한 위치를 점하고 있다. Google-Broadcom과의 기가와트급 계약은 단순히 인프라 확장이 아니라, Claude 생태계가 본격적으로 산업 표준으로 굳어지고 있다는 의미다. 컴퓨팅 자원 확보 경쟁이 곧 AI 시장 지배력으로 이어지는 구조에서, Anthropic이 선수를 쳤다.

연관 기사
더 읽기 접기