Morning Insight Digest

모닝 인사이트 다이제스트

2026년 4월 1일 수

01 RSS/Stratechery

Apple’s 50 Years of Integration

애플이 창립 50주년을 맞았다. 여전히 하드웨어와 소프트웨어 통합에서 진짜 경쟁자가 없고, 이제 AI 시대에 그 통합을 가장 강력한 무기로 쓰려 한다.

어떤 글이냐면

Ben Thompson이 애플의 50년 역사를 자신의 컴퓨터 사용 경험과 겹쳐 풀어낸 장문의 분석이다. 애플은 IBM(메인프레임), 마이크로소프트(모듈형 PC), 소니·RIM·노키아(초기 스마트폰), 구글 안드로이드를 거치며 늘 "통합형" 전략을 고수했다. DOS 시대엔 MAC이 밀렸지만, 아이폰은 iOS를 먼저 내놓으면서 안드로이드와 달리 고급 시장을 장악했다. 이제 애플은 AI 모델에 막대한 투자를 하지 않으면서도, iOS 27에서 시리를 여러 AI 제공자(ChatGPT, Gemini, Claude 등)에게 개방해 "AI 수퍼마켓" 역할을 하려 한다. 앱스토어 구독료 수수료(첫해 30%, 이후 15%)로 수익을 챙기고, 사용자는 원하는 AI를 고르게 하는 구조다. 결국 디바이스를 소유한 자가 AI를 집합(aggregate)한다는 논리다.

재밌는 포인트

애플은 이미 챗봇 구독료만으로 연 10억 달러를 벌고 있다. AI 인프라에 운영현금흐름의 94%를 쏟아붓는 빅테크들과 달리, 애플은 "고객을 소유"하는 것만으로 AI 시대의 톨게이트 역할을 한다.

왜 지금 중요한가

AI 버블 우려 속에서 애플의 전략은 "인프라 경쟁에서 빠지고 유통을 장악"하는 고전적 승리 공식의 현대판이다. 마이크로소프트가 DOS로, 구글이 검색으로 했던 걸, 애플은 아이폰으로 한다. AI 제공자들이 서로 경쟁하게 만들고, 애플은 그 위에서 수수료를 받는 구조는 앱스토어 모델의 AI 버전이다. 통합의 힘이 모듈형 시대에도 여전히 유효하다는 증거.

연관 기사
더 읽기 접기
02 HackerNews

Oracle slashes 30k jobs

오라클이 새벽 6시에 이메일 한 통으로 3만 명을 해고했다. AI 데이터센터 짓겠다고 58조 빚내고, 직원은 자르고, 주가는 반토막 났다.

어떤 글이냐면

3월 31일 새벽 6시, 오라클 직원 2만에서 3만 명(전체 인력의 18%)이 "Oracle Leadership" 명의의 이메일 한 통으로 해고 통보를 받았다. 미국, 인도 등 전 세계에서 동시에 발송됐고, HR이나 매니저의 사전 안내는 전혀 없었다. 이메일을 읽는 순간 그게 마지막 근무일이었고, 시스템 접근 권한도 즉시 차단됐다. RHS와 SVOS 팀은 30% 이상 잘렸고, 넷스위트 인도 개발센터도 PM부터 매니저까지 전 직급이 타격을 받았다. 미행사 RSU는 즉시 소멸, 회사 맥북에는 감시 소프트웨어가 설치됐다는 증언도 나왔다. 이 대규모 정리해고로 오라클은 연간 80억에서 100억 달러의 현금 흐름을 확보할 것으로 예상되는데, 이건 AI 데이터센터 건설에 쏟아부을 돈이다. 오라클은 지난 두 달간 580억 달러의 부채를 떠안았고, 주가는 2025년 9월 고점 대비 절반 이상 폭락했다. 심지어 여러 미국 은행들이 데이터센터 프로젝트 자금 지원에서 손을 뗐다. 역설적이게도 지난 분기 순이익은 61억 달러로 95% 급증했다.

재밌는 포인트

분기 순이익이 95% 폭증한 회사가 580억 달러 빚내고 3만 명을 새벽 이메일로 자른다. 성장이 아니라 베팅의 크기가 문제인 셈이다.

왜 지금 중요한가

AI 인프라 경쟁이 기업 재무구조와 고용을 어떻게 뒤흔드는지 보여주는 극단적 사례다. 수익성과 무관하게 "AI 투자 = 생존"이라는 공식이 실리콘밸리를 지배하고 있고, 그 비용은 결국 인력으로 전가된다. 오라클의 선택은 앞으로 더 많은 레거시 테크 기업들이 따를 가능성이 높은 경로다.

연관 기사
더 읽기 접기
03 RSS/Astral Codex Ten

Against The Concept Of Telescopic Altruism

"진보는 먼 나라 사람은 걱정하면서 이웃은 신경 안 쓴다"는 비판, 알고 보니 데이터도 논리도 없는 허수아비 공격이었다.

어떤 글이냐면

보수 진영에서 진보를 공격할 때 자주 쓰는 프레임이 "망원경적 이타주의(telescopic altruism)"다. 가자지구는 걱정하면서 자기 동네는 신경 안 쓴다는 식의 비판인데, 저자는 이게 완전히 허구라고 반박한다. 가자 사태에 분노하는 사람이 자기 이웃 5만 명이 죽어도 덤덤할 리 없고, 채식주의자가 돼지 10억 마리의 학대에 분노한다면 자기 친구 10억 명이 같은 상황이어도 당연히 분노할 거라는 논리다. 보수 진영이 증거로 내세우는 "그 유명한 연구"도 실제로는 진보가 가족이나 친구를 덜 챙긴다는 결과를 보여주지 않는다. 오히려 현실 데이터를 보면 진보가 빈곤층 급식 지원, 팬데믹 대응, 가족 돌봄 시간 등에서 일관되게 더 적극적이다. 저자는 "상관적 이타주의(correlated altruism)" 가설을 제시한다. 멀리 있는 사람에게 친절한 사람이 가까운 사람에게도 친절하다는 것. "손님에게는 친절하지만 웨이터에게 무례한 사람은 좋은 사람이 아니다"라는 Dave Barry의 말이 핵심이다.

재밌는 포인트

보수 진영이 증거로 삼는 "동심원 연구"의 히트맵을 완전히 오독했다. 진보의 맵이 동물 영역에서 "가장 뜨겁다"는 건 진보가 가족보다 동물을 더 챙긴다는 뜻이 아니라, 동물까지 관심 범위에 포함시킨다는 뜻이었다.

왜 지금 중요한가

AI 시대, 정치 양극화, 글로벌 이슈(기후변화, 난민 등)가 복잡하게 얽히면서 "누구를 먼저 도와야 하나" 논쟁이 격화되고 있다. 효과적 이타주의(EA) 운동도 비슷한 비판을 받는데, 이 글은 그런 공격이 대부분 데이터 없는 감정 싸움임을 보여준다. 실제로는 공감 능력 자체가 상관관계를 갖는다는 점이 정책 설계와 사회 담론에 시사점을 준다.

연관 기사
더 읽기 접기
04 RSS/Marginal Revolution

The economics of dropout risk

미국 대학생 절반이 졸업 못 하는데, 정작 본인들은 "나는 괜찮을 거야"라고 믿는다. 이 낙관 편향이 학자금 대출과 만나면 복지가 오히려 감소할 수 있다는 연구.

어떤 글이냐면

Bryan Caplan이 계속 지적해온 "대학 중퇴 리스크"에 대한 후속 연구가 나왔다. AEJ: Macroeconomics에 실린 논문은 미국 대학생들이 학위 취득 가능성을 과대평가하는 경향(widespread optimism)이 있고, 이 믿음이 실제로 입학 결정에 영향을 준다는 걸 보여준다. 연구진은 대학을 "연방 학자금 대출·보조금·가족 지원·근로소득으로 감당하는 위험한 투자"로 모델링했다. 결론은 놀랍게도, 저숙련·저소득층에게 연방 학자금 대출 접근성이 오히려 복지를 감소시킬 수 있다는 것이다. 이유는 간단하다. 잘못된 믿음 때문이다.

재밌는 포인트

정부 지원이 취약계층에 해가 될 수 있다는 역설. 낙관 편향 + 쉬운 대출 = 졸업 못 하고 빚만 남는 함정.

왜 지금 중요한가

학자금 대출 탕감 논쟁이 계속되는 미국에서, "접근성 확대"가 능사가 아니라는 데이터가 나온 셈이다. 대학을 투자로 보면, 리스크를 제대로 인식 못 하는 사람에게 레버리지를 주는 건 위험하다. 교육 정책의 기본 전제를 다시 생각하게 만드는 연구다.

더 읽기 접기
05 RSS/Platformer

Mark Zuckerberg is doing content moderation again

마크 저커버그가 다시 콘텐츠 모더레이션에 직접 나섰다. 한때 "커뮤니티 규칙"으로 떠넘겼던 그 문제로.

어떤 글이냐면

Platformer는 메타의 콘텐츠 정책 변화를 계속 추적해왔는데, 이번 글은 저커버그가 다시 모더레이션 전면에 나선 배경을 다루는 듯합니다. 최근 메타는 팩트체크 시스템을 폐지하고 커뮤니티 노트 방식으로 전환했고, 이에 대한 정치적·법적 압박이 거세지면서 저커버그가 직접 개입하는 양상으로 보입니다. 기사 제목에 등장하는 "Elon tried to tank Twitter"나 뉴멕시코 소송 언급은 소셜 미디어 플랫폼들이 직면한 규제·소송 압박이 동시다발적임을 시사합니다.

재밌는 포인트

2016년 이후 "우리는 플랫폼일 뿐"이라던 저커버그가 다시 정책 전면에 나선다는 건, 방임 전략이 실패했다는 뜻일 수 있습니다.

왜 지금 중요한가

빅테크의 콘텐츠 정책은 AI 시대 들어 더 복잡해졌습니다. 생성형 AI가 만든 허위정보, 딥페이크, 봇 계정이 폭증하는 와중에 "커뮤니티 자율"만으론 통제가 안 되고, 그렇다고 AI 모더레이션에만 맡기자니 오판 리스크가 큽니다. 저커버그의 복귀는 이 딜레마가 최고경영자급 어젠다가 됐다는 신호입니다.

연관 기사
더 읽기 접기
06 RSS/Pragmatic Engineer

What is inference engineering? Deepdive

LLM이 답변을 생성하는 순간, 바로 그 '추론(inference)' 과정을 최적화하는 엔지니어링이 AI 산업에서 가장 가치 있는 영역으로 떠오르고 있다. 그런데 정작 이 분야를 제대로 아는 사람은 아직 몇 천 명에 불과하다.

어떤 글이냐면

Baseten에서 4년간 일한 엔지니어 Philip Kiely가 쓴 "Inference Engineering" 책을 토대로, AI 모델이 실제로 응답을 생성하는 '추론' 단계의 엔지니어링을 깊이 파헤친다. 과거엔 OpenAI 같은 소수 기업만 닫힌 모델(closed model)로 추론을 다뤘지만, DeepSeek V3 같은 오픈 모델이 성능 격차를 좁히면서 Cursor 같은 회사들도 직접 추론을 최적화하기 시작했다. 추론 엔지니어링은 배칭(batching), 캐싱, 양자화(quantization), 추측 디코딩(speculative decoding), 병렬화, disaggregation 같은 기법으로 응답 속도를 높이고 비용을 80% 이상 낮출 수 있다. 결국 CUDA부터 Kubernetes까지 전체 스택을 넘나들며, AI 제품의 지연시간·안정성·경제성을 직접 통제하는 게 핵심이다.

재밌는 포인트

Hugging Face에 올라온 오픈 모델 수가 5년 전보다 25배 증가해 200만 개를 넘었고, 2024년 12월 DeepSeek V3 출시 이후 오픈 모델과 클로즈드 모델 간 성능 격차가 사실상 사라졌다. 오픈 모델 쓰면 비용은 80% 줄고, 가용성은 99%에서 99.99%로 올릴 수 있다는 게 실제 숫자로 입증되고 있다.

왜 지금 중요한가

AI 제품 경쟁력이 모델 자체가 아니라 '얼마나 빠르고 싸고 안정적으로 돌리느냐'로 옮겨가고 있다. Cursor, Notion, 의료 AI 스타트업들이 오픈 모델로 갈아타면서 추론 최적화가 차별화 포인트가 됐고, 이제 추론 엔지니어는 AI 시대의 새로운 핵심 직군으로 자리 잡는 중이다. 아직 초기 단계라 지금 뛰어들면 빠르게 전문가가 될 수 있는 타이밍이기도 하다.

연관 기사
더 읽기 접기
07 HackerNews

Artemis II is not safe to fly

NASA가 수요일 4명을 달로 보내는데, 열 차폐막이 '문자 그대로' 덩어리째 날아가는 결함을 알면서도 발사를 강행한다. 콜럼비아호 사고 조사위원장이 경고했던 "일정과 예산 압박에 안전마진을 깎아먹는" 정확히 그 상황.

어떤 글이냐면

NASA의 Artemis II 미션이 수요일 발사 예정인데, 2022년 무인 시험비행(Artemis I)에서 귀환 시 열 차폐막에 깊은 구멍들이 생기고 분리볼트 4개 중 3개가 녹아내린 문제가 발견됐다. NASA는 처음엔 이를 축소하려 했지만, 2024년 감사관실(OIG) 보고서가 사진을 공개하면서 실상이 드러났다. 문제는 세 가지 방식으로 승무원을 죽일 수 있다: 차폐막 파편화로 인한 캡슐 노출, 파편의 낙하산 구역 충돌, 볼트 용해로 인한 고온가스 유입. NASA는 "궤적 변경으로 해결 가능"하다며 발사를 강행하기로 했지만, 정작 Artemis III부터는 새 차폐막 설계를 쓸 예정이다. 우주왕복선 출신 열 차폐 전문가 Charles Camarda는 "챌린저·콜럼비아 때와 똑같은 자기기만"이라며 공개 반대에 나섰다. 1000억 달러를 쓴 25년 프로그램, 대량해고를 겪은 기관, 2029년까지 달 착륙을 약속한 신임 국장이라는 맥락 속에서, 엔지니어들은 "안전하다"고 믿고 싶어하는 모델을 만들어내고 있다.

재밌는 포인트

NASA는 민간 우주선(SpaceX Dragon, Boeing Starliner)에는 이런 손상이 나오면 재설계와 무인 재시험을 요구하지만, 자신의 flagship 프로그램에는 같은 기준을 적용하지 않는다. Orion 캡슐 1대 가격은 10억 달러 이상, SLS 로켓 1회 발사는 20억에서 40억 달러.

왜 지금 중요한가

이건 단순한 우주 프로그램 이슈가 아니라, 거대 조직이 매몰비용과 정치적 압박 앞에서 어떻게 리스크를 rationalize하는지 보여주는 케이스다. AI/테크 업계에서도 "출시 일정 맞추기 vs. 안전성 검증" 사이 긴장이 커지는 시점에, 챌린저호(1986)와 콜럼비아호(2003) 이후에도 같은 조직적 실패가 반복되는 모습은 뼈아픈 경고다. 결국 "move fast and break things"의 극한 버전.

연관 기사
더 읽기 접기
08 HackerNews

Fedware: Government apps that spy harder than the apps they ban

정부가 TikTok을 "안보 위협"이라 금지하면서, 정작 자기네 앱엔 화웨이 SDK를 박아 넣었다. 백악관 공식 앱에서.

어떤 글이냐면

백악관이 3월 27일 출시한 공식 앱(버전 47.0.1)은 뉴스 배포용이라고 하지만, GPS 위치, 지문 인식, 저장소 수정, 부팅 시 자동 실행, 다른 앱 위에 표시 권한까지 요구한다. 더 아이러니한 건 미국 정부가 제재한 화웨이의 Mobile Services Core를 포함해 3개 트래커를 내장했다는 점이다. "Text the President" 버튼을 누르면 "Greatest President Ever!"가 자동 입력되며 이름과 전화번호를 수집한다. FBI 앱은 구글 AdMob 광고 SDK를 탑재해 타겟 광고를 제공하고, FEMA 재난 알림 앱은 28개 권한을 요구한다(AP News는 같은 정보를 훨씬 적은 권한으로 제공). CBP 여권 앱은 백그라운드 위치 추적, 안면 데이터를 수집해 75년간 보관하며 DHS, ICE, FBI와 공유한다. ICE의 SmartLINK 감시 앱(GEO Group 자회사가 22억 달러 계약으로 제작)은 GPS, 얼굴, 음성, 임신 정보까지 수집하며 ICE는 "무제한 사용·폐기·공개" 권한을 갖는다. 정부는 또한 Venntel 같은 데이터 브로커로부터 하루 150억 개 위치 데이터를 영장 없이 구매해 Carpenter 판례를 우회한다. IRS는 ICE와 데이터 공유 협정을 맺어 128만 명 정보를 넘겼고, 실수로 제외 대상자까지 포함시켰다. 현 국세청 대행 위원장은 항의 사임했다. GAO는 2010년 이후 236개 프라이버시 권고사항 중 60% 가까이가 여전히 미이행 상태라고 보고했다.

재밌는 포인트

백악관 앱 버전 번호가 47.0.1인데, 47은 트럼프가 47대 대통령이라는 점을 노린 것으로 보인다. 그리고 정부가 금지한 화웨이 SDK가 그 안에 들어 있다.

왜 지금 중요한가

정부가 "국가 안보"를 이유로 중국 앱을 금지하면서, 정작 자신들은 더 침투적인 감시 인프라를 국민 기기에 심고 있다. 이건 기술적 위선을 넘어 감시 국가의 이중 잣대를 적나라하게 보여주는 사례다. 특히 AI 시대 데이터 주권 논쟁에서 "누가 데이터를 수집하느냐"보다 "어떻게 수집하고 누구와 공유하느냐"가 진짜 쟁점임을 드러낸다.

연관 기사
더 읽기 접기
09 HackerNews

Ollama is now powered by MLX on Apple Silicon in preview

Ollama가 애플 MLX 기반으로 전환하며 M5 칩에서 추론 속도가 최대 2배 빨라졌다. 로컬 AI의 판도가 다시 바뀌는 순간.

어떤 글이냐면

Ollama 0.19 버전이 애플 실리콘에서 MLX 프레임워크 기반으로 재설계됐다. M5/Pro/Max 칩의 GPU Neural Accelerator를 활용해 Qwen3.5-35B 모델 기준으로 prefill 속도가 1154에서 1810 토큰/초로, decode 속도가 58에서 112 토큰/초로 향상됐다. NVIDIA의 NVFP4 양자화 포맷을 채택해 프로덕션 환경과 동일한 품질을 유지하면서도 메모리 효율을 높였고, 캐싱 시스템을 개선해 대화 간 프롬프트 재사용과 체크포인트 저장으로 응답성을 끌어올렸다. Claude Code, OpenClaw 같은 코딩 에이전트 작업에 최적화됐으며, 32GB 이상 메모리가 필요하다.

재밌는 포인트

NVIDIA의 NVFP4 포맷을 MLX에서 쓴다는 점. 경쟁사 양자화 기술을 크로스 플랫폼으로 끌어와 "프로덕션 패리티"를 달성한 셈이다.

왜 지금 중요한가

로컬 AI 추론이 클라우드 대비 성능 격차를 빠르게 좁히고 있다. 애플 실리콘의 unified memory와 전용 가속기를 제대로 활용하면 개인 기기에서도 35B 파라미터급 모델을 실용적으로 돌릴 수 있다는 증명이고, 이는 프라이버시/비용 측면에서 클라우드 의존도를 낮추는 전환점이 될 수 있다.

연관 기사
더 읽기 접기
10 HackerNews

The Claude Code Source Leak: fake tools, frustration regexes, undercover mode

Anthropic이 Claude Code 소스를 실수로 npm에 통째로 공개했다. 가짜 툴로 경쟁사 학습 방해하기, AI가 자기 정체 숨기기, 욕설 감지는 정규식으로 하기 같은 민망한 내부 사정이 다 드러났다.

어떤 글이냐면

3월 31일, Anthropic이 Claude Code npm 패키지에 .map 파일을 포함시켜서 전체 소스가 유출됐다. 일주일 전 모델 스펙 유출에 이은 두 번째 사고다. 소스를 뜯어보니 흥미로운 게 한두 개가 아니다. API 트래픽 기록해서 모델 학습하는 경쟁사를 막으려고 가짜 툴을 시스템 프롬프트에 주입하는 anti-distillation 로직, 오픈소스 프로젝트에서 AI임을 숨기는 undercover mode, 유저 욕설은 정규식으로 감지하는 frustration detection, 그리고 Bun의 네이티브 레이어에서 해시를 심어 진짜 클라이언트인지 검증하는 DRM 같은 인증 시스템이 있다. 하루 25만 건의 API 낭비를 막은 3줄짜리 코드, 아직 출시 안 된 자율 에이전트 KAIROS 모드, 내일 출시할 것으로 보이는 타마고치 스타일 AI 컴패니언 등 로드맵도 다 드러났다. 코드 퀄리티는 들쑥날쑥인데, 5,594줄짜리 print.ts 파일과 12단계 중첩 함수도 있고, 보안 취약한 Axios를 쓰고 있다.

재밌는 포인트

LLM 회사가 유저 감정 분석에 LLM 대신 정규식을 쓴다. 빠르고 싸니까. 그리고 Anthropic이 작년 말 인수한 Bun의 버그 때문에 소스맵이 프로덕션에 노출됐을 가능성이 있다. 자기 도구가 자기를 배신한 셈.

왜 지금 중요한가

코드 자체보다 전략적 의도가 드러난 게 문제다. KAIROS 같은 미공개 기능, anti-distillation 같은 경쟁 방어 메커니즘, undercover mode 같은 윤리적으로 논란 여지 있는 설계까지 경쟁사가 다 볼 수 있게 됐다. 10일 전 OpenCode에 법적 압박 넣고 서드파티 API 접근 막은 직후라 타이밍도 최악이다. AI 시대 경쟁 구도가 기술만이 아니라 법적·윤리적 경계 싸움으로 번지고 있다는 신호다.

연관 기사
더 읽기 접기