Anthropic’s New Model, The Mythos Wolf, Glasswing and Alignment
Anthropic이 신모델을 "너무 위험해서 공개할 수 없다"고 선언했다. 근데 Ben Thompson은 이게 진짜 위험해서인지, 아니면 다른 이유가 있는지 의심하고 있다.
Anthropic이 새 AI 모델을 개발했지만 안전상의 이유로 출시하지 않겠다고 발표한 사건을 다룬다. 이 모델의 코드명은 'Mythos Wolf'이고, Glasswing이라는 기술과 관련이 있는 것으로 보인다. Thompson은 Anthropic의 주장에 회의적인 태도를 보이면서도, 만약 정말로 위험하다면 그건 더 심각한 문제를 제기한다고 본다. AI alignment(정렬) 문제, 즉 AI를 인간의 의도에 맞게 통제할 수 있느냐는 근본적 질문으로 이어지는 셈이다.
AI 회사가 자사 모델을 "너무 위험하다"며 스스로 봉인한 건 매우 이례적이다. 이게 진짜 안전 우려인지, 아니면 마케팅이나 규제 선점 전략인지 논란이 될 수밖에 없다.
OpenAI가 투자자들 사이에서 신뢰를 잃어가는 와중에 Anthropic으로 자금이 몰리는 상황이다. 여기서 Anthropic이 "우리는 안전을 최우선한다"는 포지셔닝을 강화하는 건 전략적으로 의미가 크다. 동시에 AI 능력이 정말로 통제 불가능한 수준에 도달하고 있는지에 대한 업계의 불안감도 커지고 있다.