
OpenAI의 기술 리더십에 중대한 변화가 생겼다. 연구 부문 부사장 겸 사후 학습(Post-Training) 총괄인 맥스 슈워처(Max Schwarzer)가 사임하고 경쟁사인 앤스로픽(Anthropic)에 합류했다. 2026년 3월 3일 X(구 트위터)를 통해 발표된 이번 소식은 OpenAI가 미국 전쟁부(Department of War, 구 국방부)와 논란의 소지가 있는 파트너십을 공식화한 지 불과 몇 시간 만에 전해졌으며, 이 계약은 인공지능의 군사화를 둘러싼 격렬한 논쟁을 불러일으켰다.
슈워처의 퇴사는 업계 분석가들이 OpenAI에서 앤스로픽으로 향하는 "가치 중심의 이주"라고 부르는 흐름 중 가장 최근의 고위급 사례이다. 슈워처는 공개적으로 강화 학습(Reinforcement Learning) 분야의 개인 기여자(Individual Contributor, IC) 연구로 돌아가고 싶다는 의사를 밝혔지만, OpenAI의 새로운 군사적 행보에 대한 대중의 반발과 맞물린 사임 시점은 AI 커뮤니티의 날카로운 감시를 받고 있다.
맥스 슈워처(Max Schwarzer)는 OpenAI에 기념비적인 유산을 남기고 떠난다. 사후 학습 총괄로서 그는 회사의 가장 진보된 모델들에 대한 미세 조정(Refinement) 및 안전 정렬(Safety Alignment)을 직접 책임졌다. 그의 재임 기간 동안 전체 GPT-5 계보(GPT-5.1, 5.2 및 코딩 특화형 5.3-Codex 포함)와 추론 중심의 o-시리즈(o1 및 o3)가 출시되었다.
슈워처는 작별 성명에서 "이곳에서 수행한 모든 작업의 일원이었다는 사실이 매우 자랑스럽다"고 밝혔다. 그는 동료들과 함께 추론 패러다임을 구축하고 테스트 시점 연산(Test-time compute)을 확장하는 데 기여했음을 강조했다. 그러나 그의 성명은 특히 앤스로픽(Anthropic)의 문화적 매력을 강조했다: "내가 가장 신뢰하고 존경하는 많은 사람들이 지난 몇 년 동안 앤스로픽에 합류했다."
슈워처의 이적은 단순한 행정적 변화가 아니다. 이는 핵심적인 조직 지식의 전이를 의미한다. 사후 학습(Post-training)은 가공되지 않은 AI 모델이 행동, 안전성 및 유용성을 위해 연마되는 단계로, 사실상 모델에 "성격"과 윤리적 제약 조건을 부여하는 과정이다. 앤스로픽으로 자리를 옮김으로써 슈워처는 GPT-5와 o3를 정렬하는 데 사용된 독점적인 방법에 대한 깊은 전문성을 가져가게 되었으며, 이는 앤스로픽의 이미 막강한 연구 팀을 강화할 것이다.
슈워처의 사임 배경은 현재 실리콘밸리를 휩쓸고 있는 지정학적 폭풍과 분리해서 생각할 수 없다. 이번 주 초, 최근 공식 문서 업데이트에서 **전쟁부(Department of War)**로 지칭된 펜타곤은 AI 조달 전략의 결정적인 변화를 발표했다.
트럼프 행정부의 지시에 따라, 연방 기관들은 앤스로픽이 대량 감시 및 자율 무기와 관련된 "레드 라인(Red lines)" 포기를 거부하자 해당 기업과의 계약을 중단하라는 명령을 받았다. 부서의 광범위한 접근 요구를 수용하기 위해 서비스 약관 수정을 거부한 앤스로픽의 결정은 해당 서비스의 신속한 "덤핑(중단)"으로 이어졌다.
반대로 OpenAI는 그 공백을 메웠다. CEO 샘 알트먼(Sam Altman)은 분류된 네트워크(Classified networks)에 OpenAI 모델을 배포할 수 있도록 허용하는 새로운 계약을 확인했다. 알트먼은 나중에 초기 발표 처리가 "기회주의적이고 부주의했다"고 인정하며, 이 계약에 국내 감시에 대한 안전장치가 포함되어 있다고 해명했지만, 대외적인 이미지는 이미 타격을 입었다.
다음 표는 군사 협력에 관한 두 AI 거대 기업의 엇갈린 행보를 보여주며, 이러한 분열이 인재들의 결정에 영향을 미치고 있는 것으로 보인다.
표: OpenAI vs. 앤스로픽 군사적 대치 (2026년 3월)
| 특징 | OpenAI의 입장 | 앤스로픽의 입장 |
|---|---|---|
| 계약 상태 | 기밀 배포 계약 체결 (2026년 3월) | 계약 협상 결렬/종료 |
| 주요 반대 사유 | 없음; "합법적 목적" 조항 준수 | 감시에 대한 "레드 라인" 포기 거부 |
| 감시 정책 | 국내 스파이 행위에 대한 안전장치 주장 | 서비스 약관 내 엄격한 금지 |
| 배포 환경 | 기밀 펜타곤 네트워크 허용 | 감사 없는 기밀 배포 거부 |
| 정부 관계 | 트럼프 지시 하의 선호 파트너 | "공급망 리스크"로 지정 |
| CEO 성명 | "우리는 정부와 협력해야 한다." (알트먼) | "우리는 안전 표준을 타협하지 않을 것이다." (아모데이) |
슈워처는 이례적인 사례가 아니며, 점차 커지는 추세의 일부이다. 지난 18개월 동안 앤스로픽은 급진적인 상업화나 정부와의 보조보다 AI 안전과 윤리적 엄격함을 우선시하는 연구자들의 안식처가 되었다.
슈워처가 사임서에서 언급한 "신뢰"는 얀 레이케(Jan Leike)나 일리야 수츠케버(Ilya Sutskever, 자신의 벤처를 통하지만 이념적으로는 안전 우선 진영과 일치함)와 같이 이미 자리를 옮긴 전 OpenAI 핵심 인물들을 지칭하는 것으로 보인다. 전 OpenAI 부사장 다리오 아모데이(Dario Amodei)가 이끄는 앤스로픽은 업계의 "양심"으로 성공적으로 자리매김했다.
이러한 이주는 OpenAI에 전략적 위험을 초래한다. 회사가 막대한 상업적 리드와 정부의 지원을 유지하고 있지만, 특히 사후 학습과 *사람의 피드백을 통한 강화 학습(RLHF)*의 복잡성을 이해하는 핵심 기술 리더십의 상실은 GPT-6와 같은 미래 모델의 반복 주기(Iteration cycles)를 늦출 수 있다.
OpenAI와 앤스로픽 사이의 이분법은 이제 그 어느 때보다 극명해졌다.
맥스 슈워처에게 앤스로픽으로의 이직은 자신의 뿌리로 돌아가는 것이다. 그는 강화 학습(RL) 연구의 "현장으로 복귀(get back into the weeds)"하고 싶다는 의사를 밝혔다. 앤스로픽에서 그는 차세대 헌법적 AI(Constitutional AI)에 집중하여 단순히 강력할 뿐만 아니라 엄격하게 통제 가능한 시스템을 구축하는 데 도움을 줄 것으로 보이며, 이는 전쟁부에 GPT-5를 배포하는 것보다 그에게 더 공감을 불러일으키는 미션인 것으로 보인다.
혼란스러웠던 이번 주의 먼지가 가라앉으면서, 업계는 인공지능의 두 가지 뚜렷한 미래를 지켜보게 되었다. 하나는 국가의 권력을 수용하는 미래이고, 다른 하나는 그것을 억제하려는 미래이다. 슈워처와 같은 최상급 인재의 흐름은 이러한 지능을 구축하는 연구자들에게 선택이 점점 더 명확해지고 있음을 시사한다.