앤트로픽(Anthropic)과 오픈에이아이(OpenAI)가 화요일, 과학 연구 분야를 겨냥한 신경전에 돌입했습니다. 앤트로픽은 연구자를 위한 AI 작업 공간인 ‘클로드 사이언스(Claude Science)’를 출시했으며, 오픈에이아이는 계산생물학 벤치마크 ‘진벤치-프로(GeneBench-Pro)’를 공개했습니다.
동일한 날 두 회사가 출시한 제품들은 AI 경쟁을 챗봇과 코딩을 넘어 실험실 현장까지 확장하고 있습니다. 한 회사는 과학자가 당장 사용할 수 있는 도구를 선보였습니다. 다른 한 곳은 기술이 아직 해결하지 못한 영역의 척도를 제시했습니다.
앤트로픽의 ‘클로드 사이언스’가 하는 일
클로드 사이언스는 과학자가 사용하는 데이터베이스, 코드, 컴퓨팅 파워를 하나의 앱에 통합합니다. 이 애플리케이션은 게놈학, 단백질체학, 케미인포매틱스 분야의 60개 이상의 과학 데이터베이스를 연결합니다.
클로드 사이언스는 신규 AI 모델이 아닌 앱입니다. 가장 강력한 파블 5(Fable 5)와 미소스 5(Mythos 5) 모델은 현재 미국 수출 규정 하에 제한되어 있습니다. 모든 결과는 감사가 가능하며, 생성에 사용된 코드로 추적이 가능합니다.
이 작업 도구는 앤트로픽이 2025년 10월부터 시작한 생명과학 분야 확장의 연장선상에 있습니다. 베타 테스트에서 앨런 연구소(Alllen Institute)의 제롬 르콕(Jérôme Lecoq)은 최대 2년이 걸리던 리뷰를 단기간에 압축할 수 있었습니다.
앤트로픽은 또한 최대 50개 연구 프로젝트에 프로젝트 당 최대 3만 달러 크레딧을 지원할 예정입니다.
오픈에이아이의 진벤치-프로, 기준을 높이다
앤트로픽의 클로드 사이언스 출시 직후, 오픈에이아이는 진벤치-프로(GeneBench-Pro)를 출시했습니다. 이 벤치마크는 AI 에이전트가 실제 생물학 연구에서 요구되는 판단을 내릴 수 있는지 평가합니다.
진벤치-프로에는 게놈학, 정량생물학, 중개 의학 분야의 129개 문제가 포함되어 있습니다.
오픈에이아이의 최상위 모델인 GPT-5.6 솔(Sol)은 최고 추론 단계에서 28.7%의 문제를 해결했습니다. 프로(Pro) 모드에서는 이 수치가 31.5%까지 상승했습니다. 이 회사의 이전 GPT-5.6 점진적 출시는 워싱턴 측의 요청으로 이루어졌습니다.
GPT-5는 원래 진벤치에서 5% 미만의 점수를 기록했으며, 앤트로픽의 오푸스 4.8(Opus 4.8)은 더욱 어려운 테스트에서 16%를 얻었습니다.
X에서 저희를 팔로우하시면 최신 뉴스를 가장 먼저 받아보실 수 있습니다
두 가지 전략, 하나의 경쟁
이 구도는 동일한 목표로 향하는 두 경로를 보여줍니다. 앤트로픽은 일상 실험실 환경에서 쓸 수 있는 제품을 제공합니다. 오픈에이아이는 모델이 복잡한 데이터를 얼마나 신뢰성 있게 합리적으로 처리하는지를 측정합니다.
양사 신규 제품 출시는 마침 중국산 AI 모델이 연구에서 경쟁력을 높이고 있을 때 등장했습니다. 오픈에이아이의 수치에 따르면 자사의 최고 모델도 아직 진벤치-프로 과제 대부분을 해결하지 못해, 높은 관심을 스스로 절감시키고 있습니다.
이러한 경쟁의 압박은 지정학적이면서 동시에 과학적입니다. 이미 미국 수출 제한으로 인해 앤트로픽은 자사 모델의 새로운 호스트 국가를 검토하게 되었습니다.
검토자들은 각 진벤치-프로 과제가 인간 전문가에게 20~40시간, 수천 달러의 비용을 요구한다고 추산했습니다. 오픈에이아이는 자사 모델이 동일한 분석을 몇 달러에 끝낼 수 있다고 밝혔습니다.
오브리 드 그레이(Aubrey de Grey) 생의학 노화학자는 AI가 연구 병목 현상을 빠르게 해소할 수 있다고 평가했습니다. 하지만 전반적 진전에는 시간이 더 걸릴 수 있다고 전망합니다.
“머지않아 AI가 특히 신약 개발 분야에서 특정 프로세스의 병목이 되지 않도록 할 것입니다.” – 오브리 드 그레이, 롱제비티 이스케이프 벨로시티 재단(Longevity Escape Velocity Foundation) 회장 겸 최고과학책임자, 비인크립토 팟캐스트 발언
드 그레이는 연구 속도 향상이 실제 승인 치료법으로 연결되려면 여전히 규제와 대중의 위험 수용성에 달려 있다고 경고했습니다.
연구자들은 빠른 도입을 기대합니다
일부 전문가들은 변화가 이미 시작되었다고 주장합니다. 데리야 우누트마즈(Derya Unutmaz) 면역학 교수는 같은 비인크립토 패널에서 AI가 자신의 판단보다 더 우수하다고 밝혔습니다.
“저는 35년간 연구해온 제 분야에서 제 자신의 생각보다 AI를 더 신뢰합니다.”
그는 이러한 의존이 임상 현장 전반으로 빠르게 확대될 것으로 전망했습니다.
“AI를 의료 분야에서 활용하지 않는 것은 비윤리적이며, 조만간 AI를 쓰지 않는 것이 직무유기라고 여겨질 것입니다.”
이러한 낙관론은 아직 벤치마크 결과보다 앞서나가고 있습니다. 앞으로 수개월 동안 과학계가 해당 도구를 실제로 도입하는지와 진벤치-프로 점수가 개선되는지 확인할 수 있습니다.









