챗GPT 개발사인 오픈AI가 이미지를 보고 생각하는 새로운 인공지능(AI) 모델을 출시했다.
16일(현지시간) 오픈AI는 그림이나 도표 같은 이미지를 분석하고 이해할 수 있는 새로운 모델 'o3'와 소형 모델인 'o4 미니'를 공개했다.
이는 지난해 9월 출시된 오픈AI의 첫 번째 추론 모델 o1의 후속 버전이다.
오픈AI는 o3와 o4 미니에 대해 "이미지로 사고할 수 있는 첫 번째 모델"이라며 "단순히 이미지를 보는 것뿐만 아니라 시각 정보를 추론 과정에서 직접 통합할 수 있다"고 설명했다.
두 모델은 사용자가 화이트보드에 그린 그림이나 도표, 그래프 등을 업로드하면 AI가 이를 분석해 답변한다.
특히 흐릿하거나 화질이 낮은 이미지를 이해할 수 있고, 이를 확대하거나 회전하는 작업 등도 가능하다.
이미지 처리 기능 외에도 챗GPT의 캔버스 기능을 통해 웹브라우저에서 직접 파이선 코드를 실행할 수 있다.
오픈AI에 따르면 o3는 코딩 능력을 측정하는 SWE 벤치마크 검증에서 69.1%, o4 미니는 68.1%를 기록했다.
이는 기존 o3 미니(49.3%)뿐만 아니라 앤스로픽의 클로드 3.7 소넷(62.3%)보다도 높은 것이다.
새로운 두 AI 모델은 챗GPT 플러스와 프로, 팀 등의 유료 고객이면 사용할 수 있다.
답변의 신뢰성을 높이기 위해 더 많은 시간을 들여 대답하는 'o4 미니 하이'도 해당 유료 플랜 구독자에게 제공하기 시작했다.
o3 상위 버전인 'o3-프로'도 향후 몇 주 안에 챗GPT 프로 가입자용으로 출시할 예정이다.
한편 오픈AI는 AI 기반 코딩 툴 업체인 윈드서프를 30억달러(약 4조2510억원)에 인수하기 위한 협상도 추진하고 있다.
[김
태성 기자]
[ⓒ 매일경제 & mk.co.kr, 무단전재 및 재배포 금지]