지난달 말 ‘에이닷엑스 4.0’ 공개하며
추론형 모델인 ‘에이닷엑스 4.1’ 예고
알리바바 오픈소스 모델에 한국어 학습시켜

SK텔레콤 제공
SK텔레콤이 오픈소스 모델을 기반으로 한국어를 학습시켜 완성한 자사 거대언어모델(LLM) ‘에이닷엑스(A.X) 4.0’을 지난달 말 조용히 공개했다.


SKT는 나아가 “상반기에 추론형 모델을 선보인다”라면서 추론형 모델인 에이닷엑스 4.1의 프리뷰 버전을 5월 말에 내놓을 것이라 예고했다.


23일 통신업계에 따르면 SKT는 지난 4월 30일 에이닷엑스 4.0을 출시하고 이를 소프트웨어 개발 플랫폼인 깃허브에 공개했다.

이와 함께 5월 말 나올 추론형 모델 에이닷엑스 4.1 프리뷰의 성능도 미리 공개했다.


에이닷엑스 4.0은 지난달 초 유영상 SKT 대표가 ‘개발이 마무리 단계에 있다’라고 예고했던 모델이다.

이후 한 달 만에 개발이 마무리되며 기업용 서비스에 적용을 시작한 단계로 파악된다.


다만 지난달 SKT의 대규모 해킹 사고가 발생하면서 모델에 대한 특별한 발표는 없었던 것으로 보인다.


해당 모델은 대표적인 오픈소스 모델로 꼽히는 LLM인 중국 알리바바의 ‘큐원(Qwen) 2.5’를 활용했다.

에이닷엑스 4.0은 720억 파라미터 크기의 표준 모델과 70억 파라미터 크기의 경량 모델 두 가지로 제공된다.


SKT는 큐원 2.5에 방대한 한국어 데이터를 추가로 학습시켜 국내 환경에 최적화된 성능을 구현하는 모델을 개발했다고 설명했다.

이를 위해 한국어 토크나이저를 적용해 한 번에 더 많은 한국어 정보를 처리하도록 모델을 특화시켰다.


SKT가 공개한 성능 벤치마크 결과에 따르면 에이닷엑스 4.0의 경우 한국어 전문 지식 이해를 평가하는 KMMLU 벤치마크에서 78.3점을 기록하며 오픈AI의 GPT-4o(72.5점), 알리바바의 큐원3(70.6점)를 제쳤다.


SKT가 개발하고 있는 추론형 AI 모델 ‘에이닷엑스(A.X) 4.1 프리뷰’와 딥시크 R1 모델의 주요 벤치마크 비교 [출처 = 깃허브 캡처]
5월 말에 공개될 에이닷엑스 4.1 프리뷰 모델은 SKT가 개발하고 있는 추론형 모델로, 정식 출시에 앞서 먼저 성능을 알리고 주목도를 높이기 위해 프리뷰 모델을 먼저 내놓는 것으로 풀이된다.


SKT는 특히 출시 예정인 에이닷엑스 4.1 프리뷰 모델이 올해 초 돌풍을 일으켰던 딥시크의 추론 모델이자 6710억 파라미터 크기의 ‘딥시크 R1’과 유사한 성능을 보였다고 강조했다.


SKT가 공개한 딥시크 R1과의 벤치마크 결과를 보면, 에이닷엑스 4.1 프리뷰 모델은 크기가 약 9분의 1 수준임에도 딥시크 모델과 대등한 수준의 점수를 기록했다.


SKT는 향후 계획에 대해 “에이닷엑스 4.1은 수학 문제 해결과 코드 개발 능력을 강화할 예정”이라면서 “코딩 능력과 특정 산업 전문성을 강화하고, 스스로 작업하고 합리적인 판단을 내릴 수 있는 에이전트형 모델을 개발할 것”이라고 밝혔다.



[ⓒ 매일경제 & mk.co.kr, 무단전재 및 재배포 금지]

오늘의 이슈픽

포토뉴스