LLM 경량화한 SLM 대세로
몸집 줄이고 특정분야 특화
정보 신속·정확하게 전달
비용도 LLM 20분의 1 불과
제조·금융·유통 등 적용 확산
세계 최대 산업 자동화 기업 로크웰 오토메이션은 최근 마이크로소프트(MS)와 협력해 식음료 제조 현장에 특화된 인공지능(AI) 모델을 만들었다.
이 모델은 MS의 소규모언어모델(SLM) ‘파이’ 시리즈를 기반으로 개발됐는데 설비 문제가 발생했을 경우 공장 운영자에게 그 즉시 원인 분석과 대응 방안을 실시간으로 조언해준다.
공정 데이터를 중점적으로 학습하고 응답을 빠르게 할 수 있도록 경량화된 구조 덕분에 공장이 멈춰 서는 시간을 크게 줄이고 유지보수 효율도 끌어올리는 효과를 거두고 있다.
개발 비용을 낮추면서도 특정 산업에 최적화된 SLM이 대세로 주목받고 있다.
방대한 데이터를 학습해 척척박사처럼 무엇이든지 알려주는 대규모언어모델(LLM)의 ‘범용 AI’ 대신 저비용으로 보다 빠르고 정확하게 정보를 전달하는 SLM의 ‘특화 AI’를 찾는 시장 수요가 더 두드러지고 있는 분위기다.
10일 정보기술(IT) 업계에 따르면 구글, MS, 오픈AI 등 주요 글로벌 빅테크는 엔터프라이즈 사업의 일환으로 제조·금융·유통·헬스케어 등 다양한 산업 분야에 SLM 적용을 확대하고 있다.
빅테크 기업들은 최소 수천억 개에서 많게는 1조개가 넘는 파라미터(매개변수)를 갖춘 초대형 언어모델도 보유하고 있지만, 실제 기업 고객들이 선호하는 것은 경량화된 SLM이다.
고비용·고연산의 초거대 AI보다 현장의 실질적인 문제를 빠르고 정확하게 해결할 수 있는 도메인 특화형 소형 AI가 더 현실적인 해법으로 주목받고 있는 것이다.
SLM은 수억~수십억 개 수준의 파라미터로 구성된 경량화 모델로 특정 도메인 데이터에 기반한 고정밀 질의응답과 문서 요약, 분류, 해법 제시 등의 다양한 기능을 수행한다.
파라미터 수가 적어 메모리·연산 자원 소모가 많지 않은 데다가 대형 모델과 견줘 응답 지연이 낮아 실시간 응용에 적합한 구조다.
특히 AI 모델을 운영하는 비용도 LLM보다 훨씬 저렴하다.
가령 오픈AI의 초거대 AI GPT-4o는 100만 토큰(언어모델이 텍스트를 이해하고 생성하는 기본 단위) 출력 비용(생성한 응답에 대한 비용)이 10달러에 달하지만, 이를 경량화한 GPT-4o 미니의 출력 비용은 0.6달러로 15분의 1에 불과하다.
구글의 LLM 제미나이 2.5 프로 역시 출력 비용이 100만 토큰당 10달러인 반면 경량화된 제미나이 2.0 플래시는 0.4달러에 그친다.
비용이 25분의 1 수준이다.
앤스로픽의 클로드 3 오푸스는 무려 100만 토큰당 비용이 75달러에 달하는 반면 클로드 3 하이쿠는 1.25달러로 비용 부담을 크게 줄였다.
미스트랄AI도 미스트랄 라지(12달러)에 비해 미스트랄 7B(0.25달러)가 95% 이상 저렴하다.
저비용·고효율이라는 장점이 확실한 만큼 업권을 막론하고 SLM을 채택하는 경우가 많아졌다.
미국 최대 은행인 JP모건체이스는 최근 ‘COiN’이라는 SLM을 도입해 상업 대출 계약서와 같은 법률 문서를 자동으로 검토하고 분석하고 있다.
이를 통해 수작업으로 수천 시간이 걸리던 업무를 단 몇 초 만에 처리하며, 정확성과 효율성을 크게 향상시키고 있다.
네이버 역시 자사 서비스인 네이버 플레이스에서 SLM을 활용해 장소, 지도, 여행 등 분야별 서비스를 최적화하고 있다.
애플과
삼성전자도 자사 스마트폰에서 구동되는 온디바이스 AI를 SLM으로 구현하고 있다.
SLM의 경우 문장을 자동 완성하거나 문맥을 이해하고 사용자 질의에 응답하는 등 특정 용도에 맞춰 인터넷 연결 없이도 온디바이스 환경에서 실행 가능한 구조다.
이와 관련해 가트너는 기업들이 2027년까지 특정 작업에 최적화된 SLM을 도입하면서, 전체 사용량이 LLM보다 최소 3배 이상 많아질 것으로 전망했다.
가트너는 범용 LLM이 강력한 언어 처리 능력을 갖췄지만, 실제 비즈니스 현장에서 전문성이 요구되는 작업에서는 응답 정확도가 떨어질 수 있다고 분석했다.
수밋 아가왈 가트너 VP 애널리스트는 “비즈니스 업무 흐름 내 다양한 작업과 더 높은 정확도에 대한 요구로 인해 특정 기능 또는 도메인 데이터에 맞춰 미세조정한 특화 모델로의 전환이 가속화되고 있다”며 “SLM은 응답 속도가 빠르고 컴퓨팅 자원을 적게 소모해 운영 및 유지관리 비용을 절감할 수 있다”고 설명했다.
[ⓒ 매일경제 & mk.co.kr, 무단전재 및 재배포 금지]