LG그룹의 자체 인공지능(AI) 모델 ‘엑사원 3.0’이 모습을 드러냈다. 이전 세대보다 가벼워졌으면서도 추론 성능은 대폭 향상됐다. LG는 누구나 접근해 활용할 수 있도록 소프트웨어를 개방했는데, 국내 기업이 자체 개발 대규모언어모델(LLM)을 오픈소스로 공개한 것은 이번이 처음이다.
LG 인공지능(AI)연구원은 7일 LLM 엑사원 3.0을 공개했다. LLM은 챗GPT처럼 데이터를 학습해 인간의 언어를 이해하는 AI 모델이다. 2021년 1.0 버전과 지난해 2.0 버전에서 연구·개발을 거친 세 번째 버전이다. 특허·코드·수학·화학 등 전문 분야 데이터 6000만건 이상을 학습했으며 연말까지 법률·바이오·의료 등으로 분야를 확장해 데이터를 1억건 이상으로 늘릴 계획이다.
경량화가 특징이다. 방대한 데이터 입·출력이 이뤄지는 LLM은 운영에 많은 전력이 필요하다. LG AI연구원은 “경량화·최적화 기술 연구에 집중해 초기 모델 대비 성능은 높이면서도 모델 크기는 100분의 3으로 줄이는 데 성공했다”고 밝혔다.
모델 사이즈는 작아졌지만 이전 ‘엑사원 2.0’ 대비 추론 처리 시간은 56%, 메모리 사용량은 35% 줄었다. 구동 비용도 72% 감소했다.
한국어 성능도 강점이다. LG AI연구원이 공개한 벤치마크(성능평가 지표) 결과에 따르면 엑사원 3.0의 한국어 평가 점수는 74.1점으로 알리바바 큐원2(69.9)과 메타 라마3.1(65.3)의 성능을 압도했다. 수학·코딩 등 13개 영역에서도 메타·구글 등의 AI 모델을 제쳤다고 연구원은 전했다.
엑사원 3.0은 온디바이스(기기 내장형) AI용 초경량 모델과 범용 목적의 경량 모델, 전문 분야에 활용할 수 있는 고성능 모델 등으로 나뉘어 설계됐다.
경량 모델은 오픈소스 형태로 제공하기로 했다. 글로벌 기업들도 AI 모델 소스코드를 공개하는 경우는 많지 않다. 챗GPT는 폐쇄형 모델이며, 구글도 대표 LLM인 ‘제미나이’는 소스를 공개하지 않는 대신 경량 모델 ‘젬마’를 개방형으로 운영한다.
배경훈 LG AI연구원장은 “국내에서는 처음으로 자체 개발한 AI 모델을 오픈소스로 공개해 연구기관과 스타트업이 최신 기술을 활용할 수 있게 했다”며 “AI 연구 생태계 활성화와 국가 AI 경쟁력에 기여하고자 한다”고 말했다.
LG 계열사들은 각 사가 보유한 데이터로 엑사원 3.0을 최적화해 적용할 예정이다. 아울러 LG는 이날부터 임직원을 대상으로 ‘챗엑사원’ 베타서비스를 시작했다. 엑사원 3.0을 기반으로 만든 생성형 AI 서비스다. 웹 정보, 문서, 이미지 기반의 질의응답이 가능하며 코딩 등 업무 지원 기능도 담겼다.
LG는 2020년 12월 AI 싱크탱크인 LG AI연구원을 설립한 후 생산과 제품 개발, 서비스 등에서 AI 전환 작업을 진행 중이다.