
오픈AI의 샘 올트먼 대표는 “챗지피티를 탄생시킨 개발 전략의 역할은 끝났다”고 말했다. 게티이미지뱅크
세계적인 인공지능 열풍의 주역인 챗지피티는 ‘거대 언어 모델’(LLM)을 기반으로 한 대화형 인공지능이다. 대규모 데이터를 이용한 사전학습 인공지능인 거대언어모델은 워낙에 많은 데이터로 훈련했기 때문에 자연어 이해, 자동 번역, 내용 요약, 질의-응답 등 다양한 영역에서 뛰어난 자연어 처리 능력을 보여주면서 큰 주목을 받고 있다. 오픈에이아이가 지난해 11월 말 거대언어모델 지피티3.5를 기반으로 내놓은 챗봇 ‘챗지피티’는 그 대표적 사례다.인간 뇌는 860억개의 뉴런(신경세포)과, 뉴런 사이를 연결하는 100조개의 시냅스로 이뤄져 있다. 인공지능 신경망을 인간 뇌에 비유하자면, 시냅스에 해당하는 것이 바로 매개변수다. 지피티3은 무려 1750억개의 매개변수를 갖고 있다. 인간 뇌에 비하면 규모가 작지만 인공신경망 중에선 최대 규모에 속한다.오픈에이아이가 최근에 내놓은 지피티4의 매개변수가 몇개인지는 공개되지 않았다. 기술전문매체 <와이어드>는 다만 “수조개의 단어와 수천개의 고성능 칩으로 훈련했을 것”으로 추정했다.올트먼 대표는 그러나 앞으로의 인공지능 기술 발전이 더 큰 모델에서 나오지는 않을 것으로 예상했다. 그는 지난 13일 매사추세츠공대(MIT)에서 열린 ‘인공지능과 함께하는 비즈니스의 미래’ 행사에서 기조연설을 통해 “지금은 거대모델 시대의 끝에 서 있다고 생각한다”며 “앞으로는 다른 방식으로 더 나은 인공지능을 만들게 될 것”이라고 말했다.그의 발언은 지난 몇년 간의 거대모델 개발 경쟁 흐름과는 배치된다. 지피티 매개변수의 경우 2019년 발표된 지피티2에선 15억개였던 것이 2022년 나온 지피티3에선 1750억개로 100배 이상 늘어났다.챗지피티가 출시된 이후 구글은 매개변수가 1370억개인 거대언어모델 람다를 기반으로 한 경쟁 챗봇 바드를 내놓았다. 앤트로픽(Anthropic), 에이아이21(AI21), 코히어(Cohere) 등 신생기업들도 더 큰 알고리즘을 구축하는 데 막대한 자금을 쏟아붓고 있다.

인공지능용으로 개발된 엔비디아의 최신 그래픽칩 ‘H100 NVL GPU’. 엔비디아 제공
곽노필 선임기자 nopil@hani.co.kr
출처
머스크 1만개 지피유 구입
거대언어모델의 역사