AGI의 핵심으로 떠오른 '월드 모델'
'챗GPT'의 등장으로 지난해에는 대형언어모델(LLM)이라는 단어가 유행이었습니다. 이후 이미지나 영상까지 읽어낼 수 있는 대형멀티모달모델(LMM)이라는 말이 'GPT-4o'나 '제미나이' 등의 수식어로 퍼져 나갔습니다. 그리고 이제는 '대형세계모델(LWM)'이 최신 트렌드로 떠올랐습니다.
텍스트로만 세상을 배운 인공지능(AI)의 한계를 넘기 위해 현실 세계를 학습하며 인간과 같은 인지 능력을 갖춘다는 이 모델은 일명 '몸을 가진 AI(Embodied AI)'라는 이름으로도 통했습니다.
이는 AI의 한계를 뛰어넘어 인공일반지능(AGI)에 도달할 유력한 방법으로 꼽히는 동시에 로봇 공학이나 자율주행 등으로 확장할 수 있기 때문에 매우 유망한 기술로 꼽힙니다.
장병탁 서울대학교 교수도 일찌감치 이 분야를 강조한 리더 중 한명입니다.
최근 각광을 받고 있지만, 이 말이 등장한 것은 좀 됐습니다.
사카나AI의 공동 창립자인 데이비드 하가 2018년 구글 재직 당시 '세계 모델(World Models)'이라는 제목의 논문을 내놓은 것이 처음으로 꼽힙니다. 물론 지금보다는 개념이 협소하지만, 인간의 인지 작용을 따라 하려는 의도는 같습니다.
이어 지난해 막스 테그마크라는 과학자와 MIT 연구원이 발표한 논문으로 이 용어는 개발자 사이에서 유행하기 시작했습니다.
'시간과 공간을 나타내는 언어 모델(language model represent space and time)'이라는 연구로,
LLM이 실제 세계의 시공간적 표현을 학습해 세계 모델이 될 수 있다는 가능성을 보여주는 내용입니다.
최근에는 2명의 유명 연구자가 용어 전파에 크게 기여했습니다. 먼저 'AI의 대모' 페이페이 리 스탠포드대학교 교수는 월드랩스라는 스타트업을 설립한 뒤 인터뷰를 통해 LWM을 개발한다고 밝혔습니다.
2010년 '이미지넷'을 만든 것으로 유명한 리 교수의 스타트업 설립은 화제였습니다. 이에 따라 LWM도 주목받았습니다. 리 교수는 이를 '공간 지능(spatial intelligence)'라고도 부릅니다.
다른 한명은 'AI 사대천왕'으로 꼽히는 얀 르쿤 메타 수석과학자입니다. 그는 지난 2월 'V-제파(JEPA)라는 모델을 개발 중이라며, 이를 "세상에 대한 기초적인 이해를 통해 기계 지능을 발전시키는 데 중요한 단계"라고 소개했습니다.
LWM을 개발한다고 공개적으로 말하지는 않았으나, 오픈AI나 구글, xAI 등도 관련 연구를 진행하고 있습니다. 얼마 전 오픈AI에서 '소라' 개발을 이끌었던 팀 브룩스는 구글로 이직하며 "세계 모델을 개발할 것"이라고 예고했습니다.
일론 머스크 CEO의 xAI 역시 지난 4월 첫 LMM '그록 1.5-V'를 공개하며 "멀티모달과 생성 능력을 모두 발전시키는 것은 우주를 이해할 수 있는 유익한 AGI를 구축하는 데 중요한 단계"라고 강조했습니다.
이처럼 LWM에 도달하기 전 LMM을 구축하는 것은 필수로 꼽힙니다. 메타가 지난달 커넥트 행사에서 첫 LMM '라마 3.2'를 공개한 것도 이와 무관하지 않습니다. 마크 저커버그 CEO 역시 AGI 개발이 목표라고 밝혔기 때문입니다.
출처 : AI타임스(https://www.aitimes.com)