반응형

안녕하세요, 리키입니다. 오늘 저는 거대언어모델(LLM) 이후에 우리가 어떤 시대를 맞이하게 될지, 그리고 AI가 앞으로 어디로 나아갈지에 대해 몇 가지 생각을 나누어 보려고 합니다.

2022년 말에 등장한 챗지피티(ChatGPT)를 시작으로 생성형 AI는 단순한 유행을 넘어 산업 구조 자체를 흔들기 시작했습니다. 검색, 디자인, 프로그래밍 등 거의 모든 영역에 AI가 들어오면서, LLM은 단순히 텍스트를 처리하는 것을 넘어 인간의 언어 자체를 이해하고 추론하는 범용 인터페이스로 자리 잡았더군요. AI 산업은 이제 '모든 것을 언어화하는 시대'로 접어들었다고 볼 수 있습니다.

하지만 최근 업계에서는 LLM 이후에 대한 새로운 질문이 생겨났습니다. 이는 단순히 기술의 변화를 넘어, 현재 AI가 마주한 구조적인 문제들과도 연결되어 있습니다. 최신 모델들은 방대한 데이터를 학습했지만, 모델을 더 키우는 데 필요한 고품질 데이터가 부족하고, 수만 개의 GPU와 초대형 데이터센터를 운영하는 데 엄청난 비용이 발생하고 있습니다. 또한, 단순히 모델 크기를 키우는 방식만으로는 혁신적인 성능 향상을 지속하기 어렵다는 분석도 나오고 있습니다.

그래서 현재 AI 산업은 LLM이 끝났다는 의미보다는, LLM 위에 새로운 능력을 결합하는 'LLM+' 단계로 이동하고 있다고 보는 것이 더 정확합니다. 대표적인 흐름은 에이전트 AI와 멀티모달 AI입니다. 기존 LLM이 질문에 답하는 수준이었다면, 이제는 스스로 목표를 설정하고 항공권 검색, 일정 조정, 이메일 발송까지 연결하는 작업 수행 시스템으로 발전하고 있습니다. 또한, 텍스트를 넘어 이미지, 음성, 영상 등 다양한 데이터를 동시에 이해하는 멀티모달 모델도 빠르게 발전하고 있습니다.

이러한 발전은 현실 세계와의 연결, 즉 피지컬 AI와의 결합을 요구하고 있습니다. LLM이 디지털 세계에서는 강력하지만 현실 공간을 이해하고 물체를 조작하며 위험을 예측하는 능력은 아직 부족합니다. 그래서 AI 업계는 월드모델(World Model)이나 시뮬레이션, 행동 계획 AI 같은 분야에 주목하고 있습니다. 결국 미래의 AI는 LLM이 언어와 추론을 담당하고, 멀티모달 모델이 환경 데이터를 이해하며, 월드모델이 현실을 시뮬레이션하고, 에이전트 시스템이 목표를 수행하며, 피지컬 AI가 실제 행동을 실행하는 구조로 발전할 가능성이 큽니다.

결국 LLM은 사라지는 것이 아니라, 미래 AI 스택의 중심 운영체제처럼 남을 가능성이 높습니다. 현재의 LLM은 '매우 똑똑한 단기 기억 시스템'에 가깝기 때문에, 앞으로는 사용자의 맥락을 기억하고 장기 목표를 유지하며 여러 단계를 스스로 수행하는 메모리 구조 강화와 추론 능력 향상이 중요해지고 있습니다. 우리는 지금 LLM 이후의 시대를 보는 것이 아니라, 진짜 LLM 시대의 초입을 지나고 있는 것이라고 생각하면 좋겠습니다.


참고 원문: https://brunch.co.kr/@@46ci/543

반응형

+ Recent posts