반응형

안녕하세요, 리키입니다. 오늘은 구글 딥마인드에서 새로 내놓은 오픈소스 인공지능 모델인 제마 4(Gemma 4)에 대한 이야기를 좀 해보려고 합니다.

구글 딥마인드가 이번에 제마 4라는 새로운 오픈소스 AI 모델 패밀리를 공개했습니다. 이 모델들은 복잡한 추론과 에이전트 워크플로우를 위해 설계되었으며, 아파치 2.0 라이선스라는 상업적으로 허용적인 조건으로 공개되었다는 점이 참 주목할 만합니다. 이 모델들은 구글의 자체적인 제미나이 3(Gemini 3) 모델 기술을 기반으로 만들어졌더군요.

제마 4는 총 네 가지 크기로 출시되었습니다. 바로 효과적인 20억(E2B), 40억(E4B), 260억 개의 전문가 혼합(MoE) 모델, 그리고 310억 개의 밀집(Dense) 모델입니다. 이 모델들은 단순히 크기만 큰 것이 아니라, 각기 다른 하드웨어 환경에 맞춰 설계되었다는 점이 특징입니다. 예를 들어, 260억 개의 MoE 모델은 추론 시 38억 개의 파라미터만 활성화하여 속도를 우선시하고, 310억 개의 밀집 모델은 품질과 미세 조정의 유연성을 목표로 합니다.

특히 이 모델들의 장점은 대규모 하드웨어 없이도 강력한 성능을 낼 수 있다는 점입니다. 구글은 이 모델들이 다른 경쟁 모델들보다 크기가 훨씬 작으면서도 벤치마크에서 최대 20배까지 경쟁할 수 있다고 주장합니다. 개발자 입장에서는 이 정도의 지능을 훨씬 적은 하드웨어 자원으로 구현할 수 있다는 것이 큰 의미가 있더군요.

하드웨어 측면에서도 세심하게 고려가 들어갔습니다. 작은 모델들(E2B, E4B)은 모바일이나 사물 인터넷(IoT) 기기에 최적화되어 메모리와 배터리 수명을 보존하도록 설계되었습니다. 또한, 픽셀(Pixel) 팀과 퀄컴(Qualcomm) 등과 협력하여 스마트폰이나 라즈베리 파이(Raspberry Pi) 같은 엣지 디바이스에서 거의 제로 레이턴시로 구동되도록 만들었습니다. 이는 휴대폰이나 데이터 센터뿐만 아니라 개인용 워크스테이션에서도 코딩 도우미나 에이전트 워크플로우를 구현하는 데 큰 도움이 될 것입니다.

이 모델들은 다단계 계획, 깊은 논리, 수학 및 지시 따르기 성능이 향상되었으며, 도구와 API와 상호작용하는 자율 에이전트를 구축할 수 있도록 함수 호출, 구조화된 JSON 출력, 시스템 지침 기능까지 포함하고 있습니다. 개발자들이 이 모델을 통해 로컬 환경에서 AI 코딩 도우미를 만들 수 있는 기반을 마련했다는 점이 정말 중요하다고 생각합니다.


참고 원문: https://smbtech.au/news/google-deepmind-releases-gemma-4-its-most-capable-open-source-ai-models/

반응형

+ Recent posts