2024-09-20 HaiPress
오픈소스 커뮤니티 통해 배포
스트럭트,양자화,수학 모델 등
언어 이해,추론,수학 능력 우수

조우징런 알리바바 클라우드 인텔리전스 최고기술책임자(CTO)이 새 모델을 공개하고 있다. 알리바바 클라우드가 ‘2024년 압사라 콘퍼런스’를 통해 새로운 대규모 언어 모델(LLM)을 전 세계 오픈소스 커뮤니티에 배포한다고 20일 밝혔다.
이번에 배포한 ‘큐원(Qwen) 2.5’ 모델은 5000만에서 720억 개의 매개변수를 갖추고 있는 것이 특징이다. 또 29개 이상의 언어를 지원하는데,한국어 성능이 우수한 것으로 알려졌다. 아울러 수학과 코딩 능력이 강화됐다. 자동차,게임,과학 연구 등 다양한 분야에서 활용할 수 있다는 것이 알리바바측 설명이다.
주목되는 것은 종류다. 기본 모델부터 인스트럭트,수학 모델을 포함한 100개 이상의 모델로 구성돼 있다. 이 가운데 주력은 ‘큐원 맥스(Qwen-Max)’다. 알리바바는 언어 이해,수학,코딩 부문에서 향상된 성능을 자랑한다고 덧붙였다.
이밖에 알리바바 클라우드는 이미지 생성기 ‘통이 완샹(Tongyi Wanxiang)’의 새로운 텍스트-비디오 모델을 함께 발표했다. 해당 모델은 중국어와 영어 텍스트 지시를 바탕으로 현실적인 장면부터 3차원 애니메이션까지 다양한 종류의 영상을 고품질로 생성할 수 있는 것이 특징이다.
조우징런 알리바바 클라우드 인텔리전스 최고기술책임자(CTO)는 “다양한 산업에 생성형 인공지능(AI) 기술을 도입하기 위해 첨단 AI 인프라에 지속적으로 투자할 것을 약속한다”고 말했다.
STK2026 성료… 애지봇, 전방위 로봇 응용 역량으로 주목
작은 공간에서 새로운 여정이 시작됩니다: 지난시 리샤 지구, 심층 개발을 통해 도시의 미래를 그려보다
려하를 넘어, 단순한 도시를 넘어서
A Pact for Industries: Cluster Momentum Accelerates as Multinationals Double Down on Qingdao
글로벌 기업들이 중국 칭다오로 끊임없이 몰려드는 이유는?
iQingdao와 함께 서밋 현장으로 나감: 칭다오 서밋, 글로벌 비즈니스 리더들의 '차이나 타임'