최근 수정 시각 : 2025-01-02 06:56:24

Qwen(AI)


생성형 인공지능
{{{#!wiki style="margin:-0px -10px -5px"
{{{#!folding [ 펼치기 · 접기 ]
{{{#!wiki style="margin:-5px -1px -11px; word-break:keep-all"
유니모달 모델 기반
<colkeepall> 텍스트 [[소설|
소설
]] NovelAI · AI Dungeon · AI Novelist · GPTRPG
대화형 [[챗봇|
챗봇
]] ChatGPT · Microsoft Copilot · Gemini · CLOVA X · Cue: · Inflection AI · Mistral AI · Grok · Xtion AI(액션 AI)
[[언어 모델|
언어모델
]] GPT-1 · GPT-2 · GPT-3 · GPT-4 · LLaMA · Gemma · Claude · Phi · Exaone · OpenELM · Qwen
코드 [[코드#컴퓨터 소프트웨어|
코드
]] GitHub Copilot · Devin · Phind
이미지 [[그림 인공지능|
그림
]] Midjourney · DALL·E · Artbreeder · NovelAI Image Generation · Stable Diffusion · FLUX.1 · Gaugan2 · Dream by WOMBO · Adobe Firefly · Deep Dream Generator
[[영상 인공지능|
영상
]] Stable Video · Sora · Meta Movie gen · Lumiere · Veo · Runway AI · Luma Dream Machine · Kling AI
[[모델링|
모델링
]] LATTE3D
오디오
소리
[[음성|
음성
]] A.I.VOICE · DeepVocal · Voice Engine
[[음악|
음악
]] Suno · Stable Audio · Udio · AIVA · SOUNDRAW · keeneat · Mix.audio · vio.dio
[[효과음|
효과음
]] OptimizerAI
멀티모달 모델 기반
대화형
+이미지
Exaone 3.5 · Samsung Gauss
+음성/이미지
GPT-4o · GPT-5 · Gemini · o1 · o3 · Qwen
+에이전트
Galaxy AI · Claude 3.5 Sonnet
행위
동작
[[지능형 에이전트|
에이전트
]] Apple Intelligence · Project Astra · Google Jarvis
[[인공지능 로봇|
체화
]] Tesla optimus · Google RT-X · Project Gr00t
}}}}}}}}}

Qwen
파일:Qwen_logo.png
<colbgcolor=#ddd,#000> 분류 소형 언어 모델
개발사 알리클라우드
출시일
Qwen-1
2023년 8월 3일
Qwen-1.5
2024년 2월 4일
Qwen-2
2024년 6월 7일
Qwen-2.5
2024년 9월 19일
버전 2.5
링크 파일:홈페이지 아이콘.svg 파일:허깅페이스 아이콘.svg

1. 개요2. 제품
2.1. Qwen-12.2. Qwen-1.52.3. Qwen-22.4. Qwen-2.5
3. 실험 모델
3.1. QwQ3.2. QvQ

[clearfix]

1. 개요

Qwen은 알리클라우드의 오픈소스 언어 모델이다.

2. 제품

2.1. Qwen-1

1.8B, 7B, 14B, 72B 4가지 모델로 출시 되었다.
2023년 8월 3일부터 7B가, 9월 25일에 14B가, 11월 30일에 1.8B와 72B가 출시되었다.
GPT-3.5 GPT-4에 근접하는 성능을 보여주는것으로 자체적인 평가데이터가 공개되었다.

2.2. Qwen-1.5

2024년 2월 4일에 공개되었으며, 0.5B, 1.8B, 4B, 7B, 14B, 72B 6가지 모델로 출시되었다.
GPT-3.5 대비 언어를 이해하는 능력이 월등하다고 평가데이터가 공개되었다.
2024년 4월 2일에 32B가, 4월 25일에 110B 모델이 추가로 공개되었다.

2.3. Qwen-2

2024년 6월 7일에 공개되었으며, 0.5B, 1.5B, 7B, 57B-A14B, 72B 5가지 모델로 출시되었다.
72B 모델의 경우, 밴치마크에서 LLaMA3-70B, Mixtral-8x22B와 Qwen 1.5-110B 모델을 완전히 제압하는 성능을 과시했다.
2024년 8월 8일에 Qwen2를 기반으로한 수학 특화 모델인 "Qwen2-Math" 모델을 발표했다.[1]
2024년 8월 9일에 Qwen2를 기반으로한 음성 분석 특화 모델인 "Qwen2-Audio" 모델을 발표했다.[2]
2024년 8월 29일에 Qwen2를 기반으로한 이미지 분석 특화 모델인 "Qwen2-VL" 모델을 발표했다.[3][4]

2.4. Qwen-2.5

2024년 9월 19일에 Qwen2를 개선한 2.5 모델을 발표했다.
0.5B, 1.5B, 3B, 7B, 14B, 32B, 72B 로 구성되어있으며, 이중 3B와 72B를 제외하고 나머지 모델들을 모두 Apache 2.0 라이센스를 적용해 오픈소스화 시켰다.
2024년 9월 19일에 기존 Math 모델을 업그레이드한 "Qwen2.5-Math" 모델을 발표했다.[5]
2024년 9월 19일에 코딩 특화 모델인 "Qwen2.5-Coder" 모델을 발표했다.[6]

3. 실험 모델

3.1. QwQ

AI의 추론 능력을 향상하기 위해 개발 중인 실험적 연구 모델이다. 모델의 크기는 32.5B 하나다.

3.2. QvQ

AI의 시각적 추론 능력을 향상하기 위해 개발 중인 실험적 연구 모델이다. 모델의 크기는 72B 하나다.
공개된 벤치 데이터에 의하면 OpenAI o1-2024-12-17에 근접한 성능을 보여주고 있다.[7]
[1] 1.5B, 7B, 72B [2] 7B [3] 2B, 7B, 72B [4] GPT-4o-0513 Claude 3.5-Sonnet을 압도적으로 앞서는 성능을 보여줬다.[8] [5] 1.5B, 7B, 72B [6] 7B [7] https://modelscope.cn/models/Qwen/QVQ-72B-Preview