최근 수정 시각 : 2024-04-08 15:15:24

Stable Audio

생성형 인공지능
{{{#!wiki style="margin:-0px -10px -5px" {{{#!folding [ 펼치기 · 접기 ] {{{#!wiki style="margin:-5px -1px -11px; word-break:keep-all"	유니모달 모델 기반
<colkeepall> 텍스트	[[소설\| 소설 ]] NovelAI · AI Dungeon · AI Novelist · GPTRPG
대화형	[[챗봇\| 챗봇 ]] ChatGPT · Microsoft Copilot · Gemini · CLOVA X · Cue: · Inflection AI · Mistral AI · Grok · Xtion AI(액션 AI)
대화형	[[언어 모델\| 언어모델 ]] GPT-1 · GPT-2 · GPT-3 · GPT-4 · LLaMA · Gemma · Claude · Phi · Exaone · OpenELM · Qwen
코드	[[코드#컴퓨터 소프트웨어\| 코드 ]] GitHub Copilot · Devin · Phind
이미지	[[그림 인공지능\| 그림 ]] Midjourney · DALL·E · Artbreeder · NovelAI Image Generation · Stable Diffusion · FLUX.1 · Gaugan2 · Dream by WOMBO · Adobe Firefly · Deep Dream Generator
	[[영상 인공지능\| 영상 ]] Stable Video · Sora · Meta Movie gen · Lumiere · Veo · Runway AI · Luma Dream Machine · Kling AI
	[[모델링\| 모델링 ]] LATTE3D
오디오 소리	[[음성\| 음성 ]] A.I.VOICE · DeepVocal · Voice Engine
	[[음악\| 음악 ]] Suno · Stable Audio · Udio · AIVA · SOUNDRAW · keeneat · Mix.audio · vio.dio
	[[효과음\| 효과음 ]] OptimizerAI
멀티모달 모델 기반
대화형	+이미지 Exaone 3.5 · Samsung Gauss
	+음성/이미지 GPT-4o · ~~GPT-5~~ · Gemini · o1 · o3 · Qwen
	+에이전트 Galaxy AI · Claude 3.5 Sonnet
행위 동작	[[지능형 에이전트\| 에이전트 ]] Apple Intelligence · Project Astra · ~~Google Jarvis~~
행위 동작	[[인공지능 로봇\| 체화 ]] Tesla optimus · Google RT-X · Project Gr00t	}}}}}}}}}

스테이블 오디오 Stable Audio
<colbgcolor=#ddd,#010101> 분류	음악 생성 인공지능
개발사	Stability AI
출시일	1.0 2023년 9월 14일 2.0 2024년 3월 3일
버전	2.0
라이선스	Proprietary SW [1]
링크	\|

1. 개요2. 특징

[clearfix]

1. 개요

Stability AI에서 개발한 음악 생성 인공지능. 최대 3분 길이의 음악을 생성할 수 있다.

2. 특징

텍스트를 입력하거나 오디오를 업로드 한 후 해당 오디오를 바탕으로 원하는 음악을 생성할 수 있다.

트랜스포머 아키텍처와 잠재 확산 모델(LDM)을 적절히 조합하여 효율적으로 학습되었다.

[1] 2.0 모델 기준, 향후 오픈소스 모델도 공개될 예정이다.

분류