상위 문서: NovelAI/이미지 제네레이터
[clearfix]
1. 개요
NovelAI 이미지 제네레이터, 특히 최신 버전인 V3는 매우 뛰어난 그림 인공지능이지만, 이를 원활히 사용하기 위해서는 여러 가지 태그와 시스템을 이해하고 능숙하게 조절할 수 있어야 한다. 이 문서는 그에 대한 정보를 정리한다. 공식 가이드는 이 홈페이지를 참조하자.2. 기본 시스템
- Settings
- NAI Diffusion Anime (Curated): 가장 기본적인 그림체를 허용한다.
- NAI Diffusion Anime (Full): 그림체의 다양성을 좀 더 높인다.
- NAI Diffusion Furry (Beta): 퍼리를 만드는 전용이다.
- Image Resolution
- 이미지의 사이즈 크기
- Number of Images: 생성할 이미지의 수
- Uploaded Image Settins
- Strength (기본값 0.7): 원본 이미지를 얼마나 보전하는지 나타내는 수치
- Noise (기본값 0.2): 원본 이미지를 얼마나 변형시킬지
- Model-Specific Settings
-
Undesired Content
기본적으로 Low Quality + Bad anatomy를 배제하도록 설정되어 있으며, 여기에 더해 원하는 태그를 넣어 AI가 그 속성을 배제하도록 할 수 있다. -
Add Quality Tags
Masterpiece, Best Quality를 항상 내재시키는 태그로 그냥 퀄리티 향상하라고 AI한테 한 마디 더 하는 정도의 효과가 있다. -
Steps (기본값 28)
AI가 그림을 제작하는데 들어가는 단계 수를 뜻하며, 높아질수록 그림이 자세해진다. 그러나 너무 높으면 불필요한 구조물이 생겨나 그림이 망가질 수 있다. 최대 50까지 지정 가능하다. 기본 해상도의 경우 Steps를 29 이상으로 올리면 4의 Anlas가 소모된다. -
Scale (기본값 11)
값이 높을수록 AI가 창의성을 낮추고 주어진 문장을 수행한다. 반대로 값이 낮을수록 AI가 창의성을 발휘하며 주어진 문장 일부를 변용한다. 12 이상으로 올려도 Anlas가 소모되지는 않으나, 값이 높을수록 화질이 점점 나빠지는 단점이 있다. 정확하게는, Scale이 12부터 25까지는 수채화 혹은 오일파스텔 톤의 효과가 나지만, 30 이상부터는 그림이 급격하게 망가진다. 특히 Steps가 낮다면 더더욱. -
Seed
AI가 생성한 그림에 부여되는 숫자로, 이 칸에다가 다른 AI 그림의 Seed 수치를 넣으면 해당 그림과 유사한 그림체를 모방해 그려낸다. 말 그대로 씨앗인 셈이다. - Advanced: Sampling
본래 생성한 이미지를 다운로드하려면 하나하나 수동으로 받거나 .zip 파일로 한번에 받는 수 밖에 없었다. 따라서 대량 생성 중 브라우저가 꺼져서 생성한 이미지를 다 날려먹는다던가, 일부 이미지를 다운로드 받는 것을 잊어 소실하거나, 전체 다운로드시 인터넷이나 서버 문제 등으로 일부가 누락되거나 하는 문제가 있었다. 이후 생성 후 자동 다운로드 옵션을 제공하게 되면서 상당수 해결되었다. 이 설정은 처음에는 비활성화된 상태이며, 구독 관리창에 들어가면 활성화시킬 수 있다.
3. 추천 기본문
굳이 아래의 기본문으로 시작하지 않아도 되지만 자신이 처음이거나 뭘 써넣어야 할지 모른다면 일단 집어넣고 시작해보기 좋다.-
인물 + 배경
{1girl}[1], {solo},dynamic angle
,{dynamic hair
}, {{dynamic pose}},beautiful detailed hands
, illustration,{{beautiful detailed sky
}},{{beautiful-detailed eyes
}}, {{cinematic light}}, ultra detailed,{{disheveled hair
}}
-
배경용
{extremely detailed CG unity 8k wallpaper},only background
, {{ultra-detailed}}, {best illustration}, {best shadow}, {{an extremely delicate and beautiful}},dynamic angle
,glow white particles
, {{cinematic light}}
4. 태그
NovelAI는 문장형으로 제시해도 이를 이해하지만, 단보루 계열 사이트에서 이미지를 검색하듯이 짤막한 단어로 태그를 하나씩 달아서 묘사하는 것이 보다 효과적이다.[2] 프롬프트 태그는 주로 단보루의 태그를 기준으로 하며, 단보루를 통째로 학습시킨 만큼 태그마다 학습된 데이터 수가 달라 재현도가 변화한다.보다 정확히 설명하자면, 업로드 수가 많은 태그일수록 영향력 및 재현도가 높고 반대로 데이터가 적은 태그는 낮아진다. 또한 단보루의 태그는 Artist(그린이), Copyrights(작품명), Character(캐릭터), General(일반), Meta(메타데이터)로 크게 구분되어 있는데, NovelAI 역시 내부적으로 이를 구분하여 처리하는 것으로 보인다. 따라서 그림의 내용과 직접적인 관련이 없는 화질 등을 구분하는 Meta를 제외하고 Artist, Copyrights, Character 태그는 상대적으로 적은 이미지만 있어도 반영이 비교적 잘 되지만, 그 외 자세, 비공식 의상, 머리색 등 외모, 상황, 배경, 감정, 표정 등 나머지 태그들은 모조리 General에 속하기 때문에 특정 태그에 500~1000장 정도 이미지가 있어도 데이터 전체로 봤을 때는 턱 없이 적은 양이라 다른 태그에 묻혀서 반영이 잘 안 되는 경우가 많다.
가령 General에 속하는 특정 태그의 이미지가 500장 정도 있다면 꽤 많은 데이터가 아닌가 싶겠지만, 전체 이미지 수가 어림잡아 700만장 정도에 가까운 단보루 데이터 속에서는 새발의 피(약 0.007%)나 다름 없는 양이라 반영이 어려운 경우가 많다. 후술할 태그의 위치에 따른 우선도나 가중치 문법을 이용하면 재현이 아주 불가능한 것은 아니지만 비슷한 분위기만 내도 성공한 수준. 예를 들어 고어물(guro)의 경우, NovelAI가 따로 검열을 한 것이 아니라 guro 태그가 붙은 이미지가 3,600장 뿐이고 그 자체는 적은 수는 아니지만 많은 고어물 시추에이션 태그들이 한 태그에 모여있는 셈인지라 guro에 대한 명확한 이미지가 생성되지 않아 제대로 반영이 안 되는 것 뿐이다.
따라서 원하는 태그가 있을 경우 단부루 사이트에 접속한 후 자동완성되는 태그와 투고수 및 이미지를 참고하여 정확히 어떻게 활용되는지, 충분히 재현될 만큼 이미지가 있는지 확인하는 것이 좋다. 다만 단부루는 비회원 기준으로 특정 이미지와 태그를 보이지 않게 하거나 검색어를 2개로 제한하고 있으니 거의 같은 태그를 사용하는 파생 사이트인 겔부루를 참고해도 좋다.[3]
V3 기준으로 프롬프트는 먼저 작성하는 태그 쪽이 우선도가 높은 것으로 보인다. 정확히는 Stable Diffusion 자체 특성이지만 V3는 그 정도가 강한 편. 일단 캐릭터나 그림체 태그는 앞 쪽에 쓰는 것이 잘 반영되는 편이며, 만약 원하는 프롬프트가 가중치를 넣어도 잘 작동하지 않는다면 앞 쪽에 배치해보면 잘 반영되는 경우가 있다. 단, 1girl, 1boy 등 포괄적인 범위의 태그를 앞 쪽에 쓸 경우 후술할 성전환, 의인화 등 특별한 활용이 아니라면 불필요한 데이터가 섞여 나올 위험이 있으니 너무 앞에 쓰지는 말 것.[4] 반대로 특정 프롬프트가 과하게 작용되는데 가중치를 줄여도 반영이 원치 않게 잘 된다면 뒤에 적는 것으로 대처할 수도 있다.
한편 1명이 아닌 다수의 캐릭터를 형성하고 싶을 경우에는, 2girls, 2boys, 1boy and 1girl 등 인물 숫자 태그를 맨 앞 쪽에 배치하는 것이 좋다. 그러지 않으면 두명의 캐릭터 중 한명(특히 데이터가 많은 쪽)이 크게 나오고 다른 한명은 멀리 있거나 치비, SD 캐릭터 마냥 쪼그라들어서 구석이나 배경에 빼꼼 나올 가능성이 높아진다.
작품명 태그는 캐릭터 태그의 데이터가 수천장급으로 충분하다면 필수적이지는 않으나, 작품명 태그 없이 단독으로 캐릭터 태그를 붙였을 때 캐릭터의 구현도가 떨어질 경우 작품명 태그를 붙이는 것만으로 구현도를 높일 수 있다. 또한 단부루 기준으로 자료가 부족해서 최대한 끌어모아야 할 경우에도 도움이 된다. V3 기준으로 작품 명 프롬프트 태그는 캐릭터와 그림체 태그 뒤에 붙이는 것이 좋다. 캐릭터나 그림체 태그 앞에 배치할 경우, 해당 작품 태그에 분류된 수많은 이미지들에 포함된 각종 캐릭터와 그림체 데이터가 우선시되어 작화붕괴(특정 그림체를 원했는데 공식 그림체가 섞임)나 노이즈(리본을 착용한 캐릭터가 아닌데 다른 캐릭터의 리본을 달고 있음)를 일으킬 가능성이 있다.
예를 들어, 특정 작품 A에 등장하는 디폴트 복장이 아닌 공식 복장 바리에이션 B(※ 단부루에 전용 태그가 존재할 경우 한정)를 입은 캐릭터 C를 D의 작풍 혹은 그림체로 그리고 싶다면, B, C, D, A 순으로 태그를 배열하면 재현도 향상에 도움이 된다. 만약 데이터가 더 필요하거나 공식 그림체를 더 드러나게 하고 싶다면 B, C, A, D 순으로 작품 태그를 그림체 태그보다 앞에 놓는 것도 방법이다.
- [태그] 혹은 {태그}: 각 태그를 그림에 적용시키면서 가중치를 조절할 수 있다. 대괄호[]는 가중치를 내리고, 중괄호{}는 가중치를 올린다. 가령 특정 태그를 적용시킬 때 과하게 적용한다면 대괄호를, 잘 반영되지 않는다면 중괄호를 사용해서 조절할 수 있다. {{태그}} 같이 괄호를 겹쳐 쓰는 방식으로 가중치를 더 적용시킬 수 있다.
- 태그A|태그B: A와 B의 태그 속성을 0.1~100의 가중치를 정해서 섞을 수 있다. 각 태그의 가중치는 각 태그 뒤에 :(숫자)를 붙이는 것으로 부여 가능. 다만 이 기능은 V3에서는 작동하지 않는다. 현재 특정 태그들을 섞는다면 차라리 [], {}를 활용해 가중치를 따로 조절하는 편이 낫다.
- year (XXXX): (XXXX)에 연도를 기입하여 해당 연도에 그려진 그림 데이터들을 더욱 참고한다. 연도 기준은 단부루 업로드 시기를 기준으로 한다. 가령 2014년에 그려진, 정확히는 업로드가 된 그림들의 그림체를 참고시키고 싶다면 year 2014 태그를 입력하면 된다.
- nsfw: 성인물( 18금, 야짤) 데이터를 활성화한다. 없어도 관련 태그들을 입력하면 성인물 생성은 가능하나, 프롬프트에 포함시키면 보다 확실하게(?) 참고하고 생성해준다. 반대로 이미지에 원치 않게 성인물 데이터가 반영될 경우에는 Undesired Content에 입력해서 영향력을 제거할 수 있다. 가끔 노이즈의 원인이 되기도 하는지라 그림의 질을 올리기 위해 Undesired Content에 입력하기도 한다.
4.1. 테마/도구
- 흑백 손그림: brush paint, sketch, monochrome
- 레트로 + 스케치: 1990s, 2000s, retro, sketch, monochrome
- 색연필 + 파스텔: pastel, color pencil, sketch
- 수채화: watercolor (medium)
4.2. 테마/세계관
- 중세 + 판타지: medieval, fantasy
- 미래 + 사이버펑크: science fiction, cyberpunk
- 스팀펑크: steampunk
- 포스트 아포칼립스: post-apocalypse
4.3. 테마/화풍
- 일본화: nihonga
- 아르데코: art deco
- 아르누보: art nouveau
- 낭만주의: romanticism
- 르네상스: renaissance
- 바로크: baroque
- 로코코: rococo
- 화염주의: flame painter
- 인상주의: impressionism
- 미니멀리즘: minimalism
- 초현실주의: surreal
4.4. 시점 및 구도
- 다중 구도: multiple views, multiple sketch, multiple pose
- 시점: cowboy shot, facing viewer, looking at viewer
- 초점: face only, portrait, face through shoulders, upper body, face through torso
- 더치 앵글: dutch angle
4.5. 배경
배경학개론 by 햄버거살인마원소법전 1, 1.5, 2
배경은 단부루 태그 외에도 Stable Diffusion (XL)의 기본 배경 데이터도 참고하기 때문에 원하는 배경이 단부루 태그에 없더라도 시도해보면 반영되는 경우가 많다. NAI V3 기준으로 배경 태그는 가장 뒷 편에 작성하는 것이 좋다. 그러지 않으면 배경이 우선시 되어 캐릭터 조형을 삼킬 수 있다. 그리고 배경 태그는 영향력이 크기 때문에 작화에 영향을 꽤나 주는 편이므로 가급적 대괄호를 써서 가중치를 줄이는 것이 좋다.
- 실내: indoors, living room, bedroom, cavin 등
- 실외: outdoors, city[5], town, park 등
- 바다: ocean[6], sea, deep sea 등
- 하늘: sky, night, sunset, cloudy sky, raining, snowing 등
- 구름
- cirrus fibratus, cirrostratus fibratus: 깃털 같은 구름
- altocumulus:고적운, 흩어진 솜 같은 구름
- cumulonimbus, cumulus: 뭉게구름
- contrail: 비행운
- stratus, fog: 안개
- nimbostratus: 비구름
- noctilucent cloud: 야광운
- undulatus asperatus: 거친 물결 구름
- (thing) in background: 배경에 특정 사물을 추가하고 싶다면 (thing)에 원하는 사물 태그를 붙이면 된다.
- 배경색
- (color) background: (color)에 red, orange, yellow, green, blue, purple, white, black 등 색깔 단어를 넣어서 배경색을 정할 수 있다. 영향력이 특히 강해서 대괄호로 조정하지 않으면 simple background 태그 마냥 선명한 단색이 되어버리므로 가중치 조절 필수.
- simple background: 배경을 정하지 않고 단색으로 한다. NAI V3은 simple background가 기본 설정으로 되어 있기 때문에 배경을 좀 더 명확하게 정하고 싶다면 네거티브(Undesired Content)에 이 태그를 추가하는 것이 좋다.
- dark background: 배경을 어둡게 한다. black background처럼 배경을 아예 검게 만들 경우 가중치를 낮출 것.
- dark: 이미지 전체를 어둡게 한다. 태그만으로는 효과가 다소 미미하므로 가중치를 올리는 것이 좋다.
4.6. 캐릭터
- 남자: 1boy, bishounen 등
- 여자: 1girl, bishojo 등
- 나이 및 체격 관련: mature male/female, muscular male/female, skinny 등
- 인외 관련: furry, monster, mecha musume, robot, colored skin 등
상기했듯이 단부루에 업로드된 캐릭터들의 공식 이미지, 팬아트가 많을수록 재현도가 높아진다. 일반 태그에 비해서는 상대적으로 재현을 위한 필요 데이터 수가 적지만, 못해도 이미지가 200~300장 정도는 업로드되어 있어야 특정 캐릭터가 재현되는 편. 특히 단독샷이 많고, 캐릭터의 이미지가 명확하며, 디자인이 대칭을 이루고 개성적이면서도 너무 복잡하지 않을수록[7] 재현도가 높아진다. 만약 재현도가 미묘하다면 작품명이나 해당 캐릭터의 특징에 해당하는 프롬프트를 입력하면 재현도가 확 오르는 경우가 있으니 참고. 특히 업로드된 이미지는 많은데 단체샷이 많아 재현이 잘 안 될 경우 캐릭터의 특징을 잘 집어내면 해당 캐릭터를 구현해낼 가능성이 높다. 반면 이미지가 100장 아래로 너무 적다면 단독샷 위주[8]로 올라오지 않은 한 재현도가 눈에 띄게 떨어져서 그냥 비슷한 자작 캐릭터가 나오는 경우가 많으니 LoRA 기능이 없는 NAI에서는 그냥 포기하는 것이 좋다. 또한 모델이 실시간으로 업데이트되는 것이 아니기 때문에 조건을 충족한다고 할지라도 학습 데이터가 업데이트된 시기 기준[9]으로 팬아트가 얼마 올라오지 않았거나 아예 그 이후로 소개된 캐릭터면 마찬가지로 재현이 되지 않기에 주의.
다만 데이터가 적다는 점이 꼭 단점으로만 작용하는 것만은 아니다. 얼굴 및 헤어스타일 등 캐릭터의 제일 기본적인 외형을 재현 가능한 수준 정도라도 데이터가 있을 경우, 완벽 재현은 힘들어도 헤어스타일, 복장 등을 원하는대로 커스터마이징하는 것이 가능해진다. 데이터가 많은 메이저 캐릭터들은 캐릭터 태그만으로 복장까지 완벽 재현되는 장점이 있으나, 공식이 아닌 임의의 복장을 입혀보고 싶어도 공식 복장이 계속 섞여나와서 조형이 엉망이 되는 경우가 꽤나 생긴다.[10] 특히 태그가 '캐릭터명 (시리즈명)' 식으로 되어있는 캐릭터들이 이렇게 되는 경우가 많은데, NovelAI가 태그를 인식하는 특성상 캐릭터명 뿐만 아니라 괄호 뒤의 시리즈명을 같이 반영해버리기 때문이다. 이런 경우에는 캐릭터명만 앞에다 쓰고, 괄호 내의 시리즈명을 뒤로 배치해도 제대로 나오는 경우가 많으니 공식 스타일을 벗어나고 싶거나 의상 커스터마이징이 제대로 안 된다면 참고하자.
태그 우선도와 가중치, cosplay 프롬프트를 잘 이용하면, 다른 캐릭터의 복장을 입히는 코스프레를 시키는 것도 가능하다. 아예 단보루에 ~(cosplay) 태그가 지정될 정도로 유명한 복장이라면 아주 쉽게 되는 편.
단부루에 업로드되어 있는 이미지를 기준으로 작 중 캐릭터의 의상이나 헤어스타일이 한두가지 밖에 없어서 모습이 일관적이라면 디폴트 의상이나 헤어스타일을 구현하기 쉬워지지지만 다른 의상이나 헤어스타일을 정하기가 어려워지고 특히 디폴트에 해당되는 모습에 가까울수록 지정하기 어려워진다. 반대로 헤어스타일이나 의상이 자주 변경되는 등의 이유로 정해진 모습이 일관적이지 않다면 여러 가지 스타일을 쉽게 구현할 수 있지만 특정 상황의 의상이나 헤어스타일, 디자인을 구현하기가 어려워진다. 보통 캐릭터의 모습이 크게 바뀌는 경우, 별도의 태그가 정해져있는 경우가 많지만 그렇지 않다면 작품명, 간단한 특징의 태그를 입력해야 한다.
본래 V1~2에서는 특정 그림체 프롬프트가 없을 경우 NAI 모델 특유의 기본 그림체로 출력되었는데, V3부터는 기본 그림체는 거의 희미해지고 수많은 그림체가 모두 섞인 듯한 중립적인 조형으로 캐릭터가 나온다. 따라서 프롬프트의 배치나 시드에 따라 미묘하게 그림체가 매번 바뀌는 편인데, 각 캐릭터의 기본 조형이 잘 나오는 경우도 있는 반면 다소 어설프게 섞여 나오는 경우도 있다. 만약 그림체가 계속 어설프게 출력되는 경우는 작화 및 그림체 프롬프트를 적용시키거나 그림체 태그 외에 그림체에 영향을 미치는 태그를 추려내어 가중치 세팅값을 활용해 조절해줘야 한다.
특정 캐릭터의 프롬프트 태그와 캐릭터 관련 태그들을 잘 이용하면 성전환, 의인화도 가능하다. 가령 여성 캐릭터의 경우 남성의 특성을 최대한 집어넣고 여성의 특성을 네거티브 태그에 집어넣으면 남성화가 가능하고, 남성 캐릭터의 여성화도 반대로 하면 가능하다. 의인화 역시 1girl, 1boy 태그를 캐릭터 태그 앞에 둔 뒤, 캐릭터 태그의 가중치를 적절히 낮춰 캐릭터적 특성이 전부 빠지지 않는 수준으로 조절하고, 인간의 특성을 최대한 입력하고 해당 캐릭터의 furry를 비롯한 종족 특성 태그를 최대한 제외하면 꽤나 그럴 듯하게 만들어준다. 이는 약 인공지능 특성상 기본 베이스는 인간이고 성별이나 종족 등 자세한 내막을 중시하기보다는 그 캐릭터의 보이는 특성 태그를 그대로 맞춰 이미지[11]를 생성하는 편이기 때문으로, 어찌보면 현실에서 직접 그려지는 성전환 및 의인화 팬아트와도 비슷한 방식이다.
4.6.1. 자세
- 역동적인 자세: dynamic pose, fighting stance
- 옆으로 누운 자세: on side lying, spooning position
4.7. 작화 스타일
NAI V3의 기본 그림체는 무료 모델들과 달리 원작 그림체 재현 및 중립적이고 심플한 그림체를 표방하기 때문에 강력한 성능에 비해 결과물은 다소 심심할 수 있다. 결국 만족도와 퀄리티 상승을 위해 단보루를 둘러보며 원하는 그림체 관련 프롬프트를 알아보게 될 것이다. 당연하겠지만 단보루에 아주 오랜 시간 동안 데이터가 축적되어 있는 만큼, 그림체가 재현이 되기는 하되 과거와 현재의 그림체가 뒤섞인 느낌이 나는 부정확한 경우도 자주 생긴다. 이 경우에는 상단에 언급된 'year xxxx(연도)' 태그를 활용해 조절할 수도 있다.그러나 특정 작가나 그림쟁이의 태그의 경우, 어디까지나 재미 삼아 자기만족용으로만 사용할 것을 권한다. 가중치를 낮추거나 여러 그림체를 섞는 등 특정 그림체가 묻어나오지 않게 프롬프트를 작성하지 않고 그대로 베낀 후 SNS나 픽시브 등 공유 사이트에 올릴 경우 발생하는 문제는 자기 책임이고 NovelAI는 책임지지 않는다. 픽시브 역시 노골적으로 그림체를 베낀 생성물은 신고가 들어올 시 해당 업로드를 차단하고 경고를 보내는 크리에이터 보호 정책을 취하고 있다. 단순히 양심의 문제를 떠나서 대다수의 그림 작가들은 무단학습에 대해 매우 민감한 상태[12]고, 팬들도 그림 인공지능에 대해 대부분 부정적이기 때문에 인공지능 사용자가 익명의 트롤러가 아닌 이상 각종 불이익이 들어올 것이다.
- 실사체
- realistic: 실사체
- 한국
- webtoon: 웹툰
- korea illust: 로판 일러스트
- 일본
- novel illustration: 일본 라이트노벨 일러스트
- octane render: 카툰 렌더링
- game cg: 미연시 CG
- (특정 회사 이름), anime screencap: 특정 회사 풍의 애니메이션 스크린샷[13]
- rumiko takahashi(시티팝, 세일러문)
- takehiko inoue
- makoto shinkai
- takeshi obata
- 미국 만화
- 미국 미술: andy warhol(팝 아트)
4.8. 그림의 질을 높이는 기본문
- masterpiece, best quality + 변수를 추가하고 싶을 시 이하 문단 속 태그 추가
- best quality, amazing quality, very aesthetic, absurdres (V3 기준, Add Qulity Tags 설정 활성화시 직접 입력할 필요 없음)
NovelAI의 구조, 학습 방향, 데이터 처리 특성상, NovelAI와 그 후계 파생 모델들은 masterpiece, best quality, high quality, medium quality, normal quality, low quality, worst quality 태그에 대해 생성되는 그림의 질이 유의미하게 변화하는 것으로 알려져 있다. 또한 NovelAI와 관련 없는 모델들, 특히 일본 애니메이션, 만화 쪽이 아닌 실사 모델 등에는 저 태그들이 적용되지 않기도 한다. 관련 레딧 토론
NovelAI V2부터는 각종 프롬프트 충돌 문제를 감안하여 best quality가 masterpiece를 대체하여 최고급 퀄리티 태그가 되었고, 나머지 퀄리티 태그도 amazing quality, great quality, normal quality, bad quality, worst quality로 충돌이 적도록 수정되었다. 당연하지만 NovelAI V2, V3는 유출되지 않았으므로 Web UI용 모델들은 V1 기준을 따른다.
흔히 쓰이는 "masterpiece"의 경우, NovelAI와 관련된 모델이라면 거의 최대급 퀄리티를 뽑아낼 수 있으나, 명작 혹은 걸작을 의미하는 만큼 고전 명화 양식 요소가 들어갈 수 있기 때문에 이미지 분위기에 영향을 끼치기도 한다. 가령 이미지가 생각했던 것에 비해 고풍스럽거나, 약간 갈색빛이 돌거나, 어울리지 않는 중세풍 장식[14]이 보인다면 네거티브 태그에 classical art, historical art, artifects, photo frame 같은 태그를 넣어 제거하는 것이 좋다.
"best quality"는 다음 단계인 만큼 거의 차이 없을 정도의 높은 퀄리티가 나오며, masterpiece와 병행하는 것으로 높은 퀄리티를 유지하면서 위에 언급된 고전 양식 문제를 어느 정도 해결할 수도 있다. "high quality"는 말 그대로 질이 높긴 한데, 위의 두 단계에 비교하면 확실히 질이 낮다는 느낌이 쉽게 체감된다. 태그에 함께 병행해도 질이 낮아진다는 느낌이 들기 쉬우므로, 좀 더 다양한 퀄리티의 그림를 보고 싶다는 게 아니라면 빼는 것이 좋다.
실제로 그림에 적용이 될 법한 shadow(그림자, 음영), cinematic(시네마틱, 영화풍), realistic(현실적인, 실사풍) 같은 태그들은 그림의 질 향상에 영향을 끼칠 수도 있다. 그리고 NovelAI가 데이터셋을 가져온 단부루에서 고화질 이미지에 적용하는 태그인 absurdres, highres도 영향을 줄 가능성이 있다.
그 외 단부루 태그 기준으로 그림의 퀄리티를 높히는데 영향을 줄 법한 태그는 official art, game cg, official wallpaper, novel illustration이 있다. 당연히 상대적으로 높은 퀄리티로 그려진 그림들이 분류될 수 밖에 없는 태그기 때문이다. 다만 해당 태그들은 화풍과 그림체에 영향을 줄 수 있으니 주의.
ultra-detailed, highly details, hyper extreme detailed 등 "details, detailed" 관련 태그들이 유저들 사이에서 많이 쓰이는 편인데, 단부루에는 데이터가 없다시피 한 태그지만 그림을 약간 확대하거나 세세한 디테일이 다소 변화하는 효과가 확인되고 있다. 심지어 details와 detailed 두 태그 간의 효과도 조금씩 차이가 난다. 배경 태그와 마찬가지로 SD 모델 내부적으로 적용되는 명령어 태그로 추정되며, 그림에 유의미한 변수를 주고 싶다면 시도해봐도 좋다. 다만 태그에 따라 과하게 디테일이 적용되어 불필요한 장식이나 사물이 추가되는 경우도 있으니 이 경우에는 제외하는 것이 낫다.
그 외 퀄리티에 영향을 줄 수도 있다고 알려져 있는 태그들은 상단 예시에도 일부 쓰여진 4k, 8k, beautiful, delicate, epic, ISO 200 Shutter Speed 2000, professional, SIGMA Art Lens 35mm F1.4, taken by Canon EOS, trending anime, UHD 등이 있지만 실제로 이러한 태그들이 모든 그림의 질에 주는 영향이 있는지는 잘 알려지지 않았다. 일단 프롬프트인 만큼 그림에 영향을 안 주는 것은 아닌데, 그림 자체의 퀄리티보다는 구도나 자세 등 변수에 영향을 주는 경우가 많으며 일부는 실사풍에서 주로 적용되기도 한다. 따라서 뭔가 그림에 변수를 주고자 하는 것이 아닌 한, 인터넷에서 올려진 AI 그림들에 붙어있는 여러 가지 퀄리티 관련 태그를 모조리 가져와서 도배할 필요는 없다. 실제로 저 태그들이 지원되는 모델이 아니라면 조금이라도 있을 변화나 개선을 노리고 써보거나 플라시보 효과 정도로 여기고 쓰는 정도이고, 진짜 고품질 그림을 원한다면 퀄리티 상승 태그를 도배하지 말고 차라리 그림의 기본 해상도를 올리거나 해상도 보조 기능을 사용해서 개선하는 것이 더 효과적이다. 도배한 태그들이 오히려 노이즈를 유발할 가능성도 있기 때문.
참고로 퀄리티 관련 태그에 미사여구를 잔뜩 달아 소설 문구에 가깝게 태그를 작성하는 경우도 있는데, 역시 실제 퀄리티에 큰 영향은 없다. 가령 "truly perfect and flawless masterpiece" 같은 걸 적어도 그림의 질 자체는 그냥 masterpiece만 적은 것과 별반 다를 것 없다.
4.9. 그림의 질을 낮추는 기본문
각 문단에 해당하는 단어들을 모두 복사한 후 Undesired Content(Web UI 기준 Negative tag)에 붙여넣으면 된다. 사실상 이쪽이 "그림의 질을 높이는 기본문"보다 더 중요하다. 프롬프트는 온갖 텍스트를 입력해도 퀄리티가 크게 변화하지 않지만, Undesired Content 태그는 유의미한 변화가 보이므로 그림의 기본적인 퀄리티를 위해서라도 Undesired Content를 다루는 것이 필수적이다. NovelAI는 물론이고 그 토대가 되는 Stable Diffusion 계열이면서 NovelAI에서 파생된 모델들에서도 적용된다.사실 쉽게 생각해도 NovelAI는 그 단보루를 통째로 크롤링한 거대한 데이터셋을 가지고 있기 때문에 당연히 거기에 포함된 수 많은 이미지들이 원치 않게 적용되어 작붕과 노이즈를 일으켜서 통제가 필요한 것은 당연한 일이다. 그나마 입력하지 않은 프롬프트에 대해서는 잘 반영하지 않는 V3에 와서는 상당히 나아졌지만, 그럼에도 방대한 데이터로 인해 작붕과 노이즈는 여전히 일어나므로 퀄리티를 저하시키는 태그를 빼는 작업은 언제나 필요하다.[15]
다만 여기 언급된 태그 모음들은 어디까지나 그림에서 나타나는 부정적인 부분을 최대한 줄이는 것이지 완전히 차단할 수 있다는 보장은 없으니 주의. 물론 이 태그들을 네거티브에 입력해서 그림을 뽑으면 확실히 나은 퀄리티로 나오기는 하지만, 인정된 네거티브 태그인 "low quality, worst quality, lowres, bad anatomy" 정도만 넣어도 의외로 무난하게 그림을 뽑아준다. 따라서 창의성 등 원하는 그림의 방향에 따라서는 태그를 도배하기보다 정말 빼야 하는 태그 정도만 더 넣어 간략화하는 편이 나을 수도 있다.
한편 최신판 기준으로는 Undesired Content Preset이라고 하여 부정적 태그 프리셋을 Heavy[16], Light[17], Human Focus[18] 단계로 설정하고 입력 칸에는 표시되지 않게 할 수 있다.[19] 만약 이하 태그 모음을 쓰고 싶다면, None으로 해놓고 따로 입력하면 된다.
강화를 잘 살펴보면 조금이라도 악영향을 끼칠 수 있는 태그들이 모조리 들어가 있다. 반면 monochrome, doujinshi, sketch, jaggy lines, graffiti, retro artstyle, chromatic aberration, abstract, parody, meme 등 단순히 부정적인 의미가 아니라 괜히 포함되어 노이즈를 유발해 질을 낮출까봐 들어간 태그도 있으므로, 그 쪽 방향 그림을 원하거나 토큰 한도를 초과해서 태그 자리가 필요할 경우 공식 프리셋 설정 혹은 기본/간략을 활용하거나 해당 태그만 빼면 된다.
blurry의 경우, 보통 블러 효과는 캐릭터, 배경, 사물 간 원근감이나 움직임, 속도감을 표현할 때 사용되지만 AI 특성상 이를 제대로 표현 및 구분하지 못하고 이미지 일부나 전체를 뿌옇게 만들어 오히려 뭉게지게 할 수 있기 때문에 자주 빼는 편이다. 다만 V3의 경우는 의외로 블러 효과를 잘 표현하기 때문에 blurry background, motion blur 등 해당 효과를 원할 경우에는 빼주면 된다.
- NAI V3 및 단보루 태그 기준 정리[20]
- 기본
- 강화
- 간략
- 간략 + Human Focus용 태그 포함[주의]
worst quality, bad quality, displeasing, lowres, bad anatomy, bad hands, bad feet, extra arms, extra digits, fewer digits, extra legs, missing, mismatched, twisted torso, 3d, blurry, chromatic aberration, abstract, duplicate, clone, fusion, comparison, speech, text, font, ui, glitch, noise, unfinished, artistic error, scan, cropped, third-party edit, jpeg artifacts, logo, sign, signature, watermark, username, name, notice, disfigured, mutation, guro,
worst quality, bad quality, very displeasing, displeasing, lowres, bad anatomy, bad hands, bad feet, extra arms, extra digits, fewer digits, extra legs, missing, mismatched, twisted torso, long body, 3d, blurry, monochrome, doujinshi, sketch, jaggy lines, graffiti, retro artstyle, chromatic aberration, abstract, old, ugly, fat, obese, chibi, mascot, duplicate, clone, fusion, comparison, speech, text, font, ui, glitch, noise, unfinished, artistic error, scan, cropped, third-party edit, jpeg artifacts, logo, sign, signature, watermark, username, name, notice, parody, meme, historical, disfigured, mutation, futanari, tentacles, guro, scar, skeleton, skull, vomit, suicide, death, dirty,
worst quality, bad quality, displeasing, lowres, {bad}, extra, fewer, missing, mismatched, twisted, 3d, blurry, duplicate, clone, fusion, comparison, speech, text, glitch, unfinished, artistic error, scan, cropped, third-party edit, jpeg artifacts, logo, signature, watermark, username, name, notice, guro,
worst quality, bad quality, displeasing, lowres, bad anatomy, bad hands, bad feet, extra, fewer, missing, twisted, mismatched pupils, heart-shaped pupils, @@, glowing eyes, 3d, blurry, chromatic aberration, abstract, duplicate, clone, fusion, comparison, speech, text, glitch, unfinished, artistic error, scan, cropped, third-party edit, jpeg artifacts, logo, signature, watermark, username, name, notice, guro,
-
(구) 기본
lowres, bad anatomy, bad hands, text, error, missing fingers, extra digit, fewer digits, cropped, worst quality, low quality, normal quality, jpeg artifacts, signature, watermark, username, blurry, artist name,
-
(구) 기본 강화
low quality lowres, low quality lowres low polygon 3D game, low quality lowres monochrome sketch rough graffiti, low quality lowres very ugly fat obesity scar, low quality lowres chibi, low quality lowres poorly drawn bad anatomy, low quality lowres graffiti unbecoming colorfully, low quality lowres incoherent background, low quality lowres long body, low quality lowres duplicate comparison, low quality lowres pedophile, low quality lowres sketch retro_artstyle doujinshi, low quality lowres sketch, low quality lowres text font ui error missing digit blurry, low quality lowres JPEG artifacts signature hazy bleary, low quality lowres monochrome parody meme, low quality lowres historical picture, low quality lowres disfigured mutated malformed twisted human body, low quality lowres futanari tranny, low quality lowres tentacle skeleton, low quality lowres vomit suicide death dirty,
-
(구) 기본 강화 - 간략 버전
low quality lowres, low quality lowres:<low polygon 3D game, monochrome sketch rough graffiti, very ugly fat obesity scar, chibi, poorly drawn bad anatomy, graffiti unbecoming colorfully, incoherent background, long body, duplicate comparison, pedophile, sketch retro_artstyle doujinshi, sketch, text font ui error missing digit blurry, JPEG artifacts signature hazy bleary, monochrome parody meme, historical picture, disfigured mutated malformed twisted human body, futanari tranny, tentacle skeleton, vomit suicide death dirty>,
-
WEB UI 기본
(low quality, worst quality:1.3), bad anatomy, lowres,
-
WEB UI 신체 말단 부위 기형 방지 특화[22]
{more than one person in focus, bad anatomy, [more than two arm per body:1.5], [more than two leg per body:1.5], [more than five fingers on one hand:1.5], multi arms, multi legs, bad arm anatomy, bad leg anatomy, bad hand anatomy, bad finger anatomy, bad detailed background, unclear architectural outline, non-linear background}, elf-ears, hair crosses the screen border, obesity, fat, blurry, mutated hands and fingers, disfigured, fused, cloned, duplicate, sign, artist sign, signature, artist signature, artifacts, jpeg artifacts,
Stable Diffusion의 경우 버전 업이 되면서 다양한 기능이 생겨났는데, 이중에는 Textual Inversion 등 학습 기능을 통해 이러한 네거티브 태그를 한 단어로 축약해서 만들어낸 것도 있다. 대표적으로 easynegative, bad-hands, deep_negative 등이 있으며, 이들을 활용하면 그림의 질을 더욱 강화하고 조절하면서 깔끔하게 태그 창을 작성할 수 있다. 물론 이 모든 것을 동원해도 제대로 된 화풍과 인체가 항상 나온다는 보장은 없으며, 오히려 서로 충돌해서 이미지가 깨지거나 너무 많은 요소들을 제외해 디테일이 떨어지거나 밋밋해지는 경우도 있고 그림체나 채색 방식 자체에 영향을 줄 수도 있으므로 역시나 과용은 주의할 것.
5. 예시 및 참고
- 사용 방법
- 태그 관련 사이트
- 프롬프트 추출기
- 무료 이미지 생성 사이트
[1]
여성 캐릭터의 경우다. 남자 캐릭터를 생성한다면 1boy로 바꾸면 된다.
[2]
프롬프트를 "A girl walking on the beach under the night sky."라고 입력했다고 치면, 인공지능이 저 문장을 그대로 반영하는 것이 아니라 문장 속에서 1girl, walking, beach, night, sky 태그를 추려내여 이미지에 반영하는 것이다. 가끔 작품명 등에 포함된 단어가 프롬프트로 적용되어 원치 않게 반영되는 경우가 나타나는 원인이 바로 이것이다.
[3]
한편 Stable Diffusion Web UI 버전을 병용할 경우 확장 기능 중에 단부루 태그를 제한 없이 모두 자동완성해주는 기능이 있으니 이를 참고하는 것도 좋다.
[4]
실제로 V3 공식 가이드에서도 best quality를 비롯한 퀄리티 향상 태그는 가장 뒤에 쓸 것을 명시하고 있으며, 퀄리티 향상 태그를 입력할 필요없이 항상 적용시키는 설정을 제공해주고 있다.
[5]
특이하게도 city, cityscape 등 도시 관련 태그들은 이미지의 작화를 다소 단순화시키는 부작용이 확인되고 있다. 도시 풍경만 생성하려는 것이 아니라면 대괄호로 가중치를 줄여줘야 한다.
[6]
아무래도 서브컬처 장르 특성상 바다를 배경으로 한 이미지가 많다보니 영향력이 강하다. 특히 바다를 배경으로 한 작품이라면 더욱 강하다. 바다 태그를 프롬프트에 넣지 않았는데 배경이 바다가 되거나, 배경색이 원치 않는 푸른색 계열이 된다던지, 심할 경우 캐릭터의 피부색이 바다의 반사광을 고려해 그려진 이미지들 때문에 인외물이 아님에도 파란색이 되어버리는 경우도 있다. 이 경우에는 네거티브(Undesired Content)에 ocean과 blue background를 입력하면 대부분 해결된다.
[7]
디자인이 복잡한 캐릭터들의 경우, AI 특성상 데이터가 충분해도 캐릭터의 독특한 머리 스타일이나 복장의 세세한 장식, 무늬, 주름 등을 제대로 구현하지 못하고 뭉개버리거나 이상하게 재해석(?)을 해버리는 경우가 자주 나온다. 이는 보는 각도에 따라 변화하는 장식의 위치나 무늬, 주름을 인공지능이 제대로 이해하지 못하거나, 같은 디자인이라도 그리는 사람마다 미묘하게 달라질 수밖에 없어 일관성이 떨어져버리기 때문이다. 또한 도트, 픽셀을 비롯한 레트로 그래픽 장르나 의인화/모에화 팬아트가 주류가 되는 작품처럼 캐릭터의 디자인이 명확하지 않아 그리는 사람마다 해석이 갈려서 디자인이 오락가락하는 경우는 일관성이 아예 사라져서 생성시마다 디자인이 변하기도 한다.
[8]
단독샷이라도 많을 경우, 100장 내외라도 가장 많이 그려지는 얼굴과 헤어스타일까지는 어찌저찌 재현될 가능성이 있다. 다만 공식 복장은 정말 단순한 디자인이 아니라면 기대하면 안 된다.
[9]
2023년 11월 업데이트된 V3 기준, 정확한 컷아웃 시기는 11월보다 더 앞으로 추정되며 대략 2023년 여름까지가 컷아웃 기간이라 생각하면 편하다.
[10]
여차하면 nude 태그를 써서 공식 복장을 벗겨 놓은 후 원하는 복장 태그를 입력하는 방법이 있지만, 이 방법도 성인물 데이터가 섞여나오는 리스크가 있다.
[11]
그러면 캐릭터에 상관없이 그냥 각종 보조 태그에 맞춰서 그럴 듯하게 만들어준 게 아닌가 싶겠지만, 캐릭터 태그를 넣다 뺐다 하면서 생성한 이미지들을 비교해보면 확실히 데이터를 참고하고 생성했다는 느낌은 난다. 그래도 해당 태그의 가중치를 높히면 인외 특성이 더 묻어나오기 때문에 어느 정도 낮추는 것은 필수. 예를 들어 남성 곰 캐릭터를 의인화한다고 치면, 가중치를 높힐 경우 아무리 수인이나 곰의 특성을 제외해도 곰 수인에 가깝게 만들고 가중치를 낮추면 곰처럼 우직한 체형을 가진 인간 남성을 만들어낸다.
[12]
현재 AI에 대한 명확한 법적 대응 방법이 없고, 유료 작품이나 후원용으로 그린 그림들조차 마구잡이로 무단유포되는 시대에 이미 인터넷에 퍼질 때로 퍼진 자신들의 그림들에 대한 무단학습을 막기란 쉽지 않아서 애써 무시하거나 참고 있는 것 뿐이다.
[13]
만약 해당 캐릭터가 이미 애니화가 된 캐릭터라면 애니화된 그림체를 기준으로 작화 스타일이 나온다. 작품 태그를 넣는다면 정확도가 더 올라간다.
[14]
그리스 신전에서 볼 법한 돌기둥이 나온다던지, 태그에 넣지도 않은 목재 건축물이 나온다던지, 거실을 넣었는데 호화로운 저택에 나올법한 인테리어가 등장한다던지, 창문에 고급스런 커튼이나 선반에 도자기 같은 것이 등장한다던지, 그림 가장자리에 목재 액자 프레임이 등장한다던지 등.
[15]
시중에 풀린 모델들은 제작자가 원하는 고퀄리티 이미지 위주로 넣어서 학습시킨 경우가 많지만(물론 모델이 저퀄리티 이미지라는 개념을 함께 이해해야 하므로 저퀄리티 이미지도 의도적으로 함께 학습시키긴 한다.), NovelAI는 단보루의 수많은 이미지들을 따로 엄선 과정 없이 퀄리티 태그만 입력해서 한꺼번에 학습시켰기에 이 과정이 필요하다.
[16]
nsfw, lowres, {bad}, error, fewer, extra, missing, worst quality, jpeg artifacts, bad quality, watermark, unfinished, displeasing, chromatic aberration, signature, extra digits, artistic error, username, scan, abstract
[17]
nsfw, lowres, jpeg artifacts, worst quality, watermark, blurry, very displeasing
[18]
nsfw, lowres, {bad}, error, fewer, extra, missing, worst quality, jpeg artifacts, bad quality, watermark, unfinished, displeasing, chromatic aberration, signature, extra digits, artistic error, username, scan, abstract, bad anatomy, bad hands, @@, mismatched pupils, heart-shaped pupils, glowing eyes
[19]
다만 표시되지만 않을 뿐 토큰 자리는 차지하므로 주의.
[20]
(구) 기본 및 강화를 기준으로, NAI V3의 퀄리티 태그 및 단보루 검색시 의미 있는 태그로 수정.
[주의]
중간에 작성된 @@ 태그는 @ 사이에 _ 작성을 필요로 하는 소용돌이 눈 이모티콘 태그다. _를 작성하지 않고 @@나 @ @로 작성하면 작동하지 않는다. 나무위키 문법상 표시되지 않아 별도 언급.
[22]
사실 여기에 붙어있는 기형 방지 태그들이 제대로 적용되는지는 알려지지 않았다. 신체 기형이 나올 때는 여전히 나온다.