CFG 스케일 안정 확산이란 무엇이고, 어떻게 사용하나요?

안정 확산(Stable Diffusion)에서 CFG 스케일을 이해하고, 이를 활용하여 이미지 품질을 향상시키는 방법을 블로그에서 알아보세요.

개요

CFG 척도는 Classifier Free Guidance 척도라고도 하며 텍스트 프롬프트에 대한 Stable Diffusion의 준수를 제어하는 ​​데 중요한 역할을 합니다. 텍스트를 이미지로 (txt2img) 및 이미지 대 이미지 (img2img) 세대.

이 블로그에서는 안정 확산(Stable Diffusion)에서 CFG 스케일을 포괄적으로 소개하고, 안정 확산과의 관계 및 그 기반 기술을 설명합니다. 또한, 안정 확산에서 CFG 스케일을 사용하는 방법과 흔히 저지르는 실수를 피하는 방법에 대한 자세한 가이드도 제공합니다. 자, 이제 CFG 스케일의 세계로 뛰어들어 볼까요!

안정 확산에서 CFG 규모 이해

안정적 확산에서 CFG는 "분류자 없는 안내" 척도를 나타내며, 출력 이미지의 품질을 결정하는 데 중요한 역할을 합니다.

CFG(분류기 무료 지침)의 진화

초기 확산 모델은 명시적 분류기를 사용하여 생성 과정을 안내했습니다. 즉, 노이즈가 있는 이미지에 대해 분류기를 학습시켜 고양이나 개와 같은 특정 클래스를 분류하고 생성을 안내하는 방식이었습니다. 그러나 이 방식에는 별도의 모델이 필요했습니다. 그래서 이미지 캡션을 사용하여 조건부 확산 모델을 학습하는 분류기 없는 안내(Classifier-Free Guidance)가 등장했습니다.

CFG 척도란 무엇입니까?

CFG 스케일, 즉 구성 스케일은 확산 과정의 강도를 제어하는 ​​매개변수입니다. 픽셀 값이 얼마나 퍼지거나 분산되는지, 즉 안정 확산이 프롬프트를 얼마나 잘 따르는지 결정합니다.

CFG 척도는 안정 확산에서 어떻게 작동합니까?

기본적으로 CFG 척도 값은 7로 설정되어 창의적인 자유와 신속한 안내 사이의 균형을 맞춥니다.

CFG 규모와 안정 확산 간의 관계

안정 확산은 이미지 처리 및 컴퓨터 그래픽 분야의 개념으로, 이미지 전체에 픽셀 값을 분산시키는 과정을 의미합니다. 이 기법은 블러링, 샤프닝, 엣지 감지 등 다양한 효과를 구현하는 데 자주 사용됩니다. 이 과정은 일련의 매개변수에 의해 결정되는데, 그중 하나가 CFG 스케일입니다.

CFG 스케일은 이미지 품질에 어떤 영향을 미칩니까?

CFG 스케일은 확산 과정에서 프롬프트 단어에 적용되는 계수를 결정합니다. CFG 스케일 값이 낮을수록 세부 묘사는 더 많이 보존되지만 원하는 확산 효과를 얻지 못할 수 있습니다. 반면, CFG 스케일 값이 높을수록 강한 확산 효과를 얻을 수 있지만 이미지 세부 묘사가 손실될 수 있습니다. 따라서 고품질 출력 이미지를 얻으려면 적절한 균형을 찾는 것이 중요합니다. 

안정된 확산에서 CFG 스케일을 조정하는 것은 원하는 결과에 따라 달라집니다. 미묘한 확산 효과를 만드는 것이 목표라면 낮은 CFG 스케일 값이 적절할 것입니다. 반대로, 강한 확산 효과를 만드는 것이 목표라면 높은 CFG 스케일 값이 필요할 것입니다. 

Stable Diffusion 웹 UI를 사용하는 동안 CFG는 1에서 30까지의 양수로 제한됩니다. 그러나 터미널을 통해 Stable Diffusion을 사용하는 경우 CFG를 최대 999까지 설정할 수 있으며 음수 값을 사용할 수도 있습니다. 이는 Stable Diffusion이 텍스트 프롬프트의 반대쪽에 콘텐츠를 생성하도록 하려는 의도를 나타냅니다. 

안정 확산에서 CFG 척도를 사용하는 방법은 무엇입니까?

안정 확산(Stable Diffusion)에서 CFG 스케일을 사용하는 방법을 배우려면 프로젝트에 안정 확산(Stable Diffusion) 모델이 있어야 합니다. 이 섹션에서는 안정 확산(Stable Diffusion)을 프로그램에 통합하는 단계부터 CFG 스케일을 사용하는 방법을 단계별로 설명합니다.

단계별 가이드

API를 다운로드하는 대신 통합하여 Stable Diffusion을 얻는 이점은 필요에 따라 모델을 훈련하고 조정할 수 있다는 것입니다.

  • 3단계: API 키를 받아서 프로젝트에 통합합니다.
  • 4단계: Stable Diffusion 인터페이스로 전환합니다.
  • 5단계: 목록에서 원하는 안정 확산 모델을 선택하고 이미지 프롬프트를 입력합니다. Novita AI 다음을 포함한 다양한 모델을 제공합니다. 안정적인 확산 XL 안정 확산 3.
  • 6단계: CFG 크기 값을 조정하고 이미지를 생성합니다.
  • 7단계: 다양한 CFG 스케일 값을 실험하여 가장 인상적인 결과를 가져오는 구체적인 값을 찾아냅니다.

CFG 스케일 사용에 대한 하드웨어 고려 사항

안정적 확산의 성능과 결과는 사용된 하드웨어의 영향을 받을 수 있습니다.

  • 그래픽 처리 장치(GPU): 강력한 GPU 안정적인 확산을 효율적으로 실행하는 데 필수적입니다. 이 모델은 다음을 활용합니다. GPU 이미지 생성에 필요한 계산 집약적 작업을 위해. 
  • RAM(Random Access Memory): 충분한 시스템 RAM은 전반적인 시스템 응답성과 대용량 데이터 처리 능력에 중요합니다. 최소 16GB RAM을 권장하며, 더 높은 사양의 작업에는 32GB를 권장합니다.
  • 운영 체제: Stable Diffusion은 Windows, macOS, Linux 등 다양한 운영 체제와 호환됩니다. 단, 특정 버전 및 업데이트는 호환성 및 성능에 영향을 미칠 수 있습니다.

안정적 확산을 위한 CFG 스케일의 사용 사례

안정적 확산의 CFG 스케일을 사용하면 사용자가 필요에 따라 이미지 생성 프로세스를 미세하게 조정할 수 있습니다.

이미지 품질 최적화

사용자는 CFG 스케일을 조정하여 이미지 품질을 최적화할 수 있습니다. 사실감과 입력 프롬프트 충실도 사이의 적절한 균형을 제공하기 때문에 7을 권장하는 경우가 많습니다. 

부정적인 프롬프트

CFG 척도는 부정적 프롬프트와 함께 사용할 수 있으며, 주요 텍스트 프롬프트를 유지하면서도 특정 요소를 배제하는 이미지를 만드는 데 도움이 될 수 있습니다.

사례 연구

사례 연구에서 CFG 스케일 값을 조정하면 다양한 수준의 안내가 생성된 이미지에 어떤 영향을 미치는지 관찰할 수 있으며, 고화질 출력 이미지를 얻는 데 있어 CFG 스케일의 역할이 얼마나 중요한지 더 잘 이해할 수 있습니다.

또한, Novita AI 또한 " 놀이터를 제공합니다이미지 대 이미지”. 이에 대한 사례 연구를 수행할 수 있습니다.

맺음말

결론적으로, CFG 스케일은 확산 과정의 강도를 제어하는 ​​안정 확산의 핵심 매개변수입니다. 원하는 결과와 원본 이미지의 품질에 따라 CFG 스케일을 조정하는 방법을 이해하면 안정 확산 결과를 크게 향상시킬 수 있습니다. 이미지 처리 및 컴퓨터 그래픽의 많은 요소들과 마찬가지로, 최적의 CFG 스케일 값을 찾는 것은 종종 시행착오를 거치며 각 프로젝트의 특정 요구 사항에 따라 달라집니다.

Novita AI AI에 대한 야망을 실현하는 올인원 클라우드 플랫폼입니다. 완벽하게 통합된 API, 서버리스 컴퓨팅, 그리고 GPU 가속화를 통해 AI 기반 비즈니스를 신속하게 구축하고 확장하는 데 필요한 비용 효율적인 도구를 제공합니다. 인프라 관련 문제를 해결하고 무료로 시작하세요. Novita AI AI 꿈을 현실로 만들어 드립니다.

추천 독서

  1. Stable Diffusion 3 API가 이제 사용 가능합니다. Novita AI
  2. V3에 대한 안정 확산 모델
  3. 안정적인 확산 API: 포괄적인 가이드

Novita에서 더 많은 것을 알아보세요

이메일로 최신 게시물을 받아보려면 구독하세요.

코멘트 남김

위쪽으로 스크롤

Novita에서 더 많은 것을 알아보세요

계속해서 읽고 전체 아카이브에 액세스하려면 지금 구독하세요.

계속 읽기