유니콘 뿔을 가진 고양이, AI 생성 예술 작품, 어린이 그림 및 사실적인 초상화, 이미지 제작 기술.

Scribble Diffusion AI로 그림과 설명에서 이미지를 만드는 방법

Renato Reis의 아바타
Scribble Diffusion은 무료로 손으로 그린 ​​그림에 대한 간략한 설명을 모아 이미지를 만드는 사이트입니다. 누가 이것을 수행합니까? 물론 인공 지능. 여기에서 사용 방법을 알아보세요.

사용자가 손으로 그린 ​​그림과 짧은 텍스트 설명을 통해 사실적인 이미지를 생성하는 AI를 기반으로 한 재미있고 특이한 새로운 웹 사이트가 최근 몇 주 동안 등장하여 대중의 주목을 받았습니다. 전 세계적으로 다목적 인공 지능의 물결을 감안할 때, 낙서 확산 난리를 피웠다. 이 사이트의 내용, 사용 방법 및 작동 방식을 아래에서 이해하십시오.

스크리블 확산

놀랍고 창의적인 낙서 확산 그것은 인덱싱 가능하고 인터넷에서 사용할 수 있는 이미지 및 개념의 에지 감지, 포즈의 유사성 및 깊이 맵을 갖춘 신경망 구조를 기반으로 합니다. 이 도구를 사용하면 빈 보드에 손으로 그린 ​​그림과 영숫자 필드에 쓴 내용을 읽고 이해한 다음 이 두 매개 변수를 기반으로 새 이미지를 만듭니다.

그 개발은 다음에서 영감을 받았습니다. 벤치 마크 (동일한 틈새 사이트의 무한대에서 영감을 얻은 화면 디자인) made by 베르셀 그리고 AI가 지원하는 뒤로 젖히다, 아래에서 설명합니다. 

사이트에서 생성된 이미지의 몇 가지 예를 참조하십시오.

낙서 확산 스크린샷 - 사용자 설명에 따라 생성된 이미지의 예 1. 흥미롭지 않나요? (이미지: 복제/낙서 확산)
사용자가 작성한 설명에 따라 생성된 이미지의 예 1. 흥미롭지 않나요? (이미지: 복제/스크리블 확산)
낙서 확산 스크린샷 - 사용자 설명에 따라 생성된 이미지의 예 2. 흥미롭지 않나요? (이미지: 복제/낙서 확산)
사용자가 작성한 설명에 따라 생성된 이미지의 예 2. 흥미롭지 않나요? (이미지: 복제/스크리블 확산)

누가 그랬어? 어떻게 작동합니까?

개발자가 설계한 엔진에서 사이트 뒤에서 실행되는 "기계"가 어떻게 밀접하게 작동하는지 확인할 수 있습니다. 이것은 그가 염려하는 한, 뒤로 젖히다, 작동하는 AI 소스 코드를 보관하여 사용을 단순화하는 사이트입니다. 이러한 코드는 다양한 방식으로 사용되며 플랫폼 내 개발자를 위한 아이디어와 영감을 불러일으킵니다. 종종 그들의 페이지는 이러한 전문가들의 일종의 포트폴리오 역할을 할 뿐만 아니라 GitHub의 오늘은.

낙서 확산의 스크린샷 - 세부 작업 코드 페이지가 복제됨(이미지: 복제/복제)
자세한 작업 코드 페이지는 Replicate에 있습니다(이미지: Reproduction/Replicate).

O 사이트 낙서 확산 Stanford University의 Computer Science(Ph.D.) 학생이 제작했으며, 장엘민, 그리고 마니시 아그라왈라 교수. 오픈 소스 리포지토리가 인공 지능에 의한 이미지 생성을 기반으로 하는 다른 많은 연구 및 사이트에서 사용되는 데 3주밖에 걸리지 않았습니다. 영형 드림부스아직 생성되는 과정에 있는 가 이에 대한 예입니다. 텍스트 설명과 사용자 정의 인간 포즈를 기반으로 사실적인 사진을 만듭니다.

프로그래밍 애호가라면 이 텍스트 소스의 마지막 링크에 있는 데모 비디오를 확인하십시오. 여기에서 사이트 작동 방식에 대한 완전하고 자세한 설명은 복제 채널에서 수행됩니다.

웹사이트 이용 방법

Scribble Diffusion 사이트를 사용하는 것은 매우 간단합니다. 아래 단계를 따르십시오.

  1. 웹사이트에 액세스 https://scribblediffusion.com/ 귀하의 브라우저에서;
  2. 캔버스 위의 화이트보드에 이미 그린 그림이 있을 것입니다. 동일한 디자인을 사용하여 버튼에서 증가시키거나 완전히 삭제할 수 있습니다. 초기화, 이 프레임 바로 아래에서 "여기에 뭔가를 그려" 표시하는;
ia가 생성한 이미지이며 설명은 "산 뒤로 지는 석양"입니다.
  1. 이제 화이트보드에 자유롭게 그림을 그릴 수 있습니다. 터치 패드, 마우스 또는 그래픽 태블릿(컴퓨터에서 커서를 이동하는 데 사용하는 장치). 스마트폰으로 웹사이트에 접속하면 화면을 터치하는 것만으로도 그림을 그릴 수 있습니다. 만족스러운 결과에 도달하려면 인공 지능이 최소한으로 인식할 수 있는 잘 정의된 획과 디자인을 만들어야 하지만 원하는 경우 기능의 이러한 측면을 테스트할 수 있습니다.
  2. 그리기가 완료되면 간략하게 설명하거나 화이트보드 아래의 영숫자 텍스트 필드에 자세히 쓸 차례입니다. 그림에 가장 적합하다고 생각하는 설명이나 최종 결과에서 얻고 싶은 것을 제공하십시오.
  3. 디자인과 설명이 준비되면 결과를 볼 시간입니다. 버튼을 클릭하십시오. Go 로드될 때까지 기다립니다. 그림이 "결과"에 표시되고 생성된 사실적인 이미지가 바로 오른쪽에 나타납니다. 
  4. 준비가 된! 이제 이미지를 마우스 오른쪽 버튼으로 클릭하고 저장하기만 하면 만든 이미지와 그림을 다운로드할 수 있습니다. 생성된 이미지 링크를 바로 아래에 있는 버튼에 저장 및/또는 공유할 수 있습니다.복사 링크". 동일한 사이트에서 원하는 만큼 많은 이미지를 만들 수 있습니다.
낙서 확산 웹사이트 스크린샷 - 이전 단계에 따라 낙서 확산으로 만든 드로잉의 예 (이미지: 복제/낙서 확산)
이전 단계에 따라 Scribble Diffusion으로 만든 그림의 예(이미지: Reproduction/Scribble Diffusion)

이 콘텐츠가 마음에 드셨나요? 여기에서 이야기하는 다른 AI 기반 사이트 및 기능에 대해 자세히 알아보십시오.

인공 지능으로 프레젠테이션을 만드는 8가지 도구

YouTube 사용자는 인공 지능을 사용하여 애니메이션을 만듭니다.

인공 지능으로 셀카를 찍는 방법 


출처 : India Mag의 분석, ControlNet(기사), 웹사이트 Github, 리플리케이트의 GitHub, 낙서 확산 데모

텍스트 교정자: 페드로 봄핌 (20 / 03 / 23)


쇼메텍에 대해 자세히 알아보세요.

최신 뉴스를 이메일로 받아보시려면 등록하세요.

관련 게시물
MSI MPG OLED 322URDX36 트리플 모드 QD-OLED 모니터의 전면 및 후면 모습. RGB 디자인과 컬러 패널이 게임 환경에 적합합니다.

MSI는 세계 최초의 트리플 모드 모니터인 32인치 QD-OLED 디스플레이를 공개했습니다. 이 제품은 4K 360Hz, 1440p 520Hz, 1080p 680Hz 해상도를 지원합니다.

컴퓨텍스 2026에 앞서 발표된 MPG OLED 322URDX36은 세계 최초의 트리플 모드 모니터이자 DisplayHDR True Black 600 인증을 획득한 최초의 OLED 모니터입니다. 구매 전 어떤 점이 다르고 어떤 점에 주목해야 하는지 알아보세요.
디에고 아모림의 아바타
더 읽어보기