창의성과 첨단기술이 만나는 세상, OpenAI, 다시 한 번 최신 혁신으로 놀라움을 선사합니다. 소라. 인공 지능의 새로운 발전은 텍스트 프롬프트를 놀라운 시각적 경험으로 변환할 수 있는 도구를 제공하여 비디오 제작 방식에 혁명을 일으킬 것을 약속합니다.
종이 위의 산호초 세계부터 눈 덮인 대초원의 털복숭이 매머드까지 상세한 장면을 렌더링하는 인상적인 능력을 갖춘 소라 감동과 영감을 줄 준비가 되어 있습니다.
SORA는 어떻게 작동하나요?
우리는 이미 텍스트를 기반으로 매우 놀라운 이미지를 생성하는 인공 지능 모델을 알고 있었습니다. DALL-E, 예를 들어. 그러나 이제 우리는 소라.
텍스트를 비디오로 변환하는 다른 유형의 AI 프로젝트도 이미 있지만, 소라 사실적인 이미지를 생성하고 최대 1분까지 긴 클립을 생성하는 인상적인 능력이 돋보입니다. 짧은 비디오 조각만 생성하는 경쟁 모델과 달리 새로운 AI는 더 복잡하고 매력적인 내러티브를 생성할 수 있는 잠재력을 가지고 있습니다.
개발사에서는 다음을 보증합니다. 소라 시각적 품질을 잃지 않고 사용자 명령에 정의된 매개변수를 충실하게 유지하면서 최대 1분 길이의 비디오를 만들 수 있습니다. 이것이 모든 차이를 만드는 큰 세부 사항입니다.
그러나 다음을 기억하는 것이 중요합니다. OpenAI 가능한 취약점을 평가하기 위해 일부 선별된 제작자 및 보안 전문가에게 이 도구를 계속 배포하고 있습니다. 가까운 시일 내에 더 많은 사람들이 이 제품을 사용할 수 있도록 하는 것이 목표입니다.
예시
소개글에 따르면 OpenAI, 비디오를 위한 새로운 AI는 “여러 캐릭터, 특정 움직임, 환경과 캐릭터의 정확한 세부 사항이 포함된 복잡한 장면“. 게다가 그녀는 사물이 어떻게 “현실 세계에서 상호 작용" 그리고 또한 "소품을 정확하게 해석하여 생생한 감정을 표현하는 매력적인 캐릭터 생성“. 매우 관련성이 높은 또 다른 세부 사항은 기존 비디오에서 누락된 프레임을 채우거나 확장할 수 있는 가능성 외에도 정적 이미지를 기반으로 비디오를 생성하는 것입니다.
일부 비디오에서는 여전히 AI가 생성하는 일반적인 단서를 밝힐 수 있지만 OpenAI 주장한다 소라 "복잡한 장면의 물리학을 정확하게 시뮬레이션하는 데 어려움을 겪을 수 있습니다.“. 그러나 전반적인 결과는 매우 인상적입니다. 아래 영상처럼 매우 상세한 설명으로 소라가 기대치를 뛰어넘는 경우가 있을 수 있습니다.
게시 된 예에 따르면 오픈아이, 이것은 "라는 프롬프트의 결과였습니다.애니메이션 장면에는 녹는 빨간 양초 옆에 무릎을 꿇고 있는 짧고 털복숭이 괴물이 클로즈업되어 있습니다. 아트 스타일은 조명과 질감에 초점을 맞춘 3D이며 사실적입니다. 괴물이 눈을 크게 뜨고 입을 벌린 채 불꽃을 바라보는 모습이 그림의 분위기를 경이로움과 호기심으로 가득 채운다. 그녀의 포즈와 표정은 마치 처음으로 주변 세계를 탐험하는 것처럼 순수함과 장난기를 전달합니다. 따뜻한 색상과 드라마틱한 조명의 사용은 이미지의 아늑한 분위기를 더욱 돋보이게 합니다."
뒤에 연구원들은 소라 그들은 비디오를 렌더링하는 데 시간이 얼마나 걸리는지 밝히지 않았지만 프로세스가 간식 휴식 시간과 비슷할 정도로 상대적으로 빠르다고 제안합니다. 표시된 예가 도구의 잠재력을 나타낸다면 시청각 콘텐츠가 생산되고 소비되는 방식에 혁명을 기대할 수 있습니다.
산호초를 생각하면 다음과 같은 간단한 프롬프트에서 이와 같은 결과가 나올 수 있습니다.다채로운 물고기와 바다 생물로 가득한 종이 위에 아름답게 표현된 산호초 세계":
빌 피블스연구팀의 일원인 는 다음과 같이 덧붙였습니다. 소라 카메라 각도와 타이밍을 통해 일관된 내러티브를 만들어냈습니다. 그는 여러 장면 변경이 있으며 모두 단일 반복으로 모델에 의해 생성된다고 말합니다. 즉, 아무도 모델에 이 작업을 지시하지 않고 자동으로 수행합니다.
또 다른 좋은 예는 “몇 마리의 거대한 털북숭이 매머드가 눈 덮인 초원을 쿵쿵거리며 다가옵니다. 그들이 걸을 때 그들의 긴 털털 코트가 바람에 부드럽게 흔들리고, 배경에는 눈 덮인 나무들과 극적인 눈 덮인 산들이 있고, 옅은 구름이 있는 오후의 빛과 멀리서 높은 태양이 따뜻한 빛을 만들어내고, 낮은 카메라 뷰는 놀랍도록 인상적입니다. 아름다운 사진과 피사계 심도를 갖춘 커다란 털복숭이 포유류”를 사용하면 다음과 같은 결과를 얻을 수 있습니다.
영상을 생성하는 AI의 영향
새로운 AI가 제공하는 비주얼은 OpenAI 확실히 인상적이지만, 그들의 진정한 놀라움은 예상치 못한 능력에 있습니다. 이미저에서 사용되는 확산 모델 버전에 의해 구동됨 달레-3, 변압기 기반 모터와 함께 GPT-4은 소라 이는 단순히 프롬프트의 요구 사항을 충족하는 것 이상으로, 영화 문법에 대한 새로운 이해를 드러냅니다.
고려해야 할 점은 폭력, 음란물, 유명 아티스트의 정체성이나 스타일의 무단 도용으로 콘텐츠 제한이 적용된다는 점입니다. 게다가 OpenAI 시청자가 생성된 콘텐츠를 명확하게 식별할 수 있는 수단을 제공하기 위해 최선을 다하고 있습니다. 소라 인공지능이 만든 것처럼. 최근에는 가수 테일러 스위프트 이러한 유형의 부정적인 시나리오와 연결된 그의 이미지와 일부 갈등에 직면했습니다. 딥 페이크 나 인터넷.
그러나 사실은 비디오용 AI가 큰 뉴스이긴 하지만 아직 완벽하지는 않습니다. 긍정적인 영향에도 불구하고 이 기술은 여전히 어려움에 직면해 있습니다. 이에 대한 예로는 제작된 콘텐츠에 대한 저작권 침해 외에도 보안 및 진실성 문제가 있습니다.
잘못된 정보에 대한 해결책은 우리의 행동뿐만 아니라 사회에 대한 집단적 이해와 소셜 미디어의 적응도 필요합니다.
Aditya Ramesh, Dall-E 팀 리더
하지만 영상을 생성하는 인공지능은 계속해서 다양한 상황에 대한 가능한 부록으로 여겨지고 있다. 요점은 대체물로 보는 것이 아니라 전략적으로 사용하는 방법을 아는 것입니다. 예를 들어, 영화 제작에서는 기술을 활용하여 시나리오를 실용적인 방식으로 변형할 수 있습니다. 두번째 빌 피블스, “전문적인 영화를 제작하려면 값비싼 장비가 필요해요. 이 모델은 일상적인 소셜 미디어 사용자가 고품질 콘텐츠를 만들 수 있도록 지원합니다.”
쇼메테크 트리오
주간 뉴스 트리오인 Showmetech TRIO에서 이 뉴스와 기타 뉴스를 확인하세요.
너무보세요
Gemini는 Bard를 대신하여 Google의 최고 인공지능 보조자로 자리매김합니다. 사용 방법 보기
텍스트 교정자: 페드로 봄핌
쇼메텍에 대해 자세히 알아보세요.
최신 뉴스를 이메일로 받아보시려면 등록하세요.