AI와 몇 마디로 비디오 만들기: Meta의 새로운 도구인 PlatoBlockchain Data Intelligence를 확인해 보세요. 수직 검색. 일체 포함.

AI와 몇 가지 단어를 사용한 동영상 만들기: Meta의 새로운 도구를 확인하세요

인공 지능은 DALL-E 2 및 Stable Diffusion과 같은 공개적으로 사용 가능한 AI 이미지 생성기를 통해 소수의 단어에 응답하여 이미지를 생성하는 능력이 점점 더 좋아지고 있습니다. 이제 메타 연구자들은 AI를 한 단계 더 발전시키고 있습니다. 그들은 AI를 사용하여 텍스트 프롬프트에서 비디오를 제작하고 있습니다.

메타 CEO 마크 저커버그 연구에 관해 목요일에 Facebook에 게시됨라는 비디오를 만들다, 메타 연구자들이 사용한 여러 텍스트 프롬프트와 그 결과(매우 짧은) 비디오를 편집한 20초 길이의 클립이 포함되어 있습니다. 프롬프트에는 "자화상을 그리는 곰 인형", "화성에 착륙하는 우주선", "노트북을 찾으려고 노력하는 니트 모자를 쓴 아기 나무늘보", "바다에서 파도를 타는 로봇"이 포함됩니다.

각 프롬프트에 대한 비디오의 길이는 단 몇 초에 불과하며 일반적으로 프롬프트에서 제안하는 내용을 상당히 낮은 해상도와 다소 불안정한 방식으로 보여줍니다(실제 생물과 별로 비슷해 보이지 않는 아기 나무늘보 제외). 스타일. 그럼에도 불구하고 시스템이 단어에서 이미지를 생성하는 데 점점 더 능숙해짐에 따라 AI 연구가 취하는 새로운 방향을 보여줍니다. 하지만 이 기술이 결국 널리 공개된다면, 비디오를 통해 잘못된 정보를 퍼뜨리는 데 사용될 수 있다는 등 텍스트-이미지 시스템에서 촉발된 것과 동일한 우려가 제기될 것입니다.

웹 페이지 Make-A-Video에는 이러한 짧은 클립과 기타 클립이 포함되며, 그 중 일부는 프롬프트에 응답하여 생성된 비디오와 같이 매우 사실적으로 보입니다. “산호초 사이를 헤엄치는 흰동가리” 또는 보여주려는 의도 “폭우 속을 걷고 있는 젊은 부부. "

Zuckerberg는 Facebook 게시물에서 몇 개의 단어로 움직이는 이미지를 생성하는 것이 얼마나 까다로운지 지적했습니다.

"각 픽셀을 올바르게 생성하는 것 외에도 시스템은 시간이 지남에 따라 픽셀이 어떻게 변할지 예측해야 하기 때문에 사진보다 비디오를 생성하는 것이 훨씬 더 어렵습니다."라고 그는 썼습니다.

연구 논문 작업 설명에서는 이 프로젝트가 텍스트-이미지 AI 모델을 사용하여 단어가 그림과 어떻게 일치하는지 파악하는 방법과 AI 기술인 AI 기술을 사용한다고 설명합니다. 비지도 학습 — 알고리즘이 레이블이 지정되지 않은 데이터를 조사하여 그 안의 패턴을 식별하는 경우 — 비디오를 보고 실제 동작이 어떻게 보이는지 결정합니다.

텍스트에서 이미지를 생성하는 거대하고 인기 있는 AI 시스템과 마찬가지로 연구원들은 텍스트-이미지 AI 모델이 인터넷 데이터를 통해 훈련되었다고 지적했습니다. 즉, "해로운 것을 포함하여 사회적 편견을 과장했을 가능성이 높다"는 의미입니다. 썼다. 그들은 "NSFW 콘텐츠 및 유해한 단어"에 대해 데이터를 필터링했지만 데이터 세트에는 수백만 개의 이미지와 텍스트가 포함될 수 있으므로 이러한 콘텐츠를 모두 제거하는 것은 불가능할 수 있다고 언급했습니다.

Zuckerberg는 Meta가 향후 Make-A-Video 프로젝트를 데모로 공유할 계획이라고 썼습니다.

The-CNN-Wire™ & © 2022 Cable News Network, Inc., Warner Bros. Discovery Company. 판권 소유.

타임 스탬프 :

더보기 WRAL 테크와이어