AI와 몇 가지 단어를 사용한 비디오 만들기: Meta의 새로운 도구를 확인하세요

플라톤에 의해 재발행

팔로워 : 0

작성자: Rachel Metz, CNN 비즈니스

인공 지능은 DALL-E 2 및 Stable Diffusion과 같은 공개적으로 사용 가능한 AI 이미지 생성기를 통해 소수의 단어에 응답하여 이미지를 생성하는 능력이 점점 더 좋아지고 있습니다. 이제 메타 연구자들은 AI를 한 단계 더 발전시키고 있습니다. 그들은 AI를 사용하여 텍스트 프롬프트에서 비디오를 제작하고 있습니다.

메타 CEO 마크 저커버그 연구에 관해 목요일에 Facebook에 게시됨라는 비디오를 만들다, 메타 연구자들이 사용한 여러 텍스트 프롬프트와 그 결과(매우 짧은) 비디오를 편집한 20초 길이의 클립이 포함되어 있습니다. 프롬프트에는 "자화상을 그리는 곰 인형", "화성에 착륙하는 우주선", "노트북을 찾으려고 노력하는 니트 모자를 쓴 아기 나무늘보", "바다에서 파도를 타는 로봇"이 포함됩니다.

각 프롬프트에 대한 비디오의 길이는 단 몇 초에 불과하며 일반적으로 프롬프트에서 제안하는 내용을 상당히 낮은 해상도와 다소 불안정한 방식으로 보여줍니다(실제 생물과 별로 비슷해 보이지 않는 아기 나무늘보 제외). 스타일. 그럼에도 불구하고 시스템이 단어에서 이미지를 생성하는 데 점점 더 능숙해짐에 따라 AI 연구가 취하는 새로운 방향을 보여줍니다. 하지만 이 기술이 결국 널리 공개된다면, 비디오를 통해 잘못된 정보를 퍼뜨리는 데 사용될 수 있다는 등 텍스트-이미지 시스템에서 촉발된 것과 동일한 우려가 제기될 것입니다.

웹 페이지 Make-A-Video에는 이러한 짧은 클립과 기타 클립이 포함되며, 그 중 일부는 프롬프트에 응답하여 생성된 비디오와 같이 매우 사실적으로 보입니다. “산호초 사이를 헤엄치는 흰동가리” 또는 보여주려는 의도 “폭우 속을 걷고 있는 젊은 부부. "

Zuckerberg는 Facebook 게시물에서 몇 개의 단어로 움직이는 이미지를 생성하는 것이 얼마나 까다로운지 지적했습니다.

"각 픽셀을 올바르게 생성하는 것 외에도 시스템은 시간이 지남에 따라 픽셀이 어떻게 변할지 예측해야 하기 때문에 사진보다 비디오를 생성하는 것이 훨씬 더 어렵습니다."라고 그는 썼습니다.

연구 논문 작업 설명에서는 이 프로젝트가 텍스트-이미지 AI 모델을 사용하여 단어가 그림과 어떻게 일치하는지 파악하는 방법과 AI 기술인 AI 기술을 사용한다고 설명합니다. 비지도 학습 — 알고리즘이 레이블이 지정되지 않은 데이터를 조사하여 그 안의 패턴을 식별하는 경우 — 비디오를 보고 실제 동작이 어떻게 보이는지 결정합니다.

텍스트에서 이미지를 생성하는 거대하고 인기 있는 AI 시스템과 마찬가지로 연구원들은 텍스트-이미지 AI 모델이 인터넷 데이터를 통해 훈련되었다고 지적했습니다. 즉, "해로운 것을 포함하여 사회적 편견을 과장했을 가능성이 높다"는 의미입니다. 썼다. 그들은 "NSFW 콘텐츠 및 유해한 단어"에 대해 데이터를 필터링했지만 데이터 세트에는 수백만 개의 이미지와 텍스트가 포함될 수 있으므로 이러한 콘텐츠를 모두 제거하는 것은 불가능할 수 있다고 언급했습니다.

Zuckerberg는 Meta가 향후 Make-A-Video 프로젝트를 데모로 공유할 계획이라고 썼습니다.

타임 스탬프 : 2022 년 9 월 30 일2022 년 9 월 30 일

타임 스탬프 : 21년 2022월 XNUMX일

플라톤에 의해 재발행

연준은 주택 시장을 붕괴시킬 수 있습니다

캐리 에어 캡처 스타트업 Sustaera, 가스 처리 임원을 새 CEO로 선임

Epic은 몰입형 도구로 건축, 엔지니어링, 건설 시장에 생명을 불어넣습니다.

수익 보고서: Bioventus, Humacyte, Guerrilla RF, Novan, Liquidia 등

Rocky Mount에서 확장 중인 건축 자재 회사 Woodgrain, 더 많은 직원 고용 예정

FTC, Amazon의 One Medical 인수 계획에 대해 '두 번째' 검토

Apple은 '극단적' 수준의 보안을 제공합니다. 이를 활성화하는 방법은 다음과 같습니다.

더 많은 해고: Wayfair는 전 세계 인력의 5%를 해고합니다.

A부터 Z까지, NC TECH는 연례 시상식의 최종 후보를 지명합니다.

NC 도달 범위를 확대하여 XNUMX개 주로 확장하는 Google Fiber

Apple의 최신 기술 사용: MacRumors의 내부자 조언 시청 또는 듣기

부자가 더 부자가 된다: 미국은 2.5만 명의 백만장자를 추가한다. 현재 전 세계적으로 62.5만 명 이상

회사 소개

수직 검색 및 인공 지능

플랫폼

연결 유지

계정

더보기 WRAL 테크와이어

회사 소개

수직 검색 및 인공 지능

플랫폼

연결 유지

계정