Meta, 차세대 AI Emu 비디오 및 Emu Edit 공개

Meta, 차세대 AI Emu 비디오 및 Emu Edit 공개

Meta는 차세대 AI Emu 비디오 및 Emu Edit PlatoBlockchain Data Intelligence를 공개합니다. 수직 검색. 일체 포함.

생성 AI 영역은 2023년에 이 영역에서 상당한 진전을 이루면서 급속한 발전을 목격하고 있습니다. Meta(전 Facebook)는 올해 Meta Connect 행사에서 획기적인 이미지 생성 기반 모델인 Emu를 선보였습니다. 이것 technology Meta의 앱 제품군, 특히 Instagram의 AI 이미지 편집 도구에서 수많은 AI 경험을 뒷받침합니다. 이러한 도구를 사용하면 사용자는 시각적 스타일이나 배경을 변경하여 사진을 변형할 수 있습니다. 또한 Meta AI의 Imagine 기능을 사용하면 메시지나 그룹 채팅 내에서 사실적인 이미지를 쉽게 생성할 수 있습니다.

비디오 생성의 혁신: Emu Video

Emu Video는 텍스트-비디오 생성을 위해 Emu 모델을 활용하는 중추적인 개발로 등장합니다. 확산 모델을 기반으로 하는 이 혁신적인 접근 방식은 고품질 비디오를 제작하기 위한 간단하면서도 효율적인 방법을 제공합니다. 이 프로세스는 두 단계로 구성됩니다. 처음에는 텍스트 프롬프트에서 이미지를 생성하고 이어서 텍스트와 이미지를 모두 기반으로 한 비디오를 생성합니다. 이 인수분해된 방법론을 통해 비디오 생성 모델을 효율적으로 훈련할 수 있습니다. Emu Video의 우월성은 512fps에서 512×16 비디오를 생성하는 데 두 개의 확산 모델만 필요하기 때문에 분명합니다. 이는 여러 모델이 필요한 이전 방법과 완전히 대조적입니다. 인간의 평가에서는 품질과 텍스트 프롬프트 준수 측면에서 이전 기술을 능가하는 성능을 갖춘 Emu Video에 대한 강한 선호도가 나타났습니다.

이미지 편집의 혁명: Emu Edit

Meta의 Emu Edit는 정확한 픽셀 수준 변경에 초점을 맞춘 이미지 편집의 패러다임 전환을 나타냅니다. 이 도구를 사용하면 로컬 및 전역 수정, 배경 조정, 색상 및 기하학적 변형과 같은 복잡한 편집 작업이 가능합니다. Emu Edit는 편집 지침과 관련된 픽셀만 변경하고 이미지의 대상이 아닌 부분의 무결성을 유지한다는 점에서 두드러집니다. Emu Edit를 교육하기 위해 Meta는 각각 입력 이미지, 편집 작업 설명 및 대상 출력 이미지를 포함하는 천만 개의 합성 샘플로 구성된 광범위한 데이터 세트를 개발했습니다. 이 모델은 교육 충실도와 이미지 품질 측면에서 탁월한 성능을 발휘합니다.

Meta에서의 생성 AI의 미래

생성 AI의 이러한 발전은 창의적인 표현이 더욱 접근 가능하고 다양해지는 미래를 암시합니다. Emu Video와 Emu Edit는 사람들이 미디어를 만들고 공유하는 방식에 잠재적으로 혁명을 일으킬 수 있습니다. 전문 예술가부터 일반 사용자까지 모든 사람을 위한 도구를 제공하여 새로운 형태의 표현과 창의성을 가능하게 합니다. 전문 창작자를 대체할 수는 없지만 향상된 자기 표현과 창의적인 탐구를 위한 플랫폼을 제공합니다.

미디어 보고서에서는 Emu Video의 간소화된 프로세스와 Emu Edit의 정확한 픽셀 수준 편집 기능을 강조합니다. 이 기술의 단순성과 효율성은 비디오 및 이미지 편집에 혁명을 일으킬 수 있는 잠재력과 함께 강조됩니다. 그러나 Meta는 규제 기관의 엄격한 조사를 고려하여 이러한 AI 솔루션 배포에 신중하게 접근합니다. Meta는 자사의 AI 기능을 Facebook 및 Instagram의 마케팅이나 정치 캠페인에 사용할 수 없음을 분명히 했습니다. 그럼에도 불구하고 현재 플랫폼의 기본 광고 규정은 AI를 구체적으로 다루지 않습니다.

이미지 출처 : Shutterstock

타임 스탬프 :

더보기 Blockchain News