Meta afslører næste generations AI Emu Video og Emu Edit

Meta afslører næste generations AI Emu Video og Emu Edit

Meta Unveils Next-Gen AI Emu Video and Emu Edit PlatoBlockchain Data Intelligence. Vertical Search. Ai.

Området for generativ AI er vidne til hurtige fremskridt, og 2023 markerer et betydeligt fremskridt på domænet. Meta, tidligere Facebook, har introduceret Emu, en banebrydende grundlæggende model til billedgenerering, ved dette års Meta Connect-begivenhed. Det her teknologi understøtter adskillige AI-oplevelser på tværs af Metas app-familie, især i Instagrams AI-billedredigeringsværktøjer. Disse værktøjer gør det muligt for brugere at transformere billeder ved at ændre deres visuelle stil eller baggrund. Desuden letter Imagine-funktionen i Meta AI genereringen af ​​fotorealistiske billeder i beskeder eller gruppechat.

Gennembrud i videogenerering: Emu Video

Emu Video fremstår som en central udvikling ved at bruge Emu-modellen til tekst-til-video-generering. Denne innovative tilgang, baseret på diffusionsmodeller, tilbyder en enkel, men effektiv metode til at skabe videoer i høj kvalitet. Processen involverer to faser: indledningsvis generering af billeder fra tekstprompter og efterfølgende oprettelse af videoer betinget af både tekst og billeder. Denne faktoriserede metode giver mulighed for effektiv træning af videogenereringsmodeller. Emu Videos overlegenhed er tydelig, da det kun kræver to diffusionsmodeller for at producere 512×512 videoer ved 16 fps, en skarp kontrast til tidligere metoder, der kræver flere modeller. Menneskelige evalueringer har vist en stærk præference for Emu Video, hvor dens ydeevne overstråler tidligere teknologier i både kvalitet og overholdelse af tekstprompter.

Revolutionerende billedredigering: Emu Edit

Metas Emu Edit repræsenterer et paradigmeskifte i billedredigering med fokus på præcise pixel-niveauændringer. Dette værktøj muliggør indviklede redigeringsopgaver såsom lokale og globale ændringer, baggrundsjusteringer og farve- og geometriske transformationer. Emu Edit skiller sig ud ved at sikre, at kun pixels, der er relevante for redigeringsinstruktionerne, ændres, hvilket bibeholder integriteten af ​​de ikke-målrettede dele af billedet. For at træne Emu Edit har Meta udviklet et omfattende datasæt bestående af 10 millioner syntetiserede prøver, som hver inkluderer et inputbillede, en redigeringsopgavebeskrivelse og det målrettede outputbillede. Modellen udviser enestående ydeevne med hensyn til instruktionstrofasthed og billedkvalitet.

Fremtiden for generativ AI hos Meta

Disse fremskridt inden for generativ kunstig intelligens antyder en fremtid, hvor kreativt udtryk er mere tilgængeligt og mangfoldigt. Emu Video og Emu Edit kan potentielt revolutionere, hvordan folk skaber og deler medier. De tilbyder værktøjer til alle fra professionelle kunstnere til afslappede brugere, hvilket muliggør nye udtryksformer og kreativitet. Selvom de ikke er erstatninger for professionelle skabere, giver de en platform for forbedret selvudfoldelse og kreativ udforskning.

Medierapporter understreger den strømlinede proces med Emu Video og den præcise redigeringsevne på pixelniveau i Emu Edit. Teknologiens enkelhed og effektivitet fremhæves sammen med dens potentiale til at revolutionere video- og billedredigering. Meta nærmer sig imidlertid implementeringen af ​​disse AI-løsninger forsigtigt i betragtning af den strenge kontrol fra regulatorer. Meta har præciseret, at dets AI-kapaciteter ikke vil være tilgængelige til markedsføring eller politiske kampagner på Facebook og Instagram. Ikke desto mindre omhandler platformens grundlæggende reklameregler i øjeblikket ikke specifikt AI.

Billedkilde: Shutterstock

Tidsstempel:

Mere fra Blockchain News