Meta avslører neste generasjons AI Emu Video og Emu Edit

Meta avslører neste generasjons AI Emu Video og Emu Edit

Meta Unveils Next-Gen AI Emu Video and Emu Edit PlatoBlockchain Data Intelligence. Vertical Search. Ai.

Generativ kunstig intelligens er vitne til raske fremskritt, og 2023 markerer et betydelig fremskritt i domenet. Meta, tidligere Facebook, har introdusert Emu, en banebrytende grunnmodell for bildegenerering, på årets Meta Connect-arrangement. Dette teknologi underbygger en rekke AI-opplevelser på tvers av Metas appfamilie, spesielt i Instagrams AI-bilderedigeringsverktøy. Disse verktøyene gjør det mulig for brukere å transformere bilder ved å endre deres visuelle stil eller bakgrunn. Dessuten letter Imagine-funksjonen i Meta AI genereringen av fotorealistiske bilder i meldinger eller gruppechatter.

Gjennombrudd i videogenerering: Emu Video

Emu Video fremstår som en sentral utvikling, ved å bruke Emu-modellen for tekst-til-video generering. Denne innovative tilnærmingen, basert på diffusjonsmodeller, tilbyr en enkel, men effektiv metode for å lage videoer av høy kvalitet. Prosessen involverer to faser: til å begynne med generere bilder fra tekstmeldinger og deretter lage videoer betinget av både tekst og bilder. Denne faktoriserte metodikken gir mulighet for effektiv opplæring av videogenereringsmodeller. Emu Videos overlegenhet er tydelig, siden det bare krever to diffusjonsmodeller for å produsere 512×512 videoer med 16 fps, en sterk kontrast til tidligere metoder som krever flere modeller. Menneskelige evalueringer har vist en sterk preferanse for Emu Video, med ytelsen som overgår tidligere teknologier i både kvalitet og overholdelse av tekstmeldinger.

Revolusjonerende bilderedigering: Emu Edit

Metas Emu Edit representerer et paradigmeskifte i bilderedigering, med fokus på presise endringer på pikselnivå. Dette verktøyet muliggjør intrikate redigeringsoppgaver som lokale og globale modifikasjoner, bakgrunnsjusteringer og farge- og geometriske transformasjoner. Emu Edit skiller seg ut ved å sikre at bare piksler som er relevante for redigeringsinstruksjonene endres, og opprettholder integriteten til de ikke-målrettede delene av bildet. For å trene Emu Edit har Meta utviklet et omfattende datasett som består av 10 millioner syntetiserte prøver, som hver inkluderer et inngangsbilde, en redigeringsoppgavebeskrivelse og det målrettede utdatabildet. Modellen viser eksepsjonell ytelse når det gjelder instruksjonstrohet og bildekvalitet.

Fremtiden til generativ AI hos Meta

Disse fremskrittene innen generativ AI antyder en fremtid der kreativt uttrykk er mer tilgjengelig og mangfoldig. Emu Video og Emu Edit kan potensielt revolusjonere hvordan folk lager og deler medier. De tilbyr verktøy for alle fra profesjonelle kunstnere til uformelle brukere, og muliggjør nye uttrykksformer og kreativitet. Selv om de ikke er erstatninger for profesjonelle skapere, gir de en plattform for forbedret selvuttrykk og kreativ utforskning.

Medierapporter legger vekt på den strømlinjeformede prosessen til Emu Video og den nøyaktige redigeringsevnen på pikselnivå til Emu Edit. Teknologiens enkelhet og effektivitet fremheves, sammen med potensialet til å revolusjonere video- og bilderedigering. Meta nærmer seg imidlertid distribusjonen av disse AI-løsningene forsiktig, gitt den strenge granskingen fra regulatorer. Meta har avklart at AI-funksjonene ikke vil være tilgjengelige for markedsføring eller politiske kampanjer på Facebook og Instagram. Ikke desto mindre tar plattformens grunnleggende reklameforskrifter for øyeblikket ikke spesifikt for AI.

Bildekilde: Shutterstock

Tidstempel:

Mer fra Blockchain Nyheter