Meta avslöjar nästa generations AI Emu Video och Emu Edit

Meta avslöjar nästa generations AI Emu Video och Emu Edit

Meta avslöjar nästa generations AI Emu Video och Emu Edit PlatoBlockchain Data Intelligence. Vertikal sökning. Ai.

Den generativa AI-sfären bevittnar snabba framsteg, och 2023 markerar ett betydande framsteg inom domänen. Meta, tidigare Facebook, har introducerat Emu, en banbrytande grundmodell för bildgenerering, vid årets Meta Connect-evenemang. Detta teknik stödjer många AI-upplevelser i Metas appfamilj, särskilt i Instagrams AI-bildredigeringsverktyg. Dessa verktyg gör det möjligt för användare att förvandla foton genom att ändra deras visuella stil eller bakgrund. Dessutom underlättar Imagine-funktionen i Meta AI genereringen av fotorealistiska bilder i meddelanden eller gruppchattar.

Genombrott i videogenerering: Emu Video

Emu Video framstår som en central utveckling, med användning av Emu-modellen för text-till-video-generering. Detta innovativa tillvägagångssätt, baserat på diffusionsmodeller, erbjuder en enkel men effektiv metod för att skapa videor av hög kvalitet. Processen omfattar två faser: att till en början generera bilder från textuppmaningar och sedan skapa videor som är betingade av både text och bilder. Denna faktoriserade metod möjliggör effektiv träning av videogenereringsmodeller. Emu Videos överlägsenhet är uppenbar, eftersom det bara krävs två diffusionsmodeller för att producera 512×512 videor med 16 fps, en skarp kontrast till tidigare metoder som kräver flera modeller. Mänskliga utvärderingar har visat en stark preferens för Emu Video, med dess prestanda som överträffar tidigare teknologier i både kvalitet och efterlevnad av textuppmaningar.

Revolutionerande bildredigering: Emu Edit

Metas Emu Edit representerar ett paradigmskifte inom bildredigering, med fokus på exakta pixelnivåförändringar. Det här verktyget möjliggör komplicerade redigeringsuppgifter som lokala och globala ändringar, bakgrundsjusteringar och färg- och geometriska transformationer. Emu Edit sticker ut genom att se till att endast pixlar som är relevanta för redigeringsinstruktionerna ändras, vilket bibehåller integriteten för de oriktade delarna av bilden. För att träna Emu Edit har Meta utvecklat en omfattande datauppsättning som består av 10 miljoner syntetiserade prover, var och en inklusive en ingångsbild, en redigeringsuppgiftsbeskrivning och den riktade utdatabilden. Modellen uppvisar exceptionell prestanda när det gäller instruktionstrohet och bildkvalitet.

Framtiden för generativ AI på Meta

Dessa framsteg inom generativ AI antyder en framtid där kreativt uttryck är mer tillgängligt och mångsidigt. Emu Video och Emu Edit kan potentiellt revolutionera hur människor skapar och delar media. De erbjuder verktyg för alla från professionella artister till tillfälliga användare, vilket möjliggör nya uttrycksformer och kreativitet. Även om de inte ersätter professionella kreatörer, tillhandahåller de en plattform för förbättrat självuttryck och kreativ utforskning.

Medierapporter betonar den strömlinjeformade processen med Emu Video och den exakta redigeringsförmågan på pixelnivå hos Emu Edit. Teknikens enkelhet och effektivitet lyfts fram, tillsammans med dess potential att revolutionera video- och bildredigering. Meta närmar sig dock distributionen av dessa AI-lösningar med försiktighet, med tanke på den rigorösa granskningen från tillsynsmyndigheter. Meta har klargjort att dess AI-kapacitet inte kommer att vara tillgänglig för marknadsföring eller politiska kampanjer på Facebook och Instagram. Trots det tar plattformens grundläggande reklamregler för närvarande inte specifikt upp AI.

Bildkälla: Shutterstock

Tidsstämpel:

Mer från Blockchain News