Η Meta αποκαλύπτει το Next-Gen AI Emu Video and Emu Edit

Η Meta αποκαλύπτει το Next-Gen AI Emu Video and Emu Edit

Η Meta αποκαλύπτει το Next-Gen AI Emu Video και το Emu Edit PlatoBlockchain Data Intelligence. Κάθετη αναζήτηση. Ολα συμπεριλαμβάνονται.

Η σφαίρα της γενετικής τεχνητής νοημοσύνης γνωρίζει ραγδαίες εξελίξεις, με το 2023 να σημειώνει ένα σημαντικό άλμα στον τομέα. Η Meta, πρώην Facebook, παρουσίασε το Emu, ένα πρωτοποριακό θεμελιώδες μοντέλο για τη δημιουργία εικόνων, στη φετινή εκδήλωση Meta Connect. Αυτό τεχνολογία υποστηρίζει πολλές εμπειρίες τεχνητής νοημοσύνης σε όλη την οικογένεια εφαρμογών της Meta, ιδίως στα εργαλεία επεξεργασίας εικόνων AI του Instagram. Αυτά τα εργαλεία επιτρέπουν στους χρήστες να μεταμορφώνουν τις φωτογραφίες αλλάζοντας το οπτικό στυλ ή το φόντο τους. Επιπλέον, η δυνατότητα Imagine στο Meta AI διευκολύνει τη δημιουργία φωτορεαλιστικών εικόνων μέσα σε μηνύματα ή ομαδικές συνομιλίες.

Σημαντικές ανακαλύψεις στη γενιά βίντεο: Emu Video

Το Emu Video αναδεικνύεται ως μια κομβική εξέλιξη, χρησιμοποιώντας το μοντέλο Emu για δημιουργία κειμένου σε βίντεο. Αυτή η καινοτόμος προσέγγιση, που βασίζεται σε μοντέλα διάχυσης, προσφέρει μια απλή αλλά αποτελεσματική μέθοδο για τη δημιουργία βίντεο υψηλής ποιότητας. Η διαδικασία περιλαμβάνει δύο φάσεις: αρχικά δημιουργία εικόνων από προτροπές κειμένου και στη συνέχεια δημιουργία βίντεο που εξαρτώνται από κείμενο και εικόνες. Αυτή η παραγοντοποιημένη μεθοδολογία επιτρέπει την αποτελεσματική εκπαίδευση των μοντέλων παραγωγής βίντεο. Η υπεροχή του Emu Video είναι εμφανής, καθώς απαιτεί μόνο δύο μοντέλα διάχυσης για την παραγωγή βίντεο 512×512 στα 16 fps, σε πλήρη αντίθεση με προηγούμενες μεθόδους που απαιτούσαν πολλά μοντέλα. Οι ανθρώπινες αξιολογήσεις έχουν δείξει μεγάλη προτίμηση για το Emu Video, με την απόδοσή του να ξεπερνά τις προηγούμενες τεχνολογίες τόσο στην ποιότητα όσο και στην τήρηση των μηνυμάτων κειμένου.

Επανάσταση στην επεξεργασία εικόνας: Emu Edit

Το Emu Edit της Meta αντιπροσωπεύει μια αλλαγή παραδείγματος στην επεξεργασία εικόνας, εστιάζοντας σε ακριβείς αλλαγές σε επίπεδο pixel. Αυτό το εργαλείο επιτρέπει περίπλοκες εργασίες επεξεργασίας, όπως τοπικές και καθολικές τροποποιήσεις, προσαρμογές φόντου και χρωματικούς και γεωμετρικούς μετασχηματισμούς. Το Emu Edit ξεχωρίζει διασφαλίζοντας ότι αλλοιώνονται μόνο τα pixel που σχετίζονται με τις οδηγίες επεξεργασίας, διατηρώντας την ακεραιότητα των μη στοχευμένων τμημάτων της εικόνας. Για την εκπαίδευση του Emu Edit, η Meta έχει αναπτύξει ένα εκτεταμένο σύνολο δεδομένων που περιλαμβάνει 10 εκατομμύρια συνθετικά δείγματα, το καθένα από τα οποία περιλαμβάνει μια εικόνα εισόδου, μια περιγραφή εργασίας επεξεργασίας και την στοχευμένη εικόνα εξόδου. Το μοντέλο παρουσιάζει εξαιρετική απόδοση όσον αφορά την πιστότητα των οδηγιών και την ποιότητα της εικόνας.

Το μέλλον του Generative AI στο Meta

Αυτές οι εξελίξεις στη γενετική τεχνητή νοημοσύνη υποδηλώνουν ένα μέλλον όπου η δημιουργική έκφραση είναι πιο προσιτή και ποικιλόμορφη. Το Emu Video και το Emu Edit θα μπορούσαν ενδεχομένως να φέρουν επανάσταση στον τρόπο με τον οποίο οι άνθρωποι δημιουργούν και μοιράζονται πολυμέσα. Προσφέρουν εργαλεία για όλους, από επαγγελματίες καλλιτέχνες έως απλούς χρήστες, επιτρέποντας νέες μορφές έκφρασης και δημιουργικότητας. Αν και δεν υποκαθιστούν τους επαγγελματίες δημιουργούς, παρέχουν μια πλατφόρμα για βελτιωμένη αυτοέκφραση και δημιουργική εξερεύνηση.

Οι αναφορές πολυμέσων δίνουν έμφαση στην απλοποιημένη διαδικασία του Emu Video και στην ακριβή ικανότητα επεξεργασίας σε επίπεδο pixel του Emu Edit. Τονίζεται η απλότητα και η αποτελεσματικότητα της τεχνολογίας, μαζί με τις δυνατότητές της να φέρει επανάσταση στην επεξεργασία βίντεο και εικόνας. Ωστόσο, η Meta προσεγγίζει προσεκτικά την ανάπτυξη αυτών των λύσεων AI, δεδομένου του αυστηρού ελέγχου από τις ρυθμιστικές αρχές. Η Meta διευκρίνισε ότι οι δυνατότητές της AI δεν θα είναι διαθέσιμες για μάρκετινγκ ή πολιτικές εκστρατείες στο Facebook και το Instagram. Ωστόσο, οι βασικοί κανονισμοί διαφήμισης της πλατφόρμας επί του παρόντος δεν αφορούν συγκεκριμένα την τεχνητή νοημοσύνη.

Πηγή εικόνας: Shutterstock

Σφραγίδα ώρας:

Περισσότερα από Blockchain News