Πώς το Generative IA θα διαταράξει τα πάντα στην τρέχουσα δεκαετία

Αναδημοσίευση από τον Πλάτωνα

Ακολουθούν: 0

Πολλοί θα εκπλαγούν

Εικόνα του συγγραφέα με Stable Diffusion

In Τους τελευταίους μήνες, συστήματα τεχνητής νοημοσύνης όπως το Midjourney, το DALL-E, το Stable Diffusion, το LaMDA και το PaLM έχουν κάνει μεγάλα βήματα σε τομείς που είναι προφανώς τόσο διαφορετικοί όσο η δημιουργία εικόνων και κειμένου. Οι δυνατότητες αυτών των συστημάτων είναι εντυπωσιακές: παράγουν άκρως υποδηλωτικές εικόνες, δημιουργούν αποτελεσματικά αντίγραφα πώλησης για διαφήμιση και πολλά, πολλά άλλα –όλα από απλά «προτροπές» που περιγράφουν τι θέλει να πάρει ο χρήστης.

Όλα αυτά γίνονται με Generative AI.

Το "Generative AI" αναφέρεται σε συστήματα που τροφοδοτούνται από βαθιά νευρωνικά δίκτυα που εφαρμόζουν Μεγάλα γλωσσικά μοντέλα (LLM) προκειμένου να δημιουργία κάποιου είδους περιεχόμενο. Εδώ λέω «δημιουργώ», που σημαίνει ότι δεν είναι αντίγραφο κάποιου ήδη υπάρχοντος, όχι με φιλοσοφική έννοια (τι είναι ούτως ή άλλως «δημιουργία»;).

Μεγάλες νέες εταιρείες αναδύονται σε αυτόν τον γενναίο νέο κόσμο, όπως Ίασπις, το οποίο προσφέρει τη γενιά τόσο αντιγράφων πώλησης όσο και εικόνων για διαφήμιση: Ο Τζάσπερ έχει τώρα μια αποτίμηση άνω του ενός δισεκατομμυρίου δολαρίων, μετατρέποντας σε μια νύχτα μονόκερο.

Η πρώτη πλατφόρμα Generative AI που έκανε πραγματικά ένα βαθούλωμα ήταν το GPT-3 – που κυκλοφόρησε μόλις πριν από μερικά χρόνια! Μετά από αυτό, μια σειρά από κυκλοφορίες από αρκετούς παίκτες του χώρου (OpenAI, Google, StableDiffusion, Google, DeepMind και άλλοι) εμφανίστηκε με ραγδαίους ρυθμούς, τόσο πολύ που είναι δύσκολο να παραμείνεις ενημερωμένος.

Αλλά πέρα από το πόσο διασκεδαστικό και φανταστικό είναι να περάσετε λίγο χρόνο με το Midjourney για τη δημιουργία εικόνων από τις προτροπές μας, πολλοί λάτρεις της τεχνολογίας αγωνίζονται να κατανοήσουν αυτό το κύμα Generative IA.

Είναι το Generative IA μια σταθερή τάση ή είναι απλώς μια μόδα;

θα πάω για "σταθερή τάσηγιατί θα μεταμορφώσει χιλιάδες επαγγελματικές και ψυχαγωγικές δραστηριότητες στο πεδίο εφαρμογής αυτής της δεκαετίας. Επιτρέψτε μου να ξεκινήσω με ένα παράδειγμα.

Είμαι τεράστιος φαν του τένις (τουλάχιστον με την τηλεοπτική έννοια). Αλλά οι ζωντανοί αγώνες τένις χρειάζονται ώρες για να τελειώσουν και έχω άλλες δραστηριότητες και ενδιαφέροντα, επομένως συνήθως καταφεύγω στην παρακολούθηση επαναλήψεων ή απλώς επισημάνω βίντεο με τα πιο διασκεδαστικά 4 λεπτά περίπου από έναν αγώνα.

Τι γίνεται όμως αν αντί για ένα βίντεο 4 λεπτών, θέλω 10 ή 15 λεπτά; Ή αν θέλω να συμπεριλάβω κάθε σημείο στα τάι μπρέικ; Αυτή τη στιγμή δεν έχω τύχη.

Τώρα βάλτε το καπέλο Generative-IA στη δουλειά: μια γεννήτρια αθλητικών βίντεο Generative IA θα δημιουργούσε ένα βίντεο μόνο για σένα σύμφωνα με τις προδιαγραφές που βάζετε ανεπίσημα σε μια προτροπή κειμένου όπως η παρακάτω:

"Βίντεο περίπου 15 λεπτών με τους πιο διασκεδαστικούς πόντους του αγώνα Rafa Nadal εναντίον Tommy Paul στο Paris Bercy 2022, συμπεριλαμβανομένων πλήρων τάι μπρέικ εάν υπάρχουν, καθώς και κάθε breakpoint που μετατράπηκε"

Αυτό είναι. Λαμβάνετε έναν σύνδεσμο με το εξατομικευμένο βίντεό σας, διαφορετικό από ένα βίντεο που παρακολουθεί οποιοσδήποτε άλλος στον κόσμο. Και αυτή η υπηρεσία βίντεο θα ήταν τόσο οικονομικά εφικτή όσο το DALL-E και το Midjourney.

Η έρευνα είναι διαφορετική από την καινοτομία. Το πρώτο αφορά τα δημοσιευμένα πρωτότυπα αποτελέσματα και το δεύτερο έχει να κάνει περισσότερο με την εύρεση του τρόπου οικοδόμησης μιας επιχείρησης από αυτά τα αποτελέσματα: η καινοτομία δεν ενδιαφέρεται για την πρωτοτυπία αλλά για την ανάπτυξη, την υπερασπιστικότητα, την απόδοση επένδυσης κ.λπ.

Συχνά τα πράγματα δημιουργούν σύγχυση επειδή η έρευνα γίνεται από εταιρείες όπως η Google, οι οποίες καταρχήν είναι εκεί για να βγάλουν κέρδος –αλλά καταλαβαίνουν ότι η επιχείρησή τους είναι υψηλής τεχνολογίας και Η τεχνολογία δεν είναι υψηλή χωρίς έρευνα. Έτσι, εμπλέκονται στη χρηματοδότηση της έρευνας, καθώς και στο να έρθουν κοντά στον ακαδημαϊκό χώρο – πολλοί από τους κορυφαίους ερευνητές τους προσλήφθηκαν από τον ακαδημαϊκό χώρο. Ως ερευνητής ο ίδιος, προσκλήθηκα σε ένα Faculty Summit στα κεντρικά τους γραφεία στο Mountain View πριν από μερικά χρόνια, και με ξεναγούσαν σε μια σουίτα στο ξενοδοχείο Four Seasons – ό,τι χρειάζεται για να κάνω καλή εντύπωση στην ακαδημαϊκή κοινότητα!

Αλλά ακόμα κι αν θα μπορούσε να είναι δύσκολο -και ακόμη και τεχνητό- να γίνει μια σαφής τομή μεταξύ έρευνας και καινοτομίας, η διαφορά είναι κρίσιμη εδώ γιατί, στην περίπτωση της Generative AI, τα δύο θα αναπτυχθούν από διαφορετικούς φορείς και θα συνδεθούν με δύο διαφορετικά επίπεδα στη στοίβα λογισμικού –ως επισήμανε ο J. Currier:

Το κάτω επίπεδο λογισμικού είναι το Μοντέλο Deep Learning, που βασίζεται σε υλοποιήσεις μοντέλων μεγάλων γλωσσών (LLM) ή ισοδύναμης εσωτερικής αναπαράστασης. Τα μοντέλα παρέχουν το βασικό δομικό στοιχείο από το οποίο μπορούν να αναπτυχθούν εφαρμογές.
Το ανώτερο επίπεδο λογισμικού είναι το εφαρμογή ένα, το οποίο βασίζεται στο μοντέλο Deep Learning για να ολοκληρώσει μια συγκεκριμένη εργασία, για παράδειγμα, για την έξοδο μιας εικόνας από μια προτροπή κειμένου.

Αυτή η αρχιτεκτονική δύο επιπέδων θα τροφοδοτήσει μια νέα εποχή επιταχυνόμενης καινοτομίας, επειδή μόλις αναπτυχθεί το κάτω επίπεδο από πολύ μεγάλες εταιρείες όπως η Google, το OpenAI και άλλες, οι μικρότερες εταιρείες θα παρέχουν το επίπεδο εφαρμογής - δίνοντας, φυσικά, μια περικοπή των κερδών τους στον πάροχο του κάτω επιπέδου.

Επί του παρόντος, το κάτω στρώμα έχει βελτιωθεί γρήγορα - και συχνά, έχει διανεμηθεί μαζί με μια εφαρμογή από πάνω. Για παράδειγμα, το LaMDA και το PaLM προσφέρουν δυνατότητες διαλόγου out of the box, ενώ το DALL-E και το Midjourney προσφέρουν υπηρεσίες άμεσης λήψης εικόνας. Σύντομα, όμως, ο πολλαπλασιασμός εναλλακτικών λύσεων ανοιχτού κώδικα για το κάτω επίπεδο θα καταστήσει δυνατή την ανάπτυξη μόνο του ανώτερου επιπέδου εφαρμογής και τη σύνδεσή του σε ένα ήδη διαθέσιμο κάτω στρώμα. Πιο εύκολο να ειπωθεί παρά να γίνει, φυσικά, αλλά το γεγονός είναι ότι το κάτω στρώμα είναι τάξεις μεγέθους πιο περίπλοκο από το επάνω.

Θα υποστήριζα ότι το Generative IA θα διαποτίσει σχεδόν κάθε μεμονωμένη εργασία γνώσης και ψυχαγωγική δραστηριότητα γιατί θα παρέχει εργαλεία για την απομάκρυνση της πολυπλοκότητας από παλιότερα δύσκολες δραστηριότητες και γιατί μπορεί να προσφέρει ένα εντελώς νέο επίπεδο εξατομίκευσης που θα το ονόμαζα «γενική εξατομίκευση».

Μπορείτε να δείτε τι είναι η "γενική εξατομίκευση" από το παραπάνω παράδειγμα αθλητικού βίντεο: σε κάθε χρήστη δίνεται ένα ολοκαίνουργιο και μοναδικό βίντεο με τις καλύτερες στιγμές αντί για μια απλή επιλογή μεταξύ δύο ή τριών επιλογών.

Ο αθροιστικός αντίκτυπος από όλες τις εφαρμογές Generative IA είναι δύσκολο να υπερβληθεί:

Η εύκολη δημιουργία γραφικών είναι ήδη προσβάσιμη σε μη επαγγελματίες με εργαλεία όπως το DALL-E, το Midjourney και το Stable Diffusion, τουλάχιστον για απλούς χρηστικούς σκοπούς, όπως η λήψη εικόνας κεφαλίδας για αυτήν την ανάρτηση. Πριν από φέτος, δεν μπορούσα να σχεδιάσω τις δικές μου εικόνες και οι ειδικοί του ιστολογίου συμβούλευαν να μην σπαταλάτε χρόνο σε γραφικό σχέδιο για τις δικές σας ιστορίες.
Οι χρήστες επεξεργασίας φωτογραφιών δεν θα χρειαστεί να υπομείνουν μια δύσκολη καμπύλη εκμάθησης για να κατακτήσουν το περίπλοκο σύνολο εργαλείων του Photoshop ή του Affinity Photo (χρησιμοποιώ το τελευταίο και είναι τόσο περίπλοκο που πρέπει να συμβουλευτώ τους οδηγούς YouTube για να μάθω πώς να κάνω τις περισσότερες προσαρμογές). Με το Generative AI, οι χρήστες θα ζητήσουν απλώς από το λογισμικό να εκτελέσει έναν δεδομένο μετασχηματισμό και voila! Η εικόνα θα διορθωθεί. Εάν η Adobe αποτύχει να προσφέρει Generative AI με τα εργαλεία της, θα διαταραχθεί από νέες νεοφυείς επιχειρήσεις που θα τους προσφέρουν και θα ακολουθήσουν το δρόμο του Blockbuster.
Εργαλεία παρουσίασης όπως το PowerPoint, αντί να παρέχουν απλώς πρότυπα όπως κάνουν τώρα, θα δημιουργήσουν και θα τελειοποιήσουν ολόκληρες παρουσιάσεις επαγγελματικού επιπέδου από ιδέες περιλήψεων. Επί του παρόντος, η διαφορά μεταξύ επαγγελματικών και ερασιτεχνικών παρουσιάσεων είναι τεράστια – αυτό δεν θα ισχύει πλέον.
Η σύνταξη κειμένου θα είναι μια διαδικασία που θα βελτιωθεί ιδιαίτερα από τα εργαλεία Generative AI. Πολλές μορφές γραφής λαμβάνουν ήδη βοήθεια από εξελιγμένα εργαλεία όπως το Grammarly, αλλά το Generative AI θα προσφέρει στους συγγραφείς ένα ποιοτικά νέο επίπεδο βοήθειας δημιουργώντας, για παράδειγμα, μια πλήρη πρώτη έκδοση ενός ιστολογίου. Η γραφή θα είναι μια διαδικασία συνεργασίας μεταξύ ανθρώπων και του εργαλείου AI.
Οποιοδήποτε λογισμικό προορίζεται για έναν τελικό χρήστη θα πρέπει να είναι απλό στη χρήση με μηνύματα κειμένου ή φωνής. Τα εγχειρίδια χρήστη και τα εκπαιδευτικά βίντεο θα ανήκουν στο παρελθόν και μόλις οι χρήστες συνηθίσουν τον νέο απλό τρόπο χρήσης λογισμικού, θα πρέπει να το προσφέρουν όλα για να παραμείνουν σχετικοί.
Η εκμάθηση γλωσσών θα γίνει κυρίως με τη βοήθεια φωνητικών βοηθών, οι οποίοι θα τροφοδοτούνται από –σωστά μαντέψατε– Generative AI. Οι βοηθοί φωνής, που θα λειτουργούν σαν προσωπικοί προπονητές γλώσσας, θα χρησιμοποιήσουν τις εκπληκτικές τους δυνατότητες διαλόγου φυσικής γλώσσας, που πρωτοεμφανίστηκαν σε συστήματα όπως το LaMDA της Google, για να καθοδηγήσουν τον μαθητή της ανθρώπινης γλώσσας προκειμένου να αποκτήσει λεξιλόγιο και εκφράσεις, να βελτιώσει την προφορά κ.λπ. Διδασκαλία γλώσσας Οι βοηθοί φωνής δεν είναι μια φουτουριστική φαντασία – έχει απλώς οικονομικό νόημα από τώρα.
Ακόμη και τα προϊόντα υλικού (όπως τα αυτοκίνητα) θα έχουν συστήματα βοήθειας που βασίζονται σε Generative AI. Έχετε προσπαθήσει να εκτελέσετε μια περίπλοκη λειτουργία όπως η ρύθμιση της οθόνης σε σύγχρονα αυτοκίνητα; Δεν είναι εύκολο, μπορώ να σας πω. Αντί να σκάβετε σε πολύπλοκα εγχειρίδια, θα ζητήσετε απλώς από τον φωνητικό βοηθό είτε να λάβει οδηγίες είτε να κάνει απευθείας τις ρυθμίσεις.

Πολλά επαγγέλματα θα μεταμορφωθούν πέρα από την αναγνώριση. Οι γραφίστες αισθάνονται ήδη το τσίμπημα αυτής της διαταραχής. Ολόκληρα επαγγέλματα θα εξαφανιστούν και άλλα θα δημιουργηθούν. Οι ισχυρές εταιρείες θα χρεοκοπήσουν και οι νέες θα γίνουν κυρίαρχες, ανάλογα με το πόσο καλά χειρίζονται την τεχνολογική διαταραχή που προκαλεί η Generative AI.

Και όλα αυτά θα συμβούν μέσα σε αυτή τη δεκαετία.

Μπορεί να κάνω λάθος, αλλά μου φαίνεται ότι ήταν δύσκολο, ακόμη και για έμπειρους ειδικούς της τεχνολογίας, να προβλέψουν τις τεράστιες δυνατότητες των σημερινών δημιουργών εικόνας και κειμένου: δεν ήταν προφανές πριν από μερικά χρόνια ότι τεράστια μοντέλα και σετ εκπαίδευσης θα οδηγούν σε ποιοτικά διαφορετικές δυνατότητες.

Θα έφτανα στο σημείο να πω ότι ήταν ένα τυχερό, σχεδόν τυχαίο εύρημα. Αλλά τώρα που διαθέτουμε εργαλεία παραγωγής, οι πύλες είναι ανοιχτές σε καινοτόμες εταιρείες που θα αναπτύξουν εφαρμογές μετά την εφαρμογή με γρήγορο ρυθμό: είναι κυρίως θέμα να βρούμε τι μπορεί να βελτιωθεί ριζικά και να βρούμε το κατάλληλο επιχειρηματικό μοντέλο για να δημιουργήσουμε μια επιχείρηση από μια Γενετική ιδέα ΙΑ.

Πριν από μερικά χρόνια, φαινόταν ότι άλλες τάσεις της τεχνολογίας, όπως τα αυτοοδηγούμενα αυτοκίνητα, το VR ή το blockchain, θα κυριαρχούσαν σύντομα, αλλά η τεχνολογία αυτόνομης οδήγησης έχει περιοριστεί από νομοθετικά εμπόδια, το blockchain επλήγη από την οικονομική ύφεση και το VR Η υιοθέτηση περιορίζεται από το υψηλό κόστος υλικού. Αντίθετα, το Generative AI δεν περιορίζεται ακόμη από τη νομοθεσία (hey, το γυάλισμα μιας παρουσίασης PowerPoint ή η δημιουργία ενός αθλητικού βίντεο δεν είναι θέμα ζωής ή θανάτου) και δεν χρειάζεται ακριβό υλικό για να αγοραστεί από τον χρήστη.

Και δεν πιστεύαμε ότι οι δημιουργικές δραστηριότητες επρόκειτο να διαταραχθούν τόσο σύντομα. Αλλά ήταν.

Μπαίνουμε σε νέες και μερικές φορές περίεργες εποχές, όπου η ανθρώπινη δημιουργικότητα αναμειγνύεται με τις νέες δυνατότητες των μηχανών σε σημείο που είναι δύσκολο να διακρίνει κανείς μεταξύ τους. Οπως και J. Currier επισημαίνει:

«Σήμερα και για τα επόμενα χρόνια, αυτό θα είναι εκπληκτικό και από πολλές απόψεις τρομακτικό. Γιατί εκείνες οι δημιουργικές στιγμές όπου περνάς από τις ιδέες μηδέν στις αρχικές ένιωθαν πάντα τόσο μοναδικά ανθρώπινες, γιατί ήταν τόσο μυστηριώδεις».

Πώς το Generative IA θα διαταράσσει τα πάντα στην τρέχουσα δεκαετία Αναδημοσιεύτηκε από την πηγή https://towardsdatascience.com/how-generative-ia-will-disrupt-everything-in-the-current-decade-b4e8ce7dd4f1?source=rss—-7f60cf5620c9— 4 μέσω https://towardsdatascience.com/feed

Si al principi no tens èxit, aleshores el paracaigudisme no és per a tu.

Σφραγίδα ώρας: Νοέμβριος 10, 2022Νοέμβριος 11, 2022