Η Meta αποκαλύπτει το μοντέλο τμηματοποίησης εικόνας AI, SAM

Η Meta αποκαλύπτει το μοντέλο τμηματοποίησης εικόνας AI, SAM

Η Meta αποκαλύπτει το μοντέλο τμηματοποίησης εικόνας AI, SAM PlatoBlockchain Data Intelligence. Κάθετη αναζήτηση. Ολα συμπεριλαμβάνονται.

Αλφάβητο Inc. Google έχει μοιραστεί πληροφορίες σχετικά με υπερυπολογιστές που χρησιμοποιεί για την εκπαίδευση μοντέλων τεχνητής νοημοσύνης, ισχυριζόμενος ότι είναι αποδοτικοί και ταχύτεροι από Η Nvidia Τσιπ A100. Η Google παρήγαγε το προσαρμοσμένο της τσιπ που ονομάζεται Μονάδα Επεξεργασίας Τενσόρ (TPU), το οποίο βρίσκεται στην τέταρτη γενιά του.

Σύμφωνα με τον τεχνολογικό κολοσσό, η εταιρεία χρησιμοποιεί τα τσιπ για περισσότερο από το 90% του εκπαιδευτικού έργου της εταιρείας σε τεχνητή νοημοσύνη. Η Google προσθέτει τα δεδομένα τροφοδοσίας τσιπ μέσω μοντέλων για να τα κάνει πρακτικά σε εργασίες όπως κείμενα όπως ανθρώπινα ή για τη δημιουργία εικόνων.

Ιδανικά, Οι TPU έχουν σχεδιαστεί για την επιτάχυνση της φάσης συμπερασμάτων των βαθιών νευρωνικών δικτύων (DNN), τα οποία χρησιμοποιούνται σε πολλές εφαρμογές μηχανικής εκμάθησης, όπως η αναγνώριση εικόνας, η αναγνώριση ομιλίας, η επεξεργασία φυσικής γλώσσας και άλλα. Οι TPU χρησιμοποιούνται επίσης για την εκπαίδευση DNN.

Διαβάστε επίσης: Το Twitter σε νόμιμο ζεστό νερό καθώς η Γερμανία απειλεί με πρόστιμο

Την Τρίτη Google δημοσίευσε επιστημονική εργασία εξηγώντας πώς έχει χορδίσει περισσότερες από 4 000 μάρκες. Σύμφωνα με την εταιρεία, χρησιμοποίησε προσαρμοσμένους οπτικούς διακόπτες για τη μεταφορά μεμονωμένων μηχανών σε ένα μέρος.

Στην επιστημονική εργασία, η Google είπε ότι για συστήματα συγκρίσιμου μεγέθους, τα τσιπ της είναι έως και 1.7 φορές πιο γρήγορα και 1.9 φορές πιο αποδοτικά από ένα σύστημα που βασίζεται στο τσιπ A100 της Nvidia που κυκλοφορούσε στην αγορά ταυτόχρονα με το TPU τέταρτης γενιάς.

Απαιτούνται περισσότερες βελτιώσεις

Οι αναλυτές είναι της άποψης ότι η αγορά για τα τσιπ συμπερασμάτων δεδομένων θα αναπτυχθεί γρήγορα όπως λένε οι επιχειρήσεις Τεχνολογίες AI στα προϊόντα τους. Εταιρείες όπως η Google, ωστόσο, ήδη εργάζονται για το πώς να διατηρήσουν το καπάκι στο επιπλέον κόστος που θα προσθέσει κάτι τέτοιο, και ένα από τα κόστη είναι η ηλεκτρική ενέργεια.

Μεγάλα γλωσσικά μοντέλα που οδηγούν προϊόντα όπως π.χ Της Google Bard ή OpenAI's ChatGPT έχουν μεγαλώσει πάρα πολύ σε μέγεθος. Στην πραγματικότητα είναι πολύ μεγάλα για να τα αποθηκεύσετε σε ένα μόνο τσιπ.

Ως εκ τούτου, η βελτίωση αυτών των συνδέσεων έχει γίνει βασικό σημείο για τον ανταγωνισμό μεταξύ των εταιρειών που κατασκευάζουν υπερυπολογιστές τεχνητής νοημοσύνης.

Επιπλέον, αυτά τα μοντέλα χωρίζονται σε χιλιάδες μάρκες και συνεργάζονται για εβδομάδες ή περισσότερες για να εκπαιδεύσουν το μοντέλο.

Το πιο σημαντικό δημοσίως δημοσιευμένο μοντέλο γλώσσας της Google μέχρι σήμερα, το PaLM, εκπαιδεύτηκε με το διαχωρισμό του σε δύο από τους 4 υπερυπολογιστές με τσιπ σε διάστημα 000 ημερών.

Σύμφωνα με την εταιρεία, οι υπερυπολογιστές της καθιστούν εύκολη τη διαμόρφωση των συνδέσεων μεταξύ των τσιπ εν κινήσει.

«Η εναλλαγή κυκλώματος καθιστά εύκολη τη δρομολόγηση γύρω από αποτυχημένα εξαρτήματα», δήλωσε ο συνεργάτης της Google, ο Norm Jouppi και ο διακεκριμένος μηχανικός της Google, David Patterson, σε ανάρτηση ιστολογίου σχετικά με το σύστημα.

«Αυτή η ευελιξία μας επιτρέπει ακόμη και να αλλάξουμε την τοπολογία της διασύνδεσης υπερυπολογιστή για να επιταχύνουμε την απόδοση ενός μοντέλου ML (μηχανικής εκμάθησης).

Δεν υπάρχει σύγκριση σύμφωνα με την Google

Η Nvidia κυριαρχεί στην αγορά εκπαίδευσης μοντέλων τεχνητής νοημοσύνης με τεράστιο όγκο δεδομένων. Ωστόσο, μετά την εκπαίδευση αυτών των μοντέλων, τίθενται σε ευρύτερη χρήση σε αυτό που ονομάζεται «συμπερασματικά», κάνοντας εργασίες όπως η δημιουργία απόκρισης κειμένου σε προτροπές και αποφασίζοντας εάν μια εικόνα περιέχει μια γάτα.

Σημαντικό λογισμικό Τα στούντιο χρησιμοποιούν αυτήν τη στιγμή τους επεξεργαστές A100 της Nvidia. Τα τσιπ A100 είναι τα πιο συχνά χρησιμοποιούμενα τσιπ που χρησιμοποιεί το στούντιο ανάπτυξης για φόρτους εργασίας μηχανικής εκμάθησης AI.

Η Το A100 είναι κατάλληλο για μοντέλα μηχανικής εκμάθησης που χρησιμοποιούν εργαλεία όπως το ChatGPT, BingAI, ή Σταθερή Διάχυση. Είναι σε θέση να εκτελεί πολλούς απλούς υπολογισμούς ταυτόχρονα, κάτι που είναι σημαντικό για την εκπαίδευση και τη χρήση μοντέλων νευρωνικών δικτύων.

Ενώ η Nvidia απέρριψε αιτήματα για σχόλια από Reuters, η Google είπε ότι δεν συνέκριναν την τέταρτη γενιά τους με το τρέχον κορυφαίο τσιπ H100 της Nvidia επειδή ήρθε στην αγορά μετά το τσιπ της Google και είναι κατασκευασμένο με νεότερη τεχνολογία.

Η Google είπε επίσης ότι η εταιρεία έχει «μια υγιή σειρά μελλοντικών συμβουλών», χωρίς να δώσει λεπτομερέστερες λεπτομέρειες, αλλά άφησε να εννοηθεί ότι μπορεί να εργάζεται σε ένα νέο TPU που θα ανταγωνιστεί το Nvidia H100.

Αν και η Google δημοσιεύει μόνο λεπτομέρειες σχετικά με τον υπερυπολογιστή της τώρα, είναι online εντός της εταιρείας από το 2020 σε ένα κέντρο δεδομένων στην κομητεία Mayes της Οκλαχόμα.

Η Google είπε ότι η startup Midjourney χρησιμοποίησε το σύστημα για να εκπαιδεύσει το μοντέλο της, το οποίο παράγει νέες εικόνες αφού τροφοδοτηθεί με λίγες λέξεις κειμένου.

Σφραγίδα ώρας:

Περισσότερα από MetaNews