Ο ρόλος της CPU στη βιώσιμη AI/ML

Ο ρόλος της CPU στη βιώσιμη AI/ML

Ο ρόλος της CPU στη βιώσιμη AI/ML PlatoBlockchain Data Intelligence. Κάθετη αναζήτηση. Ολα συμπεριλαμβάνονται.

αγγελίας Καθώς η τεχνητή νοημοσύνη επεκτείνει την εμβέλειά της σε περιβάλλοντα υπολογιστών επιχειρήσεων, ο αντίκτυπός της προκαλεί ορισμένα απρόβλεπτα αρνητικά αποτελέσματα. Το πιο πρόσφατο της IDC FutureScape Η έκθεση, για παράδειγμα, προβλέπει ότι καθώς οι εταιρείες αγωνίζονται να εισαγάγουν προϊόντα/υπηρεσίες βελτιωμένες με AI και να βοηθήσουν τους πελάτες τους με εφαρμογές τεχνητής νοημοσύνης, η τεχνολογία θα γίνει βασικό κίνητρο για καινοτομία.

Μια άλλη αλλαγή που βασίζεται στο AI εστιάζει στον βαθμό στον οποίο τα κέντρα δεδομένων μπορεί να πρέπει να εξισορροπούν τις CPU με διακριτούς επιταχυντές τεχνητής νοημοσύνης, όπως GPU ή εξειδικευμένες αρχιτεκτονικές, προκειμένου να παρέχουν τις υπολογιστικές δυνατότητες υψηλής απόδοσης που θέλουν οι προγραμματιστές τεχνητής νοημοσύνης.

Είναι μια συζήτηση που εγείρει ζητήματα υψηλού κινδύνου για τους ιδιοκτήτες κέντρων δεδομένων, τόσο όσον αφορά την πρόσθετη επένδυση CAPEX όσο και την πιθανότητα (ενώ οι μέθοδοι μέτρησης είναι ανακριβείς) οι τυπικές λειτουργίες τεχνητής νοημοσύνης που βασίζονται σε GPU καταναλώνουν περισσότερη ενέργεια από τους συμβατικούς φόρτους εργασίας IT.

Η ενασχόληση με την υψηλότερη επιβάρυνση ισχύος/άνθρακα της τεχνητής νοημοσύνης είναι ένα πρόσθετο σημείο πόνου για τις λειτουργίες του κέντρου δεδομένων, το οποίο πρέπει επίσης να διασφαλίζει ότι οι αναβαθμισμένες υπολογιστικές αρχιτεκτονικές βελτιστοποιημένες για τεχνητή νοημοσύνη μπορούν να διαχειριστούν τις αυξημένες απαιτήσεις ισχύος χωρίς τον κίνδυνο υπερφόρτωσης της υπάρχουσας τεχνολογίας ή εγκαταστάσεων.

Έτσι, καθώς η εκτεταμένη νομοθεσία για τη διακυβέρνηση της βιωσιμότητας και τη διαχείριση του άνθρακα ωθεί τις λειτουργίες να μειώσουν τη χρήση ενέργειας σε όλη τη γκάμα του υλικού και του λογισμικού πληροφορικής, η τεχνητή νοημοσύνη αντιπροσωπεύει ταυτόχρονα ευκαιρίες και εμπόδια.

Μετριασμός της κατανάλωσης ενέργειας AI

Συνολικά, η αυξημένη κατανάλωση ενέργειας και οι απαραίτητες αρχιτεκτονικές αναδιαμορφώσεις που απαιτούνται για την προσαρμογή του φόρτου εργασίας AI και Machine Learning αποτελούν μια αδυσώπητη πρόκληση για τα κέντρα δεδομένων, εξηγεί ο Stephan Gillich, Διευθυντής Τεχνητής Νοημοσύνης GTM στο Κέντρο Αριστείας AI της Intel.

«Είναι αρκετά σαφές σε κάθετους κλάδους και βιομηχανίες, όπου και αν αναπτύσσονται, εκπαιδεύονται και λειτουργούν εφαρμογές και υπηρεσίες AI/Machine Learning, ότι οι δυνατότητες των εγκαταστάσεων IT on-prem και που φιλοξενούνται στο cloud θα πρέπει να υποβληθούν σε αναβαθμίσεις για την αντιμετώπιση αυξημένου όγκου δεδομένων -εντατικό φόρτο εργασίας», λέει ο Gillich. «Είναι επίσης σαφές ότι αυτές οι αναβαθμίσεις θα πρέπει να συνεπάγονται περισσότερα από την απλή αύξηση της υπολογιστικής ικανότητας».

Πολλά μπορούν να γίνουν για να ενισχυθεί η βιωσιμότητα των κέντρων δεδομένων που επικεντρώνονται στην τεχνητή νοημοσύνη, πιστεύει ο Gillich, ξεκινώντας με την επανεκτίμηση ορισμένων από τις υποθέσεις γύρω από το τοπίο AI/Machine Learning. Οι μονάδες επεξεργασίας είναι ένα καλό μέρος για να ξεκινήσετε, ιδιαίτερα όταν αποφασίζετε εάν οι CPU ή οι GPU ταιριάζουν καλύτερα στην εργασία.

Επειδή, ενώ οι φόρτοι εργασίας έντασης υπολογιστών ειδικά για την τεχνητή νοημοσύνη φαίνεται να αυξάνονται (κανείς δεν είναι σίγουρος με ποιο ρυθμό), το μεγαλύτερο μέρος της εργασίας του κέντρου δεδομένων (οι φόρτοι εργασίας εκτός τεχνητής νοημοσύνης) πρέπει να συνεχίσει να απομακρύνεται μέρα με τη μέρα - παρέχοντας σταθερή εφαρμογή και οι ροές εσόδων από υπηρεσίες δεν πρέπει να διαταραχθούν.

Τα περισσότερα από αυτά διαχειρίζονται επί του παρόντος οι CPU και η επανατοποθέτηση ενός τυπικού κέντρου δεδομένων με πιο δαπανηρές GPU θα ήταν, για πάρα πολλές εγκαταστάσεις, πλεόνασμα στις απαιτήσεις. Σε γενικές γραμμές, μια GPU καταναλώνει περισσότερη ισχύ από μια CPU για να εκτελέσει μια παρόμοια εργασία. Ανάλογα με την παροχή ρεύματος σε μια δεδομένη διαμόρφωση rack, η ενσωμάτωση των GPU στην υποδομή των κέντρων δεδομένων απαιτεί αναβαθμίσεις σε συστήματα διανομής ενέργειας, για παράδειγμα, τα οποία είναι βέβαιο ότι θα επιφέρουν επιπλέον εκ των προτέρων κόστος, επιπλέον των υψηλότερων λογαριασμών ενέργειας μόλις λειτουργήσουν.

Επιπλέον, η ανάπτυξη της CPU της Intel συνεχίζει να καινοτομεί. Σε πολλαπλές περιπτώσεις χρήσης, μια CPU μπορεί να αποδειχθεί ότι επιτυγχάνει εξίσου καλή –και μερικές φορές καλύτερη– συνολική απόδοση με μια GPU, υποστηρίζει ο Gillich. Και η απόδοσή τους μπορεί να αυξηθεί με πρωτοποριακή τεχνολογία όπως το Intel® AMX (Advanced Matrix Extensions) ένας επιταχυντής ενσωματωμένος σε επεξεργαστές Intel Xeon 4ης γενιάς.

«Οι επεξεργαστές Intel Xeon μπορούν να επιτρέψουν σε ένα κέντρο δεδομένων να κλιμακώσει την υιοθέτηση της τεχνητής νοημοσύνης μέσω ενσωματωμένης επιτάχυνσης τεχνητής νοημοσύνης που ενισχύει την απόδοση της CPU για τη Μηχανική Μάθηση, την εκπαίδευση και τα συμπεράσματα», επισημαίνει ο Gillich. «Με αυτόν τον τρόπο, μπορούν να υιοθετήσουν διακριτούς επιταχυντές για να ελαχιστοποιήσουν το CAPEX και να μεγιστοποιήσουν την απόδοση αξιοποιώντας τα υπάρχοντα περιβάλλοντα επεξεργασίας Intel Xeon».

Πρέπει να συνδυάσετε φόρτους εργασίας AI και μη AI

Το Intel AMX είναι ένα αποκλειστικό μπλοκ υλικού στον πυρήνα επεξεργαστή Intel Xeon Scalable που επιτρέπει στους φόρτους εργασίας AI να εκτελούνται στη CPU αντί να τους εκφορτώνει σε έναν διακριτό επιταχυντή, παρέχοντας σημαντική ώθηση στην απόδοση. Είναι κατάλληλο για φόρτους εργασίας τεχνητής νοημοσύνης, όπως συστήματα συστάσεων μηχανικής μάθησης, αναγνώριση εικόνας και επεξεργασία φυσικής γλώσσας, που βασίζονται στα μαθηματικά μήτρας.

Ένα άλλο επιχείρημα υπέρ των επαυξημένης CPU είναι ότι παρέχουν μια οικονομικά αποδοτική διαδρομή για τους χειριστές των κέντρων δεδομένων ώστε να κάνουν περισσότερες από τις υπάρχουσες δεσμεύσεις της CPU, να προστατεύουν από το μέλλον τα περιουσιακά τους στοιχεία, ώστε να είναι σε θέση να αναλαμβάνουν μικτό φόρτο εργασίας και να τους τοποθετούν σε θέση καλύτερης έλεγχος της συνολικής χρήσης ενέργειας.

Αυτό, με τη σειρά του, μπορεί να βοηθήσει τους παρόχους υπηρεσιών κέντρων δεδομένων (και τους πελάτες τους) να επιτύχουν τους στόχους βιωσιμότητας και παρέχει ένα σημείο πώλησης για προγραμματιστές λογισμικού (επιχειρήσεις ή τρίτους) που αναζητούν μια βελτιστοποιημένη πλατφόρμα για να επιδείξουν την ενεργειακή απόδοση της κωδικοποίησής τους εξόδους.

«Η πραγματικότητα είναι ότι, αντί να βιάζονται με τις ευκαιρίες που μπορεί να υπόσχονται ο φόρτος εργασίας της τεχνητής νοημοσύνης, οι χειριστές των κέντρων δεδομένων συνειδητοποιούν ότι πρέπει να λάβουν υπόψη μια σειρά επιταγών που καλύπτονται τόσο από εμπορικές ανησυχίες όσο και από τεχνολογικές επιλογές», λέει ο Gillich.

Αυτές οι επιταγές θα μπορούσαν να περιλαμβάνουν: την ενσωμάτωση φόρτου εργασίας τεχνητής νοημοσύνης με φόρτους εργασίας εκτός τεχνητής νοημοσύνης. την ενσωμάτωση διαφορετικών στοίβων υλικού και λογισμικού· και επειδή θέλουν να διασφαλίσουν ότι έχουν μια αρχιτεκτονική που είναι κατάλληλη για πολλούς διαφορετικούς φόρτους εργασίας, την ενσωμάτωση διαφορετικών τύπων ροής εργασίας.

«Αυτές οι ερωτήσεις υποδεικνύουν περίπλοκες προκλήσεις, επειδή η σωστή τους επιρροή έχει τη βέλτιστη τεχνολογική και ενεργειακή απόδοση – με την ενεργειακή απόδοση πλέον να αποτελεί βασικό σημείο αναφοράς απόδοσης που θα επηρεάζει ολοένα και περισσότερο την εμπορική βιωσιμότητα ενός κέντρου δεδομένων», λέει ο Gillich. «Έτσι και πάλι, είναι υψίστης σημασίας».

Από την οπτική γωνία του Gillich, το κλειδί για την προσαρμογή σε αυτήν την αναδυόμενη πραγματικότητα είναι μια διαδικασία σταδίου αυτού που μπορεί να ονομαστεί «Αφομοίωση AI». Το πρώτο σημείο εδώ είναι ότι οι φόρτοι εργασίας AI δεν διαχωρίζονται από άλλους τύπους φόρτου εργασίας – θα ενσωματωθούν σε συμβατικούς φόρτους εργασίας, αντί να εκτελούνται χωριστά.

Ο Gillich δίνει τη βιντεοδιάσκεψη ως παράδειγμα αυτής της σταδιακής ολοκλήρωσης: «Ήδη κατά τη ροή τυπικής κυκλοφορίας ήχου/βίντεο σε τυπικές εφαρμογές, η τεχνητή νοημοσύνη είναι ενσωματωμένη για την εκτέλεση συνακόλουθων εργασιών όπως η σύνοψη, η μετάφραση, η μεταγραφή. Τέτοιες δυνατότητες υποστηρίζονται πολύ καλά από το AI.

Εξοικονόμηση ενέργειας από άκρο σε άκρο

Η επίτευξη ενεργειακής απόδοσης πρέπει να είναι ένα πραγματικά στρατηγικό εγχείρημα από άκρο σε άκρο, υποστηρίζει ο Gillich. «Απλώνει την πλευρά του λογισμικού καθώς και τις αρχιτεκτονικές του υλικού – τον ​​πλήρη μηχανισμό που επιτρέπει μια δεδομένη διαδικασία ροής εργασίας. Πού αποθηκεύονται δεδομένα για να γίνει η πρόσβαση πιο αποτελεσματική – υπολογιστικά και επομένως ενεργειακά – είναι αυτό το καλύτερο μέρος για ενεργειακή απόδοση;»

Ο άλλος παράγοντας που πρέπει να συμπεριληφθεί σε αυτήν την αξιολόγηση είναι να προσδιοριστεί πού εκτελείται ο φόρτος εργασίας. Για παράδειγμα, εκτελείται σε πελάτες (όπως υπολογιστής τεχνητής νοημοσύνης εξοπλισμένος με επεξεργαστές Intel Core Ultra, αντί για διακομιστές στο κέντρο δεδομένων; Μπορούν όντως ορισμένοι από αυτούς τους φόρτους εργασίας AI να εκτελεστούν σε πελάτες (μαζί με διακομιστές);

Κάθε επιλογή αξίζει να εξεταστεί εάν πρόκειται να βοηθήσει στην καλύτερη ευθυγράμμιση της ισορροπίας AI-υπολογισμού/κατανάλωσης ενέργειας, υποστηρίζει ο Gillich: «Είναι σχεδόν σαν μια επιστροφή στην παλιά έννοια του κατανεμημένου υπολογισμού».

Ο Gillich προσθέτει: «Μερικές φορές οι πελάτες μας ρωτούν, "Πού θα παίξει το AI;" – η απάντηση είναι ότι το AI θα παίζει παντού. Έτσι, στην Intel η φιλοδοξία μας επικεντρώνεται σε αυτό που θα μπορούσε να ονομαστεί καθολική προσαρμογή της τεχνητής νοημοσύνης, επειδή πιστεύουμε ότι θα εισέλθει σε όλα τα πεδία εφαρμογών».

Στην Intel αυτό περιλαμβάνει ενδιάμεσο λογισμικό, όπως τα API, τα οποία, όπως και με οποιοδήποτε άλλο μέρος της στοίβας λογισμικού, πρέπει να είναι όσο το δυνατόν πιο αποτελεσματικά. Η «εξάπλωση API» μπορεί να οδηγήσει σε περιττή επεξεργασία, ελαχιστοποίηση του αποτυπώματος υποδομής τους και έλλειψη παρακολούθησης και ελέγχου.

"Με Intel oneAPI, οι επιχειρήσεις μπορούν να συνειδητοποιήσουν την πλήρη αξία του υλικού τους, να αναπτύξουν κώδικα διασταυρούμενης αρχιτεκτονικής υψηλής απόδοσης και να κάνουν τις εφαρμογές τους έτοιμες για μελλοντικές ανάγκες», εξηγεί ο Gillich.

«Το Intel oneAPI είναι ένα ανοιχτό, διακλαδικό, βασισμένο σε πρότυπα, ενοποιημένο, πολυαρχιτεκτονικό, μοντέλο προγραμματισμού πολλών προμηθευτών που προσφέρει μια κοινή εμπειρία προγραμματιστή σε όλες τις αρχιτεκτονικές επιταχυντών – για ταχύτερη απόδοση εφαρμογών και βελτιωμένη παραγωγικότητα. Η πρωτοβουλία oneAPI ενθαρρύνει τη συνεργασία για την προδιαγραφή oneAPI και τις συμβατές εφαρμογές oneAPI σε όλο το οικοσύστημα.»

Ο Gillich προσθέτει: «Το oneAPI παρέχει μια στοίβα ενδιάμεσου λογισμικού που παίρνει τυπικά πράγματα όπως τα AI Frameworks – όπως το Pytorch ή το TensorFlow [η πλατφόρμα λογισμικού ανοιχτού κώδικα για την τεχνητή νοημοσύνη και τη μηχανική μάθηση] – και τα μεταφράζει σε επίπεδο μηχανής, και το oneAPI επιτρέπει έναν αποτελεσματικό τρόπο Κάνε αυτό. Οι χρήστες μπορούν να χρησιμοποιήσουν ένα κοινό API σε επίπεδο πλαισίου Ai και έχουμε ένα API (oneAPI) που αντιμετωπίζει τις διαφορετικές γεύσεις υλικού». Έτσι, ένα κοινό API σημαίνει ότι οι χρήστες μπορούν να δημιουργήσουν ανοιχτό λογισμικό που μπορεί να υποστηριχθεί σε μια ανοιχτή στοίβα λογισμικού.

Επιδόσεις σε επίπεδο GPU σε σημεία τιμής σε επίπεδο CPU

Η πρόοδος στον τομέα της πληροφορικής καθοδηγείται σε μεγάλο βαθμό από την προσδοκία συνεχούς τεχνολογικής προόδου που συνδέεται με βελτιώσεις που βασίζονται στη γνώση στις στρατηγικές ανάπτυξης. Είναι ένα μοντέλο που βασίζεται στην εύρεση της καλύτερης δυνατής ισορροπίας μεταξύ των δαπανών του προϋπολογισμού και της επιχειρηματικής απόδοσης επένδυσης (ROI) και στην προσδοκία ότι υπάρχει πάντα περαιτέρω καινοτομία για να επιδιώκεται. Η τεχνητή νοημοσύνη αντιπροσωπεύει το απόγειο αυτού του ιδανικού – είναι αρκετά έξυπνο ώστε να επανεφεύρει τη δική του πρόταση αξίας μέσω της διαρκούς αυτοβελτίωσης.

Χτίζοντας τον επιταχυντή AMX στους επεξεργαστές Intel Xeon 4ης γενιάς, η Intel δείχνει πώς μπορεί να επιτευχθεί απόδοση σε επίπεδο GPU σε τιμές σε επίπεδο CPU. Αυτό επιτρέπει στα κέντρα δεδομένων να κλιμακώνονται, ενώ μεγιστοποιεί την αξία επιστροφής των υπαρχόντων κτημάτων επεξεργασίας που τροφοδοτούνται από την Intel Xeon, αλλά παρέχει επίσης ένα μοντέλο τιμολόγησης που μειώνει το κόστος εισόδου για πελάτες με φόρτο εργασίας τεχνητής νοημοσύνης αλλά περιορισμένους προϋπολογισμούς.

Και η χαμηλότερη κατανάλωση ενέργειας των CPU σημαίνει ότι η ενεργειακή απόδοση μπορεί να επιτευχθεί ολιστικά σε όλες τις λειτουργίες ενός κέντρου δεδομένων – όπως η ψύξη και ο εξαερισμός – και αυτό είναι άλλο ένα νικητήριο κίνητρο για αρχιτέκτονες λογισμικού που ευσυνείδητα στη βιωσιμότητα και προγραμματιστές λύσεων AL.

Συνεισφορά από την Intel.

Σφραγίδα ώρας:

Περισσότερα από Το μητρώο