Μνήμες συνδεδεμένες μέσω PCIe και δίσκους SSD θα μπορούν να αξιοποιούν οι GPU προκειμένου να αυξήσουν τη VRAM τους
To CXL IP της Panmnesia φέρεται να περιορίζει τους χρόνους απόκρισης σε διψήφιο αριθμό νανοδευτερολέπτων.
Οι σύγχρονες GPU που προορίζονται για εφαρμογές ΑΙ και HPC εξαρτώνται από την ενσωματωμένη μνήμη HBM (υψηλού εύρους ζώνης), με αποτέλεσμα να περιορίζονται οι επιδόσεις τους στη διαχείριση λειτουργιών τεχνητής νοημοσύνης και άλλων φορτίων. Όμως, μια νέα τεχνολογία θα επιτρέψει στις εταιρίες
Οι απαιτήσεις σε επίπεδο μνήμης για τα πλέον εξελιγμένα σύνολα δεδομένων, τα οποία χρησιμοποιούνται για την εκπαίδευση μοντέλων τεχνητής νοημοσύνης, αυξάνονται με ταχύτητα, πράγμα που σημαίνει ότι οι εταιρίες που δραστηριοποιούνται στο χώρο είναι υποχρεωμένες να αγοράζουν νέες GPU, να χρησιμοποιούν λιγότερο εξελιγμένα σύνολα δεδομένων ή εναλλακτικά να αξιοποιούν τη μνήμη της CPU, περιορίζοντας τις επιδόσεις των συστημάτων. Παρότι το CXL είναι ένα πρωτόκολλο το οποίο κανονικά λειτουργεί πάνω σε ένα σύνδεσμο PCIe, επιτρέποντας στους χρήστες να συνδέουν περισσότερη μνήμη σε ένα σύστημα μέσω της θύρας PCIe, η τεχνολογία αυτή πρέπει να αναγνωρίζεται από ένα ASIC και το υποσύστημά του, επομένως η προσθήκη ενός CXL controller από μόνη της δεν επαρκεί για να λειτουργήσει η τεχνολογία, ειδικά στην περίπτωση μιας GPU.
Η Panmnesia αντιμετώπισε διάφορες προκλήσεις προκειμένου να ενσωματώσει το πρωτόκολλο CXL για την επέκταση της μνήμης μιας GPU, εξαιτίας της απουσίας ενός λογικού υποστρώματος CXL και των ανάλογων υποσυστημάτων που υποστηρίζουν τη χρήση τελικών σημείων DRAM και/ή SSD σε GPU. Εκτός αυτού, η cahce μιας GPU και τα υποσυστήματα μνήμης δεν αναγνωρίζουν καμία επέκταση, πλην της ενοποιημένης εικονικής μνήμης (UVM), η οποία τείνει να είναι αργή.
Προκειμένου να αντιμετωπίσει αυτό το ζήτημα, η Panmnesia ανέπτυξε ένα RC (root complex) συμβατό με το CXL 3.1, εφοδιασμένο με πολλαπλές root ports (RP) που υποστηρίζουν εξωτερική μνήμη μέσω PCIe, καθώς και γέφυρα υποδοχής με αποκωδικοποιητή HDM που επικοινωνεί με το δίαυλο συστήματος μιας GPU. Ο αποκωδικοποιητής HDM, υπεύθυνος για τη διαχείριση του εύρους διευθύνσεων στη μνήμη του συστήματος, ουσιαστικά ωθεί το υποσύστημα μνήμης της GPU να "νομίσει" ότι καλείται να διαχειριστεί τη μνήμη του συστήματος, όμως στην πραγματικότητα το υποσύστημα αξιοποιεί κάποια DRAM ή NAND συνδεδεμένη μέσω PCIe. Αυτό σημαίνει ότι μπορούν να χρησιμοποιηθούν μνήμης DDR5 ή δίσκοι SSD για την επέκταση της συνολικής διαθέσιμης μνήμης μιας GPU.
H λύση (βασισμένη σε custom GPU, εμφανίζεται ως CXL-Opt στο γράφημα παρακάτω) ελέγχθηκε διεξοδικά και κατέγραψε διψήφια υστέρηση απόκρισης σε νανοδευτερόλεπτα (σε σύγκριση με μια υστέρηση της τάξης των 250ns στην περίπτωση πρωτοτύπων που ανέπτυξαν οι Samsung και Meta, εμφανίζονται ως CXL-Proto), συμπεριλαμβανομένου του χρόνου που χρειάζεται για τη μετάβαση του πρωτοκόλλου μεταξύ των συνήθων λειτουργιών μνήμης και της αξιοποίησης του CXL, σύμφωνα με την Panmnesia. Το σύστημα ενσωματώθηκε με επιτυχία τόσο σε επεκτάσεις μνήμης όσο και πρωτότυπα GPU/CPU, καταδεικνύοντας τη συμβατότητά του με διάφορες μορφές υλικού εξοπλισμού.
Στις δοκιμές της Panmnesia, η UVM αποδίδει χειρότερα από όλους τους πυρήνες GPU που ελέγχθηκαν, εξαιτίας των καθυστερήσεων που προκύπτουν από σφάλματα σελίδας και τη μεταφορά δεδομένων στο επίπεδο σελίδας, που συχνά υπερβαίνουν τις ανάγκες της GPU. Αντίθετα, το CXL επιτρέπει απευθείας πρόσβαση στα διευρυμένα αποθηκευτικά μέσα, μέσω εντολών φόρτωσης/αποθήκευσης, εξαλείφοντας τα παραπάνω ζητήματα.
Έτσι, οι χρόνοι εκτέλεσης του CXL-Proto είναι 1,94 φορές συντομότεροι από ό,τι της UVM. Η CXL-Opt που ανέπτυξε η Panmnesia περιορίζει ακόμη περισσότερο το χρόνο εκτέλεσης κατά 1,66 φορές, με ένα βελτιστοποιημένο ελεγκτή να επιτυγχάνει υστέρηση που μετριέται σε διψήφιο αριθμό νανοδευτερολέπτων, ενώ παράλληλα ελαχιστοποιεί την υστέρηση σε επίπεδο ανάγνωσης/εγγραφής. Το μοτίβο αυτό αποτυπώνεται επίσης σε μία ακόμη σειρά στοιχείων, που αποδίδουν τις τιμές IPC που καταγράφηκαν κατά την εκτέλεση των πυρήνων των GPU. Προκύπτει ότι το CXL-Opt της Panmnesia επιτυγχάνει ταχύτητες 3,22 φορές και 1,65 φορές ανώτερες των UVM και CΧL-Proto, αντίστοιχα.
Γενικά, η υποστήριξη του πρωτοκόλλου CXL μπορεί να βοηθήσει πολύ τις GPU που αναλαμβάνουν εργασίες ΑΙ και HPC, όμως οι επιδόσεις παραμένουν σημαντικό ζήτημα. Εκτός αυτού, πρέπει να φανεί στην πορεία αν εταιρίες όπως η AMD και η Nvidia αποφασίσουν να συμπεριλάβουν την υποστήριξη του CXL για τις GPU τους. Κι αν η τεχνολογία αυτή αποκτήσει δυναμική, δεν είναι βέβαιο αν οι κολοσσοί της αγοράς θα χρησιμοποιήσουν IP blocks από εταιρίες όπως η Panmnesia ή απλά θα αναπτύξουν δική τους τεχνολογία.
Διαβάστε ολόκληρο το άρθρο
- Δημοφιλέστερες Ειδήσεις Κατηγορίας Τεχνολογία
- Δημοφιλέστερες Ειδήσεις Insomnia
- Τελευταία Νέα Insomnia
- Μνήμες συνδεδεμένες μέσω PCIe και δίσκους SSD θα μπορούν να αξιοποιούν οι GPU προκειμένου να αυξήσουν τη VRAM τους
- Το iPhone 16 Pro θα αποκτήσει τηλεφακό με 5x οπτικό zoom
- Επιβεβαίωση ηλικίας και αποδείξεις πληρωμών θέλει να συνδυάσει το NFC Forum
- Νέο AI εργαλείο από το YouTube, αφαιρεί μουσική με πνευματικά δικαιώματα από τα βίντεό σας
- Ο Ίλον Μασκ εκτοξεύει απειλές κατά του Μπιλ Γκέιτς
- Η Ιαπωνία επικρατεί στο διετή "πόλεμο κατά των δισκετών"
- Το Fortnite επιστρέφει τους επόμενους 2 μήνες στο iPhone, φέρνοντας μαζί του και το Epic Games Store [Ενημέρωση]
- Το Fortnite επιστρέφει τους επόμενους 2 μήνες στο iPhone, φέρνοντας μαζί του και το Epic Games Store
- Η Sony ανακοινώνει το τέλος της παραγωγής εγγράψιμων Blu-ray δίσκων για καταναλωτές
- Η Stellantis συνεργάζεται με τη γαλλική CEA πάνω στην έρευνα για μπαταρίες ηλεκτρικών οχημάτων
- Τελευταία Νέα Κατηγορίας Τεχνολογία
- Καθαρίζουμε τις πέτρες στο PowerWash Simulator (First Steps Achievement/Trophy Guide)
- Ξανά στο επίκεντρο του ενδιαφέροντος η τηλεπαράλληλη βαρύτητα
- iPhone 16 Pro: Νέες φήμες ότι θα έχει την 5x τηλεφακό κάμερα του iPhone 15 Pro Max
- The Twisters: Ανεμοστρόβιλοι απειλούν να σαρώσουν τα πάντα στην ταινία της The Asylum (trailer)
- The Best Christmas Pageant Ever: Ατίθασα παιδιά θα διδάξουν το πνεύμα των Χριστουγέννων (trailer)
- Πώς να απελευθερώσετε το Returnal bot στο Astro's Playroom (Déjà phew! Trophy Guide)
- «Η ΕΕ με Απλά Λόγια» - Ελληνικό κανάλι για να κατανοήσεις την Ευρωπαϊκή Ένωση
- Σε λιγότερο από 1 χρόνο, το Threads αγγίζει 175 τους εκατ. χρήστες
- Σε ποιους αρέσει η ιδέα ενός αποσπώμενου keyboard για το Galaxy Z Fold 7;