Το δικό της LLM και μάλιστα ανοιχτού κώδικα, το NVLM 1.0, παρουσιάζει η Nvidia
Η Nvidia. κορυφαία εταιρεία στον τομέα των GPU για τεχνητή νοημοσύνη, μπαίνει στο χώρο των LLM παρουσιάζοντας το NVLM 1.0, το οποίο μάλιστα ανήκει στην κατηγορία λογισμικού ανοιχτού κώδικα (open-source).
Σύμφωνα με το whitepaper που δημοσίευσε η εταιρεία, το κύριο μοντέλο NVLM-D-72B με 72 δισεκατομμύρια παραμέτρους
Οι ερευνητές της Nvidia υποστηρίζουν ότι η οικογένεια μεγάλων γλωσσικών μοντέλων του NVLM 1.0 πετυχαίνει κορυφαία αποτελέσματα σε εργασίες που συνδυάζουν όραση και γλώσσα, ανταγωνιζόμενη τόσο τα κορυφαία ιδιόκτητα μοντέλα (όπως το GPT-4o) όσο και τα ανοιχτού κώδικα μοντέλα (όπως το InternVL 2). Αξιοσημείωτο είναι ότι το NVLM 1.0 παρουσιάζει βελτιωμένες επιδόσεις και σε εργασίες που αφορούν μόνο κείμενο, σε σύγκριση με το βασικό LLM μοντέλο στο οποίο βασίστηκε.
Για να επιτύχουν αυτές τις επιδόσεις, οι ερευνητές της Nvidia ενσωμάτωσαν ένα υψηλής ποιότητας σύνολο δεδομένων κειμένου στην πολυτροπική εκπαίδευση, μαζί με ένα σημαντικό όγκο πολυτροπικών δεδομένων μαθηματικών και συλλογισμού. Αυτή η προσέγγιση οδήγησε σε ενισχυμένες δυνατότητες στα μαθηματικά και τον προγραμματισμό σε διάφορες μορφές εισόδου.
Το αποτέλεσμα είναι ένα μοντέλο γλώσσας μεγάλης κλίμακας (LLM) που μπορεί να εξηγήσει με την ίδια ευκολία γιατί ένα meme είναι αστείο και να επιλύσει πολύπλοκες μαθηματικές εξισώσεις, βήμα προς βήμα. Η Nvidia κατάφερε επίσης να αυξήσει την ακρίβεια του μοντέλου σε εργασίες αποκλειστικά κειμένου κατά μέσο όρο 4,3 μονάδες σε κοινά σημεία αναφοράς του κλάδου, χάρη στην πολυτροπική μέθοδο εκπαίδευσης.
Η εταιρεία φαίνεται να λαμβάνει σοβαρά υπόψη τον νέο ορισμό του "ανοιχτού κώδικα" από το Open Source Initiative. Όχι μόνο καθιστά διαθέσιμα τα βάρη εκπαίδευσης του μοντέλου για δημόσιο έλεγχο, αλλά υπόσχεται επίσης να δημοσιοποιήσει τον πηγαίο κώδικα του μοντέλου στο εγγύς μέλλον. Η προσέγγιση αυτή διαφέρει σημαντικά από τις ενέργειες ανταγωνιστών όπως η OpenAI και η Google, οι οποίες προστατεύουν τις λεπτομέρειες των βαρών και του πηγαίου κώδικα των LLM τους.
Με αυτόν τον τρόπο, η Nvidia τοποθετεί την οικογένεια NVLM όχι ως άμεσο ανταγωνιστή του ChatGPT-4o και του Gemini 1.5 Pro, αλλά ως θεμέλιο για τρίτους προγραμματιστές που επιθυμούν να αναπτύξουν τα δικά τους chatbots και εφαρμογές τεχνητής νοημοσύνης.
Η δυνατότητα του μοντέλου να χειρίζεται τόσο οπτικά όσο και γλωσσικά δεδομένα το καθιστά ιδιαίτερα ευέλικτο για ένα ευρύ φάσμα εφαρμογών. Από την ανάλυση εικόνων και την κατανόηση του περιεχομένου τους, μέχρι την επίλυση σύνθετων μαθηματικών προβλημάτων, το NVLM 1.0 φαίνεται να προσφέρει ένα ολοκληρωμένο πακέτο δυνατοτήτων, αποτελώντας μια εξαιρετική εναλλακτική σε ένα άλλο opensource LLM, το LLama της Meta.
Η απόφαση της Nvidia να διαθέσει το μοντέλο ως ανοιχτού κώδικα θα μπορούσε να επιταχύνει την έρευνα και την ανάπτυξη στον τομέα της τεχνητής νοημοσύνης, επιτρέποντας σε ερευνητές και προγραμματιστές να μελετήσουν, να βελτιώσουν και να προσαρμόσουν το μοντέλο για διάφορες εφαρμογές.
Σύμφωνα με την ανακοίνωση της Nvidia, το NVLM-D-72B μπορεί να εκτελέσει εργασίες "παραγωγικού επιπέδου πολυτροπικότητας", υποδηλώνοντας ότι είναι έτοιμο για χρήση σε πραγματικές εφαρμογές και όχι μόνο για ερευνητικούς σκοπούς.
Διαβάστε ολόκληρο το άρθρο
- Δημοφιλέστερες Ειδήσεις Κατηγορίας Τεχνολογία
- Τα ρολόγια Wear OS ίσως σύντομα να μπορούν να στέλνουν μηνύματα RCS χωρίς τη βοήθεια smartphone
- “Τα 40 έως 50 παιχνίδια PS5 Pro Enhanced κατά το λανσάρισμα της νέας κονσόλας δείχνουν την υψηλή εκτίμηση των developers”, λέει η Sony
- War Game: The Making of STALKER 2, ντοκιμαντέρ της GSC Game World για τη δημιουργία εν μέσω πολέμου (video)
- Warhammer 40K Space Marine 2 review
- Το δικό της LLM και μάλιστα ανοιχτού κώδικα, το NVLM 1.0, παρουσιάζει η Nvidia
- Δημοφιλέστερες Ειδήσεις Insomnia
- Τελευταία Νέα Insomnia
- Το δικό της LLM και μάλιστα ανοιχτού κώδικα, το NVLM 1.0, παρουσιάζει η Nvidia
- Η Google διαθέτει δωρεάν το Gemini Live σε όλους τους χρήστες Android
- Η αποτίμηση της OpenAI εκτοξεύεται στα 157 δισ. δολάρια μετά από εντυπωσιακό επενδυτικό γύρο
- Το χαρακτηριστικό Recall των Windows 11 επιστρέφει τον Νοέμβριο με έμφαση στην ασφάλεια και την ιδιωτικότητα
- Τρελή προσφορά φέρνει το MS Office 2021 Pro Plus σε ιστορικό χαμηλό με μόλις 31,75€, τα Windows 11 με 13,55€ κ.α
- Η Apple αποσύρεται από τις συνομιλίες για επένδυση στην OpenAI
- Η Apple αποσύρεται από τις συνομιλίες επένδυσης στην OpenAI
- Το iPhone SE 4 έρχεται το 2025 και θα διαθέτει νέο σχεδιασμό εμπνευσμένο από το iPhone 14
- Δικαστήριο απορρίπτει αγωγή κατά της Tesla για παραπλάνηση σχετικά με την αυτόνομη οδήγηση
- Όλες οι τελευταίες πληροφορίες για το Galaxy S25 Ultra της Samsung
- Τελευταία Νέα Κατηγορίας Τεχνολογία
- “Τα 40 έως 50 παιχνίδια PS5 Pro Enhanced κατά το λανσάρισμα της νέας κονσόλας δείχνουν την υψηλή εκτίμηση των developers”, λέει η Sony
- Warhammer 40K Space Marine 2 review
- Τα ρολόγια Wear OS ίσως σύντομα να μπορούν να στέλνουν μηνύματα RCS χωρίς τη βοήθεια smartphone
- War Game: The Making of STALKER 2, ντοκιμαντέρ της GSC Game World για τη δημιουργία εν μέσω πολέμου (video)
- Η Cloudflare αποκρούει επίθεση-ρεκόρ DDoS μεγέθους 3.8Tbps
- Public: φέρνουν ενεργειακές λύσεις για οικονομία στο ...
- To νέο οικοσύστημα της OnePlus στην ελληνική αγορά
- Aπογορεύουν ξανα την OnePlus να πουλά smartphones στη Γερμανία
- Το iPhone SE 4 αναμένεται στις αρχές του 2025 με υποστήριξη για Apple Intelligence
- iPhone 16 Pro Max: Τόσο κοστίζει στην Apple η κατασκευή του