Η OpenAI παρουσιάζει τα νέα μοντέλα τεχνητής νοημοσύνης o3 και o3-mini

Η OpenAI ανακοίνωσε τα νέα μοντέλα τεχνητής νοημοσύνης o3 και o3-mini, τα οποία χρησιμοποιούν την καινοτόμο τεχνολογία "private chain of thought".

Κατά τη διάρκεια της 12ης ημέρας του "12 days of OpenAI", ο διευθύνων σύμβουλος της OpenAI, Sam Altman, ανακοίνωσε τα νέα μοντέλα τεχνητής νοημοσύνης "συλλογισμού", o3 και o3-mini. Σύμφωνα με το The Information, η εταιρεία επέλεξε το όνομα "o3" αντί για "o2" για να αποφύγει πιθανές συγκρούσεις εμπορικών σημάτων με τον βρετανικό πάροχο τηλεπικοινωνιών O2.

Τα νέα μοντέλα χρησιμοποιούν μια καινοτόμο τεχνολογία που η OpenAI ονομάζει "private chain of thought", όπου το μοντέλο σταματά για να εξετάσει τον εσωτερικό του διάλογο και να σχεδιάσει μπροστά πριν απαντήσει. Αυτή η προσέγγιση αποτελεί μια μορφή τεχνητής νοημοσύνης που υπερβαίνει τα βασικά μοντέλα μεγάλης γλώσσας (LLMs).

Η OpenAI αναφέρει ότι το μοντέλο o3 πέτυχε ρεκόρ στο σημείο αναφοράς ARC-AGI, ένα τεστ οπτικού συλλογισμού που παρέμενε αήττητο από το 2019. Σε σενάρια χαμηλής υπολογιστικής ισχύος, το o3 σημείωσε 75,7%, ενώ σε δοκιμές υψηλής υπολογιστικής ισχύος έφτασε το 87,5% - συγκρίσιμο με την ανθρώπινη απόδοση στο όριο του 85%.



Επιπλέον, το o3 σημείωσε εντυπωσιακή επίδοση 96,7% στην Αμερικανική Εξέταση Μαθηματικών 2024, χάνοντας μόνο μία ερώτηση. Στο GPQA Diamond, που περιλαμβάνει ερωτήσεις μεταπτυχιακού επιπέδου σε βιολογία, φυσική και χημεία, το μοντέλο πέτυχε 87,7%. Στο Frontier Math της EpochAI, το o3 έλυσε το 25,2% των προβλημάτων, ενώ κανένα άλλο μοντέλο δεν είχε ξεπεράσει το 2%.

Το o3-mini, που ανακοινώθηκε επίσης την Παρασκευή, διαθέτει μια προσαρμοστική λειτουργία χρόνου σκέψης, προσφέροντας χαμηλές, μεσαίες και υψηλές ταχύτητες επεξεργασίας. Η OpenAI αναφέρει ότι οι υψηλότερες ρυθμίσεις υπολογισμού παράγουν καλύτερα αποτελέσματα.

Η ανακοίνωση έρχεται εν μέσω αυξανόμενου ενδιαφέροντος για μοντέλα προσομοιωμένου συλλογισμού, με την Google να ανακοινώνει το Gemini 2.0 Flash Thinking Experimental, τη DeepSeek να λανσάρει το DeepSeek-R1, και την ομάδα Qwen της Alibaba να κυκλοφορεί το QwQ.



Σύμφωνα με τον Sam Altman, η εταιρεία σχεδιάζει να διαθέσει το o3-mini στα τέλη Ιανουαρίου, με το o3 να ακολουθεί σύντομα μετά, αφού πρώτα διατεθούν στους ερευνητές ασφαλείας για δοκιμές.


Διαβάστε ολόκληρο το άρθρο

Keywords
Τυχαία Θέματα
  • Δημοφιλέστερες Ειδήσεις Insomnia