Google και Harvard δημιουργούν τεράστια βάση δεδομένων με 1 εκ. βιβλία, δημόσια διαθέσιμα για εκπαίδευση AI μοντέλων
Το Πανεπιστήμιο Harvard Ανοίγει Νέους Ορίζοντες στην Εκπαίδευση Τεχνητής Νοημοσύνης
Το Πανεπιστήμιο Harvard, αναγνωρίζοντας τη μεταβαλλόμενη δυναμική στον τομέα της τεχνητής νοημοσύνης, ανακοίνωσε την Πέμπτη μια πρωτοποριακή πρωτοβουλία. Μέσω του νεοσύστατου Institutional Data Initiative, το πανεπιστήμιο διαθέτει ένα εκατομμύριο βιβλία για την εκπαίδευση μοντέλων τεχνητής νοημοσύνης, με την υποστήριξη κολοσσών όπως η Microsoft και η OpenAI.
Η συλλογή, που προέρχεται από ψηφιοποιήσεις του Google Books, περιλαμβάνει έργα των οποίων τα πνευματικά δικαιώματα έχουν λήξει. Το περιεχόμενο καλύπτει ένα εντυπωσιακό εύρος, από κλασικά αριστουργήματα των Shakespeare, Dickens και Dante μέχρι εξειδικευμένα τσεχικά εγχειρίδια μαθηματικών και ουαλικά λεξικά τσέπης.
Η πρωτοβουλία έρχεται σε μια κρίσιμη στιγμή για τον κλάδο της τεχνητής νοημοσύνης. Τα θεμελιώδη γλωσσικά μοντέλα, όπως το ChatGPT, απαιτούν τεράστιους όγκους ποιοτικού κειμένου για την εκπαίδευσή τους. Όσο περισσότερες πληροφορίες επεξεργάζονται, τόσο καλύτερα αποδίδουν στη μίμηση ανθρώπινης συμπεριφοράς και στην παροχή γνώσεων.
Ωστόσο, η αυξανόμενη ανάγκη για δεδομένα έχει οδηγήσει σε νομικές διαμάχες. Μεγάλοι εκδοτικοί οίκοι, συμπεριλαμβανομένων των Wall Street Journal και New York Times, έχουν προσφύγει στη δικαιοσύνη κατά της OpenAI και της Perplexity για μη εξουσιοδοτημένη χρήση του περιεχομένου τους.
Οι υπερασπιστές των εταιρειών τεχνητής νοημοσύνης προβάλλουν το επιχείρημα ότι η διαδικασία μάθησης των ΑΙ μοντέλων προσομοιάζει την ανθρώπινη εκπαίδευση. Όπως οι άνθρωποι μελετούν, διαβάζουν και συνθέτουν νέο περιεχόμενο, έτσι και τα ΑΙ μοντέλα επεξεργάζονται και αξιοποιούν υπάρχουσες πηγές.
Παράλληλα, παρατηρείται μια αυξανόμενη τάση προστασίας των δεδομένων από πλατφόρμες κοινωνικής δικτύωσης. Το Reddit έχει συνάψει συμφωνίες εκατομμυρίων με τη Google, ενώ το X διατηρεί αποκλειστική συνεργασία με την xAI του Elon Musk για την εκπαίδευση μοντέλων τεχνητής νοημοσύνης.
Ειδικοί του κλάδου επισημαίνουν ότι παρά τον εντυπωσιακό αριθμό, το ένα εκατομμύριο βιβλία δεν επαρκεί για τις σύγχρονες ανάγκες εκπαίδευσης ΑΙ. Τα παλαιότερα κείμενα στερούνται σύγχρονης ορολογίας και εκφράσεων, ιδιαίτερα της γλώσσας που χρησιμοποιεί η Γενιά Ζ.
Η αγορά αδειών χρήσης σύγχρονου περιεχομένου αναμένεται να αποτελέσει μια ραγδαία αναπτυσσόμενη βιομηχανία. Αναλυτές προβλέπουν ότι μέχρι το 2026, η αξία της αγοράς δεδομένων για εκπαίδευση ΑΙ θα ξεπεράσει τα 10 δισεκατομμύρια δολάρια ετησίως.
Οι εταιρείες τεχνητής νοημοσύνης αναζητούν συνεχώς τρόπους διαφοροποίησης των μοντέλων τους μέσω αποκλειστικών πηγών δεδομένων. Η πρωτοβουλία του Harvard προσφέρει μια νόμιμη βάση εκκίνησης, αλλά η μάχη για πρόσβαση σε σύγχρονο περιεχόμενο μόλις αρχίζει.
Η πρωτοβουλία του Harvard έχει ήδη προσελκύσει το ενδιαφέρον άλλων ακαδημαϊκών ιδρυμάτων, με το MIT και το Stanford να εξετάζουν παρόμοιες δράσεις για το 2025.
Διαβάστε ολόκληρο το άρθρο
- Δημοφιλέστερες Ειδήσεις Κατηγορίας Τεχνολογία
- Δημοφιλέστερες Ειδήσεις Insomnia
- Τελευταία Νέα Insomnia
- Το πείραμα που άλλαξε την άποψη ενός flat earther για τον 24ωρο ήλιο
- Η Lenovo ετοιμάζει φορητή παιχνιδοκονσόλα με λειτουργικό SteamOS
- Η Apple σταματά την πώληση των iPhone 14 και SE στην Ευρωπαϊκή Ένωση
- Πέντε νέες υπηρεσίες για τους πελάτες της ΔΕΗ έρχονται το 2025
- Iris 2: Η Ευρωπαϊκή Ένωση ανακοίνωσε επίσημα τον ανταγωνιστή του Starlink με 290 δορυφόρους
- Μαγικά Χριστούγεννα με τη HUAWEI: Τα δώρα που όλοι θα λατρέψουν
- Ξεκίνησαν οι αιτήσεις για το πρόγραμμα Ψηφιακά Εργαλεία ΜμΕ Β'
- Η Microsoft εγκαταλείπει τους αποκλειστικούς τίτλους του Xbox
- Η ομάδα Trump στηρίζει τη θέση της Tesla για τις αναφορές ατυχημάτων αυτόνομων οχημάτων
- Τελευταία Νέα Κατηγορίας Τεχνολογία
- HUAWEI WATCH GT5 Series: Ευτυχισμένο το 2025 με ένα GT5!
- Δημιουργός του Unpacking καταγγέλλει τη Nintendo για «φθηνές απομιμήσεις» στο eShop
- Ελέγξτε εάν έχετε στο συρτάρι σας παλιά τηλέφωνα, αξίζουν μια περιουσία
- To Alan Wake 2 σας επιτρέπει να απενεργοποιήσετε το PSSR στο PlayStation 5 Pro
- Αναβαθμισμένο πρότυπο HDMI φέρνει το 2025
- Νέος Κανονισμός εξέτασης παραπόνων για ταχυδρομικές υπηρεσίες
- Silo: Ανανεώθηκε για 3η και 4η (και τελευταία) σεζόν!
- Το Papaki βραβεύτηκε ως Digital Provider of the Year 2024
- Η Huawei δημιουργεί Ευρωπαϊκό Κόμβο Logistics στην Ελλάδα: Ένα σημαντικό βήμα για τη διεθνή εφοδιαστική αλυσίδα της εταιρείας