Αποκρυπτογράφηση «νεκρών» γλωσσών με τη βοήθεια της τεχνητής νοημοσύνης
Ερευνητές στο Εργαστήριο Επιστήμης Υπολογιστών και Τεχνητής Νοημοσύνης του MIT (CSAIL) ανέπτυξαν σύστημα τεχνητής νοημοσύνης που μπορεί να αποκρυπτογραφήσει μια «νεκρή γλώσσα» χωρίς να χρειάζεται να γνωρίζει τη σχέση της με άλλες γλώσσες, ενώ μπορεί να προσδιορίσει με ακρίβεια τις γλωσσικές οικογένειες.
Για να επιβεβαιώσει την αποτελεσματικότητα του συστήματος, η ομάδα εφάρμοσε τον αλγόριθμό της στην Ιβηρική γλώσσα, λαμβάνοντας υπόψη τα Βασκικά. Όμως, ενώ τα Βασκικά και τα Λατινικά ήταν πιο κοντά στην Ιβηρική γλώσσα συγκριτικά με άλλες,
Απώτερος στόχος της ομάδας είναι να μπορεί το σύστημα να αποκρυπτογραφήσει τις νεκρές γλώσσες, χρησιμοποιώντας μόνο μερικές χιλιάδες λέξεις. Με επικεφαλής την καθηγήτρια του MIT Regina Barzilay ειδική στην επεξεργασία φυσικών γλωσσών, το έργο αξιοποιεί διάφορες αρχές που βασίζονται σε γνώσεις από την ιστορική γλωσσολογία.
Για παράδειγμα, ενώ μια δεδομένη γλώσσα σπάνια προσθέτει ή διαγράφει έναν ολόκληρο ήχο, είναι πιθανό να υπάρξουν ορισμένες αντικαταστάσεις. Μια λέξη που περιέχει το γράμμα «p» στη μητρική γλώσσα μπορεί να αλλάξει σε «b» στη μετεξελιγμένη γλώσσα.
Η Barzilay και η διδακτορική φοιτήτρια στο MIT Jiaming Luo ανέπτυξαν έναν αλγόριθμο αποκρυπτογράφησης που μπορεί να χειριστεί τον τεράστιο αριθμό πιθανών μετασχηματισμών μιας γλώσσας, ενώ μαθαίνει να ενσωματώνει γλωσσικούς ήχους σε έναν πολυδιάστατο χώρο όπου οι διαφορές στην προφορά αντικατοπτρίζονται στην απόσταση μεταξύ των αντίστοιχων διανυσμάτων.
Αυτός ο σχεδιασμός επιτρέπει στο σύστημα να συλλάβει μοτίβα αλλαγής γλώσσας και να τα εκφράζει ως υπολογιστικούς περιορισμούς. Το μοντέλο που προκύπτει μπορεί να χωρίσει τις λέξεις μιας αρχαίας γλώσσας και να τις χαρτογραφήσει σε διάφορες αντίστοιχες σημερινές ενεργές γλώσσες.
Το έργο βασίζεται σε μια εργασία που επιμελήθηκαν η Barzilay και η Luo πέρυσι όταν αποκρυπτογράφησαν τις «νεκρές γλώσσες» Ugaritic και Γραμμική B. Ωστόσο, μια βασική διαφορά μεταξύ των δυο έργων είναι ότι η ομάδα γνώριζε ότι οι δυο αυτές γλώσσες σχετίζονται με πρώιμες μορφές εβραϊκών και ελληνικών, αντίστοιχα.
Μελλοντικά, η ομάδα ελπίζει να επεκτείνει την έρευνά της πέρα από τη σύνδεση κειμένων με σχετικές λέξεις σε μια γνωστή γλώσσα. Η νέα προσέγγιση θα περιλαμβάνει τον προσδιορισμό σημασιολογικής έννοιας των λέξεων, ακόμη και αν δεν ξέρουν πώς να τις διαβάσουν οι ερευνητές.
«Για παράδειγμα, μπορεί να εντοπίσουμε όλες τις αναφορές σε άτομα ή τοποθεσίες στο έγγραφο, οι οποίες στη συνέχεια μπορούν να διερευνηθούν περαιτέρω υπό το φως των γνωστών ιστορικών στοιχείων», εξηγεί η Barzilay. «Αυτές οι μέθοδοι αναγνώρισης οντοτήτων χρησιμοποιούνται συνήθως σε διάφορες εφαρμογές επεξεργασίας κειμένου και είναι πολύ ακριβείς, αλλά το βασικό ερευνητικό ερώτημα είναι αν η εργασία είναι εφικτή χωρίς δεδομένα εκπαίδευσης στην εκάστοτε αρχαία γλώσσα».
Το έργο υποστηρίχθηκε εν μέρει από το Intelligence Advanced Research Projects Activity (IARPA).
ΠΗΓΗ: MIT
www.ert.gr
- Δημοφιλέστερες Ειδήσεις Κατηγορίας Ειδήσεις
- Αδίστακτοι: Οι Τούρκοι… βύθισαν το «Καλλιστώ» του Πολεμικού Ναυτικού!
- Άγριες Μέλισσες: Η ώρα μηδέν για τις αδελφές Σταμίρη έφτασε
- Προσλήψεις: Προκήρυξη για θέσεις εργασίας στην περιφέρεια Αττικής
- Νέα καταδίκη για τον Άκη Τσοχατζόπουλο, τη Βίκυ Σταμάτη και τον Νίκο Ζήγρα
- Σύγκρουση πλοίων στον Πειραιά: Εικόνες από drone με τις ζημιές στο ναρκοθηρευτικό Καλλιστώ
- Αλλάζει ώρα το «Pop Up» - Καραμπόλα στο πρόγραμμα του Alpha...
- Αποσύρεται λόγω κορονοϊού ο φτωχότερος πρόεδρος του κόσμου
- GNTM 3: Αποχώρησε ο Τσεντολίνι μετά το ατύχημα - ΒΙΝΤΕΟ
- «Ήλιος»: Οι εξελίξεις σοκάρουν
- Φωτιά στη Θήβα
- Δημοφιλέστερες Ειδήσεις ΕΡΤ
- Φωτιά στη Θήβα
- Αυγενάκης: «Υλοποιούμε την εντολή του ελληνικού λαού για διαφάνεια»
- Αποκρυπτογράφηση «νεκρών» γλωσσών με τη βοήθεια της τεχνητής νοημοσύνης
- Κορονοϊός: Οι ιλιγγιώδεις αριθμοί κρουσμάτων και θανάτων στις χώρες του πρώην Ανατολικού Μπλοκ
- Άνοιξαν τις στρόφιγγες χρηματοδότησης οι τράπεζες – 623 εκατ. ευρώ νέα δάνεια τον Σεπτέμβριο
- Δήμος Σερρών: Πρόστιμα για τα ογκώδη απορρίμματα στους κοινόχρηστους χώρους
- 229.000 τόνοι πλαστικών διαρρέουν στη Μεσόγειο Θάλασσα κάθε χρόνο – Αίγυπτος, Ιταλία και Τουρκία, οι μεγαλύτεροι ρυπαντές
- Κριτική ΣΥΡΙΖΑ Χίου για δηλώσεις Δημάρχου για κλειστή δομή προσφύγων- μεταναστών
- Οι Έλληνες του κόσμου γιορτάζουν την 80η επέτειο του θρυλικού OXI στην ERT World
- Roboat II: Το αυτόνομο σκάφος του MIT στα κανάλια του Άμστερνταμ
- Τελευταία Νέα ΕΡΤ
- Αποκρυπτογράφηση «νεκρών» γλωσσών με τη βοήθεια της τεχνητής νοημοσύνης
- Οι Έλληνες του κόσμου γιορτάζουν την 80η επέτειο του θρυλικού OXI στην ERT World
- Έλα Φιτζέραλντ: Βρέθηκε η «χαμένη ηχογράφηση» της συναυλίας στο Βερολίνο
- Διαδικτυακή διημερίδα για το δημοκρατικό σχολείο σε περιόδους κρίσης
- Eurostat: Καλή η επίδοση της Ελλάδας στην προστασία της εργασίας εν μέσω πανδημίας
- Άνοιξαν τις στρόφιγγες χρηματοδότησης οι τράπεζες – 623 εκατ. ευρώ νέα δάνεια τον Σεπτέμβριο
- 70% πτώση στον παγκόσμιο τουρισμό λόγω της πανδημίας
- Λυγουριό: Θετικός στον κορονοϊό μαθητής του Λυκείου
- Πρόεδρος της Δημοκρατίας: «Όλα είναι δυνατά και στις πιο δύσκολες συνθήκες αρκεί να το προσπαθούμε όλοι μαζί» (video)
- Αυγενάκης: «Υλοποιούμε την εντολή του ελληνικού λαού για διαφάνεια»
- Τελευταία Νέα Κατηγορίας Ειδήσεις
- Ανοίγοντας μια κονσέρβα χωρίς ανοιχτήρι
- Μειώθηκε η εμπιστοσύνη στους ειδησεογραφικούς οργανισμούς την περίοδο της πανδημίας
- Κόντρα Κοντοζαμάνη – Ξανθού στη Βουλή με αφορμή την Πρωτοβάθμια Φροντίδα και τα Κέντρα Υγείας
- Eurostat: Η Ελλάδα έχασε λιγότερες θέσεις εργασίας, συγκριτικά με άλλες χώρες, εν μέσω κορωνοϊού
- Κοροναϊός: Πολύ πάνω από τα 1.000 νέα κρούσματα αναμένονται για σήμερα
- Τόνια Κούμπα: Γι’ αυτό αποχώρησα από την εκπομπή της Αννίτας Πάνια
- Αυτός είναι ο βασικός ύποπτος για το διπλό φονικό στα Χανιά
- Στο Ναύσταθμο της Σαλαμίνας το «Καλλιστώ»
- Κορωνοϊός – Γερμανία: Για 20.000 κρούσματα τη μέρα προειδοποιεί η κυβέρνηση