Τεχνητή νοημοσύνη: Εφαρμογή αναγνωρίζει και ψηφιοποιεί ιστορικά βιβλία γραμμένα σε πολυτονικό
Μια έξυπνη πλατφόρμα τεχνητής νοημοσύνης που στοχεύει στην ψηφιακή απεικόνιση και διαχείριση κειμένων ιστορικών ελληνικών βιβλίων, γραμμένων σε πολυτονικό σύστημα, ανέπτυξε η ομάδα Ψηφιακής Επεξεργασίας Εγγράφων του Εργαστηρίου Υπολογιστικής Ευφυίας του Εθνικού Κέντρου Έρευνας Φυσικών Επιστημών «Δημόκριτος».
Η εφαρμογή παρουσιάζεται στο «Athens Science Festival», που φιλοξενείται μέχρι αύριο Κυριακή 21 Απριλίου στην Τεχνόπολη του δήμου Αθηναίων.
Η πλατφόρμαΗ πλατφόρμα αναπτύχθηκε στο πλαίσιο του έργου
Με τη βοήθεια της εφαρμογής ερευνητές του Δημόκριτου ψηφιοποιούν και επανεκδίδουν ψηφιακά, περίπου 100 βιβλία από τα αρχεία του ΣΩΒ, τα οποία χρονολογούνται από τις αρχές του 20ου αιώνα και μετά. Ανάμεσα σε αυτά βρίσκονται το σύγγραμμα του Αδαμάντιου Κοραή «Επιστολαί προς τον Πρωτοψάλτην», που εκδόθηκε το 1911 και επανεκδόθηκε το 1959. Επίσης, το βιβλίο «Η ελληνικότης των νομών Προύσης και Σμύρνης» του Παντελή Κοντογιάννη, που πρωτοεκδόθηκε το 1919.
Στην εφαρμογή ανεβαίνουν εικόνες σκαναρισμένων βιβλίων και στη συνέχεια με τη βοήθεια της τεχνητής νοημοσύνης αναγνωρίζεται το κείμενο της κάθε εικόνας, ακόμα και αν είναι γραμμένο σε πολυτονικό σύστημα. Επίσης, στο στάδιο της προεπεξεργασίας της κάθε εικόνας, η εφαρμογή διορθώνει τα προβλήματα που μπορεί να έχει η εικόνα του βιβλίου, από το στραβό σκανάρισμα μέχρι τη διόρθωση ξεθωριασμένων σελίδων.
«Υπάρχει ένας τεράστιος όγκος βιβλίων που δεν είναι διαθέσιμα ψηφιακά και θέλουμε να τα κάνουμε διαθέσιμα, να βγάλουμε στην επιφάνεια τεκμήρια, τα οποία είναι στα ντουλάπια και τα ράφια βιβλιοθηκών. Οπότε ο στόχος μας είναι ιστορικά βιβλία να φτάσουν στο ευρύ κοινό και τους ερευνητές», εξηγεί στο ΑΠΕ-ΜΠΕ η Κατερίνα Χριστοπούλου, υποψήφια διδάκτορας Οικολογίας Τοπίου και επιστημονική συνεργάτιδα του «Δημόκριτου».
Εξηγώντας την αξία της εφαρμογής η κ. Χριστοπούλου επισημαίνει ότι «δεν βλέπουμε απλά ένα pdf με την εικόνα της σελίδας, αλλά η εικόνα έχει από πίσω την οπτική αναγνώριση χαρακτήρων (OCR), οπότε ο αναγνώστης μπορεί να χρησιμοποιήσει τμήματα του αρχείου ή να κάνει αναζήτηση μέσα σε αυτό». Η μεγάλη διαφορά όμως της εφαρμογής έγκειται «στην ανάγνωση του πολυτονικού συστήματος».
Δεν είναι η πρώτη φορά που το Εργαστήριο Υπολογιστικής Ευφυΐας του Ινστιτούτου Πληροφορικής και Τηλεπικοινωνιών του Δημόκριτου ασχολείται με την επεξεργασία και αναγνώριση ιστορικών εγγράφων. Σε αντίστοιχο έργο που υλοποίησε σε συνεργασία με το Πανεπιστήμιο Κύπρου προχώρησε στην ψηφιοποίηση με την ίδια μέθοδο πολυτονικών κειμένων από περίπου 150 εκδόσεις έργων του Σέξπιρ στα ελληνικά. Πρόκειται για μεταφράσεις που υπέγραψαν σπουδαίοι λογοτέχνες, όπως ο Κωνσταντίνος Καβάφης, ο Κωνσταντίνος Θεοτόκης και ο Δημήτριος Βικέλας, και οι οποίες προέρχονται μεταξύ άλλων από τις συλλογές της Βιβλιοθήκης της Βουλής, της Εθνικής Βιβλιοθήκης και του Ελληνικού Λογοτεχνικού και Ιστορικού Αρχείου.
Ένα από τα στοιχήματα που έχει βάλει το Εργαστήριο είναι η ψηφιακή απεικόνιση χειρογράφων. «Η αναγνώριση χειρογράφων στα σύγχρονα κείμενα έχει προχωρήσει πολύ. Αυτό που δεν είχε γίνει στο παρελθόν είναι κάποιο εργαλείο που να μπορεί να αναγνωρίσει τα παλιά χειρόγραφα και ιδίως τα ελληνικά πολυτονικά», εξηγεί στο ΑΠΕ-ΜΠΕ ο υπεύθυνος του Εργαστηρίου, Βασίλης Γάτος.
Αυτή την περίοδο βρίσκεται σε εξέλιξη έργο σε συνεργασία με την Τράπεζα της Ελλάδας για την αναγνώριση και επεξεργασία, και πάλι με τη βοήθεια τεχνητής νοημοσύνης, των χειρόγραφων πρακτικών του ΔΣ της Τράπεζας της περιόδου 1928-1988. Το αρχείο αριθμεί περίπου 30.000 σελίδες. «Είναι πολύ δύσκολο το πρόβλημα των χειρογράφων, αλλά κάτι που μας βοηθάει σε αυτή την περίπτωση είναι ότι οι γραφείς είναι συγκεκριμένοι όλα αυτά τα χρόνια, οπότε για κάθε γραφέα έχουμε χιλιάδες σελίδες και αυτό μας βοηθάει στο θέμα της εκπαίδευσης του συστήματος», τονίζει ο κ. Γάτος.
Σε παλιότερο έργο της, η ομάδα συνεργάστηκε με το Ίδρυμα της Μονής του Όρους Σινά με σκοπό την ανάπτυξη τεχνολογιών για αναζήτηση πληροφορίας απευθείας από τις εικόνες των χειρογράφων της Μονής. Στο πλαίσιο του έργου αναλύθηκαν και αναγνωρίστηκαν περισσότερες από 100.000 σελίδες ιστορικών χειρογράφων.
Σημειώνεται ότι στο «Athens Science Festival» θα παρουσιαστεί η δουλειά μιας ακόμα ερευνητικής ομάδας του ίδιου Εργαστηρίου του Δημόκριτου. Η ομάδα «AI4GEO» θα εξηγήσει πώς η παρατήρηση της Γης μέσω εφαρμογών τεχνητής νοημοσύνης «μεταμορφώνεται» σε ένα γιγάντιο άγρυπνο μάτι που μας βοηθά να ανακαλύψουμε πετρώματα και κοιτάσματα, να καταγράψουμε φυσικές καταστροφές ή να παρακολουθήσουμε τις εξελισσόμενες ανθρωπιστικές κρίσεις.
Διαβάστε περισσότερα στο iefimerida.gr
- Δημοφιλέστερες Ειδήσεις Κατηγορίας Ειδήσεις
- Μανώλης Τσικνάκης: Συγκλονίζει φαντάρος που υπηρετούσε μαζί του - «Δεν αυτοκτόνησε, τον δολοφόνησαν»
- Μαγειρέψτε τα αυγά υγιεινά. Το λάθος που ίσως κάνετε κι εσείς
- Καιρός: Πλημμύρες και διακοπές ρεύματος από την κακοκαιρία – Σε ποιες περιοχές χιόνισε
- Αγγελική Ηλιάδη: Υποψήφια ευρωβουλευτής μαζί με την Βέφα Αλεξιάδου σε κόμμα – έκπληξη
- Αμηχανία στον ΣΥΡΙΖΑ για το ευρωψηφοδέλτιο: Οι αιχμές Κασσελάκη για το θαύμα και το «Αλέξη έλα πάνω» στον Τσίπρα
- Νικόλαος - Τατιάνα Μπλάτνικ: Ο παραμυθένιος γάμος στις Σπέτσες, η κρίση και το διαζύγιο
- Θεωρείο: Τι δίνει δημοσκοπικά ο Μπελέρης
- Θα εκπλαγούμε στις ευρωεκλογές
- Νέο θρίλερ με τον φαντάρο που βρέθηκε νεκρός στη Ρω το 2018 - «Δεν αυτοκτόνησε, τον δολοφόνησαν»
- Εορτολόγιο: Ποιοι γιορτάζουν σήμερα 20 Απριλίου
- Δημοφιλέστερες Ειδήσεις iEfimerida
- The Line: Τέλος για το μεγαλεπήβολο έργο της Σ. Αραβίας; -«Περιλαμβάνει τεχνολογία που δεν υπάρχει»
- Ο Κάρολος λατρεύει τις γραβάτες του ελληνικού brand Thalassa Collection -Πώς έφθασαν στα χέρια του, η παραγγελία του παλατιού
- Ο Κασσελάκης σε κουβανέζικο μπαρ στου Ψυρρή με τους υποψήφιους ευρωβουλευτές του ΣΥΡΙΖΑ -Δείτε εικόνες
- Royal Couple Nikolaos and Tatiana Announce Divorce After 14 Years of Marriage
- «Σασμός»: Ποιοι ηθοποιοί της σειράς υπέκυψαν στις... σειρήνες της πολιτικής
- Νικόλαος Γλύξμπουργκ - Τατιάνα Μπλάτνικ: Από τον παραμυθένιο γάμο στις Σπέτσες, στο «βελούδινο» διαζύγιο
- Greece’s Credit Outlook Upgraded Amid Economic Recovery
- Τεχνητή νοημοσύνη: Εφαρμογή αναγνωρίζει και ψηφιοποιεί ιστορικά βιβλία γραμμένα σε πολυτονικό
- Greece grips with torrential rain
- Ουκρανία: Ρώσος δημοσιογράφος σκοτώθηκε στη Ζαπορίζια
- Τελευταία Νέα iEfimerida
- Τεχνητή νοημοσύνη: Εφαρμογή αναγνωρίζει και ψηφιοποιεί ιστορικά βιβλία γραμμένα σε πολυτονικό
- Παύλος Μαρινάκης: Ο Κασσελάκης έχει πολλά κοινά με τον Βελόπουλο -Τα λεφτόδεντρα τελείωσαν [βίντεο]
- Νικόλαος – Τατιάνα Μπλάτνικ: Η τελευταία δημόσια εμφάνισή τους πριν την ανακοίνωση του διαζυγίου
- Στην Τουρκία ο ηγέτης της Χαμάς για συνομιλίες με τον Ερντογάν, που διεκδικεί μεσολαβητικό ρόλο στο Παλαιστινιακό
- Αυγενάκης: Θα βοηθήσουμε στη σύσταση Διεπαγγελματικής Γραβιέρας Κρήτης ΠΟΠ
- Royal Couple Nikolaos and Tatiana Announce Divorce After 14 Years of Marriage
- Κίνητρα για συγχωνεύσεις επιχειρήσεων και αύξηση της απασχόλησης των γυναικών - Δύο παρεμβάσεις για την ανάπτυξη
- Τραγωδία στο Ρέθυμνο: Νεκρός 78χρονος, έπεσε από το μπαλκόνι του σπιτιού του
- Φιμέ τζάμια στο αυτοκίνητο - Πότε η Τροχαία σου παίρνει τις πινακίδες, ποιο είναι το πρόστιμο
- 3+1 eyeliners για εντυπωσιακό βλέμμα, που δεν θα «τρέξουν» ποτέ -Ακόμα και αν δακρύσετε ή ιδρώσετε
- Τελευταία Νέα Κατηγορίας Ειδήσεις
- Κοιμήθηκαν σε εκκλησία μετά την επίθεση που δέχθηκαν από τον γιο τους
- Τζέιμς Καφετζής: Η πρώτη συνάντηση με τον πατέρα του μετά το ναυάγιο στον Ειρηνικό Ωκεανό
- «Καλάθι του Πάσχα» και «Καλάθι των Νονών»: Πότε έρχονται, τι θα περιλαμβάνουν
- Δήμος Θεσσαλονίκης: Εκχωρεί υπηρεσία καθαριότητας σε ιδιώτη
- Σύμη: Βρέθηκαν 200.000 δολάρια σε κούτα που έπλεε σε θαλάσσια περιοχή του νησιού
- Ρωσικές βόμβες ολίσθησης συνθλίβουν την ουκρανική άμυνα
- Δείτε το πρόγραμμα της TV ολόκληρης της εβδομάδας
- Αλτσχάιμερ: Τα γνωστά φάρμακα που μπορούν να μειώσουν τον κίνδυνο
- Τα Ζώδια σήμερα: Σάββατο (20/4) – Ζυγοί ενισχύεται η ανάγκη σας για συντροφικότητα
- Τα ζώδια για σήμερα Σάββατο 20 Απριλίου 2024