Ο Έλληνας αστυνομικός που "εκπαίδευσε" αλγόριθμους για τα fake news της πανδημίας
Η πρώτη εντύπωση είναι ότι πρέπει να βουτήξεις σε έναν ωκεανό από λέξεις, «ψιθύρους» και «κραυγές», γραμμένες στο Twitter από χιλιάδες ανθρώπους που ποστάρουν με ρυθμό πολυβόλου και σε συνθήκη lockdown για τη μεγαλύτερη υγειονομική κρίση των τελευταίων δεκαετιών. Έπρεπε να γίνει ένα πρώτο ξεκαθάρισμα. Αρχικά, επιλέχθηκαν τα tweets με το hashtag #Covid19 που είχαν γραφτεί το διάστημα μεταξύ 1ης Νοεμβρίου και 31ης
Ο Γιώργος Λυγερός είναι αστυνομικός στην Υποδιεύθυνση Ασφάλειας της Πάτρας. Ένας από τους τομείς πάνω στους οποίους δουλεύει είναι η Δίωξη του Ηλεκτρονικού Εγκλήματος και είναι σύνδεσμος με την κεντρική υπηρεσία στην Αθήνα. Εκτός της Αστυνομίας, έχει σπουδές στη Διοίκηση Επιχειρήσεων και μέσα στην πανδημία ολοκλήρωσε ένα δεύτερο μεταπτυχιακό στο Τμήμα Μηχανικών Πληροφοριακών Συστημάτων του Πανεπιστημίου Αιγαίου. Στη διπλωματική του εργασία προσέγγισε υπολογιστικά τις ελληνικές δημοσιεύσεις στο Twitter που αφορούσαν την πανδημία.
Αυτήν την εβδομάδα, ο κ. Λυγερός πρόκειται να παρουσιάσει την έρευνα στο Βίλνιους της Λιθουανίας, στο συνέδριο της CEPOL, δηλαδή της ευρωπαϊκής Ακαδημίας για την εκπαίδευση των στελεχών των διωκτικών Αρχών. Λίγες μέρες πριν το συνέδριο, εξήγησε στο Magazine τον τρόπο με τον οποίο έγραψε και εκπαίδευσε αλγόριθμους μηχανικής μάθησης, ώστε να μπορούν να χαρακτηρίζουν, με σχετικά μεγάλη επιτυχία, ένα tweet για την Covid-19 ως «αληθινό», «ψευδές» ή «μη σχετικό» με την πανδημία.
«Το προηγούμενο διάστημα μεγάλος όγκος πληροφορίας στα social media αφορούσε fake news και θεωρίες συνωμοσίας για τον Covid-19, επομένως υπήρχε ερευνητικό αντικείμενο που ταυτόχρονα αφορούσε τη δημόσια υγεία», σημειώνει ο κ. Λυγερός. «Σκοπός της εργασίας είναι να περιοριστεί ο χρόνος που χρειάζεται κάποιος για να διαχωρίσει όλη αυτήν την πληροφορία», λέει ο ίδιος. Το εργαλείο γι’ αυτό ήταν η τεχνητή νοημοσύνη και η Μηχανική Μάθηση, δηλαδή αλγόριθμοι, τους οποίους, αν εκπαιδεύσεις με συγκεκριμένα γλωσσολογικά χαρακτηριστικά, μπορούν να αυτοματοποιήσουν τον εντοπισμό των ψευδών ειδήσεων.
Η δεξαμενή της μελέτης ήταν τα 61.147 ελληνικά tweets. Ο ερευνητής αστυνομικός έλαβε από το Twitter το αρχείο των μηνυμάτων σε κωδικοποιημένη μορφή αριθμών, επομένως έπρεπε να φτιάξει ένα εργαλείο στη γλώσσα προγραμματισμού Python για να διαβάσει λέξεις. Οι λέξεις βγάζουν πάντα νόημα. «Μέσω κατάλληλων συναρτήσεων επισημάνθηκαν 10.923 χαρακτηριστικά, τα οποία σχετίζονται με τη γλωσσική μορφολογία των tweets, την ανάλυση συναισθήματος, τη σπουδαιότητα ή το είδος των λέξεων που χρησιμοποιούνται», εξηγεί ο κ. Λυγερός.
Μέσω της Μηχανικής Υπολογιστών, ταξινομήθηκαν συνολικά 3.931 tweets ως «αληθινά», «ψευδή» και «μη σχετικά». Αυτά θα ήταν στο εξής ο μπούσουλας των «εκπαιδευμένων» αλγόριθμων για τον χαρακτηρισμό των υπολοίπων tweets. «Είναι η ίδια φιλοσοφία με την οποία λειτουργούν τα ρομπότ», λέει ο ερευνητής. Στην ταξινόμηση, όπως σημειώνει, υπάρχει πάντα το υποκειμενικό στοιχείο του ερευνητή, ο οποίος επιπλέον στη συγκεκριμένη περίπτωση δεν είναι ειδικός για την Covid-19. Αυτό μπορεί να έχει αντίκρισμα στα τελικά ευρήματα, όμως είναι πάντα μία πρόκληση.
«Αφού χαρακτηρίστηκε ένας επαρκής αριθμός από δεδομένα, στη συνέχεια για κάθε κατηγορία οπτικοποιήθηκαν οι πιο χαρακτηριστικές λέξεις σε wordclouds. Εξήχθη από αυτά ένα σύνολο από γλωσσικά μορφολογικά χαρακτηριστικά, εφαρμόζοντας μεθόδους μετατροπής των κειμένων σε διανύσματα, καθώς και χαρακτηριστικά σχετικά με την υποκειμενικότητα των κειμένων», λέει κ. Λυγερός.
Δεν υπάρχει απάντηση στο αυθόρμητο ερώτημα για τα πόσα από τα 61.147 ελληνικά tweets της πανδημίας που ελέγχθηκαν ήταν «αληθινά», «ψευδή» ή «μη σχετικά», επομένως σε τι ποσοστό τουιτάραμε fake news και θεωρίες συνωμοσίας. Αντί για απάντηση σε αυτό, ο κ. Λυγερός δείχνει στο Magazine ορισμένα γραφήματα, που μπορούν να γίνουν κατανοητά από κάποιον που δεν είναι εξοικειωμένος με τους αλγόριθμους και τη μηχανική μάθηση.
Ένα πρώτο συμπέρασμα είναι ότι όσο περισσότερες λέξεις έχει ένα tweet, τόσο αυξάνεται η πιθανότητα να είναι »ψευδές», το ίδιο και αν είναι γραμμένο με κεφαλαία ή έχει πολλά σημεία στίξης, για παράδειγμα θαυματιστικά. Επίσης, υπάρχουν οι λέξεις-κλειδιά που χτυπούν καμπανάκι στον εκπαιδευμένο αλγόριθμο. Ενδεικτικά, λέξεις όπως «πανδημία», «κρούσματα», «covid» ή «κορονοϊός», ήταν συχνότερες στα tweets που ταξινομήθηκαν ως «αληθή». Αντίθετα λέξεις όπως «εμβόλιο», «Ελλάδα», «μάσκα», «νεκρός» ή «εκκλησία», παραπέμπουν σε μεγαλύτερο ποσοστό σε «ψευδές» περιεχόμενο.
Ο ερευνητής αστυνομικός εκπαίδευσε τέσσερις αλγόριθμους Μηχανικής Μάθησης, ώστε να καταλήξει σε αυτόν που θα αξιολογούσε τα tweets με τη μεγαλύτερη αξιοπιστία. Όπως λέει, το υψηλότερο ποσοστό που πέτυχε ήταν στο 70%. Θεωρείται αρκετά ικανοποιητικό ποσοστό, με δεδομένο ότι αξιοποιήθηκαν μόνο γλωσσικά χαρακτηριστικά κι επιπλέον τα tweets ταξινομήθηκαν σε μικρό αριθμό κατηγοριών.
«Η επιλογή του Covid-19 ήταν σχετική, καθώς την περίοδο που έγινε η έρευνα μονοπωλούσε την επικαιρότητα η πανδημία. Η ίδια έρευνα μπορεί να εφαρμοστεί σε διαφορετικά θέματα, διότι χρησιμοποιήθηκαν αλγόριθμοι επεξεργασίας της φυσικής γλώσσας», λέει ο κ. Λυγερός. «Τα αποτελέσματα αποδεικνύουν ότι είναι εφικτή η αυτόματη ανίχνευση μη έγκυρης πληροφορίας σε δημοσιεύσεις στο Twitter, παρά τις ιδιαιτερότητες που χαρακτηρίζουν την ελληνική γλώσσα».
- Δημοφιλέστερες Ειδήσεις Κατηγορίας Ειδήσεις
- «Λαχτάρα» με την «πυραυλική» ανάδυση του υποβρυχίου ΠΙΠΙΝΟΣ
- Δεύτερη πιο νόστιμη κουζίνα στον κόσμο η ελληνική – Στη 17η θέση η τουρκική
- Έγκλημα σε ελβετικό σαλέ: Η μάχη μιας μητέρας για να τιμωρηθεί ο πλούσιος δολοφόνος του παιδιού της
- Κλέαρχος Μαρουσάκης: Παράταση στην κακοκαιρία - Οι δύο επικίνδυνες μέρες
- Ταϊλάνδη: Ψάρι πήδηξε από το νερό και καρφώθηκε στον λαιμό άνδρα!
- Καιρός: Προσοχή, έρχονται δύο δύσκολες ημέρες – «Εξαιρετικά επικίνδυνες συνθήκες»
- Έξαρση μωβ μεδουσών (Pelagia noctiluca)
- Θα μπλέξουμε άσχημα με τις "φορτωτικές" του Μητσοτάκη και του Παναγιωτόπουλου
- Τρόμος στον αέρα για αεροσκάφος που έκανε την πτήση Αθήνα – Θεσσαλονίκη
- Ευρυδίκη Παπαδοπούλου: Είχα καρκίνο στο τελευταίο στάδιο, κατάφερα να το ξεπεράσω
- Δημοφιλέστερες Ειδήσεις News 24|7
- Θα μπλέξουμε άσχημα με τις "φορτωτικές" του Μητσοτάκη και του Παναγιωτόπουλου
- Έρχεται σοκ και δέος, εκτός αν μας σώσει ο... Μαδούρο!
- Survivor Trailer: Ξεσπά η Βρισηίδα - "Δεν μπορώ να ακούω αυτά που λένε εδώ μέσα"
- Ο Έλληνας αστυνομικός που "εκπαίδευσε" αλγόριθμους για τα fake news της πανδημίας
- Δίκη προπονητή ιστιοπλοΐας: Ξανά στο βήμα του μάρτυρα η καταγγέλλουσα
- Καύσιμα, ενέργεια, στέγαση, τρόφιμα και επιτόκια απειλούν νοικοκυριά και επιχειρήσεις
- Η Underground Youth Orchestra ενώνει τις δυνάμεις της με την άλλη πλευρά του Ατλαντικού
- ΥΠΕΞ Γερμανίας: "Επισκέπτομαι έναν από τους στενότερους εταίρους μας στην Ευρώπη"
- Η αναπαραγωγή των κατσαρίδων πήρε παράξενη τροπή που τις κάνει πιο ανθεκτικές
- Προγράμματα "εξοικονομώ" με επιδότηση σε μικρομεσαίες επιχειρήσεις
![Έλληνας,ellinas](https://images32.inewsgr.com/4547/45478041/o-ellinas-astynomikos-pou-ekpaidefse-algorithmous-gia-ta-fake-news-tis-pandimias-160.jpg)
- Τελευταία Νέα News 24|7
- Ο Έλληνας αστυνομικός που "εκπαίδευσε" αλγόριθμους για τα fake news της πανδημίας
- Survivor Trailer: Ξεσπά η Βρισηίδα - "Δεν μπορώ να ακούω αυτά που λένε εδώ μέσα"
- Εισβολή στο Καπιτώλιο: Βαρύτατες κατηγορίες για 5 μέλη των Proud Boys
- Survivor: Αυτός είναι ο πρώτος υποψήφιος προς αποχώρηση
- Ζελένσκι: "Η Ουκρανία θα αποκτήσει σύντομα καθεστώς χώρας υποψήφιας προς ένταξη στην ΕΕ"
- ΥΠΕΞ Γερμανίας: "Επισκέπτομαι έναν από τους στενότερους εταίρους μας στην Ευρώπη"
- ΗΠΑ: Αγόρι 2 ετών σκότωσε κατά λάθος τον πατέρα του - Είχε αφήσει το όπλο στο δωμάτιο
- Ασπρόπυργος: Σε ύφεση η φωτιά σε εργοστάσιο πλαστικών
- Η Underground Youth Orchestra ενώνει τις δυνάμεις της με την άλλη πλευρά του Ατλαντικού
- Τελευταία Νέα Κατηγορίας Ειδήσεις
- Μαζί για τα επόμενα δυο χρόνια Παναθηναϊκός και Χουανκάρ!
- NATO should consider parting ways with Turkey
- Ασπρόπυργος: Σε ύφεση η φωτιά σε εργοστάσιο πλαστικών
- Κλέαρχος Μαρουσάκης: «Αυτές θα είναι οι δύο πιο επικίνδυνες ημέρες» της κακοκαιρίας
- Απλησίαστα πλέον σουβλάκι, πίτσα, μπέργκερ - Πικρός και ο καφές
- Καιρός σήμερα: Bροχές και καταιγίδες στο μεγαλύτερο μέρος της χώρας – Πού θα είναι ισχυρά τα φαινόμενα (Videos)
- Κίνηση τώρα: Στο «κόκκινο» από νωρίς ο Κηφισός – Η εικόνα στους υπόλοιπους δρόμους (live χάρτης)
- Βόλος: Κατήγγειλε τον άνδρα της για κακοποίηση της ίδιας και των παιδιών τους επειδή μιλούσε με άλλες στο Facebook