Το VLC θα αποκτήσει σύντομα λειτουργία αυτόματης δημιουργίας υποτίτλων με τη βοήθεια του AI

Το VLC Media Player έφτασε το ορόσημο των 6 δισεκατομμυρίων λήψεων, όπως ανακοίνωσε η VideoLAN στην έκθεση CES 2025.

Η VideoLAN, ο μη κερδοσκοπικός οργανισμός πίσω από το VLC Media Player, ανακοίνωσε στην έκθεση CES 2025 ότι το δημοφιλές πρόγραμμα αναπαραγωγής πολυμέσων ανοιχτού κώδικα έχει ξεπεράσει τα 6 δισεκατομμύρια downloads.

Παράλληλα με αυτό το επίτευγμα, η ομάδα ανάπτυξης παρουσίασε τρεις νέες λειτουργίες τεχνητής νοημοσύνης που θα ενσωματωθούν στην εφαρμογή.

Το πρώτο και κυριότερο χαρακτηριστικό αφορά την αυτόματη δημιουργία υποτίτλων σε πραγματικό χρόνο, χρησιμοποιώντας μοντέλα τεχνητής νοημοσύνης ανοιχτού κώδικα. Η δεύτερη λειτουργία επικεντρώνεται στην αυτόματη μετάφραση των υποτίτλων σε περισσότερες από 100 γλώσσες, ενώ η τρίτη αφορά την ενσωμάτωση όλων των παραπάνω απευθείας στην εφαρμογή, χωρίς την ανάγκη σύνδεσης στο διαδίκτυο.

Ο Jean-Baptiste Kempf, πρόεδρος της VideoLAN, τόνισε ότι η νέα λειτουργία θα λειτουργεί τοπικά στον υπολογιστή του χρήστη, χωρίς να απαιτείται η χρήση υπηρεσιών cloud. Αυτή η προσέγγιση διαφοροποιείται από άλλες παρόμοιες υπηρεσίες, όπως το OpenAI Whisper, που βασίζονται σε διαδικτυακές υπηρεσίες για την αναγνώριση και μετατροπή ομιλίας σε κείμενο.

Η τεχνολογία που αναπτύσσεται υπόσχεται να υποστηρίξει διάφορες διαλέκτους και προφορές, αξιοποιώντας εκτενή σύνολα δεδομένων για την εκπαίδευση των μοντέλων τεχνητής νοημοσύνης. Η ενσωμάτωση αυτών των λειτουργιών στοχεύει στην εξυπηρέτηση χρηστών που επιθυμούν να απολαμβάνουν περιεχόμενο σε διαφορετικές γλώσσες, χωρίς την ανάγκη εγκατάστασης πρόσθετου λογισμικού.

Ωστόσο δε λείπουν ήδη οι πρώτες αμφιβολίες σχετικά με την ακρίβεια των υποτίτλων που παράγονται από την τεχνητή νοημοσύνη αφού παραμένει αδιευκρίνιστο ποια συγκεκριμένα μοντέλα ανοιχτού κώδικα θα χρησιμοποιηθούν και πώς θα αντιμετωπιστούν πιθανά προβλήματα ακρίβειας στη μετάφραση.

Οι τεχνικές απαιτήσεις του συστήματος αποτελούν επίσης θέμα συζήτησης, καθώς η επεξεργασία τεχνητής νοημοσύνης απαιτεί σημαντικούς υπολογιστικούς πόρους, με πιθανότερο την ύπαρξη υπολογιστή με NPU για βέλτιστη απόδοση.

Η VideoLAN δεν έχει ανακοινώσει συγκεκριμένη ημερομηνία κυκλοφορίας, αλλά διαβεβαιώνει ότι η αναβάθμιση θα διατεθεί δωρεάν στο εγγύς μέλλον.


Διαβάστε ολόκληρο το άρθρο

Keywords
Τυχαία Θέματα