Η Roblox αναπτύσσει ένα μοντέλο μετάφρασης για συνομιλία σε πραγματικό χρόνο

Η Roblox αναπτύσσει ένα μοντέλο μετάφρασης για συνομιλία σε πραγματικό χρόνο

Η Roblox αναπτύσσει ένα μοντέλο μετάφρασης για συνομιλία σε πραγματικό χρόνο PlatoBlockchain Data Intelligence. Κάθετη αναζήτηση. Ολα συμπεριλαμβάνονται.

Η Roblox, μια εταιρεία τυχερών παιχνιδιών, δημιουργεί ένα πολύγλωσσο μοντέλο μετάφρασης με τεχνητή νοημοσύνη (AI) για να διευκολύνει τις αλληλεπιδράσεις συνομιλίας σε πραγματικό χρόνο στην πλατφόρμα.

Η εταιρεία είπε σε ένα ανάρτηση ότι χρησιμοποίησε το μοντέλο μεγάλων γλωσσών (LLM) της Roblox με εξελιγμένες λειτουργίες για να φιλοξενήσει 16 γλώσσες για την παροχή της δυνατότητας. Χάρη στο εργαλείο μετάφρασης που βασίζεται στην τεχνητή νοημοσύνη, οι 70 εκατομμύρια καθημερινοί χρήστες του Roblox μπορούν να συνομιλούν μεταξύ τους σε πραγματικό χρόνο χωρίς καμία καθυστέρηση.

Πολύγλωσση μετάφραση

Ο Roblox's LLM φέρεται να πέτυχε το ορόσημο λόγω της ταχύτητας επεξεργασίας του, με λανθάνουσα κατάσταση κάτω από 100 χιλιοστά του δευτερολέπτου. Εκτός από την ταχύτητα επεξεργασίας της, η δυνατότητα AI υποστηρίζει «Γλώσσα, καθομιλουμένη και συντμήσεις ειδικά για το Roblox.

Η ανάπτυξη της Roblox έχει πολλαπλά πλεονεκτήματα στη δημιουργία μεμονωμένων LLM για κάθε ζεύγος γλωσσών, καθώς φιλοξενεί όλα τα ζεύγη γλωσσών σε μια ενιαία διεπαφή. Η ενοποιημένη μετάφραση που βασίζεται σε μετασχηματιστή προσφέρει οφέλη εξοικονόμησης χρόνου και κόστους, καθώς διατηρεί την ακρίβεια της μετάφρασης.

Σύμφωνα με τον Daniel Sturman, τον Chief Technology Officer της Roblox, αυτή η αρχιτεκτονική επιτρέπει την καλύτερη χρήση των πόρων, καθώς κάθε ειδικός έχει διαφορετική ειδικότητα, κάτι που οδηγεί σε πιο αποτελεσματική εκπαίδευση και συμπέρασμα χωρίς να θυσιάζεται η ποιότητα της μετάφρασης.

Ωστόσο, το LLM που αναπτύχθηκε εσωτερικά υποστηρίζει 16 γλώσσες, μεταξύ των οποίων Αγγλικά, Ιαπωνικά, Γαλλικά, Πολωνικά, Βιετναμέζικα, Ταϊλανδέζικα και πολλά άλλα, με γρήγορη μετάφραση μεταξύ οποιουδήποτε ζεύγους γλωσσών. Οι χρήστες μπορούν να δουν το αρχικό μήνυμα κάνοντας κλικ στο σύμβολο δίπλα στο όνομα του παίκτη, ενώ οι απαγορευμένες και καταραμένες λέξεις θα εξακολουθούν να μπλοκάρονται.

Το μοντέλο της Roblox

Μετά από πιο προσεκτική εξέταση, το μοντέλο του Roblox δείχνει ότι το ενοποιημένο σύστημα μπορεί να στηριχθεί στις ομοιότητες μεταξύ πολλών γλωσσών για να αυξήσει την ακρίβεια. Η προκαταρκτική έρευνα δείχνει ότι το μοντέλο μπορεί να προσδιορίσει με ακρίβεια τα δεδομένα σε διάφορες γλώσσες και να παρέχει μια αρκετά ολοκληρωμένη μετάφραση.

Η τεχνική ομάδα της Roblox χρησιμοποίησε διάφορα σύνολα δεδομένων εκπαίδευσης για να διασφαλίσει ότι το μοντέλο μετάφρασης ήταν καλά αναπτυγμένο. Η ομάδα ξεκίνησε με δεδομένα ανοιχτού κώδικα και πρόσθεσε αποτελέσματα μετάφρασης συνομιλίας και εσωτερικά δεδομένα, ενώ εξαρτιόταν από την πίσω μετάφραση για να χειριστεί περίπλοκα ζεύγη μετάφρασης.

Η Web3Η εταιρεία τυχερών παιχνιδιών με έδρα την εταιρεία είπε ότι για να διασφαλίσει μια ασφαλή εμπειρία παιχνιδιού για τους χρήστες, το LLM θα αποκλείει αυτόματα φράσεις που παραβιάζουν τις πολιτικές του.

Σύμφωνα με τον Sturman, η ασφάλεια και η ευγένεια βρίσκονται στην πρώτη γραμμή όλων όσων κάνουν στο Roblox, επομένως αυτό ήταν ένα ουσιαστικό κομμάτι του παζλ.

Τα αναπτυξιακά σχέδια της Roblox

Ο CTO της Roblox αποκάλυψε ότι η εταιρεία θα συλλέγει σταθερά σχόλια χρηστών για την πλατφόρμα για να βελτιώσει τη λειτουργία μετάφρασης που βασίζεται σε AI. Ενώ εξέταζε την προσθήκη νέων γλωσσών, η τεχνική ομάδα αποκάλυψε ότι θα γίνονται τακτικές ενημερώσεις για να συμβαδίζει με τη νέα αργκό.

Σύμφωνα με τον Sturman, η ελπίδα είναι τελικά το μοντέλο του μεταφραστή να περάσει απλώς από τη μετάφραση των συνομιλιών κειμένου. Πρόσθεσε ότι στο μέλλον, θα μπορούσαν να χρησιμοποιούν την τεχνητή νοημοσύνη για να μεταφράζουν μη συμμορφούμενες λέξεις σε συμβατές λέξεις ή να το ρίχνουν σε φωνητικές συνομιλίες για φωνητική μετάφραση σε πραγματικό χρόνο.

Άλλες εταιρείες αναπτύσσουν επίσης μοντέλα μετάφρασης AI. Το SeamlessM4T, ένας μεταφραστής ομιλίας σε κείμενο και κειμένου σε κείμενο που χειρίζεται σχεδόν 100 γλώσσες, κυκλοφόρησε από τη Meta.

Εκτός από τη μετάφραση σε περίπου 100 γλώσσες, το Universal Speech Model της Google έχει χρησιμοποιηθεί για τη μετάφραση υπότιτλων στο YouTube.

Σφραγίδα ώρας:

Περισσότερα από MetaNews