Η Meta, στρέφει φέτος το ενδιαφέρον της στις φωνητικές δυνατότητες της τεχνητής νοημοσύνης, ενισχύοντας τις προοπτικές δημιουργίας νέων εσόδων από αυτήν την ταχέως αναπτυσσόμενη τεχνολογία. Σύμφωνα με τους Financial Times, η εταιρεία σχεδιάζει να ενσωματώσει εξελιγμένες λειτουργίες φωνής στο Llama 4, το νέο μοντέλο ανοιχτού κώδικα μεγάλης γλώσσας, το οποίο αναμένεται να παρουσιαστεί μέσα στις επόμενες εβδομάδες.
Η Meta έχει δώσει ιδιαίτερη έμφαση στη βελτίωση της φυσικότητας των συνομιλιών μεταξύ χρηστών και φωνητικών μοντέλων, επιδιώκοντας μια πιο αμφίδρομη επικοινωνία που επιτρέπει παύσεις και φυσική ροή διαλόγου. «Πιστεύω ότι είναι τεράστια υπόθεση για το προϊόν, η ιδέα ότι μπορείς να μιλήσεις στο Διαδίκτυο και να το ρωτήσεις οτιδήποτε. Νομίζω ότι ακόμα προσπαθούμε να κατανοήσουμε το πόσο ισχυρό είναι αυτό», ανέφερε ο Chief Product Officer της Meta, Κρις Κοξ, αναλύοντας τα σχέδια για το Llama 4.
Η στροφή προς τις φωνητικές λειτουργίες αποτελεί μέρος της στρατηγικής του Ζάκερμπεργκ να καθιερώσει τη Meta ως ηγέτιδα δύναμη στην τεχνητή νοημοσύνη, ανταγωνιζόμενη κολοσσούς όπως η OpenAI, η Microsoft και η Google. Ο ίδιος έχει δηλώσει πως το 2025 θα είναι καθοριστική χρονιά για την τεχνητή νοημοσύνη και τα προϊόντα της.
Στο πλαίσιο αυτής της στρατηγικής, η Meta εξετάζει τη δοκιμαστική εισαγωγή premium συνδρομών για τον Meta AI, προσφέροντας υπηρεσίες όπως κρατήσεις και δημιουργία βίντεο. Επιπλέον, σύμφωνα με τους FT, η εταιρεία εξετάζει την εισαγωγή πληρωμένων διαφημίσεων και χορηγούμενων αναρτήσεων στα αποτελέσματα αναζήτησης του βοηθού AI της.
Παράλληλα, ο Ζάκερμπεργκ έχει ανακοινώσει την ανάπτυξη ενός βοηθού AI με ικανότητες κωδικοποίησης και επίλυσης προβλημάτων σε επίπεδο μηχανικού μεσαίου επιπέδου, μια τεχνολογία που εκτιμάται ότι θα έχει μεγάλη αγορά. Η OpenAI, από την πλευρά της, έχει ήδη κυκλοφορήσει λειτουργίες φωνής με ξεχωριστές προσωπικότητες, ενώ το Grok 3 της xAI του Έλον Μασκ έχει αρχίσει να δοκιμάζεται στην πλατφόρμα X.
Το Grok του Μασκ διακρίνεται για τη μειωμένη παρουσία προστατευτικών φίλτρων και μια «ασταθή λειτουργία» που επιτρέπει πιο προκλητικές και απρόβλεπτες απαντήσεις. Από την άλλη, η Meta έχει επίσης προχωρήσει στη δημιουργία μιας λιγότερο περιοριστικής έκδοσης του Llama 3, μετά από κριτική που δέχθηκε το Llama 2 για υπερβολικά ηθικολογική συμπεριφορά.
Με τη ραγδαία εξέλιξη της τεχνητής νοημοσύνης, η μάχη για την κυριαρχία στον χώρο της φωνητικής επικοινωνίας εντείνεται, διαμορφώνοντας μια νέα πραγματικότητα στον τρόπο που αλληλεπιδρούμε με την τεχνολογία.