Με αρκετό ενδιαφέρον περιμέναμε την ανακοίνωση των αναβαθμίσεων του ChatGPT από την OpenAI. Και πράγματι, πριν από μερικές ώρες, η εταιρεία προχώρησε στην παρουσίαση του GPT-4o, που αποτελεί μια ενημερωμένη έκδοση “πολύ ταχύτερη” με νέες δυνατότητες σε επίπεδο κειμένου, εικόνας και ήχου.
Πιο αναλυτικά, η εταιρεία γνωστοποίησε ότι η νέα έκδοση θα είναι δωρεάν για όλους τους χρήστες, αν και οι συνδρομητές των premium πακέτων θα απολαμβάνουν πρόσθετα προνόμια, όπως ίσχυε μέχρι σήμερα. Σύμφωνα με τα όσα ανέφερε ο διευθύνων σύμβουλος της OpenAI, Sam Altman, το μοντέλο είναι «multimodal εκ φύσεως» πράγμα που σημαίνει ότι μπορεί να δημιουργήσει περιεχόμενο ή να κατανοήσει φωνητικές εντολές, κείμενο ή εικόνες. Οι προγραμματιστές που θέλουν να ασχοληθούν με το GPT-4o θα έχουν πρόσβαση στο API, το οποίο προσφέρεται με μισή τιμή και διπλάσια ταχύτητα σε σχέση με το GPT-4 Turbo. Οι νέες δυνατότητες κειμένου και εικόνας είναι ήδη διαθέσιμες.
Νέα χαρακτηριστικά έρχονται και στη φωνητική λειτουργία του ChatGPT, καθώς η εφαρμογή θα μπορεί να λειτουργεί ως φωνητικός βοηθός φωνής σε πραγματικό χρόνο. Αυτό που φαίνεται αρκετά εντυπωσιακό είναι η φυσικότητα στην ομιλία, αφού στο νέο μοντέλο έχει προστεθεί τόνος και συναίσθημα, κάνοντας τη συνομιλία με το χρήστη να μοιάζει ανθρώπινη. Σε κάποιες περιπτώσεις, μπορεί και να φλερτάρει. Όπως δείχνουν σχετικά videos, η ΑΙ μπορεί να αλληλοεπιδρά με το χρήστη μέσω της κάμερας, ακόμη και τραγουδώντας…
Say hello to GPT-4o, our new flagship model which can reason across audio, vision, and text in real time: https://t.co/MYHZB79UqN
Text and image input rolling out today in API and ChatGPT with voice and video in the coming weeks. pic.twitter.com/uuthKZyzYx
— OpenAI (@OpenAI) May 13, 2024
Κατά τη διάρκεια μιας ζωντανής επίδειξης, χρησιμοποιώντας τη φωνητική έκδοση του GPT-4o, η OpenAI παρείχε χρήσιμες προτάσεις για το πώς αντιμετωπίζεται μια απλή εξίσωση που ήταν γραμμένη σε ένα φύλλο χαρτί, ανέλυσε κάποιον κώδικα υπολογιστή, μεταφράζοντας ανάμεσα σε Ιταλικά και Αγγλικά και ερμήνευσε τα συναισθήματα από μια selfie ενός χαμογελαστού άνδρα.
Χρησιμοποιώντας ζεστή, γυναικεία φωνή, το chat bot χαιρέτισε τους χρήστες, ρωτώντας τους “πώς τα πάνε”.