Η νέα γενιά μοντέλων AI, όπως το ChatGPT και το Gen-4 της Runway, έχουν φέρει επανάσταση στην δημιουργία εικόνας και βίντεο, προκαλώντας ταυτόχρονα και αρκετές αντιπαραθέσεις. Με την ικανότητα να δημιουργούν βίντεο από απλές περιγραφές κειμένου και εικόνας, αυτά τα μοντέλα φέρνουν μια νέα διάσταση στην παραγωγή ταινιών και ειδικών εφέ. Το Gen-4, για παράδειγμα, έχει δείξει εξαιρετική ικανότητα στη σταθεροποίηση χαρακτήρων και σκηνών, κάτι που ήταν δύσκολο να επιτευχθεί με τα πρώτα μοντέλα.
Αυτό δημιουργεί ερωτήματα για την ασφαλή χρήση αυτών των εργαλείων, καθώς η δυνατότητα να παρακάμπτουν ζητήματα πνευματικών δικαιωμάτων και γενικής γνώσης καθιστά τα συστήματα αυτά επικίνδυνα, αν δεν ρυθμιστούν σωστά. Παράλληλα, παρατηρούνται προβλήματα απόδοσης με τις συχνές διακοπές της λειτουργίας του ChatGPT λόγω της αυξημένης χρήσης του από χρήστες που πειραματίζονται με τις δυνατότητες του εργαλείου.
Μια άλλη αξιοσημείωτη πρόοδος έρχεται από το MoCha AI της Meta, το οποίο αναπτύχθηκε σε συνεργασία με το Πανεπιστήμιο του Waterloo. Το MoCha μπορεί να δημιουργεί βίντεο με χαρακτήρες που φαίνεται να έχουν πλήρεις συνομιλίες με συγχρονισμένο ήχο, μια πρόοδος που εντυπωσιάζει σε live-action και κινούμενα σχέδια. Ωστόσο, οι κινήσεις του προσώπου και τα μάτια συχνά αποκαλύπτουν την τεχνητή φύση του βίντεο, κάτι που είναι εμφανές σε μεγαλύτερες οθόνες ή όταν κάποιος γνωρίζει τις δυνατότητες του εργαλείου.
Ανάλογα εργαλεία, όπως το Vasa-1 της Microsoft και το μοντέλο της Bytedance για βίντεο και κινούμενα σχέδια, φέρνουν επίσης την τεχνητή νοημοσύνη σε νέα επίπεδα. Παρά τις δυνατότητες τους, όμως, οι προκλήσεις που σχετίζονται με τη χρήση τους συνεχίζουν να υφίστανται, όπως οι ανησυχίες για κατάχρηση και παραποίηση περιεχομένου.