Η OpenAI ανακοίνωσε σήμερα τη νέα έκδοση του ChatGPT, που θεωρείται από τους δημιουργούς της ως η πιο προηγμένη μορφή τεχνητής νοημοσύνης.
Το GPT-4o φέρνει τον άνθρωπο ένα (μεγάλο) βήμα πιο κοντά στην αλληλεπίδραση με τις μηχανές, μιας και το συγκεκριμένο λογισμικό μπορεί να χρησιμοποιήσει κάθε κείμενο, κάθε ήχο και φωτογραφία και να δημιουργήσει υλικό και με τις τρεις αυτές μορφές συνδυαστικά. Πλέον αυτές οι τρεις δυνατότητες ενυπάρχουν σε ένα λογισμικό, το οποίο μάλιστα είναι αρκετά γρήγορο στις απαντήσεις του. Το τελικό αποτέλεσμα δεν θυμίζει απλώς τη Siri ή την Alexa, καθώς ο τρόπος με τον οποίο αλληλεπιδρά το λογισμικό με τον άνθρωπο – ή με άλλο λογισμικό – είναι πηγαίος, σαν να πρόκειται για έναν συνομιλητή άνθρωπο, ο οποίος μάλιστα έχει καλλιεργημένες ικανότητες επικοινωνίας.
Το νέο μοντέλο παρουσιάστηκε μέσα από μια σειρά βίντεο, το πιο εντυπωσιακό από τα οποία ήταν αυτό όπου το λογισμικό συνομιλεί με ένα άλλο λογισμικό.
Ένας χρήστης ανοίγει το πρώτο λογισμικό μέσα σε έναν υλικό φορέα που μπορεί να το υποστηρίξει, του κάνει κάποιες ερωτήσεις, αυτό απαντάει και στη συνέχεια του δίνει τη δυνατότητα να μιλήσει με ένα άλλο λογισμικό. Τόσο στη μία επικοινωνία, όσο και στην άλλη, τα αποτελέσματα είναι εντυπωσιακά και, δεν θα το κρύψουμε, λίγο τρομακτικά.
Η εταιρεία υποστηρίζει ότι υπάρχουν δικλείδες ασφαλείας για τη λειτουργία του GPT-4o, όπως διάφορα φίλτρα πληροφοριών, ενώ η συμπεριφορά του βρίσκεται υπό παρακολούθηση για να μπορεί να εκπαιδευτεί από την αρχή, αν χρειαστεί να διορθωθούν κάποια πράγματα στη χρήση του. Για τη διαμόρφωση του λογισμικού χρειάστηκε η συμβολή πάνω από 70 ειδικών στους τομείς της ψυχολογίας και της κοινωνιολογίας, που προσπάθησαν να εκτιμήσουν τους κινδύνους που μπορεί να προκύψουν από τη χρήση του. Ο αριθμός των ειδικών είναι εντυπωσιακός, το ίδιο και η προετοιμασία που έκαναν μέχρι το λανσάρισμα του προϊόντος, ωστόσο η εταιρεία παραδέχεται ότι το ρίσκο σε επίπεδο κυβερνοασφάλειας και λειτουργίας με αυτονομία παραμένει σε μεσαίο επίπεδο.
Το νέο λογισμικό έχει περιορισμένο αριθμό φωνών, κάτι που σημαίνει ότι δεν μπορεί να μιλήσει με νέα φωνή και να παραπλανήσει κάποιον χρήστη ως προς την ταυτότητά του, αλλά όπως μπορείτε να δείτε στο παρακάτω βίντεο, με αυτές τις φωνές μπορεί να τραγουδήσει και να γελάσει.
Εσείς θα το χρησιμοποιούσατε;