Τελευταία αναβάθμιση του ChatGPT: Αναγνώριση ομιλίας, ακρόασης και εικόνας

Ο ταχέως εξελισσόμενος τομέας της δημιουργικής τεχνητής νοημοσύνης (ΤΝ) γνώρισε μια σημαντική εξέλιξη με την εισαγωγή από την OpenAI του GPT-4V, ενός μοντέλου εξοπλισμένου με οπτικές δυνατότητες, και την ενσωμάτωση πολυτροπικών τρόπων συνομιλίας στο σύστημα ChatGPT.

Η ανακοίνωση της OpenAI, που έγινε στις 25 Σεπτεμβρίου, εγκαινιάζει μια νέα εποχή για τους χρήστες του ChatGPT, δίνοντάς τους τη δυνατότητα να συμμετέχουν σε δυναμικές συνομιλίες με το chatbot. Τα υποκείμενα μοντέλα που τροφοδοτούν το ChatGPT, δηλαδή τα GPT-3.5 και GPT-4, έχουν βελτιωθεί ώστε να κατανοούν προφορικά ερωτήματα σε καθημερινή γλώσσα και να απαντούν χρησιμοποιώντας μία από πέντε διαφορετικές φωνές.

Σύμφωνα με την ανάρτηση του OpenAI στο ιστολόγιο, αυτή η νέα πολυτροπική διεπαφή ανοίγει καινοτόμους τρόπους αλληλεπίδρασης των χρηστών με το ChatGPT:

“Συλλαμβάνετε μια εικόνα ενός ορόσημου ενώ ταξιδεύετε και συμμετέχετε σε μια ζωντανή συνομιλία σχετικά με τα μοναδικά χαρακτηριστικά του. Όταν επιστρέψετε στο σπίτι, τραβήξτε στιγμιότυπα του ψυγείου και του ντουλαπιού σας για να καθορίσετε τις επιλογές σας για δείπνο (και αναζητήστε περαιτέρω καθοδήγηση για μια συνταγή βήμα προς βήμα). Μετά το δείπνο, βοηθήστε το παιδί σας σε ένα μαθηματικό πρόβλημα, φωτογραφίζοντας το, επισημαίνοντας το σύνολο του προβλήματος και λαμβάνοντας χρήσιμες συμβουλές που ωφελούν και τους δυο σας”.

Η αναβαθμισμένη έκδοση του ChatGPT πρόκειται να γίνει προσβάσιμη στους χρήστες Plus και Enterprise σε πλατφόρμες κινητών μέσα στο επόμενο δεκαπενθήμερο, ενώ η πρόσβαση θα επεκταθεί στους προγραμματιστές και στην ευρύτερη κοινότητα χρηστών λίγο αργότερα.

Αυτή η πολυτροπική βελτίωση του ChatGPT συμπίπτει με την πρόσφατη κυκλοφορία του DALL-E 3, του πρωτοποριακού συστήματος παραγωγής εικόνων της OpenAI. Ειδικότερα, το DALL-E 3 ενσωματώνει δυνατότητες επεξεργασίας φυσικής γλώσσας, επιτρέποντας στους χρήστες να συμμετέχουν σε συνομιλίες με το μοντέλο για τη βελτίωση των αποτελεσμάτων και την ενσωμάτωση του ChatGPT για να βοηθήσει στη δημιουργία προτροπών εικόνας.

Σε μια ξεχωριστή εξέλιξη στο τοπίο της τεχνητής νοημοσύνης, ο ανταγωνιστής της OpenAI, η Anthropic, ανακοίνωσε την ίδια ημέρα στρατηγική συνεργασία με την Amazon. Η Amazon έχει δεσμευτεί για μια σημαντική επένδυση ύψους έως και 4 δισεκατομμυρίων δολαρίων, η οποία περιλαμβάνει υπηρεσίες cloud και πρόσβαση σε υλικό. Σε αντάλλαγμα, η Anthropic δεσμεύεται να προσφέρει ενισχυμένη υποστήριξη για το θεμελιώδες μοντέλο AI Bedrock της Amazon, μαζί με ασφαλή προσαρμογή του μοντέλου και λεπτομερή ρύθμιση προσαρμοσμένη στις ανάγκες των επιχειρήσεων. Η συνεργασία αυτή υπογραμμίζει τη συνεχή επέκταση και καινοτομία στον κλάδο της τεχνητής νοημοσύνης.

Για περισσότερα ενημερωμένα νέα, βρείτε μας στο Twitter και στις Ειδήσεις ή εγγραφείτε στο κανάλι μας στο YouTube .

Ποια είναι η γνώμη σας για το συγκεκριμένο θέμα; Αφήστε μας το σχόλιο σας από κάτω! Πάντα μας ενδιαφέρει η γνώμη σας!

Αρθρογράφος: Dimitrios Alexandridis

Leave a Reply

Your email address will not be published. Required fields are marked *

Προτεινόμενα άρθρα:

Μοιράσου τη Δημοσίευση: