Και εγένετο… Sora: Τι κάνει το νέο επαναστατικό tool της OpenAI

Και εγένετο… Sora: Τι κάνει το νέο επαναστατικό tool της OpenAI
OpenAI is releasing its first video generation model, Sora, which generates video from input text, in Suqian, Jiangsu Province, China, on February 16, 2024. (Photo Illustration by Costfoto/NurPhoto) (Photo by CFOTO / NurPhoto / NurPhoto via AFP) Photo: AFP
Αλλάζει ξανά τα δεδομένα ο γίγαντας της τεχνητής νοημοσύνης.

Η OpenAI παρουσίασε ένα νέο εργαλείο με την ονομασία «Sora», το οποίο είναι ικανό να δημιουργεί ρεαλιστικά βίντεο με διάρκεια έως ένα λεπτό, απλά εισάγοντας ένα κείμενο.

Αυτή η καινοτομία στον τομέα της τεχνητής νοημοσύνης αποτελεί μια συνέχεια των προηγούμενων ερευνών για τα προγράμματα DALL-E και GPT.

Το νέο αυτό εργαλείο βρίσκεται ακόμα υπό δοκιμή, αλλά έχουν ήδη παρουσιαστεί μερικά δείγματα του τι μπορεί να προσφέρει.

Το Sora μπορεί να δημιουργήσει πολύπλοκα βίντεο με πολλά πρόσωπα, συγκεκριμένους τύπους κινήσεων και λεπτομερείς σκηνές.

Μπορεί ακόμα να δημιουργήσει βίντεο από μια σταθερή εικόνα ή να επιμηκύνει υφιστάμενα βίντεο.

Ο επικεφαλής της OpenAI, Σαμ Άλτμαν, ανέφερε ότι το Sora θα είναι διαθέσιμο σε περιορισμένο αριθμό δημιουργών στην αρχή, στο πλαίσιο μιας πειραματικής φάσης.

Ο ίδιος κάλεσε επίσης τους χρήστες να κάνουν προτάσεις για τη δημιουργία βίντεο και μερικά λεπτά αργότερα ανέβασε στην πλατφόρμα τα πιο επιτυχημένα απ’ αυτά.

ΔΙΑΒΑΣΤΕ ΑΚΟΜΑ

Παράλληλα, η OpenAI προειδοποίησε ότι το τρέχον μοντέλο της πλατφόρμας έχει ορισμένα ελαττώματα, όπως την αδυναμία να διατηρήσει συνοχή στο βίντεο.

«Για παράδειγμα, ένα πρόσωπο μπορεί να δαγκώσει ένα μπισκότο, όμως μετά το μπισκότο μπορεί να μην έχει ίχνη από το δάγκωμα», εξηγεί η εταιρεία.

Ωστόσο, προσπαθεί να βελτιώσει αυτά τα σημεία μέσω πειραματικών διαδικασιών και συνεργασίας με επαγγελματίες από διάφορους τομείς.

Παρουσιάζοντας αυτό το νέο εργαλείο, η OpenAI ανέφερε πως το ζήτημα της ασφάλειας αποτελεί ουσιώδες διακύβευμα και ότι προσομοιώσεις θα οργανωθούν με χρήστες από τους οποίους θα ζητηθεί να παραγάγουν δυσλειτουργίες ή να δημιουργήσουν ανάρμοστα περιεχόμενα, ώστε να καθορισθούν καλύτερα τα όρια της πλατφόρμας.

«Θα καλέσουμε πρόσωπα που λαμβάνουν πολιτικές αποφάσεις, εκπαιδευτικούς και καλλιτέχνες απ’ όλο τον κόσμο για να κατανοήσουμε τις ανησυχίες τους και να εντοπίσουμε τις θετικές περιπτώσεις χρήσης αυτής της νέας τεχνολογίας», ανέφερε η OpenAI. Οι Meta, Google και Runway AI, οι οποίες εργάζονται σε παρόμοιες εφαρμογές μετατροπής κειμένου σε βίντεο, τις λεγόμενες «text-to-video» («από κείμενο σε βίντεο»), έχουν ήδη παρουσιάσει δείγματα.

ΔΙΑΒΑΣΤΕ ΠΕΡΙΣΣΟΤΕΡΕΣ ΕΙΔΗΣΕΙΣ: