Η OpenAI μεταφέρει τη μάχη της Gen AI στο… Hollywood

Η OpenAI μεταφέρει τη μάχη της Gen AI στο… Hollywood
A photo shows a frame of a video generated by a new intelligence artificial tool, dubbed "Sora", unveiled by the company OpenAI, in Paris on February 16, 2024. OpenAI, the creator of ChatGPT and image generator DALL-E, said it was testing a text-to-video model called Sora that would allow users to create realistic videos with a simple prompt. The Microsoft-backed company said the new platform was currently being tested but released a few videos of what it said was already possible, with the accompanying input made to generate the video. (Photo by Stefano RELLANDINI / AFP) Photo: AFP
Το επόμενο κύμα της Τεχνητής Νοημοσύνης είναι εδώ.

Την Πέμπτη, η OpenAI, η κατασκευάστρια εταιρεία του ChatGPT, κυκλοφόρησε ένα νέο προϊόν που μπορεί να δημιουργήσει απίστευτα ρεαλιστικά βίντεο με βάση μόνο τις λέξεις που πληκτρολογεί ο χρήστης.

Τα video clips – που περιλαμβάνουν μια γυναίκα, η οποία δημιουργήθηκε από την Τεχνητή Νοημοσύνη, και περπατά στους φωτισμένους με neon δρόμους του Τόκιο, αστροναύτες που φορούν μάλλινα πλεκτά κράνη από πλεκτό μαλλί και έναν νέο άνδρα που διαβάζει ένα βιβλίο σε ένα σύννεφο – αυξάνουν το στοίχημα στην ήδη, άκρως ανταγωνιστική βιομηχανία της τεχνητής νοημοσύνης και προαναγγέλλουν τις ταχέως επερχόμενες αλλαγές που είναι σχεδόν βέβαιο ότι θα ταράξουν τα νερά στις βιομηχανίες ψυχαγωγίας και δημιουργίας περιεχομένου.

«Αν κάποιος πίστευε ότι ο ρυθμός προόδου στην τεχνητή νοημοσύνη θα επιβραδυνόταν, τώρα βλέπουμε καθημερινά παραδείγματα του ακριβώς αντίθετου», έγραψε στο Twitter ο διευθύνων σύμβουλος της Box, Aaron Levie, αναρτώντας και ένα βίντεο ενός κλιπ που δημιουργήθηκε από το Sora.

Το Sora, όπως αποκαλεί η OpenAI το νέο της προϊόν μετατροπής κειμένου σε βίντεο, δεν είναι ακριβώς το πρώτο του είδους του. Η Runway, μια startup τεχνητής νοημοσύνης που έχει συγκεντρώσει 263 εκατομμύρια δολάρια σε χρηματοδότηση, φιλοξενεί ένα ολόκληρο φεστιβάλ κινηματογράφου αφιερωμένο σε καλλιτέχνες που δημιουργούν ταινίες με την τεχνολογία του text-to-video, που διαθέτει. Υπάρχει, επίσης, το Midjourney, που προσφέρει εικόνες υψηλής ποιότητας από κείμενο.

Αλλά το πιο συναρπαστικό στα βίντεο που δημοσίευσε την Πέμπτη η OpenAI είναι η πιστότητα και η φωτορεαλιστική λεπτομέρεια που δημιουργούν τα μοντέλα Τεχνητής Νοημοσύνης της εταιρείας, από τις ίνες των μαλλιών του ατόμου που διαβάζει ένα βιβλίο σε ένα από τα κλιπ μέχρι τις διάσπαρτες λιμνούλες στο έδαφος στη σκηνή του Τόκιο. Η ιδέα να δημιουργηθεί ένα τόσο ρεαλιστικό βίντεο από προτροπές κειμένου δεν ήταν μόνο αδύνατη πριν από λίγα χρόνια, αλλά σχεδόν αδιανόητη με τα εργαλεία και τα μοντέλα της εποχής.

ΔΙΑΒΑΣΤΕ ΑΚΟΜΑ

«Αυτό ήταν ένα από εκείνα τα πράγματα που λες στον εαυτό σου ότι θα έρθουν και νομίζεις ότι είσαι έτοιμος γι’ αυτό και δεν θα μπορούσε να σε εκπλήξει, αλλά μετά το βλέπεις και δεν το πιστεύεις εντελώς και δεν είσαι σίγουρος γιατί δεν πίστεψες ότι θα εκπλαγείς»,

Το προϊόν υπογραμμίζει τον εκθετικό ρυθμό με τον οποίο εξελίσσεται η τεχνολογία της Τεχνητής Νοημοσύνης, κάτι που συζητούν εδώ και καιρό φουτουριστές όπως ο Ray Kurzweil. Στο βιβλίο του «The AI Revolution: The Road to Superintelligence», ο διάσημος συγγραφέας τεχνολογίας Tim Urban αντλεί έμπνευση από τον Kurzweil, ο οποίος προέβλεψε ότι ο 21ος αιώνας «θα επιτύχει 1.000 φορές την πρόοδο του 20ού αιώνα».

Ο στόχος της OpenAI δεν είναι άλλος από τη δημιουργία Gen AI, μιας έκδοσης της Τεχνητής Νοημοσύνης που θα μπορεί να εκτελεί τις περισσότερες εργασίες εξίσου καλά ή και καλύτερα από τον άνθρωπο. Δεν είναι όλοι πεπεισμένοι ότι μια τέτοια υπερ-νοημοσύνη είναι καν δυνατή. Αλλά ο ταχύς ρυθμός με τον οποίο εξελίσσεται η ΤΝ είναι σαφώς ορατός στην πληθώρα νέων προϊόντων. Ήταν μόλις πριν από 14 μήνες όταν το ChatGPT μεταμόρφωσε την τεχνολογική βιομηχανία, λανσάροντας ένα bot που μπορεί να γράφει ποίηση, εργασίες τετραμήνων και να διεξάγει συζητήσεις που είναι σχεδόν αδύνατο να διακριθούν από μια συζήτηση με έναν άνθρωπο.

Μόλις πέρυσι, τα AI-generated βίντεο της Midjourney εξακολουθούσαν να επικρίνονται, επειδή προσέθεταν επιπλέον δάχτυλα σε ένα χέρι. Το Sora της OpenAI έχει κάνει αυτό το πρόβλημα να φαίνεται τόσο απαρχαιωμένο όσο ο ήχος κλήσης ενός μόντεμ.

Για τις AI startups που ήδη επικεντρώνονταν στο βίντεο, το τελευταίο προϊόν της OpenAI αποτελεί μία προειδοποιητική βολή.

ΔΙΑΒΑΣΤΕ ΑΚΟΜΑ

Η Runway, μια νεοφυής επιχείρηση που ιδρύθηκε το 2018, απολαμβάνει ένα σαφές πλεονέκτημα, καθώς έχει αφιερώσει χρόνια στην τελειοποίηση των μοντέλων της. Μέχρι τώρα, καμία αντίπαλη startup AI text-to-video δεν έχει αποτελέσει απειλή για το προϊόν της Runway. Αξίζει να αναφέρουμε ότι το Runway χρησιμοποιείται ήδη από το Χόλιγουντ, μια ταινία που χρησιμοποιεί το προϊόν τους κέρδισε 7 ολόκληρα Όσκαρ, ενώ το Sora της OpenAI δημιουργεί μόνο μικρά βίντεο – προς το παρόν.
«Game on», έγραψε στο Twitter ο διευθύνων σύμβουλος της Runway Cristobal Valenzuela την Πέμπτη, μετά την ανακοίνωση της OpenAI.

Ίσως το μεγαλύτερο εμπόδιο για την OpenAI στην προώθηση των βίντεο της είναι η ανάγκη να υπερασπιστεί τα εδάφη της και να συνεχίσει να προοδεύει σε τόσα πολλά διαφορετικά μέτωπα, με τον ανταγωνισμό να εντείνεται απέναντι στο ChatGPT και του εργαλείο δημιουργίας εικόνων DALL-E. Ο διευθύνων σύμβουλος της OpenAI, Sam Altman έχει αποδείξει ότι είναι ικανός στο να παραμένει μπροστά από τον ανταγωνισμό μέχρι στιγμής, συγκεντρώνοντας 13 δισεκατομμύρια δολάρια από τη Microsoft και φέρεται να επιδιώκει να συγκεντρώσει ακόμη περισσότερα χρήματα για την ανάπτυξη υποδομών υλικού, που θα μπορούσαν να τροφοδοτήσουν το όραμά του.

Όσο εντυπωσιακά και αν είναι, τα βίντεο που δημοσίευσε η OpenAI την Πέμπτη αντιπροσωπεύουν ένα περιορισμένο, επιλεγμένο δείγμα της καλύτερης δουλειάς της τεχνολογίας. Το πόσο καλά θα λειτουργεί συνολικά η τεχνολογία θα καθορίσει την εν δυνάμη επέλαση που θα μπορέσει να κάνει η OpenAI στο Χόλιγουντ, καθώς επιδιώκει να διευρύνει την αγορά που απευθύνεται και να αντιμετωπίσει τους ανταγωνιστές της στην Τεχνητή Νοημοσύνη. Game on.

ΔΙΑΒΑΣΤΕ ΠΕΡΙΣΣΟΤΕΡΕΣ ΕΙΔΗΣΕΙΣ:

Πηγή: fortune.com