DeepSeek: Η κινεζική πρόκληση στην τεχνητή νοημοσύνη με εκπαίδευση μόλις 294.000 δολαρίων

DeepSeek: Η κινεζική πρόκληση στην τεχνητή νοημοσύνη με εκπαίδευση μόλις 294.000 δολαρίων
The DeepSeek AI application is seen on a mobile phone in this photo illustration taken in Warsaw, Poland on 27 January, 2025. (Photo by Jaap Arriens/NurPhoto) (Photo by Jaap Arriens / NurPhoto / NurPhoto via AFP) Photo: AFP
Η κινεζική DeepSeek ταράζει τον παγκόσμιο χάρτη της τεχνητής νοημοσύνης, αποκαλύπτοντας ότι εκπαίδευσε το μοντέλο R1 με κλάσμα του κόστους των αμερικανικών κολοσσών, προκαλώντας ανησυχίες για την κυριαρχία τους.

Η DeepSeek εκπαίδευσε το μοντέλο R1 με μόλις $294.000, σύμφωνα με το Nature.

Χρησιμοποίησε 512 τσιπ Nvidia H800, σχεδιασμένα ειδικά για την κινεζική αγορά.

Η αποκάλυψη εντείνει τον ανταγωνισμό με την OpenAI και προκαλεί πτώση σε τεχνολογικές μετοχές.

Η εμφάνιση της DeepSeek, της ανερχόμενης κινεζικής δύναμης στην τεχνητή νοημοσύνη, προκαλεί αναταράξεις στον παγκόσμιο ανταγωνισμό. Το μεγαλύτερο πλήγμα το δέχθηκε η OpenAI, όταν έγινε γνωστό ότι η DeepSeek δαπάνησε μόλις 294.000 δολάρια για την εκπαίδευση του μοντέλου R1, ποσό ασύγκριτα χαμηλότερο από τις δαπάνες των αμερικανικών κολοσσών.

Η αποκάλυψη, που δημοσιεύτηκε στο Nature, έρχεται σε μια κρίσιμη στιγμή, εντείνοντας τις ανησυχίες για τον ρόλο της Κίνας στον παγκόσμιο χάρτη της τεχνητής νοημοσύνης. Η ανακοίνωση της DeepSeek για ανάπτυξη χαμηλού κόστους συστημάτων AI είχε ήδη προκαλέσει πτώση στις μετοχές μεγάλων τεχνολογικών εταιρειών, καθώς οι επενδυτές φοβούνται για την κυριαρχία παικτών όπως η Nvidia.

ΔΙΑΒΑΣΤΕ ΑΚΟΜΑ

Σύμφωνα με τα στοιχεία, η εκπαίδευση του μοντέλου βασίστηκε σε 512 τσιπ Nvidia H800, ειδικά σχεδιασμένα για την κινεζική αγορά μετά την απαγόρευση εξαγωγής πιο ισχυρών τσιπ (H100 και A100) από τις ΗΠΑ. Για πρώτη φορά η DeepSeek παραδέχθηκε ότι είχε στην κατοχή της τσιπ A100, τα οποία χρησιμοποίησε στο προπαρασκευαστικό στάδιο ανάπτυξης, ενώ το κύριο στάδιο εκπαίδευσης ολοκληρώθηκε σε 80 ώρες με τα H800.

Η εταιρεία έχει δεχθεί επικρίσεις από Αμερικανούς αξιωματούχους και στελέχη του κλάδου, με κατηγορίες ότι «διαστρωμάτωσε» μοντέλα της OpenAI. Ωστόσο, η ίδια υπερασπίζεται την τεχνική της διαστρωμάτωσης, υποστηρίζοντας ότι οδηγεί σε καλύτερη απόδοση με χαμηλότερο κόστος εκπαίδευσης και λειτουργίας, καθιστώντας την τεχνητή νοημοσύνη πιο προσιτή σε περισσότερους χρήστες.

ΔΙΑΒΑΣΤΕ ΠΕΡΙΣΣΟΤΕΡΕΣ ΕΙΔΗΣΕΙΣ: