Η κινεζική startup τεχνητής νοημοσύνης DeepSeek είδε το chatbot της να “φιγουράρει” στην κορυφή των charts του App Store στις ΗΠΑ, ξεπερνώντας το ChatGPT της OpenAI ως η πιο δημοφιλής δωρεάν εφαρμογή. Το chatbot της DeepSeek, που βασίζεται σε open-source μοντέλα, ισχυρίζεται ότι μπορεί να εκπαιδευτεί με πολύ χαμηλότερο κόστος και λιγότερα chips σε σχέση με τα κορυφαία μοντέλα στον κόσμο. Αυτό, είχε ως αποτέλεσμα οι μετοχές της Nvidia, η οποία είναι ο μεγαλύτερος προμηθευτής προηγμένων chips AI, σημείωσαν πτώση άνω του 12% στις προ-χρηματιστηριακές συναλλαγές.
Η έκρηξη των downloads σημειώθηκε μετά την κυκλοφορία του νέου μοντέλου συλλογιστικής R1 στις 20 Ιανουαρίου, το οποίο είναι σχεδιασμένο για επίλυση σύνθετων προβλημάτων και φέρεται να αποδίδει ισάξια με το OpenAI o1 σε ορισμένα benchmarks. Το R1 βασίζεται στο μοντέλο V3 που κυκλοφόρησε τον Δεκέμβριο, το οποίο η DeepSeek ισχυρίζεται ότι ανταγωνίζεται το GPT-4o και το Claude 3.5 Sonnet της Anthropic, ενώ κόστισε λιγότερο από $6 εκατομμύρια για την ανάπτυξή του. Συγκριτικά, ο CEO της OpenAI, Sam Altman, δήλωσε ότι η εκπαίδευση του GPT-4 κόστισε πάνω από $100 εκατομμύρια.
Επιπλέον, η DeepSeek δηλώνει ότι χρειάστηκε μόλις 2.000 εξειδικευμένα chips από τη Nvidia για να εκπαιδεύσει το V3, ενώ τα κορυφαία μοντέλα απαιτούν 16.000 ή περισσότερα, σύμφωνα με τους New York Times. Αυτοί οι ισχυρισμοί, αν αληθεύουν, αμφισβητούν την προσέγγιση που βασίζεται στη μεγάλη υπολογιστική ισχύ, την οποία προτιμούν εταιρείες όπως η OpenAI και η Nvidia.
Η είδηση έχει προκαλέσει ανησυχία για τη βιωσιμότητα των δαπανών στις υποδομές AI, με έργα όπως το Stargate να αγγίζουν τα $500 δισ. και οι μετοχές εταιρειών όπως η Microsoft και η Nvidia να σημειώνουν πτώση, καθώς επενδυτές επανεξετάζουν τη στρατηγική των υπολογιστικών κέντρων μεγάλης κλίμακας.