Deepseek και η στιγμή Σπούτνικ της Τεχνητής Νοημοσύνης


Του Στέλιου Κωνσταντινίδη *

Tις τελευταίες ήμερες συνέβησαν τεκτονικές αλλαγές στον χώρο της Τεχνητής Νοημοσύνης. Μία Κινέζικη εταιρεία, η Deepseek, δημοσιοποίησε ένα Μεγάλο Γλωσσικό Μοντέλο (Large Language Model), ονόματι R1 [1], το οποίο είναι ισάξιο των αντίστοιχων μοντέλων των Αμερικανικών εταιρειών τεχνολογίας. Το R1 ταρακούνησε τον χώρο της Τεχνητής Νοημοσύνης δημιουργώντας κύματα ενθουσιασμού στους ερευνητές και σοκ στις Αμερικανικές αγορές.

Τι είναι ένα γλωσσικό μοντέλο; Ένα πρόγραμμα με το οποίο μιλάς σαν να μιλάς σε άνθρωπο και το οποίο σου απαντά εξίσου φυσικά. Και μπορεί να απαντήσει με αστείρευτη λεπτομέρεια σε διαφορετικά πεδία: από το να συντάξει κείμενα και να αυτοματοποιήσει καθημερινές εργασίες μέχρι να επιλύσει μαθηματικά προβλήματα και να γράψει τα δικά του προγράμματα. Τα τελευταία χρόνια, η φρενίτιδα γύρω από την Τεχνητή Νοημοσύνη αναφέρεται ως επί το πλείστον σε αυτά. Το πιο γνωστό είναι φυσικά το ChatGPT (της OpenAI), αλλά εξίσου ευφυή είναι και το Claude (της Anthropic) ή το Gemini (της Google).

Το μοντέλο της Deepseek βρίσκεται στο ίδιο επίπεδο με αυτά. Δεν είναι όμως ευφυέστερο, δεν έγκειται σε αυτό το σοκ των αγορών. Η τεκτονική αλλαγή είναι πως η Deepseek αφ’ ενός δημοσιοποίησε τον αλγόριθμο κατασκευής του [2] και αφ’ ετέρου επέτρεψε στους πάντες να το κατεβάσουν στον υπολογιστή τους ελεύθερα [3].

Οι Αμερικανικοί κολοσσοί μέχρι τώρα ακολουθούσαν την αντίθετη τακτική. Κατασκεύαζαν πανίσχυρα γλωσσικά μοντέλα μεν, μειώναν δε όλο και περισσότερο τις λεπτομέρειες του αλγορίθμου τους, δίνοντας μόνο αδρές περιγραφές για το πώς λειτουργούν. Επιπλέον, δεν προσέφεραν τα γλωσσικά μοντέλα ως αρχεία προς download, αλλά ως κλειστές υπηρεσίες, τα ενδότερα των οποίων δεν μπορείς να δεις.

Η Deepseek δεν είναι η πρώτη εταιρεία που προσέφερε τα αποτέλεσματά της έρευνάς της ανοιχτά στο κοινό. Έχουν προηγηθεί εταιρείες όπως η Meta ή η Alibaba, όμως αυτά τα μοντέλα υστερούν σε απόδοση από τις κλειστές ναυαρχίδες. Με το R1 η διαφορά αυτή εκλείπει, και ξαφνικά η OpenAI, η Anthropic ή η Google δεν έχουν κάποιο μυστικό.

Σαν να μην έφτανε αυτό, το R1 είναι και 27 φορές φθηνότερο των αντίστοιχων Αμερικανικών. Tο να παράγει πρωτότυπο κείμενο 500 χιλιάδων λέξεων (όσο περίπου ο Πόλεμος και η Ειρήνη), θα κοστίσει στον χρήστη 2 ευρώ.

Όλα αυτά μαζί, ο τετραπλός συνδυασμός της χαμηλής τιμής, της υψηλής ευφυίας του, της διαφάνειας του σχεδιασμού και της ελεύθερης διανομής, ενθουσίασαν τον χώρο της Τεχνητής Νοημοσύνης. Ένα πανίσχυρο μοντέλο βρίσκεται στα χέρια κάθε ερευνητή και κάθε εταιρείας. Προοιωνίζεται μία ακόμα επιτάχυνση των ήδη αλματωδών εξελίξεων στον χώρο, με νέα έκρηξη μοντέλων στηριζόμενων στο R1 και στα διδάγματα από αυτό.

Υπάρχει όμως μία ακόμα πτυχή. Ο Μαρκ Αντρίσεν (πανίσχυρος Αμερικανός επενδυτής της Σίλικον Βάλεϊ), χαρακτήρισε το R1 τη στιγμή Σπούτνικ της Τεχνητής Νοημοσύνης [4]. Το παρομοιάζει με το δορυφόρο της ΕΣΣΔ, που εκτοξευόμενος το 1957 έγινε ο πρώτος δορυφόρος που τέθηκε σε τροχιά γύρω από τη Γη, προκαλώντας πανικό στις HΠΑ, αφού έβαλε την ΕΣΣΔ μπροστά στην κούρσα του διαστήματος. Τυπικά, η αναλογία είναι δεν είναι εντελώς ορθή. Η Deepseek δεν βγήκε μπροστά από τις υπόλοιπες εταιρείες, αφού δεν έφτιαξε ένα ισχυρότερο μοντέλο. Απλώς έδωσε στον κόσμο αυτό που οι Αμερικανικές εταιρίες φυλούσαν ως επτασφράγιστο μυστικό, διαβρώνοντας το πλεονέκτημά τους.

Μεγαλύτερο όμως ενδιαφέρον έχει το τι επιβεβαιώνει η αναλογία αυτή. Η Τεχνητή Νοημοσύνη και κυρίως τα Μεγάλα Γλωσσικά Μοντέλα εντάσσονται σε μία κούρσα ανταγωνισμού ανάμεσα στις ΗΠΑ και στην Κίνα. Η ανακοίνωση από τον Τραμπ, την επομένη της ορκωμοσίας του, της επένδυσης μισού τρις δολλαρίων στην Τεχνητή Νοημοσύνη είναι άλλο ένα σημάδι αυτής της κούρσας. Και προμηνύει πως το R1 της Deepseek δεν θα μείνει αναπάντητο.

Σύνδεσμοι:



 

* Στέλιος Κωνσταντινίδης, μηχανικός Τεχνητής Νοημοσύνης

Πηγή: militaire.gr

από dromosanoixtos.gr

Δημοσίευση σχολίου

0 Σχόλια