Για BMS, λεωφορείο, βιομηχανικό, καλώδιο οργάνων.

Ο Elon Musk και η ομάδα XAI ξεκίνησαν επίσημα την τελευταία έκδοση του Grok, Grok3, κατά τη διάρκεια ενός livestream. Πριν από αυτό το γεγονός, μια σημαντική ποσότητα σχετικών πληροφοριών, σε συνδυασμό με τη διαφημιστική διαφημιστική εκστρατεία 24/7 της Musk, αύξησε τις παγκόσμιες προσδοκίες για το Grok3 σε πρωτοφανή επίπεδα. Μόλις πριν από μία εβδομάδα, ο Musk δήλωσε με σιγουριά κατά τη διάρκεια ενός livestream, σχολιάζοντας το Deepseek R1, "Το XAI πρόκειται να ξεκινήσει ένα καλύτερο μοντέλο AI". Από τα δεδομένα που παρουσιάστηκαν ζωντανά, το Grok3 έχει ξεπεράσει όλα τα τρέχοντα mainstream μοντέλα σε σημεία αναφοράς για τα μαθηματικά, την επιστήμη και τον προγραμματισμό, με τον Musk να ισχυρίζεται ακόμη ότι το GROK3 θα χρησιμοποιηθεί για υπολογιστικά καθήκοντα που σχετίζονται με τις αποστολές του Mars του SpaceX, προβλέποντας "Ανακαλύψεις σε επίπεδο βραβείου Νόμπελ εντός τριών ετών". Ωστόσο, αυτές είναι σήμερα μόνο οι ισχυρισμοί του Musk. Μετά την εκτόξευση, δοκιμάσαμε την τελευταία έκδοση beta του Grok3 και έθεσα την κλασική ερώτηση τέχνασμα για μεγάλα μοντέλα: "Ποια είναι μεγαλύτερη, 9.11 ή 9.9;" Δυστυχώς, χωρίς προκριματικά ή σημάνσεις, το λεγόμενο Smart Grok3 δεν μπορούσε να απαντήσει σωστά σε αυτήν την ερώτηση. Το Grok3 απέτυχε να εντοπίσει με ακρίβεια την έννοια της ερώτησης.
Αυτή η δοκιμή επέστησε γρήγορα σημαντική προσοχή από πολλούς φίλους και συμπτωματικά, διάφορες παρόμοιες δοκιμές στο εξωτερικό έδειξαν ότι το Grok3 αγωνίζεται με βασικές ερωτήσεις φυσικής/μαθηματικών όπως "που η μπάλα πέφτει πρώτα από τον πύργο της Πίζας;" Έτσι, έχει χαρακτηριστεί χιουμοριστικά ως "μια μεγαλοφυία που δεν θέλει να απαντήσει σε απλές ερωτήσεις".

Το Grok3 είναι καλό, αλλά δεν είναι καλύτερο από το R1 ή το O1-Pro.
Το Grok3 παρουσίασε "αποτυχίες" σε πολλές κοινές δοκιμές γνώσης στην πράξη. Κατά τη διάρκεια της εκδήλωσης εκτόξευσης XAI, ο Musk κατέδειξε χρησιμοποιώντας το Grok3 για να αναλύσει τις κατηγορίες χαρακτήρων και τα αποτελέσματα από την πορεία του παιχνιδιού της εξορίας 2, την οποία ισχυρίστηκε ότι παίζει συχνά, αλλά οι περισσότερες από τις απαντήσεις που έδωσε ο Grok3 ήταν λανθασμένες. Το Musk κατά τη διάρκεια του Livestream δεν παρατήρησε αυτό το προφανές ζήτημα.
Αυτό το λάθος όχι μόνο παρείχε περαιτέρω στοιχεία για τους υπερπόντιους νεετούς να ψεύδουν το Musk για την "εύρεση ενός αναπληρωτή" στο παιχνίδι, αλλά έθεσαν επίσης σημαντικές ανησυχίες σχετικά με την αξιοπιστία του Grok3 σε πρακτικές εφαρμογές. Για μια τέτοια "μεγαλοφυία", ανεξάρτητα από τις πραγματικές δυνατότητές της, η αξιοπιστία της σε εξαιρετικά σύνθετα σενάρια εφαρμογών, όπως τα καθήκοντα εξερεύνησης του Άρη, παραμένει αμφιβολία.
Επί του παρόντος, πολλοί δοκιμαστές που έλαβαν πρόσβαση στο Grok3 πριν από εβδομάδες, και εκείνοι που μόλις εξέτασαν τις δυνατότητες του μοντέλου για λίγες ώρες χθες, όλα δείχνουν ένα κοινό συμπέρασμα: "Το Grok3 είναι καλό, αλλά δεν είναι καλύτερο από το R1 ή το O1-Pro".

Μια κρίσιμη προοπτική για την "διαταραχή της Nvidia"
Στο επίσημα παρουσιαζόμενο PPT κατά τη διάρκεια της απελευθέρωσης, το Grok3 αποδείχθηκε ότι είναι "πολύ μπροστά" στο chatbot αρένα, αλλά αυτή η έξυπνη χρησιμοποιούμενη γραφική τεχνική: ο κατακόρυφος άξονας στον πίνακα που αναγράφεται μόνο στα αποτελέσματα της σειράς βαθμολογίας 1400-1300, καθιστώντας την αρχική διαφορά 1% στα αποτελέσματα των δοκιμών να εμφανίζονται εξαιρετικά σημαντικές σε αυτή την παρουσίαση.

Σε πραγματικά αποτελέσματα βαθμολόγησης μοντέλων, το Grok3 είναι μόλις 1-2% μπροστά από το Deepseek R1 και το GPT-4.0, το οποίο αντιστοιχεί σε εμπειρίες πολλών χρηστών σε πρακτικές δοκιμές που βρήκαν "καμία αξιοσημείωτη διαφορά". Το Grok3 υπερβαίνει μόνο τους διαδόχους του κατά 1%-2%.

Παρόλο που το Grok3 σημείωσε υψηλότερα από όλα τα μοντέλα που δοκιμάστηκαν σήμερα, πολλοί δεν το λαμβάνουν σοβαρά: τελικά, ο Xai έχει επικριθεί προηγουμένως για "χειραγώγηση βαθμολογίας" στην εποχή Grok2. Καθώς ο leaderboard τιμωρούσε το στυλ μήκους απάντησης, οι βαθμολογίες μειώθηκαν σημαντικά, οδηγώντας τους εμπιστευματοδόχους της βιομηχανίας να επικρίνουν συχνά το φαινόμενο της "υψηλής βαθμολογίας αλλά χαμηλής ικανότητας".
Είτε μέσω της "χειραγώγησης" ή των κόλπων σχεδίασης σε εικονογραφήσεις αποκαλύπτουν την εμμονή του Xai και του Musk με την έννοια του "οδηγού του πακέτου" στις δυνατότητες μοντέλων. Ο Musk πλήρωσε μια απότομη τιμή για αυτά τα περιθώρια: Κατά τη διάρκεια της εκτόξευσης, καυχήθηκε να χρησιμοποιήσει 200.000 H100 GPUs (ισχυριζόμενος "πάνω από 100.000" κατά τη διάρκεια της ζωής) και να επιτύχει συνολικό χρόνο κατάρτισης 200 εκατομμυρίων ωρών. Αυτό οδήγησε μερικούς να πιστεύουν ότι αντιπροσωπεύει ένα άλλο σημαντικό όφελος για τη βιομηχανία GPU και να θεωρήσει την επίδραση του Deepseek στον τομέα ως "ανόητο". Συγκεκριμένα, ορισμένοι πιστεύουν ότι η καθαρή υπολογιστική ισχύς θα είναι το μέλλον της κατάρτισης μοντέλων.
Ωστόσο, ορισμένοι νέοι συνέκριναν την κατανάλωση 2000 H800 GPU σε διάστημα δύο μηνών για την παραγωγή Deepseek V3, υπολογίζοντας την πραγματική κατανάλωση ενέργειας του GROK3 είναι 263 φορές αυτή του V3. Το χάσμα μεταξύ Deepseek V3, το οποίο σημείωσε 1402 μονάδες, και το Grok3 είναι μόλις κάτω από 100 πόντους. Μετά την απελευθέρωση αυτών των δεδομένων, πολλοί γρήγορα συνειδητοποίησαν ότι πίσω από τον τίτλο του Grok3 ως το "ισχυρότερο" στον κόσμο "βρίσκεται ένα σαφές οριακό φαινόμενο - η λογική των μεγαλύτερων μοντέλων που δημιουργούν ισχυρότερη απόδοση έχει αρχίσει να δείχνει μειωμένες αποδόσεις.

Ακόμη και με "υψηλή βαθμολογία αλλά χαμηλή ικανότητα", το Grok2 είχε τεράστιες ποσότητες υψηλής ποιότητας δεδομένων πρώτου μέρους από την πλατφόρμα X (Twitter) για να υποστηρίξει τη χρήση. Ωστόσο, κατά την κατάρτιση του Grok3, η XAI φυσικά αντιμετώπισε το "ανώτατο όριο" που αντιμετωπίζει η OpenAI - η έλλειψη δεδομένων κατάρτισης premium εκθέτει γρήγορα την οριακή χρησιμότητα των δυνατοτήτων του μοντέλου.
Οι προγραμματιστές του Grok3 και του Musk είναι πιθανότατα οι πρώτοι που κατανοούν και εντοπίζουν αυτά τα γεγονότα βαθιά, γι 'αυτό το Musk έχει αναφερθεί συνεχώς στα κοινωνικά μέσα που βιώνουν οι χρήστες τώρα είναι "ακόμα μόνο το beta" και ότι "η πλήρης έκδοση θα κυκλοφορήσει τους ερχόμενους μήνες". Ο Musk έχει αναλάβει το ρόλο του διαχειριστή προϊόντων του Grok3, υποδηλώνοντας ότι οι χρήστες παρέχουν σχόλια σε διάφορα θέματα που συναντώνται στην ενότητα σχολίων.
Ωστόσο, μέσα σε μια μέρα, η απόδοση του Grok3 αναμφισβήτητα έθεσε συναγερμούς για όσους ελπίζουν να βασίζονται σε "μαζικούς υπολογιστικούς μυς" για να εκπαιδεύσουν ισχυρότερα μεγάλα μοντέλα: με βάση τις διαθέσιμες στο κοινό πληροφορίες της Microsoft, το GPT-4 της OpenAI έχει μέγεθος παραμέτρων 1,8 τρισεκατομμυρίων παραμέτρων, πάνω από δέκα φορές του GPT-3. Οι φήμες υποδηλώνουν ότι το μέγεθος των παραμέτρων του GPT-4,5 μπορεί να είναι ακόμα μεγαλύτερο.
Καθώς τα μεγέθη των παραμέτρων του μοντέλου ανεβαίνουν, το κόστος εκπαίδευσης είναι επίσης ανεκμετάλλευση. Με την παρουσία του Grok3, οι υποψήφιοι όπως το GPT-4.5 και άλλοι που επιθυμούν να συνεχίσουν να "καίγονται χρήματα" για να επιτύχουν καλύτερη απόδοση μοντέλου μέσω του μεγέθους των παραμέτρων πρέπει να εξετάσουν το ανώτατο όριο που τώρα είναι σαφώς στο βλέμμα και να εξετάσει πώς να το ξεπεράσει. Αυτή τη στιγμή, η Ilya Sutskever, πρώην επικεφαλής επιστήμονας στο OpenAI, είχε προηγουμένως δηλώσει τον περασμένο Δεκέμβριο, "η προ-προπόνηση που γνωρίζουμε θα τελειώσει", η οποία έχει επανεμφανιστεί σε συζητήσεις, προκαλώντας προσπάθειες για να βρουν την πραγματική πορεία για την εκπαίδευση μεγάλων μοντέλων.

Η άποψη της Ilya έχει ακούσει τον συναγερμό στον κλάδο. Προβλέπει με ακρίβεια την επικείμενη εξάντληση των προσβάσιμων νέων δεδομένων, οδηγώντας σε μια κατάσταση όπου η απόδοση δεν μπορεί να συνεχίσει να ενισχύεται μέσω της απόκτησης δεδομένων, να το παρομοιαστεί με την εξάντληση των ορυκτών καυσίμων. Ανέφερε ότι "όπως το πετρέλαιο, το περιεχόμενο που παράγεται από τον άνθρωπο στο Διαδίκτυο είναι ένας περιορισμένος πόρος". Στις προβλέψεις του Sutskever, η επόμενη γενιά μοντέλων, μετά την προπόνηση, θα διαθέτει "αληθινή αυτονομία" και δυνατότητες συλλογισμού "παρόμοιες με τον ανθρώπινο εγκέφαλο".
Σε αντίθεση με τα σημερινά προ-εκπαιδευμένα μοντέλα που βασίζονται κυρίως στην αντιστοίχιση περιεχομένου (με βάση το περιεχόμενο μοντέλου που έχουν εκπαιδευθεί προηγουμένως), τα μελλοντικά συστήματα AI θα μπορούν να μάθουν και να δημιουργήσουν μεθοδολογίες για την επίλυση προβλημάτων με τρόπο παρόμοιο με την «σκέψη» του ανθρώπινου εγκεφάλου. Ένας άνθρωπος μπορεί να επιτύχει θεμελιώδη επάρκεια σε ένα θέμα με απλώς βασική επαγγελματική βιβλιογραφία, ενώ ένα μεγάλο μοντέλο AI απαιτεί εκατομμύρια σημεία δεδομένων για να επιτευχθεί μόνο η πιο βασική αποτελεσματικότητα εισόδου. Ακόμη και όταν η διατύπωση αλλάζει ελαφρώς, αυτά τα θεμελιώδη ερωτήματα ενδέχεται να μην είναι σωστά κατανοητά, δείχνοντας ότι το μοντέλο δεν έχει πραγματικά βελτιωθεί στη νοημοσύνη: τα βασικά αλλά ασταμάτητα ερωτήματα που αναφέρονται στην αρχή του άρθρου αντιπροσωπεύουν ένα σαφές παράδειγμα αυτού του φαινομένου.

Σύναψη
Ωστόσο, πέρα από τη βίαιη δύναμη, αν το Grok3 πετύχει πράγματι να αποκαλύψει στον κλάδο ότι "τα προ-εκπαιδευμένα μοντέλα πλησιάζουν στο τέλος τους", θα φέρει σημαντικές επιπτώσεις στον τομέα.
Ίσως μετά τη φρενίτιδα που περιβάλλει το GROK3 σταδιακά υποχωρεί, θα παρακολουθήσουμε περισσότερες περιπτώσεις όπως το παράδειγμα της Fei-Fei Li για το "συντονισμό μοντέλων υψηλής απόδοσης σε ένα συγκεκριμένο σύνολο δεδομένων για μόλις $ 50", ανακαλύπτοντας τελικά την αληθινή πορεία προς την AGI.
Καλώδια ελέγχου
Δομημένο σύστημα καλωδίωσης
Δίκτυο & Δεδομένα, καλώδιο οπτικών ινών, καλώδιο έμπλασσης, ενότητες, πρόσοψη
Απριλίου-16η-18η, 2024 Μεσαία Ενεργειακή Αριακή στο Ντουμπάι
Απριλίου-16η-18η, 2024 Securika στη Μόσχα
Μάιος.
Οκτώβριος 22ος-25ος, 2024 Ασφάλεια Κίνα στο Πεκίνο
Νοέμβριος 19-20, 2024 Connected World KSA
Χρόνος δημοσίευσης: Φεβ-19-2025