Σε μια άκρως απόρρητη επιστημονική συνάντηση που πραγματοποιήθηκε τον Μάιο στο Μπέρκλεϊ της Καλιφόρνια, 30 από τους κορυφαίους μαθηματικούς του πλανήτη αντιμετώπισαν – και σε μεγάλο βαθμό ηττήθηκαν από – ένα προηγμένο σύστημα τεχνητής νοημοσύνης. Στόχος της συνάντησης ήταν να αξιολογηθεί η ικανότητα ενός νέου γλωσσικού μοντέλου AI να λύνει εξαιρετικά σύνθετα μαθηματικά προβλήματα, επιπέδου διδακτορικής έρευνας.

Διαβάστε: Βρετανία: Η νευροδιέγερση του εγκεφάλου ως λύση κατανόησης των μαθηματικών

Το επίκεντρο της δοκιμής ήταν το o4-mini, ένα ελαφρύ αλλά εντυπωσιακά ισχυρό μεγάλο γλωσσικό μοντέλο (LLM) που ανέπτυξε η OpenAI. Το συγκεκριμένο chatbot όχι μόνο κατανοεί περίπλοκες μαθηματικές έννοιες, αλλά έχει και τη δυνατότητα να αναπτύσσει ολοκληρωμένες λογικές αλυσίδες, κάτι που παλαιότερα θεωρούταν αποκλειστικό προνόμιο του ανθρώπινου νου. Στο ίδιο επίπεδο φέρεται να κινείται και το Gemini 2.5 Flash της Google.

Το πείραμα της Epoch AI και το project FrontierMath

Για να ελέγξει τις δυνατότητες του o4-mini, η OpenAI συνεργάστηκε με την Epoch AI, μια μη κερδοσκοπική οργάνωση που ειδικεύεται στην αξιολόγηση συστημάτων τεχνητής νοημοσύνης. Δημιουργήθηκαν 300 πρωτότυπα μαθηματικά προβλήματα χωρίς γνωστές λύσεις, στο πλαίσιο ενός έργου που ονομάστηκε FrontierMath.

Τα προβλήματα χωρίστηκαν σε τέσσερα επίπεδα δυσκολίας – από προπτυχιακό έως εξαιρετικά προχωρημένο. Το τέταρτο επίπεδο, συγκεκριμένα, περιλάμβανε ερωτήματα τόσο απαιτητικά, που μόνο μια ελάχιστη ομάδα ανθρώπων παγκοσμίως θα μπορούσε καν να τα προσεγγίσει. Μάλιστα, κάθε μαθηματικός που κατάφερνε να δημιουργήσει ένα άλυτο πρόβλημα για το AI λάμβανε αμοιβή 7.500 δολαρίων.

Η συνάντηση κορυφής: 30 μαθηματικοί VS AI

Για να επιταχυνθεί η διαδικασία, η Epoch AI οργάνωσε ένα διήμερο workshop στις 17 και 18 Μαΐου με φυσική παρουσία. Οι 30 διακεκριμένοι μαθηματικοί χωρίστηκαν σε ομάδες των έξι και προσπάθησαν να σχεδιάσουν προβλήματα που θα μπορούσαν να λύσουν οι ίδιοι αλλά όχι το o4-mini.

Ωστόσο, η τεχνητή νοημοσύνη αποδείχθηκε σχεδόν ανίκητη.

Ο επικεφαλής της συνάντησης, καθηγητής Ken Ono από το Πανεπιστήμιο της Βιρτζίνια, υπέβαλε στο σύστημα ένα εξαιρετικά δύσκολο πρόβλημα θεωρίας αριθμών – ένα ερώτημα που θα μπορούσε να αποτελέσει θέμα για διδακτορική διατριβή. Το o4-mini χρειάστηκε μόλις 10 λεπτά για να το λύσει. Μέσα σε λίγα λεπτά αναζήτησε σχετική βιβλιογραφία, κατασκεύασε παράδειγμα για επαλήθευση και παρουσίασε την πλήρη λύση.

«Δεν ήμουν προετοιμασμένος να αντιμετωπίσω ένα LLM όπως αυτό», σχολίασε νικημένος ο Όνο. «Δεν έχω ξαναδεί τέτοια συλλογιστική σε αλγόριθμους, παρά μόνο σε επιστήμονες. Είναι τρομακτικό», πρόσθεσε.

Τεχνητή Νοημοσύνη: Το μέλλον της μαθηματικής έρευνας

Παρόλο που η ομάδα των μαθηματικών κατάφερε τελικά να βρει 10 προβλήματα που το o4-mini δεν μπόρεσε να λύσει, η ταχύτητα και η ακρίβεια του AI άφησαν έντονα το αποτύπωμά τους. Το μοντέλο μπορούσε να επιλύσει σε λεπτά προβλήματα που ένας άνθρωπος θα χρειαζόταν εβδομάδες ή μήνες.

Στο τέλος της συνάντησης, οι συζητήσεις επικεντρώθηκαν στο λεγόμενο “επίπεδο πέντε” – μαθηματικά προβλήματα τόσο σύνθετα που ίσως ούτε ο πιο ευφυής ανθρώπινος νους δεν μπορεί να τα προσεγγίσει. Σε αυτό το μελλοντικό σενάριο, η τεχνητή νοημοσύνη ίσως δεν είναι απλώς εργαλείο, αλλά ενεργός εταίρος στην ανακάλυψη νέων μαθηματικών αληθειών.

Η ερώτηση που προκύπτει: Θα αλλάξει η AI για πάντα τον ρόλο του μαθηματικού;