ИИ-стартап решил сложнейшие задачи Putnam, превзойдя тысячи студентов

ИИ-система стартапа Axiom, существующего всего четыре месяца, продемонстрировала выдающиеся способности, решив 9 из 12 задач на William Lowell Putnam Mathematical Competition — одной из самых сложных математических олимпиад в мире.

William Lowell Putnam Mathematical Competition, или просто Putnam, — это ежегодное соревнование по математике, предназначенное для студентов бакалавриата университетов США и Канады. Эта олимпиада широко признана как исключительно трудная, и средний балл участников часто колеблется в районе 0–1 из 120 возможных баллов.

В этом году олимпиада проходила на минувших выходных. Сегодня молодой и пока малоизвестный стартап Axiom объявил, что их система AxiomProver успешно справилась с 9 из 12 предложенных задач. Примечательно, что 8 из них были решены непосредственно во время проведения конкурса, а еще одна — вскоре после его официального завершения.

Это поистине впечатляющий результат. Если бы этот показатель был достигнут в прошлом году, он бы обеспечил ИИ-системе AxiomProver абсолютное первое место среди примерно 4000 участников. Более того, это могло бы принести ей престижный статус Putnam Fellow

"Putnam Fellow" — это звание, присваиваемое десяти лучшим участникам олимпиады Putnam, признающее их выдающиеся математические способности.

, что является знаком признания десяти лучших результатов за несколько лет. Точное место в этом году пока неизвестно, так как оно зависит от общего распределения баллов среди всех участников.

Особый интерес вызывает то, что модель AxiomProver не просто предоставила решения в виде утверждений на естественном языке, но и формализовала их с использованием языка Lean

Lean — это интерактивный помощник по доказательству теорем и язык программирования, который позволяет математикам и программистам формально записывать и проверять математические доказательства с помощью компьютера.

. Это означает, что каждое решение представлено в виде машинно-проверяемого proof-скрипта, обеспечивающего высокую точность и верифицируемость.

Остается лишь гадать, принимали ли участие в этой олимпиаде или проводили свои эксперименты в этой области технологические гиганты, такие как Google и OpenAI.

ИИ-стартап решил сложнейшие задачи Putnam, превзойдя тысячи студентов

AI саммари

ИИ-стартап решил сложнейшие задачи Putnam, превзойдя тысячи студентов