feedback

AI саммари

Четырехмесячный ИИ-стартап Axiom объявил, что его система AxiomProver успешно решила 9 из 12 задач крайне сложной математической олимпиады Putnam. Этот результат является выдающимся, потенциально обеспечивая системе первое место среди тысяч участников и демонстрируя способность ИИ не только решать задачи, но и формализовывать их в машинно-проверяемые proof-скрипты на языке Lean.
от FlowFeed AI
Обновлено: 4 hours ago

ИИ-система стартапа Axiom, существующего всего четыре месяца, продемонстрировала выдающиеся способности, решив 9 из 12 задач на William Lowell Putnam Mathematical Competition — одной из самых сложных математических олимпиад в мире.



William Lowell Putnam Mathematical Competition, или просто Putnam, — это ежегодное соревнование по математике, предназначенное для студентов бакалавриата университетов США и Канады. Эта олимпиада широко признана как исключительно трудная, и средний балл участников часто колеблется в районе 0–1 из 120 возможных баллов.



В этом году олимпиада проходила на минувших выходных. Сегодня молодой и пока малоизвестный стартап Axiom объявил, что их система AxiomProver успешно справилась с 9 из 12 предложенных задач. Примечательно, что 8 из них были решены непосредственно во время проведения конкурса, а еще одна — вскоре после его официального завершения.



Это поистине впечатляющий результат. Если бы этот показатель был достигнут в прошлом году, он бы обеспечил ИИ-системе AxiomProver абсолютное первое место среди примерно 4000 участников. Более того, это могло бы принести ей престижный статус Putnam Fellow

"Putnam Fellow" — это звание, присваиваемое десяти лучшим участникам олимпиады Putnam, признающее их выдающиеся математические способности.
, что является знаком признания десяти лучших результатов за несколько лет. Точное место в этом году пока неизвестно, так как оно зависит от общего распределения баллов среди всех участников.



Особый интерес вызывает то, что модель AxiomProver не просто предоставила решения в виде утверждений на естественном языке, но и формализовала их с использованием языка Lean

Lean — это интерактивный помощник по доказательству теорем и язык программирования, который позволяет математикам и программистам формально записывать и проверять математические доказательства с помощью компьютера.
. Это означает, что каждое решение представлено в виде машинно-проверяемого proof-скрипта, обеспечивающего высокую точность и верифицируемость.



Остается лишь гадать, принимали ли участие в этой олимпиаде или проводили свои эксперименты в этой области технологические гиганты, такие как Google и OpenAI.

ИИ-стартап решил сложнейшие задачи Putnam, превзойдя тысячи студентов
Link copied