На смену вайб-кодингу в будущем придёт вайб-рисерч — OpenAI выпустили я бы сказал документ эпохи, показывающий возможности LLM для ускорения научных открытий сейчас.
Блог и статья разбиты на 4 блока, в которых показывается, как GPT-5 / GPT-5 Pro:
— независимо повторно открывают известные результаты на переднем крае науки (фронтире), используя недавно опубликованные статьи (тем самым показывая, что если бы статей не было, то модель могла бы догадаться и придумать сама)
— осуществляют глубокий поиск по научной литературе, чтобы проверить, находил ли кто-то решения для задач, числящихся нерешёнными в Erdős Problems List (про этот пример писал недавно). Оказывается, для более чем десятка проблем уже давно были найдены доказательства, просто они были глубоко закопаны в малораспространённых работах и доказаны в рамках вообще отсранённой работы.
— работают совместно с учёными над новыми идеями, или более конкретно позволяют делегировать часть легко проверяемых, но всё же нетриваиальных вычислений. Со слов учёного, он закидывал в модель разные идеи, пробовал так и эдак, и смотрел, получится ли. Тут идеально сочетается наша креативность и устойчивость силиконовых болванов к рутинной работе. В конце главы ещё интересная заметка про соавторство статей, и что пока GPT-5 не проходит порог, установленный автором (но он достаточно высокий).
— наконец, самое главное: где модели смогли сгенерировать доказательства для открытых проблем. В статье даётся несколько примеров, и речь конечно не идет о гипотезе Римана или программе Ленглендса, но над этими задачами работала небольшая группа экспертов в прошлом, вероятно, в течение нескольких недель, и они оставались нерешёнными. Для некоторых из задач простая система с GPT-5 в основе работала двое суток, и пришла к результату — это чрезвычайно впечатляет.
В самой статье для каждого блока есть несколько примеров с рассказами учёных, которые были вовлечены в работу, и примеры их чатов с ChatGPT — по математике, физике, биологии, информатике, астрономии и материаловедению. Очень рекомендую полистать эти примеры, если вы занимаетесь схожими исследованиями.
В OpenAI собрана отдельная команда, плотно работающая с учёными разных направлений, чтобы в следующем году начать системно двигать фронтир науки с помощью LLM. Как я писал днём, во многих задачах дойти до 5-7% качества сложнее, чем развить его до 70%. И сейчас тот самый миг, когда модели ещё чуть-чуть позади, и уже делают маааааленький процент открытий, но пройдет немного времени — год, два — и эпоха закончится (не во всех областях, не сразу и не для всех, и всё же).
Блог и статья разбиты на 4 блока, в которых показывается, как GPT-5 / GPT-5 Pro:
— независимо повторно открывают известные результаты на переднем крае науки (фронтире), используя недавно опубликованные статьи (тем самым показывая, что если бы статей не было, то модель могла бы догадаться и придумать сама)
— осуществляют глубокий поиск по научной литературе, чтобы проверить, находил ли кто-то решения для задач, числящихся нерешёнными в Erdős Problems List (про этот пример писал недавно). Оказывается, для более чем десятка проблем уже давно были найдены доказательства, просто они были глубоко закопаны в малораспространённых работах и доказаны в рамках вообще отсранённой работы.
— работают совместно с учёными над новыми идеями, или более конкретно позволяют делегировать часть легко проверяемых, но всё же нетриваиальных вычислений. Со слов учёного, он закидывал в модель разные идеи, пробовал так и эдак, и смотрел, получится ли. Тут идеально сочетается наша креативность и устойчивость силиконовых болванов к рутинной работе. В конце главы ещё интересная заметка про соавторство статей, и что пока GPT-5 не проходит порог, установленный автором (но он достаточно высокий).
— наконец, самое главное: где модели смогли сгенерировать доказательства для открытых проблем. В статье даётся несколько примеров, и речь конечно не идет о гипотезе Римана или программе Ленглендса, но над этими задачами работала небольшая группа экспертов в прошлом, вероятно, в течение нескольких недель, и они оставались нерешёнными. Для некоторых из задач простая система с GPT-5 в основе работала двое суток, и пришла к результату — это чрезвычайно впечатляет.
В самой статье для каждого блока есть несколько примеров с рассказами учёных, которые были вовлечены в работу, и примеры их чатов с ChatGPT — по математике, физике, биологии, информатике, астрономии и материаловедению. Очень рекомендую полистать эти примеры, если вы занимаетесь схожими исследованиями.
В OpenAI собрана отдельная команда, плотно работающая с учёными разных направлений, чтобы в следующем году начать системно двигать фронтир науки с помощью LLM. Как я писал днём, во многих задачах дойти до 5-7% качества сложнее, чем развить его до 70%. И сейчас тот самый миг, когда модели ещё чуть-чуть позади, и уже делают маааааленький процент открытий, но пройдет немного времени — год, два — и эпоха закончится (не во всех областях, не сразу и не для всех, и всё же).