Yandex Cup 2025: Взгляд 'Медиа' на ML-Трек и Организацию

Недавно посчастливилось побывать на Yandex Cup 2025 в роли «медиа» — так было написано на моём бейджике. Приглашение пришло совершенно без обязательств и какой-либо нагрузки, что позволило наблюдать за происходящим со стороны.

Для гостей, не участвующих в основном соревновании, была предусмотрена отдельная программа. Она включала один доклад, который, на мой взгляд, был весьма достойным: лид претрейна Яндекса поделился верхнеуровневым обзором обучения языковых моделей. А вот «дискуссии» оказались, мягко говоря, не очень интересными. Вечером для представителей «медиа» был организован ужин в ресторане, где царила приятная атмосфера.

О Соревновании

Само соревнование было разделено на шесть треков, среди которых были ML, бэкенд, аналитика, а также три других направления. Почти каждый трек делился на три категории: основную, юниорскую и для сотрудников Яндекса. Общая продолжительность соревнования составляла пять часов. Участники могли заранее подготовить своё рабочее окружение, а для каждой задачи были предоставлены бейзлайны. Важное условие: для решения задач было запрещено использовать модели по API, разрешалось только self-hosted развёртывание.

ML-Трек: Взгляд Изнутри

Я сфокусировал внимание на ML-треке. Признаюсь, как «медиа» мне было довольно скучно, хотя вокруг было немало интересных стендов, где можно было попробовать себя в различных традиционных ремёслах. Участникам же, судя по всему, было гораздо веселее.

Задачи в ML-треке были посвящены различным аспектам работы с большими языковыми (LLM) и визуальными языковыми моделями (VLM)

"LLM (Large Language Models) — это класс языковых моделей на основе нейронных сетей, способных понимать и генерировать человеческий текст. VLM (Vision-Language Models) — это мультимодальные модели, которые могут обрабатывать и связывать информацию как из текста, так и из изображений."

. (Эти детали были записаны со слов составителей и участников, так как тексты условий задач мне не показывали):

Первая задача требовала поиска замаскированных «иголок в стоге сена» в обширном наборе текстов, что по сути является поиском скрытых данных в больших объёмах информации.

Вторая задача касалась проведения adversarial атак картинками на VLM для вопросов и ответов, цель которых — изменить их ответ на конкретный вопрос.

Третья задача предлагала сгенерировать изображения с минимальным числом заполненных пикселей, которые при этом должны быть корректно распознаны VLM как определённые объекты.

Организация и Нюансы

С точки зрения логистики и обустройства площадки, всё было организовано на высшем уровне, что, впрочем, характерно для всех мероприятий Яндекса, на которых мне доводилось бывать.

Среди забавных моментов запомнилась лоббистская часть мероприятия: один из приглашённых спикеров, турецкий зам. министр транспорта и инфраструктуры, не упустил случая упомянуть вклад Реджепа Тайипа Эрдогана в своей речи. Также отмечу яркое выступление команды ИТМО, занявшей второе место в ML-треке, и их фотосессию с флагом университета, а также последующую «ответку» от ЦУ в другом треке.

Было очень приятно пообщаться с коллегами по «медиа-цеху»: Борисом (@boris_again), Артёмом (@ai_newz), Настей (@ainastia), Сергеем (@doomgrad), Лаидой (@tech_priestess) и Таней (@dl_stories). Обмен мнениями и впечатлениями всегда ценен.

Yandex Cup 2025: Взгляд 'Медиа' на ML-Трек и Организацию

AI саммари