Недавно посчастливилось побывать на Yandex Cup 2025 в роли «медиа» — так было написано на моём бейджике. Приглашение пришло совершенно без обязательств и какой-либо нагрузки, что позволило наблюдать за происходящим со стороны.
Для гостей, не участвующих в основном соревновании, была предусмотрена отдельная программа. Она включала один доклад, который, на мой взгляд, был весьма достойным: лид претрейна Яндекса поделился верхнеуровневым обзором обучения языковых моделей. А вот «дискуссии» оказались, мягко говоря, не очень интересными. Вечером для представителей «медиа» был организован ужин в ресторане, где царила приятная атмосфера.
О Соревновании
Само соревнование было разделено на шесть треков, среди которых были ML, бэкенд, аналитика, а также три других направления. Почти каждый трек делился на три категории: основную, юниорскую и для сотрудников Яндекса. Общая продолжительность соревнования составляла пять часов. Участники могли заранее подготовить своё рабочее окружение, а для каждой задачи были предоставлены бейзлайны. Важное условие: для решения задач было запрещено использовать модели по API, разрешалось только self-hosted развёртывание.
ML-Трек: Взгляд Изнутри
Я сфокусировал внимание на ML-треке. Признаюсь, как «медиа» мне было довольно скучно, хотя вокруг было немало интересных стендов, где можно было попробовать себя в различных традиционных ремёслах. Участникам же, судя по всему, было гораздо веселее.
Задачи в ML-треке были посвящены различным аспектам работы с большими языковыми (LLM) и визуальными языковыми моделями (VLM)
- Первая задача требовала поиска замаскированных «иголок в стоге сена» в обширном наборе текстов, что по сути является поиском скрытых данных в больших объёмах информации.
- Вторая задача касалась проведения adversarial атак картинками на VLM для вопросов и ответов, цель которых — изменить их ответ на конкретный вопрос.
- Третья задача предлагала сгенерировать изображения с минимальным числом заполненных пикселей, которые при этом должны быть корректно распознаны VLM как определённые объекты.
Организация и Нюансы
С точки зрения логистики и обустройства площадки, всё было организовано на высшем уровне, что, впрочем, характерно для всех мероприятий Яндекса, на которых мне доводилось бывать.
Среди забавных моментов запомнилась лоббистская часть мероприятия: один из приглашённых спикеров, турецкий зам. министр транспорта и инфраструктуры, не упустил случая упомянуть вклад Реджепа Тайипа Эрдогана в своей речи. Также отмечу яркое выступление команды ИТМО, занявшей второе место в ML-треке, и их фотосессию с флагом университета, а также последующую «ответку» от ЦУ в другом треке.
Было очень приятно пообщаться с коллегами по «медиа-цеху»: Борисом (@boris_again), Артёмом (@ai_newz), Настей (@ainastia), Сергеем (@doomgrad), Лаидой (@tech_priestess) и Таней (@dl_stories). Обмен мнениями и впечатлениями всегда ценен.