feedback

AI саммари

Автор поделился впечатлениями от посещения Yandex Cup 2025 в роли "медиа", отметив высокий уровень организации и относительно скучную программу для не-участников. Особое внимание уделено ML-треку, где участники решали сложные задачи с LLM и VLM, включая поиск "иголок в стоге сена" и adversarial атаки. В посте также упомянуты интересные моменты и общение с коллегами из медиасферы.
от FlowFeed AI
Обновлено: 8 hours ago

Недавно посчастливилось побывать на Yandex Cup 2025 в роли «медиа» — так было написано на моём бейджике. Приглашение пришло совершенно без обязательств и какой-либо нагрузки, что позволило наблюдать за происходящим со стороны.



Для гостей, не участвующих в основном соревновании, была предусмотрена отдельная программа. Она включала один доклад, который, на мой взгляд, был весьма достойным: лид претрейна Яндекса поделился верхнеуровневым обзором обучения языковых моделей. А вот «дискуссии» оказались, мягко говоря, не очень интересными. Вечером для представителей «медиа» был организован ужин в ресторане, где царила приятная атмосфера.



О Соревновании


Само соревнование было разделено на шесть треков, среди которых были ML, бэкенд, аналитика, а также три других направления. Почти каждый трек делился на три категории: основную, юниорскую и для сотрудников Яндекса. Общая продолжительность соревнования составляла пять часов. Участники могли заранее подготовить своё рабочее окружение, а для каждой задачи были предоставлены бейзлайны. Важное условие: для решения задач было запрещено использовать модели по API, разрешалось только self-hosted развёртывание.



ML-Трек: Взгляд Изнутри


Я сфокусировал внимание на ML-треке. Признаюсь, как «медиа» мне было довольно скучно, хотя вокруг было немало интересных стендов, где можно было попробовать себя в различных традиционных ремёслах. Участникам же, судя по всему, было гораздо веселее.



Задачи в ML-треке были посвящены различным аспектам работы с большими языковыми (LLM) и визуальными языковыми моделями (VLM)

"LLM (Large Language Models) — это класс языковых моделей на основе нейронных сетей, способных понимать и генерировать человеческий текст. VLM (Vision-Language Models) — это мультимодальные модели, которые могут обрабатывать и связывать информацию как из текста, так и из изображений."
. (Эти детали были записаны со слов составителей и участников, так как тексты условий задач мне не показывали):



  • Первая задача требовала поиска замаскированных «иголок в стоге сена» в обширном наборе текстов, что по сути является поиском скрытых данных в больших объёмах информации.

  • Вторая задача касалась проведения adversarial атак картинками на VLM для вопросов и ответов, цель которых — изменить их ответ на конкретный вопрос.

  • Третья задача предлагала сгенерировать изображения с минимальным числом заполненных пикселей, которые при этом должны быть корректно распознаны VLM как определённые объекты.



Организация и Нюансы


С точки зрения логистики и обустройства площадки, всё было организовано на высшем уровне, что, впрочем, характерно для всех мероприятий Яндекса, на которых мне доводилось бывать.



Среди забавных моментов запомнилась лоббистская часть мероприятия: один из приглашённых спикеров, турецкий зам. министр транспорта и инфраструктуры, не упустил случая упомянуть вклад Реджепа Тайипа Эрдогана в своей речи. Также отмечу яркое выступление команды ИТМО, занявшей второе место в ML-треке, и их фотосессию с флагом университета, а также последующую «ответку» от ЦУ в другом треке.



Было очень приятно пообщаться с коллегами по «медиа-цеху»: Борисом (@boris_again), Артёмом (@ai_newz), Настей (@ainastia), Сергеем (@doomgrad), Лаидой (@tech_priestess) и Таней (@dl_stories). Обмен мнениями и впечатлениями всегда ценен.

Yandex Cup 2025: Взгляд 'Медиа' на ML-Трек и Организацию
Link copied