Тренды в RecSys. Финальная лекция курса по рекомендательным системам в ШАД.
Вот и подошла первая итерация нашего курса к концу! Доделываю финальные слайды последней лекции на последнем издыхании)) Опыт очень крутой, как-нибудь позже напишу отдельный развернутый пост по результатам. А пока ловите содержимое финальной лекции:
1. Industry vs Academy, индустриальные тренды и откуда их узнавать. Отставание от других областей, bitter lesson, сами тренды.
2. Масштабирование. Scaling hypothesis, четыре оси масштабирования рексистем. Матрицы эмбеддингов, датасеты, контекст (признаки и история пользователя), энкодеры.
3. Actions speak louder than words. DLRM, inductive bias, генеративная постановка ранжирования и кандгена, HSTU, результаты, критика подхода.
4. LLM x RecSys. Мотивация, эволюция подходов, проблемы, recommendation-language gap.
5. Семантические айдишники. Мотивация, generative retrieval, вариационные автокодировщики, RQ-VAE, public и proprietary сетапы обучения, применения, оценки качества от Google
6. Foundation модели и кросс-платформенность
7. Снова про генеративные модели. OneRec, PinRec — описания подходов и результаты
Что не влезло — RL, mixture of logits, GPU Retrieval. И про LLM будет очень поверхностное обсуждение.
P.S: слайды как всегда скину после лекции :)
Вот и подошла первая итерация нашего курса к концу! Доделываю финальные слайды последней лекции на последнем издыхании)) Опыт очень крутой, как-нибудь позже напишу отдельный развернутый пост по результатам. А пока ловите содержимое финальной лекции:
1. Industry vs Academy, индустриальные тренды и откуда их узнавать. Отставание от других областей, bitter lesson, сами тренды.
2. Масштабирование. Scaling hypothesis, четыре оси масштабирования рексистем. Матрицы эмбеддингов, датасеты, контекст (признаки и история пользователя), энкодеры.
3. Actions speak louder than words. DLRM, inductive bias, генеративная постановка ранжирования и кандгена, HSTU, результаты, критика подхода.
4. LLM x RecSys. Мотивация, эволюция подходов, проблемы, recommendation-language gap.
5. Семантические айдишники. Мотивация, generative retrieval, вариационные автокодировщики, RQ-VAE, public и proprietary сетапы обучения, применения, оценки качества от Google
6. Foundation модели и кросс-платформенность
7. Снова про генеративные модели. OneRec, PinRec — описания подходов и результаты
Что не влезло — RL, mixture of logits, GPU Retrieval. И про LLM будет очень поверхностное обсуждение.
P.S: слайды как всегда скину после лекции :)

