№41: Рекомендаційні системи, ч.1. CTO про побудову рекомендаційних систем, їх складові і оцінку якості.

Опівночні Балачки

May 26 2023 • 57 mins

В гостях Дмитро Войтех, СТО @ S-PRO

🔞 Тут будуть матюки 🔞

Робочі посилання і коментарі в каналі ⁠⁠⁠⁠⁠⁠⁠⁠⁠https://t.me/midnight_chatter⁠

  • 0:00-0:30 Інтро
  • 0:30 - 1:18 — рекомендаційна система для банок на донати - поповнюйте рахунки Повернись Живим
  • 1:19 - 5:45 — Дмитро (ex-Giphy, CTO@S-PRO) розказує, чому він хороша людина на поговорити про рекомендаційні системи
  • 5:46 - 8:10 — чутки про те, в який ML/AI хочуть вкладати гроші європейські компанії
  • 8:10 - 11:43 — визначимо проблему рекомендацій, говоримо про задачу отримання інформації (information retrieval)
  • 11:44 - 12:20 — чому задачу рекомендацій варто розбивати на підсистеми
  • 12:21 - 17:15 — candidate generation – бази даних, векторні індекси, текстові індекси
  • 17:16 - 19:20 — що таке precision та recall, скільки потрібно сіньйорів…
  • 19:21 - 22:20 — чому фільтрувати кандидатів в рекомендації є хорошою ідеєю
  • 22:21 - 30:50 — на чому тренувати рекомендаційну систему: не забудьте полайкати наш подкаст на вашій улюбленій платформі!
  • 30:51 - 40:45 – для чого потрібні офлайн та онлайн метрики; роздумуємо про інтуїцію метрик для оцінки якості рекомендацій
  • 40:46 - 46:50 — чому Mean Reciprocal Rank (MRR) — ймовірно, не найкращий вибір для метрики, говоримо про Expected Reciprocal Rank (ERR) — чому структура гріда рекомендацій має значення
  • 46:51 - 47:45 – Click Through Rate (CTR)
  • 47:46 - 49:55 — говоримо про customer satisfaction та функції втрат для тренування рекомендаційної системи
  • 49:56 - 55:28 — проблема feedback loop, exploration vs exploitation, рандомізуємо рекомендації; багаторукі бандити
  • 55:29 - 57:28 — робимо паузу; оутро і канал 'Kyiv Data Science’; чекайте продовження в наступному випуску!

Долучайтесь до наших соцмереж:

Музика: ⁠⁠⁠⁠⁠⁠⁠⁠⁠https://www.streambeats.com/⁠⁠⁠⁠⁠⁠⁠⁠⁠ | ⁠⁠⁠⁠⁠⁠⁠⁠⁠@stasgavrylov