Diese Präsentation wurde erfolgreich gemeldet.
Die SlideShare-Präsentation wird heruntergeladen. ×

20130420 mathematics and_internet-advertizing_in_internet-viktor_lobachev

Anzeige
Anzeige
Anzeige
Anzeige
Anzeige
Anzeige
Anzeige
Anzeige
Anzeige
Anzeige
Anzeige
Anzeige
Nächste SlideShare
02 2016 Workshop VON
02 2016 Workshop VON
Wird geladen in …3
×

Hier ansehen

1 von 78 Anzeige

Weitere Verwandte Inhalte

Ähnlich wie 20130420 mathematics and_internet-advertizing_in_internet-viktor_lobachev (20)

Anzeige

Weitere von Computer Science Club (20)

20130420 mathematics and_internet-advertizing_in_internet-viktor_lobachev

  1. 1. Математика в Интернет-рекламе Виктор Лобачев
  2. 2. 3 Математика в Интернет-рекламе •Особенности рекламы в Интернет •Наш взгляд на аудиторию •Как показывать рекламу? •Моделирование
  3. 3. Альберт Эйнштейн Вы думаете, всѐ так просто? Да, всѐ просто. Но совсем не так. Реклама в Интернет
  4. 4. 5 Особенности рекламы в Интернет •Offline и Online реклама •Медийная и контекстная реклама •Участники игры
  5. 5. 6 Offline реклама •Журналы, щиты на дорогах, телевидение, … – Заранее известны: тираж журналов, время показа по телевидению и т.д. – Заранее оценивается: объем и характеристики аудитории – Обратная связь только очень долгосрочная
  6. 6. 7 Offline реклама Кампания 1 Кампания 2 Кампания 3 Кампания 4 Кампания N Рекламные кампании Рекламное агентство Планирование, размещение Газеты, журналы Телевидение Наружная реклама
  7. 7. 8 Online реклама. Базовая схема. Кампания 1 Кампания 2 Кампания 3 Кампания 4 Кампания N Рекламные кампании Аудитория Рекламный сервер Сайты Интернета Планирование, показы
  8. 8. 9 Online реклама •Интернет – Известны: рекламодатели, их кампании, сайты. – Заранее оценивается: трафик по сайтам – Каждый посетитель интернета может получать свою рекламу, и это можно контролировать.
  9. 9. 10 Online реклама •Основные отличия от Offline – Фиксируется каждый показ. – На каждый запрос можно реагировать «на лету» – Система показов может обладать обратной связью – Система планирования должна учитывать алгоритмы системы показов.
  10. 10. 11 Медийная и контекстная реклама •Медийная реклама: обычные старые добрые баннеры – Показываются независимо от текущего содержания страницы • Контекстная реклама: баннер или текстовое объявление – Показываются в зависимости от содержания страницы – Яркий пример: показ объявления зависит от поискового запроса
  11. 11. 12 Online реклама. Участники игры. • Рекламодатели: рекламные кампании • Объем, время, целевая аудитория, ограничения • Ресурсы Интернета: сайты, страницы • Тематика, аудитория, трафик • Посетители • Пол, возраст, доход, интересы, поведение
  12. 12. Роберт Зенд Общего у людей только одно: все они разные. Наш взгляд на аудиторию
  13. 13. Как смотрели на аудиторию несколько лет назад 1. Принадлежащих императору 2. Набальзамированных 3. Дрессированных 4. Молочных поросят 5. Сирен 6. Сказочных 7. Бродячих собак 8. Включенных в данную классификацию 9. Неисчислимых 10.Нарисованных самой лучшей верблюжьей кисточкой 11.Тех, которые только что разбили цветочную вазу Древняя китайская классификация животных. Животные подразделяются на:
  14. 14. 15 Как смотрели на аудиторию несколько лет назад Аудитория Сегменты были неупорядочены Посетитель был «приписан» к некоторым сегментам
  15. 15. 16 Наш взгляд на аудиторию •Пространство сегментов аудитории •Таргетирование рекламных кампаний •Вероятностное представление посетителей •Вероятность попадания посетителя в таргет
  16. 16. 17 Пространство сегментов аудитории. Категории. • Категория определяет множество взаимоисключающих значений какой-либо характеристики. –Пример: возраст. Человеку не может быть одновременно 25 и 40 лет. • Значения в общем случае неупорядочены. –Пример: пол, мужчины и женщины. • Категории независимы. –Пример: пол и возраст.
  17. 17. 18 Пространство сегментов аудитории. Сегменты. • Простой сегмент: значение по одной из категорий. • Атомарный сегмент: совокупность значений по всем категориям 36+19-35-18 Муж Жен Пол Возраст Категория сегментов Простые сегменты Атомарный сегмент
  18. 18. 19 Пространство сегментов аудитории. Сегментный куб. • Сегментный куб - пересечение множеств простых сегментов по разным категориям. –Примеры: –Пример множества, не являющегося сегментным кубом: Муж Жен Пол Возраст-18 19-35 36+ Муж Жен Пол Возраст-18 19-35 36+ Муж Жен Пол Возраст-18 19-35 36+
  19. 19. 20 Таргетирование рекламных кампаний • Таргет (целевая аудитория) – область в пространстве сегментов, является сегментный кубом по определению. • Кампании с более сложной целевой аудиторией разбиваются на несколько:Пол -18 19-35 Возраст Муж Жен Пол -18 19-35 36+ Возраст Муж Жен -18 19-35 36+ Возраст Муж Жен Пол 36+ Таргет кампании 1 Таргет кампании 2
  20. 20. 21 Вероятностный взгляд на посетителей • Посетитель – реальный человек. Жен Муж Пол Возраст-18 19-35 36+ 0% 0% 0%100% 0% 0%
  21. 21. 22 Вероятностный взгляд на посетителей • Посетитель – реальный человек. • Модель посетителя – «суперпозиция реальных людей», т.е. распределение вероятностей. Жен Муж Пол Возраст-18 19-35 36+ 0% 0% 0%100% 0% 0% Муж Жен Пол Возраст-18 19-35 36+ 15% 5% 15%50% 15% 0%
  22. 22. 23 Вероятностный взгляд на посетителей. Как хранить профиль? • Хранить многомерное распределение вероятностей слишком дорого. • Кроме того, его очень трудно получить. • Решение – хранить проекции. Муж Жен Пол Возраст-18 19-35 36+ 15% 5% 10%50% 20% 0% ЖенМуж 40% 60% 20% 40% Пол Вероятность 60%
  23. 23. 24 Вероятностный взгляд на посетителей. Как построить профили? Поведение посетителей из обучающей выборки Вероятностные профили посетителей Крутилка Обучение Классификация Параметры классификации Другие приложения Поведение всех посетителей Классификация при помощи машинного обучения
  24. 24. 25 Вероятностный взгляд на посетителей. Опасность хранения проекций. • В одном доме живут 2 человека.
  25. 25. 26 Жен Вероятностный взгляд на посетителей. Опасность хранения проекций. • В реальности – 2 человека. • Получаются проекции: Муж Пол Возраст-18 19-35 36+ 0% 50% 0%50% 0% 0% ЖенМуж 40% 50% 20% 50% Пол Вероятность 60% 40% 50% 20% 50% Возраст Вероятность 60% -18 36+19-35 • Как восстановить реальность? 0%
  26. 26. 27 Вероятностный взгляд на посетителей. Опасность хранения проекций. • Если просто перемножить вероятности, то получатся 4 человека. Жен Муж Пол Возраст-18 19-35 36+ 0% 25% 0%25% 25% 25% А этих двоих тут не было
  27. 27. 28 Вероятностный взгляд на посетителей. Восстановление профиля по проекциям. 33.3% 33.3% 36+ Доход 19-35 -18 Возраст A B C 10% 7%8% 2%40% 12% 7% 10% 4% Распределение всех посетителей сайта: Простые вероятности пользователя: 40% 70% 20% 20% 19-35 60% -18 36+ Возраст 10% % 40% 33.3% 20% Доход % Возраст A B C 3% 1%2% 4%80% 7% 14% 6% 2% Доход Атомарные вероятности пользователя 36+ 19-35 -18 A B C Томография
  28. 28. Восстановление профиля по проекциям. Ограничения:
  29. 29. 30 Восстановление профиля по проекциям • Задача – минимизация квадратичного функционала. • Размерность задачи равна количеству атомарных сегментов. Случай «Пол- Возраст-Доход» дает размерность 30. • Решение нужно искать при каждом запросе.
  30. 30. 31 Восстановление профиля по проекциям • Задача – минимизация квадратичного функционала. • Размерность задачи равна количеству атомарных сегментов. Случай «Пол- Возраст-Доход» дает размерность 30. • Решение нужно искать при каждом запросе.
  31. 31. 32 Попадание посетителя в таргет • Задача: найти одно число – вероятность принадлежности посетителя к таргету. А В Доход Возраст-18 26-35 36+19-25 С Таргет:
  32. 32. 33 Попадание посетителя в таргет • Таргет – сегментный куб. • Следовательно, можно по каждой категории перейти к двум значениям: «Принадлежит – Не принадлежит» 40%40% Простые вероятности посетителя: 40% 60% 20% 20% 26-35 60% -18 36+ Возраст 10% % 40% 20% 20% ВА С Доход % 19-25 10% А В Доход Возраст-18 26-35 36+19-25 С Таргет: Вероятности попадания в таргет: 40% 20% Нет 60% По возрасту % По доходу Да 70% 30% 40% 20% Нет 60% % Да 40% 60%
  33. 33. 34 Попадание посетителя в таргет • 40% 20% Нет 60% По возрасту % По доходу Да 70% 30% 40% 20% Нет 60% % Да 40% 60% Нет Да Да Нет 10%40% 30% 20% Вероятности попадания посетителя в таргет: Распределение по сайту: Подходит по возрасту? Подходит По доходу? Нет Да Да Нет 5%35% 35% 25% Окончательные вероятности для посетителя по сайту: Подходит По доходу? Подходит по возрасту? Интересующая нас вероятность попадания в таргет
  34. 34. 35 Попадание посетителя в таргет •
  35. 35. 36 Попадание посетителя в таргет. Решение задачи без ограничений.
  36. 36. 37 Попадание посетителя в таргет. Решение задачи без ограничений. • 1-мерный случай:
  37. 37. 38 Попадание посетителя в таргет. Решение задачи без ограничений. • 1-мерный случай: • 2-мерный случай:
  38. 38. 39 Попадание посетителя в таргет. Решение задачи без ограничений. • 1-мерный случай: • 2-мерный случай: • 3-мерный случай:
  39. 39. 40 Попадание посетителя в таргет. Решение задачи без ограничений. • 1-мерный случай: • 2-мерный случай: • 3-мерный случай: • n-мерный случай:
  40. 40. Альберт Эйнштейн Сделай настолько просто, насколько это возможно, но не проще. Как показывать рекламу
  41. 41. 42 Как показывать рекламу •Рекламные кампании •Крутилка •«Классическая» модель •Real-Time Bidding (RTB)
  42. 42. 43 Как показывать рекламу. Кампании. • Идеальная цель рекламной кампании –Повысить прибыльность бизнеса • Реальные цели: –Просмотр пользователем баннеров –Клики пользователя по баннерам Медийная реклама Контекстная реклама
  43. 43. 44 Как показывать рекламу. Кампании. • Условия медийных кампаний: –Временные рамки –Количество показов –Растянутость показов во времени –Множество ресурсов (сайтов) –Целевая аудитория (таргет) –Ограничения на количество показов одному пользователю
  44. 44. Как показывать рекламу. План показов рекламной кампании. Показы Время Т Общее количество показов 0 Временные рамки План показов, растягивающий показы во времени
  45. 45. • Профили определены нечетко • Таргет рекламной кампании задан точно • Алгоритмы должны максимизировать процент целевых показов при любом трафике Как показывать рекламу. Таргет кампании.
  46. 46. Как показывать рекламу. Крутилка. Кампания 1 Кампания 2 Кампания 3 Кампания 4 Кампания N Рекламные кампании Рекламный сервер Планирование, показы «Крутилка» Запрос Ответ При каждом запросе крутилка принимает решение, объявление какой рекламной кампании надо показать
  47. 47. Как показывать рекламу. Крутилка. • Выделяются две подзадачи: – Определение множества кампаний, объявления которых можно показать – Конкурс – выбор одной кампании из этого множества Вторая подзадача (выбор кампании из известного множества) решается эвристически, случайным выбором с заданным весом. Сосредоточимся на первой подзадаче: Какие кампании включать в это множество?
  48. 48. Как показывать рекламу. Крутилка. Показы Время Т Общее количество показов 0 Временные рамки План показов, растягивающий показы во времени Реальные показы
  49. 49. Как показывать рекламу. Крутилка. Показы Время Т Общее количество показов 0 Временные рамки План показов, растягивающий показы во времени Реальные показы Надо выполнить план, при этом оптимизировав другие показатели
  50. 50. Как показывать рекламу. Крутилка. Нечеткие профили ТаргетОпределение вероятности принадлежности к таргету Реальный посетитель 0 1 ПоказыватьНе показывать Порог постоянно подстраивается Вероятность принадлежности к таргету
  51. 51. Математическая модель 10.50 R(t) Дополнительные условия:
  52. 52. Математическая модель. Критерии.
  53. 53. Как показывать рекламу. Real-Time Bidding. RTB - система DSP 1Сайт 1 Сайт 2 Сайт N Посетители сети Интернет Сайт 3 DSP 2 DSP 3 Кампания 1 Кампания 2 Кампания 3 Кампания 4 Кампания 5 Кампания 6 Кампания 7 Кампания M DSP – Demand-Side Platform, аналог крутилки в классической схеме.
  54. 54. Как показывать рекламу. Real-Time Bidding. •RTB –Проводит аукцион по каждому запросу –Выбирает максимальную ставку из предложенных –Обеспечивает показ объявления выигравшей кампании •DSP –Выбирает подходящую кампанию –Определяет свою ставку
  55. 55. Real-Time Bidding •
  56. 56. Real-Time Bidding. Вероятность показа. 0.1 1 10 Ставка b Вероятности выигрыша ( ) для разных сайтов: 0 1 Зная функцию вероятности выигрыша, можно контролировать скорость показов при помощи ставок.
  57. 57. Real-Time Bidding. Вероятность показа. 0-1 1-2 2-3 3-4 4-5 5-6 6-7 Ставка Количество выигравших ставок 0-1 1-2 2-3 3-4 4-5 5-6 6-7 Ставка Количество проигравших ставок 0-1 1-2 2-3 3-4 4-5 5-6 6-7 Ставка
  58. 58. Real-Time Bidding. Простейший случай. •
  59. 59. Real-Time Bidding. Простейший случай. Получаем систему уравнений: для всех р.
  60. 60. Real-Time Bidding. Простейший случай. •Недостатки простейшего подхода: – Ставка не зависит от кампании – Много вычислений при каждом запросе – Зависимость вероятности выигрыша от ставки трудно оценить
  61. 61. Real-Time Bidding. Реальный подход к биддингу. •Каждая кампания имеет свои ставки –Ставки медленно меняются во времени –Ставки зависят от сайта, с которого пришел запрос •Выбор кампании внутри DSP – процесс, независимый от биддинга.
  62. 62. Real-Time Bidding. Реальный подход к биддингу. • Ответы на запросы RTB τ2 τ1 Время Пересчет весовПересчет ставок
  63. 63. Real-Time Bidding. Цель та же - план. Показы Время Т Общее количество показов 0 Временные рамки План показов, растяг ивающий показы во времени Реальные показы Надо выполнить план, при этом оптимизировав другие показатели
  64. 64. Real-Time Bidding. Биддинг для пар кампания-сайт. Изолиния текущей скорости показов Изолиния новой скорости показов
  65. 65. Real-Time Bidding. Как увязать биддинг и таргетинг? Скорость показа меньше желаемой Да Нет Ускорить показ Ставка максимальна? Значение порога R максимально? Замедлить показ R→R-dR Да R→R+dR Изменение порога вероятности Нет Увеличение ставок Снижение ставок Изменение ставок ДаНет R – порог вероятности попадания в таргет Схема предполагает приоритет попадания в таргет над затратами
  66. 66. Real-Time Bidding. Как увязать биддинг и таргетинг? Оптимальная траектория должна учитывать соотношение цены показа и качества аудитории 0 0 Траектории • Предложенный алгоритм движется по такой траектории: • Возможно, другие траектории покажутся более оптимальными :
  67. 67. Real-Time Bidding. Об общей задаче DSP. •
  68. 68. Дуайт Эйзенхауэр План – ничто, планирование – всѐ. Моделирование
  69. 69. 70 Моделирование •Зачем? •Как?
  70. 70. 71 Моделирование. Зачем оно нужно? Кампания 1 Кампания 2 Кампания 3 Кампания 4 Кампания N Рекламные кампании Аудитория Рекламный сервер Сайты Интернета Удастся ли сделать все показы? Какие посетители увидят объявления каждой из кампаний? Можно ли добавить новую кампанию? Как она повлияет на уже созданные кампании?
  71. 71. 72 Моделирование. Что Моделируем? • Известна история: – Точное время каждого посещения каждого сайта – Профиль каждого посетителя • Хотим узнать: – Какие посетители придут на каждый из сайтов – Какая реклама им будет показана Сутки Исторический интервал Время Интервал прогноза
  72. 72. 73 Моделирование. Как моделировать? Исторический трафик Прогноз трафика Предсказанный трафик Выборка из истории посещений Предиктор Предсказанные посещения Кампании Модель крутилки Картина показов - вход - выход - модуль Количество посещений, активность пользователей Детальная картина посещений сайтов пользователями Каким посетителям будут показаны объявления, сколько доступно свободного места
  73. 73. 74 Моделирование. Прогноз трафика. • Прогнозируется объем трафика и средняя активность пользователя –Выделение тренда –Выделение сезонности –Экстраполяция
  74. 74. 75 Моделирование. Предиктор. • Делаем случайную выборку пользователей. Работаем только с этой выборкой. • Для каждого дня прогноза случайно выбираем тот же день недели в истории. • Делаем нормировки в соответствии с историческим и прогнозным трафиком. • Детальный прогноз трафика готов!
  75. 75. 76 Моделирование показов рекламы. Кампания 1 Кампания 2 Кампания 3 Кампания 4 Кампания N Рекламные кампании Выборка из аудитории Модель рекламного сервера Сайты Интернета Нормируем условия рекламных кампаний на размер выборки. Запускаем процесс, аналогичный реальному, но с маленькой выборкой. Результат нормируем на полную аудиторию.
  76. 76. 77 Заключение •Задач много: – Алгоритмы показа соц-дем рекламы – Алгоритмы игры на аукционе RTB – Построение профилей посетителей – Оценка вероятности попадания в таргет – Предсказание трафика – . . . – А ведь мы даже не коснулись контекстной рекламы… •Решены далеко не все задачи
  77. 77. Виктор Лобачев, Ph.D. Аналитик, Рекламные технологии victor@yandex-team.ru Спасибо!

×