Развитие поиска Mail.ru1. • Образец текста
«Поиск@Mail.Ru»
Владимир Габриелян
Вице-президент и технический директор
Руководитель Поиска, глава направления E-commerce
Mail.Ru Group
© Mail.ru Group предыдущая … 1 ... следующая
предыдущая … 1 ... следующая
2. Сегодня
Поиск@Mail.Ru - самая молодая и быстрорастущая поисковая система в Рунете.
• Образец текста
© Mail.ru Group предыдущая … 2 ... следующая
предыдущая … 2 ... следующая
3. Российский рынок: рост за 2011 год
• Образец текста
38980
26148
19413 18759
11402
33030
Feb-11 Feb-12 Jan-11 Jan-12 Jan-11 Jan-12
Yandex - Web Search Google Web Search Mail.Ru - Web Search
18% 35% 65%
Данные comScore, Россия, фев. 12 - фев. 11, месячная аудитория тыс. человек
© Mail.ru Group предыдущая … 3 ... следующая
предыдущая … 3 ... следующая
4. Доли поисковых систем на рынке
• Образец текста
54.3 9.5
36.2
6.6
50.5 34.6
Jan-11 Jan-12 Jan-11 Jan-12 Jan-11 Jan-12
Yandex - Web Search Google - Search Mail.ru - Search
-7% +6% +44%
Данные LiveInternet, total
© Mail.ru Group предыдущая … 4 ... следующая
предыдущая … 4 ... следующая
5. Аудитория поиска в РФ
янв.12 % роста фев.12
Mail.Ru 2 540,00 15,35% 2 930,00
Поиск - день
Яндекс 12 913,60 9,01% 14 077,00
• Образец текста
Mail.Ru 15 233,00 1,74% 15 498,60
Поиск -месяц
Яндекс 27 250,60 3,80% 28 286,00
Данные TNS, Россия, февраль 2012, 100 000+
© Mail.ru Group предыдущая … 5 ... следующая
предыдущая … 5 ... следующая
6. Доля рынка Поиск@Mail.Ru в России
Доля Поиска@Mail.Ru в России (по li.ru)
11
• Образец текста
10
9
Mail.Ru
8
7
6
© Mail.ru Group предыдущая … 6 ... следующая
предыдущая … 6 ... следующая
7. 4
5
6
7
9
10
11
12
8
25/Sep
•
05/Oct
15/Oct
© Mail.ru Group
25/Oct
04/Nov
14/Nov
24/Nov
04/Dec
Образец текста
15
17
19
21
23
25
27
14/Dec
25/Sep
24/Dec
05/Oct
03/Jan
15/Oct
13/Jan
25/Oct
23/Jan
02/Feb 04/Nov
12/Feb 14/Nov
22/Feb 24/Nov
03/Mar 04/Dec
13/Mar 14/Dec
Доля Поиска@Mail.Ru в Белоруссии (по li.ru)
23/Mar 24/Dec
Доля рынка в странах СНГ
03/Jan
3
4
5
6
7
8
9
13/Jan
25/Sep
23/Jan
05/Oct
02/Feb
15/Oct
12/Feb
25/Oct
04/Nov 22/Feb
14/Nov 03/Mar
24/Nov 13/Mar
Доля Поиска@Mail.Ru в Казахстане (по li.ru)
04/Dec 23/Mar
14/Dec
24/Dec
03/Jan
Яндекс
Mail.Ru
13/Jan
23/Jan
02/Feb
12/Feb
предыдущая … 7 ... следующая
предыдущая … 7 ... следующая
22/Feb
03/Mar
13/Mar
Доля Поиска@Mail.Ru на Украине (по li.ru)
23/Mar
8. • Образец текста
Качество поиска
© Mail.ru Group предыдущая … 8 ... следующая
предыдущая … 8 ... следующая
9. Качество тематического поиска
Качество тематического поиска.
Чем выше, тем лучше
40
• Образец текста
35
30
25
20 Google
Mail.Ru
15
Яндекс
10
5
0
Сколько на свете аквапарков и духовных семинарий? Не очень много, и при этом большинство из них
имеют свои сайты. Поэтому хороший ответ на запрос *аквапарки Казани+ или *духовные семинарии
СПб+ может и должен содержать полный список сайтов соответствующих организаций.
Запросы в этом анализаторе отобраны таким образом, чтобы для каждого из них имелось
ограниченное количество (не более десяти) прямо соответствующих им сайтов.
© Mail.ru Group предыдущая … 9 ... следующая
Данные Ашманов и Партнеры предыдущая … 9 ... следующая
10. Ответы на вопросы
Ответы на вопросы
75.00
• Образец текста
70.00
65.00
60.00
55.00 google
50.00 mail
45.00 yandex
40.00
35.00
30.00
9/26/11 10/26/11 11/26/11 12/26/11 1/26/12 2/26/12 3/26/12
Этот анализатор проверяет, насколько хорошо поисковые машины умеют находить ответы на вопросы
явные (содержащие вопросительное слово, например, *В каком году ЦСКА завоевал кубок УЕФА?+, *Где
добывают уран в России?+ или подразумеваемые (имеющие вид утверждения со значением
вопроса, например, *Автор книг Девятые врата+, *Общая высота водопада Анхель]).
Когда пользователь вводит запрос, содержащий явный или неявный вопрос, он, скорее всего, просто
ищет ответ. Чем быстрее он его увидит, тем лучше. В идеале ответ должен содержаться прямо на
странице результатов поиска, в первом же снипете.
© Mail.ru Group предыдущая … 10 ... следующая
Данные Ашманов и Партнеры предыдущая … 10 ... следующая
11. Устойчивость к опечаткам
Устойчивость к опечаткам
100
• Образец текста
90
80
70
60
google
50
mail
40
yandex
30
20
10
0
9/26/11 10/26/11 11/26/11 12/26/11 1/26/12 2/26/12
Человек – не робот и может ошибиться. В том числе и при вводе запроса в поисковую строку. Он
может просто допустить опечатку, введя соседний символ (и тогда вместо "запрос" получится
"звпрос"), он может по ошибке ввести символ дважды или пропустить вовсе (и тогда вместо
"запрос" получится "зпрос" или "заппрос"), наконец, он может не знать правильного написания
слова и ввести его "как слышится" (и тогда вместо "яндекс" получится "яндыкс").
© Mail.ru Group предыдущая … 11 ... следующая
Данные Ашманов и Партнеры предыдущая … 11 ... следующая
12. Качество поиска цитат
Качество поиска цитат
80
• Образец текста
70
60
50
40
google
30 mail
yandex
20
10
0
1/2/12
1/9/12
2/6/12
3/5/12
9/26/11
10/3/11
10/10/11
10/17/11
10/24/11
10/31/11
11/7/11
11/14/11
11/21/11
11/28/11
12/5/11
12/12/11
12/19/11
12/26/11
1/16/12
1/23/12
1/30/12
2/13/12
2/20/12
2/27/12
3/12/12
3/19/12
Цитатный поиск - это поиск конкретного текста по его известному фрагменту. Задавая такой
запрос, пользователь (обычно заинтересовавшийся цитируемым в сети высказыванием) пытается
найти оригинальное произведение, и задача поисковика выдать не отрывки и выдержки из него, а
полный текст.
© Mail.ru Group предыдущая … 12 ... следующая
Данные Ашманов и Партнеры предыдущая … 12 ... следующая
13. Качество поиска крылатых фраз
Качество поиска крылатых фраз
• Образец текста
60
50
40
google
30
mail
20 yandex
10
0
9/26/11 10/26/11 11/26/11 12/26/11 1/26/12 2/26/12
Данный анализатор собирает результаты поиска по запросам, содержащим крылатые слова – то
есть устойчивые словосочетания, которые вошли в язык из литературных источников и получили
широкое распространение.
© Mail.ru Group предыдущая … 13 ... следующая
Данные Ашманов и Партнеры предыдущая … 13 ... следующая
14. Запросы-синонимы
Запросы-синонимы
• Образец текста
75
70
65
60
google
55 mail
yandex
50
45
40
9/26/11 10/26/11 11/26/11 12/26/11 1/26/12 2/26/12
Один и тот же вопрос можно задать десятком способов. Например, для пользователей запросы "как
узнать адрес по номеру телефона", "поиск адреса по номеру телефона" и "найти адрес по номеру
телефона" имеют одинаковый смысл, это запросы-синонимы.
© Mail.ru Group предыдущая … 14 ... следующая
Данные Ашманов и Партнеры предыдущая … 14 ... следующая
15. • Образец текста
Искусственный интеллект
и машинное обучение
© Mail.ru Group предыдущая … 15 ... следующая
предыдущая … 15 ... следующая
16. Машинное обучение: что это такое
Компоненты ранжирования:
1. Факторы
2. •Алгоритм построения формулы
Образец текста
3. Обучающее множество
Выявленные Результаты
Люди Система
факторы, хара поиска
оценивают анализирует, ч
ктерные для становятся
результаты ем «хорошие»
«хороших» лучше, «хорош
работы сайты
сайтов ие» сайты
поисковой отличаются
внедряются в лучше
системы от «плохих»
формулу ранжируются
© Mail.ru Group предыдущая … 16 ... следующая
предыдущая … 16 ... следующая
17. Машинное обучение
70
65
• Образец текста
60
55
50 mail
mail_beta
45
40
35
• В феврале мы запустили публичную тестовую версию нашего нового алгоритма на
основе технологий искусственного интеллекта и машинного обучения: O.Go.mail.ru
• Сегодня она перегнала по качеству основную версию поиска
© Mail.ru Group предыдущая … 17 ... следующая
предыдущая … 17 ... следующая
18. • Образец текста
Роль дистрибуции в
продвижении поиска
© Mail.ru Group предыдущая … 18 ... следующая
предыдущая … 18 ... следующая
19. Что такое дистрибуция
Дистрибуция – один из важных каналов для продвижения любой поисковой
системы.
• Образец текста
Существует несколько популярных направлений дистрибуции:
Тулбары (Яндекс-бар, «Спутник@Mail.Ru», Google Toolbar)
«Поиск по умолчанию» в настройках существующего у пользователя браузера
(search box)
“Брендированные” сборки популярных браузеров Firefox, Opera, Chrome
Предустановленные поиски в мобильных устройствах (iPhone с Google, Bada c
Яндексом) составляют 90% запросов с мобильных устройств
Стартовые страницы
© Mail.ru Group предыдущая … 19 ... следующая
предыдущая … 19 ... следующая
20. Дистрибуция в мире
Google toolbar появился в декабре 2000
• Google Desktop появился в октябре 2004
Образец текста
с 2005 года Google устанавливает Toolbar вместе с WinZip, Real Player и
InterVideo WinDVD, а так же в составе инсталлятора Adobe Flash Player
Первый сёрч-бокс в появился в октябре 2006 в Internet Explorer 7 (Microsoft)
В 2006 году Mozilla Firefox подписывает соглашение о партнёрстве с Google
В 2008 году Google запускает Google Chrome
В 2012 Google Chrome – самый популярный браузер
© Mail.ru Group предыдущая … 20 ... следующая
предыдущая … 20 ... следующая
21. Дистрибуция в России
Первый Яндекс.Бар появился ещё в 2000-2001 (для IE), 2003-2004 (для FF)
Образец текста
• С 2005 появился Sputnik@Mail.Ru
C 2006-2007 года Яндекс.Бар стал активно дистрибуцироваться
В конце 2007 дистрибуцию начал вести QIP
C 2007 года Яндекс по умолчанию в Opera
C 2008 года Яндекс по умолчанию в Firefox
В 2009 появился Guard QIP
С 2011 года Mail.Ru распространяет собственный браузер “Интернет” на
основе Chromium
© Mail.ru Group предыдущая … 21 ... следующая
предыдущая … 21 ... следующая
22. Дистрибуция в поисковых системах
Доля дистрибуции в переходах с Яндекса и поиска Mail.ru
в процентах (по top.mail.ru)
• Образец текста
60
50
40
30
20
10
0
Jan/11 Feb/11 Mar/11 Apr/11 May/11 Jun/11 Jul/11 Aug/11 Sep/11 Oct/11 Nov/11 Dec/11 Jan/12 Feb/12 Mar/12
Jan/11 Feb/11 Mar/11 Apr/11 May/11 Jun/11 Jul/11 Aug/11 Sep/11 Oct/11 Nov/11 Dec/11 Jan/12 Feb/12 Mar/12
Яндекс 53.87 54.62 55.15 54.71 54.55 54.74 55.41 55.36 54.84 55.27 55.95 55.47 54.04 53.04 53.43
Поиск Mail.ru 32 31.4 31.2 30.5 29.1 28.3 29.1 29.8 30.2 31.6 32.8 35.9 42.51 47.59 48.18
© Mail.ru Group предыдущая … 22 ... следующая
предыдущая … 22 ... следующая
23. Дистрибуция в поисковых системах
Отношение дистрибуционных переходов с Поиска@Mail.ru
и Яндекса (по top.mail.ru)
• Образец текста
25.00%
20.00%
15.00%
отн
10.00%
5.00%
0.00%
© Mail.ru Group предыдущая … 23 ... следующая
предыдущая … 23 ... следующая
24. • Образец текста
Тренды в развитии поиска
© Mail.ru Group предыдущая … 24 ... следующая
предыдущая … 24 ... следующая
25. Тенденции
• Образец текста
Выделение фактов, прямые ответы на вопросы
Социализация: подстройка поиска под конкретного человека
Регионализация
Рост числа факторов ранжирования
Мультиплатформенность: мобилизация, ТВ
© Mail.ru Group предыдущая … 25 ... следующая
предыдущая … 25 ... следующая
26. Мультиплатформенность
• Образец текста
Web-версии для мобильных устройств и
планшетов
Голосовой поиск для мобильных устройств:
iOS: iPhone/iPad/iPod, Android
Готовится к выходу:
WP7, Bada
Идёт разработка интерфейсов для ТВ
© Mail.ru Group предыдущая … 26 ... следующая
предыдущая … 26 ... следующая
27. Статистика использования мобильной версии Поиск@Mail.ru
Запросы к мобильной версии Поиска@Mail.ru (веб и
• Образец текста картинки) в млн. (внутренняя статистика)
30
25
20
15
запросы
10
5
0
Feb/11 Mar/11 Apr/11 May/11 Jun/11 Jul/11 Aug/11 Sep/11 Oct/11 Nov/11 Dec/11 Jan/12 Feb/12
© Mail.ru Group предыдущая … 27 ... следующая
предыдущая … 27 ... следующая
28. Куда движется продукт
Мультиплатформенность: уже выпущены приложения для голосового поиска
под iOS и Android (golos.mail.ru), выходят WP7 и Bada версии
• Образец текста
Мы первыми запустили "лайки в выдаче" ещё год назад. Наши поисковые
подсказки умеют подстраиваться под пол и возраст пользователя
Регионализация: мы уже научились привязывать сайты к регионам, теперь
учимся определять геозависимость запроса
Увеличение числа факторов ранжирования: от ручной настройки десятков
факторов, к сотням факторов
Тестируем до 600+ факторов в технологиях машинного обучения и
искусственного интеллекта на o.go.mail.ru
Извлечение фактов и семантический поиск
© Mail.ru Group предыдущая … 28 ... следующая
предыдущая … 28 ... следующая
29. Социализация
Рекомендации от людей в поисковой выдаче:
• Образец текста
Соц.дем. подсказки:
© Mail.ru Group предыдущая … 29 ... следующая
предыдущая … 29 ... следующая
30. Семантический поиск
• Образец текста
Извлечение фактов, например, о лекарствах в Поиске@Mail.Ru
© Mail.ru Group предыдущая … 30 ... следующая
предыдущая … 30 ... следующая
31. • Образец текста
Q&A
© Mail.ru Group предыдущая … 31 ... следующая
предыдущая … 31 ... следующая