2. Содержание
2
1. Подготовка к ведению работ.
2. Основные текстовые факторы ранжирования в
современных поисковых системах.
3. Составление ТЗ на копирайт
4. Типы поисковых запросов
4
• Геозависимые (90% случаев)
• Коммерческие ссылки
принимаются во внимание
• Коммерческие страницы в
ТОПе (исключение СПЕКТР)
• Коммерческие факторы
ранжирования
• Цены, фото, возможность
купить или заказать
товар/услугу
• Геонезависимые
• Можно не покупать ссылки
• Лучше не совмещать с
коммерческими на одной
странице
• Более полные / объемные
статьи
• Важна общая
авторитетность ресурса
Коммерческие Информационные
5. Подготовка к проведению работ
5
По каждому запросу важно получить
• Тип запроса (коммерческий или информационный)
• Частоту по статистике Яндекса (общую и точную)
• Целевую страницу (URL)
• Прогнозируемый бюджет на ссылки
• Текущую позицию в поиске
8. Основные типы факторов
8
Факторы учитывающие плотность вхождения, объем
• процент вхождений слов из запроса
• BM25 (число вхождений каждого слова и объем текста в
словах)
• различные вариации BM25 с различными весами слов и
учётом синонимов
Факторы учитывающие близость и порядок слов из запроса
• повышенный вес у текста в начале документа
• чистое вхождение
• последовательности из двух слов из запроса
• совпадение позиций слов в предложении (текст) и в запросе
(на странице поиска)
Синонимы (переколдовки)
9. Встречаемость слов из документа
9
Основные параметры:
TF – число вхождений леммы в документ (предварительная лемматизация),
DocLength – длина документа в словах,
CF – число вхождений леммы в коллекцию,
D – число документов в коллекции,
HDR – сумма весов за форматирование ( слово в первом предложении,
втором предложении, внутри выделяющихся html-тегов).
P – вероятность того, что документ “про это слово”.
10. Учет пар слов
10
Варианты учета пар слов и веса вхождений:
• Слова встречаются подряд (+1).
• Слова встречаются через слово или в обратном порядке (+0,5).
• Слова встречаются через одно слово и идут подряд (+0,1).
Основные параметры:
TF – количество вхождений пары в текст с учетом весов вхождений.
p1 и p2 – p для первого и второго слова пары по формуле
11. Учет всех слов из запроса в документе, учет фраз
11
1. Бонус за наличие в документе всех слов из запроса.
2. Наличие запроса целиком в тексте.
3. Наличие в тексте предложений, содержащие многие слова из
запроса.
Основные параметры:
• Nmiss – количество отсутствующих в документе слов запроса.
• TF – количество вхождений запроса в текст документа.
• TFp – количество предложений в тексте, где сумма idf слов из запроса,
больше половины суммы idf всех слов из запроса.
12. Relevance feedback
12
1. Дополнительный бонус получают документы той же
темы, что и первые документы выдачи (классификация
документов по темам Яндекс.Каталога).
2. Бонус получают документы, использующие сходную с
лидерами лексику. (Типичная группа: дружба,
понимание, тепло, нежность, страсть, забота, узы, брак,
семейный, диван, тысячелетие, уставать, бессмертие…).
13. Те же факторы «по-русски»
13
Основные факторы Трудности при работе
Объем текста
Процент вхождений
Морфология
Специализированные
термины
Синонимы
Структура: списки, картинки
Топонимы
Откуда брать?
Можно ли однозначно
рассчитать?
Поиск синонимов
Контроль при формировании
текста
14. В общем случае
14
В общем случае, расчет текстовых показателей
производится по ТОП-10 по запросу.
При этом, отбрасываются:
• Справочники и не подходящие по тематике ресурсы
(Википедия и другие)
• Слишком авторитетные и витальные сайты (kremlin.ru,
ru.wikipedia.org и т.п.)
Выявляются ближайшие соседи (Евклидова метрика)
15. Поиск ближайших соседей
15
Пред-фильтрация для анализа
• Тип ресурса, список витальных сайтов
• Главная / Внутренняя страница
• СПЕКТР
Факторы для анализа (координаты вектора)
• Возраст сайта в днях
• Число релевантных запросу документов
• Посещаемость (оценка)
• тИЦ / число уникальных доноров сайта
• …
16. Языковые модели
16
n-грамные языковые модели
1. На практике чаще используются n = 1 (уни-), 2 (би-), 3 (три-).
2. Вероятность появления слова n в последовательности
зависит только от предыдущих n-1 слов.
17. Самое простое решение
17
«Универсальные» решения для 70% запросов
Объем текста
Процент вхождений
Морфология
Специализированные термины
Синонимы
Структура: списки, картинки
Обычно: от 1 200 до 3 000 знак.
По дефолту: 2%
Надо: 1 чистое + 1 разбавка
Добавляем: тематические слова
Обязательно: слова из подсветки
1 список и 1 картинка на 1 000 – 1
500 знаков текста
18. А если запрос ВЧ и ВК?
18
Для конкурентных запросов
всё может быть сильно иначе!
Делайте расчет по ТОП-10 и
ЭКСПЕРИМЕНТИРУЙТЕ!
19. Алгоритм формирования ТЗ на копирайт
19
Составление
ключевых фраз
для ТЗ на текст
Поиск
синонимов и
тематических
слов
Задание
ограничений на
использование
слов из запроса
Расчет объема
текста
Формирование
структуры
текста
20. Составление ключевых фраз для ТЗ
20
С чем мы сталкиваемся ?
• Много ключей на страницу
• Текстовый антиспам
• Недостаточная релевантность
по текстовым факторам
Что будет, если внести в ТЗ на копирайт все
378 ключей в исходном виде?
22. Основные правила компоновки запросов
22
Когда более 6-8 ключей идут на страницу =)
1. Компонуем чистые вхождения так,
чтобы они все дополняли друг
друга.
• сайты по поиску грузов в
России
• сайты по поиску грузов и
машин
Получается 1 чистое:
[сайты по поиску грузов и
машин в России]
2. Делаем чистыми вхождениями
первые 5 самых популярных
фраз по точной частоте, а
остальные фразы добавляем
вокруг словами.
Есть 2 самых частотных фразы:
• сайты по поиску грузов
• сайты по поиску грузов в России
И есть НЧ фраза:
• сайты поиск грузов и машин
Получается фраза: [сайты по поиску
грузов в России и машин]
23. + НЕ ЗАБЫВАЕМ
23
Неестественные фразы приводим к корректной форме с точки зрения русского
языка. Например: поиск грузов сайты-> поиск грузов на сайте.
Следим за тем, чтобы каждое слово из продвигаемых запросов встречалось в
ключевых фразах для текста не менее 3 раз (могут быть исключения при
больших объемах слов).
Не забываем добавлять топоним (Москва).
Следим за тем, чтобы не была превышена плотность по N-граммам в списке
ключевых фраз для текста (проверка http://text.ru/seo).
Тип запроса Число вхождений
2-х словный 1 чистое + 1 морфология + 1 слова из запроса встречаются
через одно слово + далее слова запроса разбросаны по тексту
3-х словный 1 чистое + 1 морфология (+ точное title + анкоры = СПАМ ???)
4-х словный можно без чистого вхождения (зависит от контекста запроса)
24. Пример компоновки ключевых фраз
24
Продвигаемые запросы Скомпонованные запросы
для ТЗ на текст
• груз для перевозки
• грузы для перевозки
• поиск груза
• поиск грузов
• груз найти
• найти груз
• грузы для перевозчиков
• ищу груз
• груз найти для перевозки
• как найти груз для перевозки
• как найти грузы для перевозок
• найду груз для перевозки
• найти груз для перевозки
• найти груз на перевозку
• …
• Онлайн поиск грузов и грузоперевозок
по городам России бесплатно
• Поисковик товаров для грузоперевозок
на авто
• Отыскать на сайте грузы и
грузоперевозчиков для доставки по
России
• Популярный сайт, где можно найти груз
и заказы для перевозки бесплатно
• Найти свободные грузы в Москву и
Московскую область на портале
• …
25. Пример компоновки ключевых фраз
25
Продвигаемые запросы Скомпонованные запросы
для ТЗ на текст
• картины ге
• художник ге
• н н ге картины
• николай ге картины
• ге художник картины
• ге николай николаевич картины
• художник николай ге
• творчество ге
• художник н н ге
• русский художник ге
• живопись ге
• Картины Николая Николаевича Ге
• Живопись и картины русского художника Ге
• Творчество и картины Н. Н. Ге
• Живопись и картины Николая Николаевич
Ге
• Русский художник Николай Николаевич Ге
и живопись
• Творчество русского художника
• Произведения и творчество
28. Поиск специализированных терминов
28
1. Настраиваем отображение выдачи с расширенными описаниями
сниппетов.
2. Компонуем сниппеты с сайтов топ-10 (advego.ru, text.ru).
3. Составляем частотный словарь.
4. Пишем текст используя данные термины и лексику.
перевозка
транспорт
грузоперевозка
находить
россия
попутный
свободный
транспортный
перевозчик
система
страна
машина
29. Считаем оставшиеся метрики
29
• Указываем ограничение на использование слов по
самому частотному слову с целью избежать
переспам/переоптимизацию.
• Рассчитываем объем текста (Количество символов =
Число вхождений/0,02*6,5).
30. Считаем оставшиеся метрики
30
В нашем примере:
1. Использовать в тексте слова ”груз, поиск, грузоперевозки”, не более
15 раз (13 по скомпонованным фразам + 2 для удобного написания
копирайтеру).
2. Объем текста = 15/0,02*6,5= 4900 символов.
31. Контент: SEO vs маркетинг
31
Ищем баланс
1. SEO должно учитывать и интересы маркетинга
2. Во главу угла ставятся — число продаж с сайта
3. Недостаточно привлекать трафик, его надо
конвертировать
4. Текст можно сделать и SEO-оптимизированным и
продающим — это реально!
5. Текст мало кто читает целиком, для продаж делаем
ставку на:
– Заголовок
– Картинку / Иллюстрации
– Кнопку «Купить / Заказать»
32. Формирование структуры текста
32
Задание проблематики копирайтеру:
1. Писать про то, о чём пользователи оставляют
отзывы.
2. Для товарных запросов используем агрегаторы
отзывов market.yandex.ru, wikimart.ru и т.п.
3. Для сайтов услуг можно использовать порталы и
форумы с отзывами.
4. Выделение устойчивых би- триграмм при парсинге
текстов расширенных сниппетов.
34. Вёрстка и размещение текста
34
Требования к вёрстке текста
Верстаем параграфами: <p>текста</p> или <div>текст</div>
Заданные стили у: <h1>, <h2>, <h3>, <ul>, <ol>, <li>, <p>, <a>
Картинки с отступами: <img src="/img/img.png" alt="Описание"
class="imga" width="760" height="124" />
Код: отсутствие JS-скриптов в исходном коде
Ссылки: подчёркнутые ссылки
Форматирование: разбивать текст на небольшие логические блоки
35. Советы
35
1) Контролируйте вхождения слов из запроса в исходном коде
документа (alt и title картинок).
2) При составлении ТЗ на копирайт учитываем авторитетность
ресурса (возраст, посещаемость, количество страниц,
коммерческие факторы).
3) Избегаем наличия в контенте страницы непрерывного блока
текста.
4) Дополнительно можно давать копирайтеру слова, которые нельзя
использовать или использовать 1 раз: подобный, различные, на
сегодняшний день, можно, безусловно, всем известно, что, без
сомнения, бесспорно и так далее.
5) Проверяем текст от копирайтера по инструкции
http://www.pixelplus.ru/samostoyatelno/stati/vnutrennie-
faktory/trebovaniya-optimizacii-stranicy.html