Поскольку в контекстной рекламе основным критерием таргетинга являются ключевые слова, то специалистам пригодится знания о морфологии.

Сжатие

В 1977 был издан грамматический словарь Зализняка. Он лег в основу большинства компьютерных морфологических словарей. В том числе и используемого в Яндексе. В нем около 100 тысяч слов и 3 миллиона словоформ.

Чтобы уместить весь этот объем на бумаге использовалось “сжатие”. Вместо того, чтобы писать все словоформы для каждого слова: “великий, великая, великого, великое…”. Были определены общие наборы окончаний и для определения слова нужно указать его начало и номер набор окончаний: “велик…, 121-ый набор окончаний”.

Такое сжатие приводит к потерям, которые не были существенны для бумажного словаря. Однако, в компьютерной морфологии это приводит к малозаметным артефактам, как и сжатие картинок в формат JPG.

m1

Например:

  • Глаголы и Деепричастия  это одно слово. сделать=сделавший=сделанный
  • Глаголы совершенного и несовершенного  вида не одно слово. Делать≠сделать
  • Склейка степеней прилагательных. Красивый=красивейший, хороший=лучший

В этом легко убедится с помощью WordStat. В морфологии Google подобных проблем нет.

Яндекс Google
глаголы и причастия cделать=cделавший=сделанный, купить=купивший=купленный cделать≠cделавший≠сделанный,
купить≠купивший≠купленный
вид глаголов делать≠сделать, купить≠покупать, варить≠сварить делать=сделать, купить=покупать, варить=сварить
степени прилагательных красивый=красивейший, надежный=надежнейший, хороший=лучший красивый≠красивейший, надежный≠надежнейший, хороший≠лучший
форма прилагательных красивый=красивее, надежный=надежнее, хороший=лучше красивый=красивее, надежный=надежнее, исключение: хороший≠лучше

 

Омонимия

В некоторых словоформах некоторые слова пишутся одинаково. Например, “нож из стали” и “мы стали сильнее”. Это называется омонимией.

Если вы добавите в AdWords или Директ ключевое слово `стали`, то системы не смогут понять что вы имели ввиду `стать` или `сталь` и ваша реклама будет показываться по обоим словам.

Поэтому, нужно стараться использовать в ключевых словах такие словоформы в которых нет омонимии. Чтобы система могла однозначно определить какое именно слово вы имели ввиду. Например, если вы продаете бильярдные кии, то не стоит писать “продажа киев”, лучше использовать “кии продажа”.

Однако, это помогает только в AdWords, но не в Директе.

Нормализация

В Яндекс.Директ используется упрощенная морфология. С так называемой нормализацией. Это позволяет значительно ускорить поиск. Однако, иногда это приводит к глюкам.

Если слова имеют омонимию в какой-то из словоформ, то они склеиваются в одно. Например, для Директа Дели (столица Индии) и дело одно и тоже слово.

m2

Это может привести к ошибкам в вашей рекламной кампании. Например, большинство показов ключевого слова “Москва Дели” будут по запросам вроде “уголовные дела москвы”. Чтобы не попасть в такую ситуацию нужно пробивать ваши ключевые слова используя WordStat или HTraffic.

Украинский язык

В Яндекс.Директ есть не только русская морфология, но еще и украинская, а нормализация действует не только на слова из одного языка. Таким образом, русские и украинские слова могут с друг-другом склеятся, если у них есть омонимия.

Из-за сходства двух языков такое происходит довольно часто и может показаться, что в Директе есть переводчик. Однако, это работает только когда с однокоренными словами, у которых есть омонимия. Например, квартиры/квартири. Но не работает в других случаях, например, август/серпень.

m3

В AdWords того-же эффекта можно добиться указав общую словоформу для двух языков. Например, вместо квартиры, ввести квартира.

AdWords

Справедливости ради хочу заметить, что у AdWords есть тоже проблема с морфологией. AdWords в минус-словах ее не понимает.

Например, вы продаете ноутбуки. И вы хотите избавится от запросов вроде “скачать драйвер для ноутбука”. Если вы добавите минус-слово `драйвер`, то показы по запросам содержащим другую словоформу все равно будут происходить. Например, ваше объявление все равно будет показываться по запросу `драйверы для ноутбука`.

Чтобы этого избежать нужно просклонять слово драйвер: драйвер, драйверы, драйвера, драйверов, … И добавить все эти словоформы как минус-слова. Ну либо использовать HTraffic, который обходит этот и многие другие подводные камни автоматически.