Руководство по созданию поисковых запросов. Часть 2. Персоны

В первой статье мы рассмотрели настройку объектов с уникальными названиями, такими как, например, Аэрофлот, Сбербанк, IKEA. Часто в рамках настройки темы требуется также найти упоминания первых лиц компании, даже если имя бренда не присутствует в тексте сообщения. Еще более распространенная задача — поиск упоминаний по медийным личностям: политикам, артистам, бизнесменам, блогерам.

Особенность настройки поисковых запросов по персонам в том, что довольно часто встречаются случаи омонимии (слова с одинаковым написанием, но разным значением) для фамилий, произошедших от названий профессий, народностей, представителей флоры и фауны, (Орлов и орлов, Рыбаков и рыбаков, Французов и французов).

В этой статье мы расскажем, как пошагово настроить поиск упоминаний персон так, чтобы соблюсти баланс между полнотой сбора (нет пропусков сообщений) и релевантностью (в теме нет однофамильцев).

В качестве базиса мы используем 5 шагов настройки:

  1. Распространенные варианты самых частых слов, характеризующих объект: на кириллице, латинице, варианты с ошибками.
  2. Адрес сайта.
  3. Официальные группы в соцсетях.
  4. Хештеги.
  5. Сокращенные и сленговые названия, жаргонизмы, ассоциации.

Не всегда будут использованы все пять пунктов. Например, у нашей персоны может не быть сайта и страниц в соцсетях, но в процессе настройки мы должны пройти эти шаги и проверить наличие всех параметров.

Открываем в браузере две идентичные вкладки c настройкой темы. Первую используем для настройки и сохранения финального запроса, вторую — для проверки каждой части запроса на частоту использования и релевантность. Настраивать мы будем в форме с операторами.

Так как при настройке любого запроса мы идем от широкого поиска к узкому, то сначала пробуем поиск только по фамилии, без имени.

Во второй вкладке вводим фамилию нашей персоны и нажимаем кнопку «Показать результаты».

Для удобства рассмотрим три варианта развития событий:

Вариант 1. При вводе фамилии все сообщения релевантны и действительно относятся к настраиваемой персоне.
Вариант 2. В выдаче встречаются однофамильцы.
Вариант 3. Фамилия очень распространенная, часто встречается в сообщениях без имени персоны, возможен вариант омонимии.

Вариант 1. Выдача по фамилии полностью релевантна.

Возможно, выборка в предпросмотре будет полностью релевантна — наша задача значительно упростится, фактически мы можем воспользоваться статьей по настройке объектов с уникальными названиями (ссылка). Примеры таких персон — Владимир Путин, Ксения Собчак, Анатолий Чубайс. Их фамилии достаточно уникальны и будут во всех случаях указывать на отношение к настраиваемой персоне.

Воспользовавшись пятью шагами настройки поискового запроса по Ксении Собчак, мы получим запрос:

собчак, sobchak, sobchakprotivvseh, kseniasobchakgroup, sob4ak, sobcak, ксениясобчак, ксюшасобчак, ксюшадь, xeniasobchak

Перед сохранением финального запроса еще раз проверяем объем и релевантность выдачи с помощью кнопки «Показать результаты», а затем переходим к следующим пунктам настройки темы.

Вариант 2. В выдаче встречаются однофамильцы.

Представим, что у нас стоит задача настроить тему по упоминаниям Никиты Михалкова.

Протестировав выдачу по только фамилии, мы увидим упоминания как однофамильцев, так и членов семьи Михалковых.

Конкретизировать поиск поможет использование имени и инициалов.

«Никита Михалков»~1 — Тильда 1 позволяет найти не только склоняемые упоминания имени и фамилии рядом в указанном порядке, но и вставить между ними еще одно произвольное слово, например, отчество.

«Михалков Никита»~0 – так как между фамилией и именем отчество уже быть не может, ставим ~0 для нахождения слов рядом и возможности склонения.

Для поиска вариантов с инициалами добавляем

«михалков н с»~0, «н с михалков»~0

Сайт отсутствует.

Для поиска аккаунтов в соцсетях в запрос пишем

Nsmikhalkov, nikitabesogon, «vk com nm»~0

Обычно мы используем только часть ссылки, но так как для страницы в контакте ns слишком неуникальное сочетание, добавляем в запрос более длинную часть.

После добавления хештегов и распространенного прозвища готовый запрос выглядит так:

«Никита Михалков»~1, «Михалков Никита»~0, «михалков н с»~0, «н с михалков»~0, «михалков н с»~0, «н с михалков»~0, никитамихалков, михалковникита, бесогон

Перед сохранением финального запроса еще раз проверяем объем и релевантность выдачи с помощью кнопки «Показать результаты», а затем переходим к следующим пунктам настройки темы.

Вариант 3. Фамилия очень распространенная, часто встречается в сообщениях без имени персоны, возможен вариант омонимии.

Рассмотрим самый сложный вариант: распространенная фамилия, наличие омонимии и частые упоминания персоны без указания имени, но с привязкой к профессиональной деятельности. Чаще всего такие варианты встречаются при мониторинге упоминаний политических деятелей.

В качестве примера возьмем губернатора Московской области Андрея Юрьевича Воробьева.

Как обычно, мы должны пройти 5 шагов настройки.

1. Распространенные варианты написания. Вбив фамилию во вторую вкладку для проверки, в показанных результатах сразу сталкиваемся с омонимией (упоминаниями птиц и Джека Воробья) и множеством однофамильцев.

Убираем омонимы добавлением минус-слов в точном соответствии: «воробей», «воробью», «воробьям», «воробьями», «воробьи», «воробьевы горы»~0, затем конкретизируем, что нам нужны упоминания Андрея Воробьева.

«андрей воробьев»~1

По данному варианту по всем типам источников выдача релевантная, но необходимо учесть и другие варианты.

Так как в некоторых сообщениях фамилия может стоять перед именем, а тильда 1 не дает возможности перестановки слов, добавляем

«Воробьев андрей юрьевич»~0

На первый взгляд, использование отчества в запросе излишне, но «воробьев андрей»~0, дает в результатах сообщения вида: «Егор Воробьев, Андрей Платонов – Чевенгур», когда данные фамилия и имя, хоть и стоят рядом, но относятся к разным людям. Таким образом, необходимо уточнение в виде отчества.

Также добавляем вариант с инициалами:

«Воробьев а ю»~0

В значительной части сообщений не будет упоминания имени, но будет привязка к профессиональной деятельности, поэтому к фамилии Воробьев нам требуется дополнительный контекст.

Для Андрея Воробьева это будут слова губернатор, Подмосковье, Московская область, Путин, министр, министерство т.д.

В результате чего у нас появляются запросы:

Воробьев губернатор, Воробьев губернаторский, Воробьев губер, Воробьев Подмосковье, Воробьев «московская область»~0, Воробьев «московская обл»~0, Воробьев подмосковный, Воробьев министр, Воробьев министерство, Воробьев нашеподмосковье, Воробьев московскаяобласть

Каждую часть запроса мы тестируем отдельно, пополняя список минус-слов.

Для качественной проверки рекомендуем в сложных случаях проверить запрос не только по всем типам источников сразу, но и по отдельности: в СМИ, соцсетях, блогах и т.д., так как релевантность выдачи для них может быть разной.

Англоязычный вариант запроса будет также содержать имя, иначе будет много нерелевантных сообщений:

«andrey vorobyev»~2, «andrey vorobiev»~2 .

Тильда 2 позволяет не только вставить между двумя словами два произвольных слова, но и поменять указанные слова местами.

По завершению первого этапа настройки запрос выглядит так:

2. Сайт. Отсутствует. Этот пункт пропускаем.

3. Официальные аккаунты в соцсетях. Добавляем к запросу andreyvorobiev, vorobievandrey, 100001789519210 (аккаунт в Facebook).

4. Хештеги. Дополняем вариантами: андрейворобьев, воробьевандрей.

5. Сокращенные и сленговые названия, жаргонизмы, ассоциации – отсутствуют.

Итоговый вариант запроса:

Перед сохранением финального запроса рекомендуем еще раз проверить объем и релевантность выдачи с помощью кнопки «Показать результаты», а затем перейти к следующим пунктам настройки темы.

Конечно, в некоторых сообщениях будут упоминания Воробьева и без контекста губернаторства, упоминания региона и прочего. Действительно такие сообщения есть и порой достаточно важные. Но они обычно встречаются там, где люди понимают, о каком Воробьеве идет речь без контекста. На практике таких сообщений немного, и существенно на картину инфополя они не влияют. Но если нужен максимально полный сбор сообщений по персоне, можно заводить и дополнительные темы с облегченным запросом, но с ограничением по авторам, источникам и географии.

Например, для региональных политиков можно завести вторую тему с облегченным запросом. В запросе мы в настройках ограничиваем географию нужным регионом и используем только фамилию, без контекста и минус-слов. Но так как по статистике география определяется только у 50-70% сообщений, необходимо сочетать оба подхода.

В следующей статье мы расскажем о том, как настраивать упоминания брендов с неуникальными названиями (например, «Снежная Королева», «Магнит» и др.).

 

Запись опубликована в рубрике Обучающие материалы. Добавьте в закладки постоянную ссылку.
Рубрика: Обучающие материалы
Автор:
Комментариев: 0
Добавить комментарий

Ваш e-mail не будет опубликован. Обязательные поля помечены *

*