Фильтр «Выборка»: сэмплирование данных внутри темы

Новые возможности анализа данных в системе Brand Analytics: теперь в темах типа Соцмедиа и онлайн-СМИ доступен фильтр «Выборка». Этот функционал дает вам возможность работать не только с полным объемом данных, но и формировать необходимые выборки, которые репрезентуют весь массив собранных сообщений.

При создании фильтра вам необходимо указать размер выборки и принцип ее формирования.

Размер выборки — это процент собранного объема сообщений, формирующий выборку. Вы можете выбрать размер выборки от 1% до 99%. Чем больше размер, тем выше точность выборки, но и выше ваши трудозатраты при работе с ней. При этом для больших массивов данных нет смысла «гнаться» за большим размером выборки. А при малых массивах, если и использовать выборку, то не «экономить» на ее размере.

Доступны два типа выборки:

  • Равномерная – производится случайным образом из всей совокупности.
  • Равномерная с учетом типа источника – группирует исходную совокупность сообщений в подгруппы по типам источников. Затем производится случайная выборка из каждой подгруппы по отдельности.

Сформированную выборку вы можете сохранить как персональный фильтр. При его создании доступен параметр обновления выборки. Если он выбран, то в выборку добавляются новые сообщения в соответствии с ее настройками. При этом сообщения, которые уже попали в выборку, остаются в ней при каждом применении фильтра. Если фильтр задан без обновления, то выборка будет зафиксирована и не будет пополняться новыми сообщениями.

Работа с сэмплированными данными внутри темы позволяет уменьшить количество обрабатываемых вручную сообщений до разумного количества. При этом, для поиска инсайтов и поддержки пользователей, контроля репутации рекомендуем работать с полным потоком данных.

Фильтр «Выборка» доступен клиентам начиная с тарифа «Расширенный». Применить фильтр можно будет к сообщениям, собранным после 1 сентября.

Система Brand Analytics также позволяет задать выборку на этапе сбора в тему. Подробнее про эту возможность вы можете прочитать в новости «Новый функционал сэмплирования данных при сборе темы».

Бесплатный демонстрационный доступ

Персональный консультант проведет демонстрацию и поможет протестировать систему с учетом ваших бизнес-задач

Запросить демо

Похожие статьи

Передача аналитики и сообщений из Корпоративного Детектора сбоев по API

Передача аналитики и сообщений из Корпоративного Детектора сбоев по API

Цветные группы авторов в Brand Analytics

«Группы авторов» — теперь цветные

Новые возможности для анализа и обработки дублей

Добавили фильтрацию оценок без текста на отзовиках и маркетплейсах

Последние статьи

Программа Brand Analytics Forum 2024: представляем спикеров форума по аналитике соцмедиа для решения задач государства

Вебинар 25 апреля: Как определить целевую аудиторию

Вебинар 25 апреля: «Как определить целевую аудиторию»

BrandGPT для быстрой аналитики соцмедиа и СМИ: пользователям Brand Analytics теперь доступен умный ИИ-ассистент

Аналитика соцмедиа для государства

Аналитика соцмедиа для государства: современный инструмент сбора и анализа обратной связи от граждан для принятия эффективных решений