Тарифные планы

Как анализировать данные опроса

Вы собрали результаты своего опроса, и у Вас уже есть план анализа данных. Теперь пора разобраться в этих данных, рассортировать их и проанализировать.

Анализировать данные опросов стало просто

Вы получили результаты своего онлайн-опроса. Теперь у Вас есть статистические результаты опроса и план анализа данных, а значит самое время оценить полученную информацию. Вот как наши специалисты по изучению опросов находят объяснение количественным данным (разбор качественных данных отличается), начиная с обзора ответов и выделения главных вопросов исследования и целей опроса и заканчивая обработкой чисел и формулированием выводов.

Посмотрите, как SurveyMonkey проводит анализ результатов на одном дыхании

Чтобы эффективнее оценивать результаты опроса, выполните следующие 4 действия:

  1. определите главные вопросы исследования;
  2. составьте перекрестную таблицу и отфильтруйте результаты;
  3. проведите расчет;
  4. сделайте выводы.

Отметьте главные вопросы исследования

Сначала давайте выясним, как Вы будете рассчитывать результаты опроса, исходя из главных вопросов исследования. Выделяли ли Вы вопросы практического вопросы исследования? Пробовали ли Вы применить вероятностную выборку? Помните, что, ставя цель для своего опроса, Вы должны сформулировать главные вопросы исследования.

Например, если Вы организовали образовательную конференцию и провели среди участников опрос для сбора отзывов о проведенном мероприятии, один из Ваших главных вопросов исследования может звучать примерно так: «Как участники оценили конференцию в целом?». Теперь взгляните на полученные ответы на конкретный вопрос, который является главным в исследовании:

Планируете ли Вы участвовать в этой конференции в следующем году?

Варианты ответа
Да71 %852
Нет18 %216
Не знаю11 %132
Всего1200

Обратите внимание, что среди ответов есть как процентные значения (71 %, 18 %), так и абсолютные цифры (852, 216).

Проценты — это просто процентные доли респондентов, которые дали определенный ответ. Иначе говоря, проценты показывают количество респондентов, которые дали каждый из ответов, в отношении к общему количеству людей, которые ответили на вопрос. Так, 71 % респондентов (852 из 1200 опрошенных) планируют посетить конференцию в следующем году.

Из этой таблицы также видно, что 18 % респондентов не планируют участвовать снова, а 11 % еще не знают.

Составление перекрестных таблиц и фильтрация результатов

Когда Вы ставили цель для своего опроса и разрабатывали план анализа результатов, Вы наверняка думали о том, какие подгруппы собираетесь анализировать и сравнивать. И это было правильное решение! Например, Вы хотели узнать, как отличаются друг от друга ответы преподавателей, студентов и администраторов на вопрос об участии в конференции в следующем году. Чтобы выяснить это, Вы можете составить перекрестную таблицу, в которой результаты будут показаны по подгруппам:

ДаНетНе знаюВсего
Преподаватель80 %
320
7 %
28
13 %
52
400
Администратор46 %
184
40 %
160
14 %
56
400
Студент86 %
344
8 %
32
6 %
24
400
Всего респондентов8522161321200

Из этой таблицы видно, что значительное большинство студентов (86 %) и преподавателей (80 %) планируют участвовать в конференции в следующем году. Однако администраторы, посетившие Вашу конференцию, не столь заинтересованы в том, чтобы принять участие в Вашей конференции еще раз: менее половины (46 %) из них собираются это сделать. Надеемся, что некоторые другие наши вопросы помогут Вам понять, а чем причина таких результатов, и что можно сделать, чтобы конференция стала более привлекательной для администраторов.

Фильтр — это еще один полезный инструмент моделирования данных. Фильтр позволяет сузить область рассмотрения до одной конкретной подгруппы и отфильтровать другие. Таким образом, вместо того, чтобы сравнивать подгруппы друг с другом, здесь мы просто рассмотрим, как одна подгруппа ответила на вопрос. Например, можно отфильтровать данные по полу, а затем повторно создать перекрестную таблицу по типу участников, чтобы сравнить администраторов-женщин, преподавателей-женщин и студенток. Однако при таком выделении данных следует помнить: при каждом применении фильтра или перекрестной таблицы размер выборки уменьшается. Чтобы убедиться, что Ваши результаты остаются статистически значимыми, полезно использовать калькулятор размера выборки.

Сопоставительный анализ, определение тенденций и сравнительные данные

Допустим, один из ключевых вопросов в опросе о Вашей конференции звучит так: «В целом, насколько вы удовлетворены этой конференцией?». Результаты показывают, что конференцией довольны 75 % участников. Казалось бы, довольно хороший результат Но нельзя ли больше контекста? С чем сравнивать? Это лучше или хуже, чем в прошлом году? А по сравнению с другими конференциями?

Допустим, Вы задали такой вопрос в опросе для сбора отзывов о прошлогодней конференции. Тогда Вы сможете сравнить ответы и выявить тренды. Исследователи общественного мнения знают, что выявление трендов — уже половина успеха.

Если в прошлом году уровень удовлетворенности был 60 %, то в этом году он увеличился на 15 процентных пунктов! Что вызвало это повышение удовлетворенности? Ответы на другие Ваши вопросы помогут это прояснить.

Если у Вас нет данных с конференций прошлых лет, начните с этого года собирать отзывы после каждой конференции. Это называется сопоставительным анализом. Вы задаете контрольную или эталонную цифру и, двигаясь вперед, можете видеть, изменился ли этот показатель и если да, то как. Можно сопоставлять не только удовлетворенность участников, но и другие аспекты. Вы сможете год за годом отслеживать, что думают участники конференции. Это называется анализом длительного наблюдения.

Можно даже отслеживать данные для разных подгрупп. Допустим, что уровень удовлетворенности с каждым годом растет у студентов и преподавателей, но не у администраторов. Возможно, Вы захотите посмотреть ответы администраторов на различные вопросы и попытаться понять, почему они менее удовлетворены, чем другие участники.

Работа с числами

Вы знаете, сколько участников сообщили о своем желании снова участвовать в конференции, но откуда Вы знаете, можно ли доверять ответам на этот опрос и можно ли с уверенностью использовать их для обоснования будущих решений? Важно, чтобы Вы учитывали качество Ваших данных и знали, что составляет статистическую значимость.

В обиходной речи слово «значимость» означает важность или значительность. Но для анализа и статистики опросов этот термин означает «оценка точности». Здесь в работе над опросом неизбежно появляется слово «приблизительно». В частности, оно означает, что результаты опроса точны в пределах определенной степени достоверности, а не по случайным причинам. Делать выводы на основе неточных (то есть статистически незначимых) результатов рискованно. Первым фактором, который следует учитывать при любой оценке статистической значимости, является репрезентативность выборки, то есть насколько группа людей, принимавшая участие в Вашем опросе, «похожа» на общую совокупность людей, для которой Вы хотите сделать выводы.

Возможно, все не так хорошо, если из участников конференции, которые ответили на опрос, 90 % — мужчины, однако лишь 15 % всех участников конференции были мужчинами. Чем больше Вы знаете о группе, которую хотите изучать, тем больше уверенности у Вас будет, когда Ваш опрос согласуется с этими цифрами. По крайней мере, если речь идет о поле, то Вам не о чем беспокоиться, если в этом примере мужчины составляют 15 % респондентов.

Если выборка Вашего опроса сформирована путем случайного отбора из известной общей совокупности, статистическую значимость можно рассчитать простым способом. Основной фактор при этом — размер выборки. Предположим, что в опросе приняли участие 50 из 1000 человек, принявших участие в Вашей конференции. Пятьдесят — это небольшой размер выборки, который вызывает большую погрешность. Иными словами, Ваши результаты не будут иметь большого веса.

Например, Вы спросили своих респондентов, сколько из 10 заседаний конференции они посетили. И Ваши результаты выглядят так:

12345678910ВсегоСредняя оценка
Кол-во заседаний10 %
100
0 %
0
0 %
0
5 %
50
10 %
100
26 %
280
24 %
240
19 %
190
5 %
50
1 %
10
10006,1

Возможно, Вы захотите проанализировать среднее значение. Как Вы помните, существует три разных типа средних величин: среднее арифметическое, медиана и мода.

В приведенной выше таблице среднее количество посещенных заседаний составляет 6,1. Здесь указано среднее арифметическое — тот тип средней величины, который, вероятно, наиболее знаком Вам. Чтобы определить среднее арифметическое, Вы складываете все значения и делите их на количество сложенных значений. В этом примере у нас 100 человек, которые посетили одно заседание, 50 человек с четырьмя заседаниями, 100 человек с пятью заседаниями и т. д. Итак, Вы перемножаете эти пары чисел, суммируете их и делите на общее количество участников.

Медиана — это другая разновидность средней величины. Медиана представляет собой значение, которое располагается посередине, на отметке 50 %. Чтобы обнаружить это значение, в таблице выше мы находим точку (количество заседаний), слева и справа от которой будут находиться по 500 человек. Медиана в данном случае составляет шесть заседаний. Эта величина позволяет устранить влияние статистических выбросов, которые могут исказить Ваши данные.

И последний тип средней величины — это мода. Мода представляет собой наиболее частый ответ, в нашем случае — шесть. 260 участников опроса посетили шесть заседаний — больше, чем любое другое количество заседаний.

Среднее арифметическое и другие типы средних значений также можно использовать, если Ваши результаты основаны на шкалах Лайкерта.

Делаем выводы

Когда понадобится составить отчет по результатам опроса, подумайте, о чем говорят данные.

Скажем, Ваша конференция в целом получила посредственные оценки. Вы проанализировали данные и выяснили, в чем дело. Данные показывают, что участники дали очень высокие оценки почти всем аспектам Вашей конференции — пленарным заседаниям и занятиям, культурной программе и размещению — но город, выбранный для конференции, им очень не понравился. (Возможно, конференция проводилась в Чикаго в январе, когда на улице слишком холодно.) Вывод: конференция в целом отличная, но неудачный выбор места. Зимнюю конференцию лучше было бы устроить в Майами или Сан-Диего.

Один из аспектов анализа данных и составления отчетов, который необходимо учитывать, это причинно-следственная связь и корреляция.

Проанализируйте Ваш следующий опрос вместе с SurveyMonkey

Приложение

Что означает сбор данных опроса?

Сбор данных опроса происходит при получении информации от определенных респондентов. Сбор данных опроса может заменять или дополнять другие типы сбора данных, включая собеседование, фокус-группы и т. д. Данные, собранные при опросах, могут быть использованы для усиления вовлеченности сотрудников, исследования поведения покупателей и улучшения обслуживания клиентов.

Что такое анализ длительного наблюдения?

Анализ длительного наблюдения (или «анализ трендов») показывает, как реакция на определенные вопросы изменяется со временем. После того, как будет установлен эталонный уровень, Вы сможете определить, будут ли меняться показатели и как они будут меняться. Предположим, что уровень удовлетворенности Вашей конференцией составлял 50 % три года назад, 55 % два года назад, 65 % в прошлом году и 75 % в этом году. Замечательные показатели! Анализ длительного наблюдения показывает устойчивый тренд удовлетворенности на повышение.

В чем разница между корреляцией и причинно-следственной связью?

Причинно-следственная связь имеет место, когда один фактор вызывает другой, а корреляция — когда две переменные изменяются вместе, но ни одна не влияет на другую. Например, горячий шоколад и варежки — это две переменные, которые коррелируют друг с другом: они увеличиваются и уменьшаются вместе. Однако ни одна из них не является причиной для другой. На самом деле причиной возникновения обоих является третий фактор — холодная погода. Холодная погода влияет как на потребление горячего шоколада, так и на вероятность надевания варежек. Холодная погода — это независимая переменная, а потребление горячего шоколада и вероятность одевания варежек — зависимые переменные. В нашем опросе о конференции холодная погода, вероятно, повлияла на неудовлетворенность участников конференции местом проведения и конференцией в целом. Для дальнейшего изучения взаимосвязи между переменными в Вашем опросе может понадобиться регрессионный анализ.

Что такое регрессионный анализ?

Регрессионный анализ — это продвинутый метод визуализации и анализа данных, который позволяет посмотреть на взаимосвязь между двумя или более переменными. Существует много типов регрессионного анализа, и ученые выбирают один или несколько из них в зависимости от переменных, которые изучаются. Все типы регрессионного анализа имеют одну общую черту: они исследуют влияние одной или нескольких независимых переменных на зависимую переменную. При анализе данных этого опроса нам может быть интересно узнать, какие факторы больше всего влияют на удовлетворенность участников конференции. Дело в количестве заседаний? Основном докладчике? Культурной программе? Сайте? Используя регрессионный анализ, исследователь может определить, влияет ли удовлетворенность этими различными атрибутами конференции на общую удовлетворенность, и если да, то в какой степени.

Это, в свою очередь, дает представление о том, какие аспекты полезно будет изменить на следующей конференции. Скажем, например, Вы заплатили большой гонорар, чтобы заполучить на вступительное заседание конференции популярного оратора. Участники дали этому оратору и конференции в целом высокие оценки. Исходя из этих двух фактов, Вы можете подумать, что выступление знаменитого (и дорогого) оратора — ключ к успеху конференции. Но так ли это на самом деле Вам поможет выяснить регрессионный анализ. Вы можете обнаружить, что популярность основного докладчика была основным фактором удовлетворенности конференцией. Если так, то Вы захотите снова пригласить такого же докладчика на следующий год. Но, допустим, регрессия показывает, что, хотя докладчик понравился всем, это не сильно повлияло на удовлетворенность участников конференции. Если это так, большие деньги, потраченные на докладчика, лучше всего потратить на что-нибудь другое. Если Вы постараетесь тщательно проанализировать достоверность данных опроса, Вы сможете сделать полученные ответы фундаментом для принятия грамотных решений.