назад

34.           Подготовка данных к анализу.

Анализ собранных данных состоит из нескольких этапов:

1.Подготовка данных к анализу. Она включает проверку и редактирование анкет, кодирование.

2.  Базовый анализ или табуляция. Некоторые исследования на этих этапах и останавливаются, но во многих случаях анализ продолжается.

 

3.   Проверка статистической значимости наблюдаемых различий между группами и внутри групп.

Применение дисперсионного, корреляционного, фактор­ного и других методов анализа.

Качество статистических результатов напрямую зависит от того, насколько тщательно и аккуратно данные готовились к анализу (рис. 18).

Подготовка данных начинается по мере поступления анкет, в то время как полевые работы еще продолжаются. Если воз­никнут проблемы, ход полевых работ можно скорректировать в нужном направлении.

Проверка анкет-Редактирование-Кодирование-Преобразование-Очищение данных-Статистическая корректировка данных.

Проверка и редактирование анкет. По мере поступления анкеты проверяются на полноту заполнения, качество интервью, соответствие определенным кво­там.

Если в ходе проверки установлено, что: 1) не заполнены от­дельные части анкеты; 2) респондент не понял вопросов; 3) от­веты не варьируются, например, респондент отметил одни пя­терки в серии семибалльных рейтинговых шкал, даже не обра­тив внимания, что некоторые позиции выражали негативное, а некоторые позитивное отношение респондентов; 4) анкеты не­полные - отсутствуют страницы; 5) ответы даны респондентом, не входящим в группу, выделенную для участия в исследовании, то такие анкеты не принимаются.

Редактирование - это обработка анкет, повышающая точность и аккуратность представленной в них информации. Она заключается в просмотре анкет и выявлении нечитабель­ных, неполных, логически непоследовательных или неоднознач­ных ответов.

Редактирование может выполняться в две стадии: полевое редактирование и централизованное офисное редактирование.

Полевое редактирование выполняется руководителем поле­вых работ сразу же после заполнения анкеты, пока конкретные контакты еще свежи в памяти проводивших опрос.

Централизованное офисное редактирование - это более полная и точная проверка и коррекция собранных ответов. Для этой работы нужен опытный сотрудник, обладающий острым глазом. Чтобы повысить качество проверки, все анкеты предос­тавляются одному человеку. Если объем велик и работу нужно делить между несколькими людьми, то лучше делить по частям анкеты, а не по респондентам: один редактор редактирует часть «А» всех анкет, а другой - часть «В».

 

Что делать с анкетами неудовлетворительного качества? Их обычно отправляют обратно на место сбора данных для уточнения, либо назначаются пропущенные значения, либо ан­кеты отбраковываются и не включаются в анализ.

Возврат анкет для уточнения возможен, если выборки не­больших размеров и можно идентифицировать респондентов, предоставивших ответы низкого качества.

Назначение пропущенных значений. Если анкету невозмож­но вернуть для уточнения данных, исследователь может само­стоятельно присвоить пропущенные значения. Это возможно в следующих случаях: если количество анкет с неудовлетвори­тельными ответами невелико; доля ответов неудовлетворитель­ного качества в анкете незначительна; переменные по неудовле­творительным ответам не основные.

Некачественные анкеты отбраковываются и не включа­ются в анализ. Этот способ эффективен в следующих случаях: доля некачественных анкет меньше 10%; размер выборки велик; если «неудовлетворительные» респонденты явно не отличаются от «удовлетворительных» (например, по демографическим при­знакам, по характеристикам использования товара); доля не­удовлетворительных ответов в одной анкете велика; если про­пущены ответы по основным переменным. Но бывают случаи когда «неудовлетворительные» респонденты отличаются от «удовлетворительных». В этих случаях использование данного метода повлечет за собой искажение данных. Если принимается решение отбраковать анкеты, то исследователь должен пояснить на основании чего это делается.

Кодирование — это процедура присвоения цифрового ко­да каждому возможному варианту ответа по каждому вопросу.

Если анкета включает только структурированные вопросы или небольшое количество неструктурированных вопросов, она кодируется заранее во время разработки.

Если же анкета содержит в основном неструктурированные вопросы, коды присваиваются после того, как заполненные ан­кеты возвращаются с места сбора данных. Исследователь со­ставляет список наиболее часто повторяющихся вариантов отве­тов на неструктурированные вопросы, определяет категории, подлежащие кодированию. Категории должны быть взаимоис­ключающими и взаимоисчерпывающими. Затем для них разра­батываются коды, которые и присваиваются конкретным отве­там. Категории считаются взаимоисчерпывающими, если каж­дый ответ соответствует одному из кодов. Этого можно достичь введением дополнительного кода категории, например, «дру­гое», «ни один из предложенных вариантов», но в такие катего­рии должна войти незначительная часть ответов (не более 10 %). По наиболее важным вопросам коды категорий должны присваиваться даже в том случае, если нет ни одного ответа респондентов. Иногда важно знать именно то, что никто из от­вечающих не дал тот или иной вариант ответа.

Кроме присвоения цифровых кодов вопросам и ответам, при процедуре кодирования необходимо выполнять следующие рекомендации:

•         кодировать каждую анкету (респондента);

•         для каждого респондента следует включать дополни­
тельные коды: код проекта, код даты и времени.

Исследователю необходимо подготовить кодировочную книгу - инструкцию по кодированию переменных.

Преобразование данных заключается в переносе закоди­рованных данных из анкеты в компьютер. Данные вводятся че­рез клавиатуру или оптическим сканированием. Пример - пре­образование штрих-кода при считывании его в кассах супермаркетов.

Очищение данных заключается в проверке состоятель­ности собранных данных и работе с пропущенными ответами.

Предварительная проверка состоятельности собранных данных проводится на этапе редактирования, но на этом этапе она точнее и тщательнее, так как проводится с использованием компьютерной техники. Проверка состоятельности данных по­зволяет выявить:

-   данные, выходящие за пределы определенного диапазона;

-   логически непоследовательные ответы;

-   экстремальные значения.

Если обнаружены данные с такими ошибками, их нельзя использовать в анализе, тогда по возможности, их исправляют.

Су­ществует несколько методов работы с пропущенными ответами.

1. Замена пропущенного значения нейтральным (сред­ним).

2.Замена пропущенного значения условным (вмене­ние значений). Используется, если по структуре ответов на другие вопросы можно определить или вы­числить ответы на пропущенные. Очень трудоемок и нередко серьезно искажает данные.

3.      Исключение объекта целиком.

4.      Попарное исключение переменных. Анкеты с про­пущенными значениями не отбраковываются авто­матически. В вычислениях учитываются анкеты, по которым есть полные ответы; в результате разные вычисления в ходе анализа основываются на разных
размерах выборок. Такая процедура обычно приме­няется в следующих случаях: если размеры выборки велики, если количество пропущенных ответов не­значительно, если переменные не сильно взаимосвя­заны.

Статистическая корректировка данных включает взвешивание, преобразование переменной и преобразование шкалы. Все эти корректировки необязательны, но их примене­ние может значительно повысить качество анализа.

Взвешивание. Каждому респонденту присваивается весовой коэффициент, отражающий степень его значимости по сравне­нию с другими. Значение 1 применяется для обозначения рес­пондента с отсутствием весового коэффициента. Цель взвеши­вания - увеличить или уменьшить в выборке количество наблю­дений с определенными характеристиками:

• повысить значимость респондентов, по опросам кото­рых были собраны данные более высокого качества, чем по другим;

      •  повысить значимость ответов респондентов, которые чаще других используют продукцию. Это достигается присвоением весового коэффициента 3 тем покупате­лям, которые покупают товар чаще всех, коэффициента
2 - тем, кто пользуется им в средних пределах, 1 - тем, кто приобретает редко.

Метод следует применять с огромной осторожностью, по­скольку он разрушает саму природу самовзвешенности любого выборочного обследования. Если метод используется, то проце­дура взвешивания тщательно документируется и составляется соответствующая часть отчета.

Переопределение переменной. Преобразование данных для создания новых переменных или изменения существующих с тем, чтобы они точнее соответствовали основным задачам ис­следования.

Преобразование шкалы измерений. Манипулирование зна­чениями шкалы для того, чтобы иметь возможность сравнивать ее с другими шкалами.

 назад главная