Кодирование и кодировочная таблица



3.1 Кодирование и кодировочная таблица

Для того чтобы полученные данные можно было обработать, прежде всего следует создать кодировочную таблицу. Кодировочная таблица устанавливает соответствие между отдельными вопросам анкеты и переменными. используемыми при компьютерной обработке данных. Например, пункту анкеты "Пол" может быть поставлена в соответствие переменная sex.

Переменные — это ячейки памяти, в которые можно записывать значения, введенные с клавиатуры. Мы выбрали для переменной имя sex, так как имена переменных в SPSS для Windows могут содержать до восьми символов. Другое, более подробное имя было бы слишком длинным. Имена переменных могут состоять из букв латинского алфавита, цифр и специальных символов; причем первым символом имени должна быть буква.

Переменные могут принимать различные значения. Переменная sex может иметь два возможных значения: "женский" и "мужской". Кодировочная таблица определяет кодовые числа, соответствующие отдельным значениям переменных; например, значению "женский" может соответствовать цифра "1", а значению "мужской" — "2".

Подитожим задачи, которые решаются при составлении кодировочной таблицы:

Кодировочная таблица устанавливает соответствие между отдельным вопросам анкеты и переменными.

" Кодировочная таблица устанавливает соответствие между возможным значениями переменных и кодовыми числами.

Для нашей анкеты мы можем составить следующую кодировочную таблицу. Она приводится в самой анкете.





Матрица данных



3.2 Матрица данных

Предположим, что 30 анкет были заполнены следующим образом:

fragebnr

Sex

age

party



1

W-001

женский

45

ХДС/ХСС

2

W-002

мужской

22

СДПГ

3

W-003

мужской

19

сдпг

4

W-004

женский

42

ХДС/ХСС

5

W-005

мужской

34

Зеленые/Союз 90

6

W-006

женский

72

сдп

7

W-007

мужской

38

СДПГ

8

W-008

женский

56

СДПГ

9

W-009

мужской

61

ХДС/ХСС

10

W-010

женский

77

ХДС/ХСС

11

W-01 1

женский

23

Зеленые/Союз 90

12

W-012

мужской

67

Республиканцы

13

W-013

мужской

79

Прочие

14

W-01 4

женский

26

СДПГ

15

W-01 5

мужской

59

ХДС/ХСС

16

O-001

женский

34

Зеленые/Союз 90

17

O-002

мужской

18

Республиканцы

18

O-003

женский

44

ХДС/ХСС

19

O-004

мужской

68

ХДС/ХСС

20

O-005

женский

33

пдс

21

O-006

мужской

66

ХДС/ХСС

22

O-007

женский

22

нет данных

23

O-008

мужской

нет данных

СДПГ

24

O-009

женский

67

СДПГ

25

O-010

мужской

33

сдп

26

O-011

мужской

44

ХДС/ХСС

27

O-012

женский

22

СДПГ

28

O-013

женский

19

Прочие

29

O-014

женский

55

ХДС/ХСС

30

O-015

мужской

39

СДПГ

Приведенная выше таблица называется матрицей данных. Данные, предназначенные для обработки в SPSS для Windows, должны быть представлены в виде такой матрицы. Матрица данных состоит из определенного числа строк и столбцов. Строки и столбцы образуют прямоугольную таблицу. При этом каждая строка соответствует одной анкете, а каждый столбец — одной переменной. Так как в нашем небольшом опросе участвовало 30 респондентов, матрица содержит 30 строк. Каждая строка включает четыре столбца для переменных fragebnr, sex, age и party.

Мы предполагаем, что опрос проводился как в старых, так и в новых федеральных землях. Опрашивающие должны были отмечать это с помощью буквы перед номером анкеты. Буква "W" с дефисом должна была обозначать старые федеральные земли (West), а буква "О" — новые (Ost). Например, W-001 означает первую анкету, которая была заполнена в старых федеральных землях, а О-005 — пятую анкету, которая была заполнена в новых федеральных землях.





Запуск SPSS



3.3 Запуск SPSS

Начнем с ввода данных для небольшого примера анализа.

Запустите SPSS для Windows, дважды щелкнув левой кнопкой мыши на значке SPSS.

Откроется редактор данных SPSS (см. рис. 3.1).

Редактор данных — это одно из многих окон SPSS. Здесь можно вводить новые данные или загружать существующие из файлов данных с помощью команд меню File (Файл) Open... (Открыть...)

Так как при запуске SPSS ни один файл данных еще не загружен, в заголовке редак тора данных стоит "Untitled" (Без имени). Над изображением таблицы в редакторе данных имеются строка меню и панель символов.





Определение переменных



3.4.1 Определение переменных

Начнем с определения переменных. Переменную можно определить следующим образом:

В редакторе данных дважды щелкните на ячейке с надписью var или щелкните на ярлычке Variable view (Просмотр переменных) на нижнем краю таблицы.

В обоих случаях вы перейдете в режим просмотра переменных, который обеспечивает редактор данных (см. рис. 3.2). Здесь мы можем последовательно, строка за строкой определить необходимые переменные.

Имя переменной

Чтобы задать имя переменной, поступите следующим образом:

Введите в текстовом поле Name (Имя) выбранное имя переменной. В нашем примере мы сначала определим переменную fragebnr. Для этого введите в поле Name текст "fragebnr".

При выборе имени переменной следует соблюдать определенные правила:

Имена переменных могут содержать буквы латинского алфавита и цифры. Кроме того, допускаются специальные символы _ (подчеркивание), . (точка), а также символы @ и #. Не разрешаются, например, пробелы, знаки других алфавитов и специальные символы, такие как !, ?," и *.

Имя переменной должно начинаться с буквы.

Последний символ имени не может быть точкой или знаком подчеркивания (_).

Длина имени переменной не должна превышать восьми символов.

Ввод данных



3.4.2 Ввод данных

Приступим ко вводу данных:

fragebnr

sex

age

party

1

W-001

1

45

1

2

W-002

2

22

3

3

W-003

2

19

3

4

W-004

1

42

1

5

W-005

2

. 34

4

6

W-006

1

72

2

7

W-007

2

38

3

8

W-008

1

56

3

9

W-009

2

61

1

10

W-010

1

77

1

11

W-011

1

23

4

12

W-012

2

67

6

13

W-013

2

79

7

14

W-014

1

26

3

15

W-015

2

59

1

16

О-001

1

34

4

17

О-002

2

18

6

18

О-00З

1

44

1

19

О-004

2

68

1

20

О-005

1

33

5

21

О-006

2

66

1

22

О-007

1

22

0

23

О-008

2

0

3

24

О-009

1

67

3

25

О-010

2

33

2

26

0-011

2

44

1

27

О-012

1

22

3

28

О-013

1

19

7

29

О-014

1

55

1

30

0-01 5

2

39

3

Данные можно вводить по отдельным наблюдениям (строкам) или по отдельным переменным (столбцам). Действуйте следующим образом:

Щелкните на ячейке в левом верхнем углу. Вокруг ячейки появится рамка. Таким образом эта ячейка обозначается как активная.

Введите значение, в нашем примере это "W-001". Это значение отобразится в редакторе ячеек в верхней части окна редактора данных.

Нажмите клавишу <Таb>. Значение из редактора ячеек отобразится в ячейке.

В следующих таблицах показано, каким клавишам в редакторе данных соответствует какая функция. Здесь, как и далее, мы предполагаем, что активизирована таблица просмотра данных.

Позиционирование

Клавиша

Функция

<Таb> или <стрелка вправо>

Перемещает курсор на ячейку вправо.

<Enter> или <стрелка вниз>

Перемещает курсор на ячейку вниз.

<стрелка вверх>

Перемещает курсор на ячейку вверх.

<Shift> <Tab> или <стрелка влево>

Перемещает курсор на ячейку влево, т.е. в предыдущее поле.

<Ноте>

Перемещает курсор в первую ячейку строки или случая.

<End>

Перемещает курсор в последнюю ячейку случая.

<Ctrl> <стрелка вверх>

Перемещает курсор в первый случай столбца.

<Ctrl> <стрелка вниз>

Перемещает курсор в последний случай столбца.

<Ctrl> <Home>

Перемещает курсор в первую ячейку первого случая.

<Ctrl> <End>

Перемещает курсор в последнюю ячейку последнего случая.

<Page Up>

Прокручивает таблицу на одну страницу вверх.

<Page Down>

Прокручивает таблицу на одну страницу вниз.

Выделение

<Shift> <пробел>

Выделяет всю строку.

<Ctri> <пробел>

Выделяет весь столбец.

<Shift> <клавиши со стрелками>

Выделение области случаев и переменных. Также можно щелкнуть мышью и перетянуть ее из верхнего левого угла области в нижний правый угол.

Редактирование

F2

Переключает в режим редактирования. Следующее нажатие <F2> отключает режим редактирования.

<стрелка вправо>

Переместить позицию редактирования в ячейке вправо на один знак.

<стрелка влево>

Переместить позицию редактирования в ячейке влево на один знак.

<Ноте>

Перейти в начало значения ячейки.

<End>

Перейти в конец значения ячейки.





Редактор данных



3.4 Редактор данных

Сейчас с помощью редактора данных мы создадим файл данных. Редактор данных это приложение, напоминающее электронную таблицу. Под электронной таблицей подразумевается рабочий лист, разделенный на строки и столбцы, который позволяет про сто и эффективно вводить данные. Отдельные строки таблицы соответствуют отдельным наблюдениям. Например, при обработке данных опроса одна строка содержит данные одного респондента. Отдельные столбцы соответствуют отдельным переменным. При обработке данных наблюдений анкеты в одной переменной хранятся ответы на отдельный вопрос. Отдельные ячейки таблицы содержат значения переменных для каждого отдельного наблюдения; в каждой ячейке хранится одно значение переменной.



Сохранение файла данных



3.5 Сохранение файла данных

Сейчас мы сохраним созданный файл данных. Поступите следующим образом:

Выберите в меню команды File (Файл) Save as... (Сохранить как...) Откроется диалоговое окно Save Data as (Сохранить данные как).

По умолчанию SPSS сохраняет файл данных в текущем каталоге с расширением .sav.

Если вы следовали указаниям по инсталляции и задали рабочий каталог \SPSSBOOK, он будет предлагаться по умолчанию.

Задайте имя файла, соответствующее соглашению об именах в DOS. Для рассматриваемого примера мы предлагаем имя файла "btwahl.sav". Расширение .sav SPSS присваивает файлам данных по умолчанию. Поэтому расширение .sav вводить необязательно.

Копирование описаний переменных



3.6 Копирование описаний переменных

В исследовании на тему "Здоровье и питание", в частности, проводится опрос о предпочитаемых диетах. Респонденты должны ответить, насколько к ним относится одно из следующих высказываний.

Я предпочитаю следующую диету

Да, конечно

Да

Частично

В малой степени

Нет

вегетарианскую

X

X

X

X

X

биодинамическую

X

X

X

X

X

с низким содержанием животных белков

X

X

X

X

X

фаст-фуд

X

X

X

X

X

с учетом калорийности

X

X

X

X

X

сытную

X

X

X

X

X

дешевую

X

X

X

X

X

Так как в этом случае описания семи переменных в матрице данных почти одинаковы, можно сэкономить время, просто перенеся параметры описания первой переменной на остальные шесть. Для этого поступите следующим образом.

Активизируйте вид данных редактора данных, введите в поле Name текст "vegetar" и подтвердите ввод нажатием клавиши <Таb>.

Чтобы задать тип переменной, щелкните в поле Туре на кнопке с тремя точками



Завершение сеанса работы



3.7 Завершение сеанса работы

Сейчас мы завершим наш сеанс работы с SPSS.

Выберите в меню команды File (Файл) Exit (Выход)

Для каждого из открытых окон SPSS спрашивает, надо ли сохранить его содержимое. Если щелкнуть на кнопке "Yes" (Да) или нажать <Enter>, SPSS открывает специальное диалоговое окно, в котором надо указать тип сохраняемого файла (файл данных, вывода или синтаксиса).

Так как у нас было открыто только окно редактора данных и мы уже сохранили его содержимое в разделе 3.5, программа ничего не запрашивает и просто закрывается.





Диалоговое окно Define Missing Values



Диалоговое окно Define Missing Values


По умолчанию предлагается вариант No missing values (Нет пропущенных значений), то есть все значения в настоящее время рассматриваются как допустимые.

Щелкните на пункте Discrete missing values (Отдельные пропущенные значения). Для одной переменной нужно задать до трех пользовательских пропущенных значений. Введите значение "О".

Существует еще один вариант:

Range and one optional Discrete missing value (Диапазон и единичное отсутствующее значение): при выборе этого варианта все значения в диапазоне от Minimum (Наименьшее значение) до Maximum (Наибольшее значение) включительно объявляются как пропущенные. Кроме того, можно объявить как отсутствующее еще одно значение вне этого диапазона.

К сожалению, при сборе данных, как правило, не удается избежать пропущенных значений. Во многих статистических методах, прежде всего одномерных, учет пропущенных значений не составляет проблемы, так как кроме соответствующего уменьшения количества наблюдений не нужно вносить никаких дополнительных изменений в расчетный метод. Однако при двумерном, а тем более при многомерном анализе пропущенные значения в списках переменных создают более значительные проблемы, так как одного-единственного отсутствующего значения достаточно, чтобы сделать всю выборку непригодной для анализа. Впрочем, для многих методов анализа SPSS предлагает выход из такой ситуации.

Подтвердите выбор пропущенных значений для переменной sex кнопкой ОК.

В полях Columns и Alignment примите настройки, предлагаемые по умолчанию.

В поле Measure щелкните на кнопке



Диалоговое окно Define Value Labels



Диалоговое окно Define Value Labels


Метки значений определяются следующим образом:

Вначале введите в поле Value (Значение) число "1". Нажмите клавишу <Таb>.

Введите в поле Value label (Метка значения) текст "женский".

Щелкните на кнопке Add (Добавить). Метка значения будет добавлена в список. Для этой цели можно также нажать комбинацию клавиш <Alt>+<h>.

Повторите эти действия для значений "2" — "мужской" и "0" — "нет данных". Максимально допустимая длина метки значения составляет 60 знаков.

Результат ввода всех значений в диалоговом окне показан на рис. 3.6.



Диалоговое окно Define Variable Type (для численной переменной)



Диалоговое окно Define Variable Type (для численной переменной)


В SPSS существуют следующие типы переменных:

Numeric (Численный)

К допустимым значениям относятся цифры, перед которыми стоит знак плюс или минус и десятичный разделитель. Знак плюс перед числом, в отличие от минуса, не отображается. В текстовом поле Length (Длина) задается максимальное количество знаков, включая позицию для десятичного разделителя. В текстовом поле Decimals (Десятичные разряды) вводится количество отображаемых знаков дробной части.

Comma (Запятая)

К допустимым значениям относятся цифры, перед которыми стоит знак плюс или минус, точка, как десятичный разделитель и одна или несколько запятых в качестве разделителей групп разрядов. Если запятые опускаются при вводе, они вставляются автоматически. Длина такой переменной равна максимальному количеству знаков, включая десятичный разделитель и запятые между группами разрядов.

Dot (Точка)

К допустимым значениям относятся цифры, перед которыми стоит знак плюс или минус, запятая, как десятичный разделитель и одна или несколько точек в качестве разделителей групп разрядов. Если точки опускаются при вводе, они вставляются автоматически.

Scientific notation (Экспоненциальное представление)

При вводе данных разрешаются все допустимые численные значения, включая экспоненциальное представление, о котором свидетельствует содержащаяся в числе буква Е или D, а также знак плюс или минус.

Date (Дата)

Допустимые значения — дата и/или время.

Dollar (Доллар)

К допустимым значениям относятся: знак доллара, точка, как десятичный разделитель и запятые, как разделители групп разрядов. Если знак доллара или запятые опускаются при вводе, они вставляются автоматически.

Special currency (Специальная валюта)

Пользователь может задавать собственные форматы валюты. В поле Length в этом случае задается максимальное количество знаков, включая все знаки, заданные пользователем. Обозначение валюты при вводе не указывается; оно вставляется автоматически.

String (Строка)

Строка символов. К допустимым значениям относятся: буквы, цифры и специальные символы. Различаются короткие и длинные строковые переменные. Короткие строковые переменные могут содержать не более восьми знаков. В большинстве процедур SPSS применение длинных строковых переменных ограничивается или вообще не допускается.

При вводе и выводе данных надо учитывать следующие особенности:

Численные форматы: В численных форматах десятичным разделителем может быть либо точка, либо запятая. Тип десятичного разделителя зависит от настроек диалогового окна Язык и стандарты (Regional Settings) на панели управления Windows. Точное значение переменной хранится внутри программы, а Редактор данных отображает на экране лишь заданное число десятичных разрядов. Значения, которые имеют больше десятичных разрядов, округляются. Для вычислений применяется точное значение.

Строковые форматы: В длинных строковых переменных значения дополняются пробелами до максимальной длины. Например, в строковой переменной длины 10 значение "SPSS" хранится внутри программы как "SPSS

Форматы даты и времени: В форматах даты в качестве разделителей между значениями дня, месяца и числа могут применяться косая черта, дефис, пробел, запятая или точка. Можно выбрать один из нескольких форматов даты (dd-mm-yyyy, dd-mmm-yy, mm/dd/yyyy и т.д.). Дата в формате dd-mmm-yy отображается с разделителем-дефисом и сокращением названия месяца из трех букв. Дата в форматах dd/mm/yy и mm/dd/yy отображается с разделителем-косой чертой и номером месяца вместо названия.

Всего доступно 27 различных форматов даты и времени, которые отображаются в разворачивающемся списке. В форматах времени в качестве разделителей между значениями часов, минут и секунд могут использоваться двоеточие, точка или пробел.

Специальная валюта: Форматы отображения валюты ССА, ССВ, ССС, CCD и ССЕ задаются с помощью вкладки Currency (Валюта), которая открывается командой меню Edit (Правка) Options... (Параметры...)

Установите для переменной fragebnr тип String и длину пять символов и щелкните на кнопке ОК.

Диалоговое окно Define Variable Type (для строковой переменной).



Диалоговое окно Define Variable Type (для строковой переменной).


Переменная fragebnr получила строковый тип. С такими переменными нельзя выполнять никаких вычислительных операций, но можно проводить, например, подсчеты повторяемости. Кроме того, становится возможным ввод букв, например, "W" для старых федеральных земель и "О" — для новых. Мы выбрали длину пять символов, чтобы можно было кодировать до 999 анкет для обеих групп земель. В этом случае для анкет в старых федеральных землях можно будет задавать номера анкет от "W-001" до "W-999", а для новых федеральных земель — от "О-001" до "О-999".

Нажмите клавишу <ТаЬ>, чтобы перейти к установке формата столбца.

Формат столбца (Width)

Для переменной fragebnr задано число позиций в столбце, равное "5". Это значение следует из длины переменной, указанной в диалоге Define Variable Type.

Чтобы изменить этот формат представления переменной, перенесенный из диалога Define Variable Type, щелкните на кнопке лифта:

Диалоговое окно Paste Variables



Диалоговое окно Paste Variables


Замените предлагаемое имя vege на новое имя biolog и щелкните на кнопке ОК.

Диалоговое окно Paste Variables (см. рис. 3.12) дает возможность указать количество новых переменных. Если задать здесь число 6, параметры объявления переменной vegetar можно будет перенести на все остальные переменные за одну операцию. В этом случает таблица будет выглядеть так:



Диалоговое окно Save Data as



Диалоговое окно Save Data as






Подготовка данных


Глава 3. Подготовка данных

Подготовка данных 3.1 Кодирование и кодировочная таблица 3.2 Матрица данных 3.3 Запуск SPSS 3.4 Редактор данных 3.4.1 Определение переменных 3.4.2 Ввод данных 3.5 Сохранение файла данных 3.6 Копирование описаний переменных 3.7 Завершение сеанса работы



Подготовка данных



Подготовка данных

В этой главе мы на небольшом примере опишем процесс подготовки данных. За основу мы возьмем вымышленный опрос — так называемый "воскресный вопрос", который студенты, изучающие политологию в Марбургском университете, задавали избирателям:

"За кого бы вы голосовали, если бы в воскресенье были выборы в бундестаг?" С помощью следующей анкеты был проведен телефонный опрос 30 человек. Мы ограничили количество респондентов, чтобы избавить вас от ввода слишком большого количества данных.

После заполнения анкет, их следует подготовить для ввода данных в компьютер и обработки с помощью программы SPSS для Windows.





Редактор данных: просмотр данных



Редактор данных: просмотр данных






Редактор данных: просмотр переменных



Редактор данных: просмотр переменных


Имена переменных нечувствительны к регистру, то есть прописные и строчные буквы не различаются.

Примеры допустимых имен переменных:

budget99

gender

zarplata

quest_13

var3_1_2

Примеры недопустимых имен переменных:

1nа1

Имя начинается не с буквы

Assignment

Имя длиннее 8 символов

Прибыль

Имя содержит символы другого алфавита

State 94

Имя содержит пробел

None!

Символ "!" не разрешается

Нажмите на клавишу <Таb>, чтобы подтвердить ввод и перейти к установке типа переменной.

Тип переменной

Как видно из электронной таблицы, вновь созданные в SPSS переменные по умолчанию являются численными с максимальной длиной восемь знаков, причем дробная часть состоит из двух знаков (формат F8.2).

• Если требуется изменить тип переменной, щелкните в ячейке на кнопке с тремя точками:

Скопированные параметры описания .переменной



Скопированные параметры описания .переменной


Далее измените предлагаемое имя переменной var0000l на biolog и повторите эти действия для всех остальных переменных.

После пометки и копирования описания переменной, когда выделена вторая строка для вставки описания, вместо команд Edit Paste можно также использовать команду меню Edit Paste variables... (Вставить переменные) Откроется диалоговое окно Paste Variables.

Таблица после вставки нескольких переменных



Таблица после вставки нескольких переменных


Нам остается только заменить имена переменных vege I — vege6 на желаемые, например, biolog, lowprot, fastfood, calbal, rich и cheap, и все переменные шкалы "Предпочтения в питании" будут объявлены.





Выделенное описание переменной



Выделенное описание переменной


Выберите в меню команды Edit (Правка) Сору (Копировать)

Поместите курсор в ячейку с номером 2, т.е. в начало второй строки, и нажмите левую кнопку мыши — будет выделена вторая строка.

Выберите в меню команды Edit (Правка) Paste (Вставить)

Параметры объявления первой переменной будут скопированы во вторую строку.



Заполненное диалоговое окно Define Value Labels для переменной party



Заполненное диалоговое окно Define Value Labels для переменной party


Подтвердите введенные данные кнопкой О К, а затем — клавишей <Таb>.

Чтобы задать пропущенные значения, щелкните в поле Missing на кнопке с тремя точками

Подтвердите выбор пропущенных значений для переменной party кнопкой ОК и нажмите клавишу <Таb>.

В полях Columns и Alignment примите настройки, предлагаемые по умолчанию.

В поле Measure щелкните на кнопке с тремя точками



Заполненное диалоговое окно Define Value Labels (Определение меток значений)



Заполненное диалоговое окно Define Value Labels (Определение меток значений)


Подтвердите введенные данные кнопкой ОК, а затем — клавишей <ТаЬ>.

Чтобы задать пропущенные значения, щелкните в поле Missing на кнопке с тремя точками