Как настроить смартфоны и ПК. Информационный портал
  • Главная
  • Windows Phone
  • Как работать с программой spss 22. Конспект по программе SPSS, что за программа, в чем ее преимущества

Как работать с программой spss 22. Конспект по программе SPSS, что за программа, в чем ее преимущества

Два студента Норман Най (Norman Nie) и Дейл Вент (Dale Bent), специализировавшиеся в области политологии в 1965 году пытались отыскать в Стенфордском университете Сан-Франциско компьютерную программу, подходящую для анализа статистической информации. Вскоре они разочаровались в своих попытках, так как имеющиеся программы оказывались более или менее непригодными, неудачно построенными или не обеспечивали наглядность представления обработанной информации. К тому же принципы пользования менялись от программы к программе.

Так, не долго думая, они решили разработать собственную программу, со своей концепцией и единым синтаксисом. В их распоряжении тогда был язык программирования FORTRAN и вычислительная машина типа IBM 7090. Уже через год была разработана первая версия программы, которая, еще через год, в 1967, могла работать на IBM 360. К этому времени к группе разработчиков присоединился Хэдлай Халл (Hadlai Hull).

Как известно из истории развития информатики, программы тогда представляли собой пакеты перфокарт. Как раз на это указывает и исходное название программы, которое авторы дали своему продукту: SPSS - это аббревиатура от Statistical Package for the Social Science.

В 1970 году работа над программой была продолжена в Чикагском университете, а Норман Най основал соответствующую фирму - к тому моменту уже было произведено шестьдесят инсталляций. Первое руководство для пользователей описывало одиннадцать различных процедур.

Спустя пять лет SPSS была уже инсталлирована шестьсот раз, причём под разными операционными системами. С самого начала версиям программы присваивали соответствующие порядковые номера. В 1975 была разработана уже шестая версия (SPSS6). До 1981 последовали версии 7, 8 и 9.

Командный язык (синтаксис) SPSS в то время был ещё не так хорошо развит, как сейчас, и естественно ориентирован на перфокарты. Поэтому так называемые управляющие карты SPSS состояли из идентификационного поля (столбцы 1-15) и из поля параметров (столбцы 16-80).

В 1983 году командный язык SPSS был полностью переработан, синтаксис стал значительно удобней. Что бы отметить этот факт, программа была переименована в SPSSX, где буква X должна была служить как номером версии в римскими числами, так и сокращением для extended (расширенный).

Так как применение перфокарт к этому моменту уже стало историей, то программа SPSS и информация, подлежащая обработке, сохранялись в отдельных файлах на винчестерах больших ЭВМ, которые тогда использовались повсеместно. Год от года постоянно увеличивалось и количество процедур.

С появлением персональных компьютеров была разработана также и PC-версия SPSS, с 1983 года появилась PC-версия SPSS\PC+. рассчитанная на MS-DOS. Позже, с момента основания в 1984 году европейского торгового представительства в Горинхеме в Нидерландах, SPSS стал широко применяться и в Европе. В настоящее время это самое распространённое программное обеспечение для статистического анализа во всём мире.

Для того, чтобы отразить возможность использования программы во всех областях, имеющих отношение к статистическому анализу, буква X вновь была удалена из названия марки, а исходной аббревиатуре присвоено новое значение: Superior Performance Software System (система программного обеспечения высшей производительности).

Если PC версия SPSS/PC+ была чуть усовершенствованной версией для больших ЭВМ, то SPSS для операционной системой Windows (SPSS for Windows) стала большим шагом вперёд. Во первых эта версия SPSS обладает всеми возможностями версии для больших ЭВМ, во вторых, за некоторыми немногочисленными исключениями, программой можно пользоваться без особых знаний в области прикладного программирования. Вызов необходимых процедур статистического анализа происходит при помощи стандартной техники, применяемой в Windows, то есть с помощью мыши и соответствующих диалоговых окон.

Первая версия SPSS для Windows имела порядковый номер 5. Затем последовали версии 6.0 и 6.1 с некоторыми нововведениями в статистической и графической областях; версия 6.1 была первой статистической программой для Windows, которая использовала 32 битную архитектуру Windows 3.1. Это можно было заметить по более высокой скорости выполнения вычислений. Усовершенствования коснулись также и интерфейса пользователя. В конце концов, была выпущена версия 6.1.3, которая уже могла работать и под Windows 95 и под NT.

В начале 1996 года появилась 7-я версия SPSS, сначала как версия 7.0, а затем 7.5. Наряду с расширением возможностей в сфере статистики, разница между этими двумя версиями заключалась в том, что в версии 7.5 как меню, так и интерфейс программы были выполнены уже не только на английском, но и на других наиболее распространенных языках.

Самым весомым отличием версии 7 по отношению к предыдущим версиям, был абсолютно новый подход к выводу информации на экран. Так, во первых, получил новые очертания так называемый Viewer (Окно просмотра), и, во вторых, более приятный внешний вид приобрели таблицы результатов расчётов (мобильные таблицы). Появившаяся технология мобильных таблиц позволяет перестраивать полученные таблицы различным способами.

Если предшественница данной версии - версия 6.1.3 могла работать как под старой Windows 3.1 так и под новой Windows 95 (NT), то SPSS версии 7 могла работать только при наличии Windows 95 (NT).

За версией 7.5 последовала версия 8.0, прогресс которой заключался в усовершенствовании графической оболочки. Возможность составления интерактивных графиков предоставляет рад преимуществ по сравнению с традиционными графиками, которые являются стандартом для многих других пакетов.

Версия 9.0 включала в себя несколько новых статистических методов, в т.ч. мультиномиальную логистическую регрессию, и несколько новых графических возможностей, расширяющих область интерактивных графиков.

С 2005 года распространяется 13 версия пакета SPSS.

Модули SPSS

Основу программы SPSS составляет SPSS Base (базовый модуль), предоставляющий разнообразные возможности доступа к данным и управления данными. Он содержит методы анализа, которые применяются чаще всего.

Традиционно вместе с SPSS Base (базовым модулем) поставляются ещё два модуля: Advanced Models (продвинутые модели) и Regression Models (регрессионные модели). Эти три модуля охватывают тот спектр методов анализа, который входил в раннюю версию программы для больших ЭВМ.

В приложении А Вы сможете найти информацию о том, какие методы анализа относятся к тому или иному модулю. Пользователь, который приобрёл все эти три модуля, может не обращать внимания на данное приложение.

Наряду с тремя упомянутыми, существует еще ряд специальных дополнительных модулей и самостоятельных программ, число которых постоянно растёт, так что пользователям следует постоянно знакомиться с информацией о нововведениях в SPSS.

В этой книге описываются базисный модуль, а также модули Regression Models, Advanced Models и Tables. Назначением последнего модуля является составление презентационных таблиц. В книге не рассматриваются логлинейные модели, анализ выживания и многомерное шкалирование, а также процедура составления презентаций.

SPSS Base (Базовый модуль)

SPSS Base входит в базовую поставку. Он включает все процедуры ввода, отбора и корректировки данных, а также большинство предлагаемых в SPSS статистических методов. Наряду с простыми методиками статистического анализа, такими как частотный анализ, расчет статистических характеристик, таблиц сопряженности, корреляций, построения графиков, этот модуль включает t-тесты и большое количество других непараметрических тестов, а также усложненные методы, такие как многомерный линейный регрессионный анализ, дискриминантный анализ, факторный анализ, кластерный анализ, дисперсионный анализ, анализ пригодности (анализ надежности) и многомерное шкалирование.

Regression Models

Данный модуль включает в себя различные методы регрессионного анализа, такие как: бинарная и мультиномиальная логистическая регрессия, нелинейная регрессия и пробит-анализ.

В этот модуль входят различные методы дисперсионного анализа (многомерный, с учетом повторных измерений), общая линейная модель, анализ выживания, включая метод Каплана-Майера и регрессию Кокса, лог-линейные, а также логит-лог-линсйные модели.

Модуль Tables служит для создания презентационных таблиц. Здесь предоставляются более широкие возможности по сравнению со упрощенными частотными таблицами и таблицами сопряженности, которые строятся в SPSS Base (базовом модуле).

Ниже в алфавитном порядке приведен список остальных модулей и программ предлагаемых для расширения SPSS.

Amos (Analysis of moment structures - анализ моментных структур) включает методы анализа с помощью линейных структурных уравнений. Целью программы является проверка сложных теоретических связей между различными признаками случайного процесса и их описание при помощи подходящих коэффициентов. Проверка проводится в форме причинного анализа и анализа траектории. При этом пользователь в графическом виде должен задать теоретическую модель, вкоторую вместе с данными непосредственных наблюдений могут быть включены и так называемые скрытые элементы. Программа Amos включена в состав модулей расширения SPSS, как преемник L1SREL (Linear Structural RELationships - линейные структурные взаимоотношения).

AnswerTree (дерево решений) включает четыре различных метода автоматизированного деления данных на отдельные группы (сегменты). Деление проводится таким образом, что частотные распределения целевой (зависимой) переменной в различных сегментах значимо различаются. Типичным примером применения данною метода является создание характерных профилей покупателей при исследовании потребительского рынка. AnswerTree является преемницей программы Chi squared interaction Detector - детектор взаимодействий на основе хи-квадрата).

Модуль содержит различные методы для анализа категориальных данных, а именно: анализ соответствий и три различных метода оптимального шкалирования (анализ однородности, нелинейный анализ главных компонент, нелинейный канонический корреляционный анализ).

Clementine - это программа для data mining (добычи знаний), в которой пользователю предлагаются многочисленные подходы к построению моделей, к примеру, нейронные сети, деревья решений, различные виды регрессионного анализа. Clementine представляет собой "верстак" аналитика, при помощи которого можно визуализировать процесс моделирования, перепроверять модели, сравнивать их между собой. Для удобства пользования программой имеется вспомогательная среда внедрения результатов.

Conjoint (совместный анализ)

Совместный анализ применяется при исследовании рынка для изучения потребительских свойств продуктов на предмет их привлекательности. При этом опрашиваемые респонденты по своему усмотрению должны расположить предлагаемые наборы потребительских свойств продуктов в порядке предпочтения, на основании которого можно затем вывести так называемые детализированные показатели полезности отдельных категорий каждого потребительских свойства.

Data Entry (ввод данных)

Программа Data Entry предназначена для быстрого составления вопросников, а также ввода и чистки данных. Заданные на этапе создания вопросника вопросы и категории ответов потом используются в качестве меток переменных и значений.

Exact Tests (Точные тесты)

Данный модуль служит для вычисления точного значения вероятности ошибки (величины р) в условиях ограниченности данных при проверке по критерию Хи-квадрат (Chi-Quadrat-Test) и при непараметрических тестах. В случае необходимости для этого также может быть применён метод Монте-Карло (Monte-Carlo).

Программа содержит специальную регрессионную модель для регрессионного анализа упорядоченных зависимых и независимых переменных.

При помощи SamplePower может быть определён оптимальный размер выборки для большинства методов статистического анализа, реализованных в SPSS.

SPSS Missing Value Analysis

Данный модуль служит для анализа и восстановления закономерностей, которым подчиняются пропущенные значения. Он предоставляет различные варианты замены недостающих значений.

Модуль Trends содержит различные методы для анализа временных рядов, такие как: модели ARIMA, экспоненциальное сглаживание, сезонная декомпозиция и спектральный анализ.

Контрольная работа

«СТАТИСТИЧЕСКАЯ ОБРАБОТКА В ПСИХОЛОГИЧЕСКОМ ИССЛЕДОВАНИИ»

1. Конспект по программе SPSS, что за программа, в чем ее преимущества. 3

1.1. Анализ данных в психологическом исследовании. 5

2. По данным публикаций периодической печати, интернета и т.д. выбрать достаточную информацию для анализа и провести его с объяснением, сделать вывод. 9

2.1. Пример использования программы при расчете коэффициента корреляции 13

Список литературы.. 19

Конспект по программе SPSS, что за программа, в чем ее преимущества

Анализ литературы по математической обработке данных в психологических исследованиях и результаты анкетирования позволили выделить четыре основных программы, применяемых психологами. К ним относятся такие программные продукты как Statistica, SPSS, Stadia и MS Excel. Такие известные математические программы как MatLab, Maple, Mathematica и Mathcad практические не используются в психологических исследованиях из-за своей сложности. Более надежной и хорошо зарекомендовавшей себя программой является SPSS Statistics.

SPSS Statistics (аббревиатура англ. «Statistical Package for the Social Sciences» - «статистический пакет для социальных наук») - компьютерная программа для статистической обработки данных, один из лидеров рынка в области коммерческих статистических продуктов, предназначенных для проведения прикладных исследований в социальных науках .

SPSS является комплексной системой анализа данных. SPSS может использовать данные почти из всех типов файлов и генерировать табличные отчёты, графики, рисунки распределений и трендов, описательную статистику и проводить сложные виды статистического анализа.

Программа предоставляет полный набор методов анализа данных, начиная с описательной статистики и заканчивая сложными видами анализа (дисперсионный, факторный, спектральный и т.д.). Представление результатов происходит при помощи различных видов диаграмм и гистограмм. При этом пользователя предоставляется возможность самому создавать шаблоны диаграмм. Но главной особенностью SPSS является ее интеграция с большим количеством внешних программ (MS Excel, dBASE, Lotus, SQL, SYSTAT и т.д.) и форматов (XML, HTML, PC, SAS и т.д.). Еще одной важной особенностью программы является поддержка современных программных решений. Так, последняя версия программ SPSS строится на основе клиент-серверной архитектуры, объявлено, что новая версия программы будет полностью совместима с Windows Vista.

Между 2009 и 2010 название программного обеспечения SPSS было изменено на PASW (Predictive Analytics SoftWare) Statistics.

28 июля 2009 компания объявила, что она была приобретена компанией IBM за 1,2 млрд долл. США. По состоянию на январь 2010 года компания стала называться «SPSS: An IBM Company».

Норман Най, Хедли Халл и Дейл Бент разработали первую версию системы в 1968 году, затем этот пакет развивался в рамках Чикагского университета. Первое пользовательское руководство вышло в 1970 году в издательстве McGraw-Hill, а с 1975 года проект выделился в отдельную компанию SPSS Inc. Первая версия пакета под Microsoft Windows вышла в 1992 году. На данный момент также существуют версии под MacOs X и Linux.

В 2009 году компания SPSS произвела ребрендинг своего статистического пакета, который теперь стал называться PASW Statistics (Predictive Analytics SoftWare). 29 июля 2009 года компания SPSS объявила о том, что она приобретается фирмой IBM.

Возможности и преимущества программы.

· Ввод и хранение данных.

· Возможность использования переменных разных типов.

· Частотность признаков, таблицы, графики, таблицы сопряжённости, диаграммы.

· Первичная описательная статистика.

· Маркетинговые исследования

· Анализ данных маркетинговых исследований

IBM SPSS Statistics 18 функционирует под управлением Windows XP, Windows Vista (32- или 64-разрядных редакций), Windows 7, Mac OS X 10.5, Mac OS X 10.6 и Linux для x86. Требует 800 МБайт места на жёстком диске и 1 ГБайт оперативной памяти.

Современная психология широко используют самые разнообразные статистические методы. Они позволяют наглядно описать некоторое явление или процесс, выявить закономерности, сделать выводы или прогноз. Как пишет Е.В. Сидоренко: «Стало принято использовать математические методы, как принято жениться молодому человеку, если он хочет сделать дипломатическую или политическую карьеру…» При этом «мода» иногда доходит до того, что при планировании эксперимента предлагается строить гипотезу, исходя из расчета определенных статистических процедур получения результатов, их оценивания и анализа, а статистическая верификация выводов считается обязательной.
Можно говорить о том, что программа SPSS является наиболее функциональной и поддерживает самые современные технологий. Однако ее цена и модульная структура приводит к тому, что SPSS является ориентированной на применение в коммерческих проектах .

Книга представляет собой практическое руководство по анализу данных с помощью самой мощной и популярной программы статистической обработки информации – SPSS версии 19. В издании подробно описываются основы работы с пакетом SPSS, рассматривается большинство методов обработки и анализа данных, а также способов табличного и графического представления полученных результатов. Материал книги организован таким образом, чтобы удовлетворить запросы как новичка, впервые приступающего к анализу данных на компьютере, так и опытного исследователя, желающего воспользоваться самыми современными методами. Основное содержание глав составляют пошаговые инструкции по реализации различных видов математико-статистического анализа в SPSS. Особое внимание уделяется получаемым результатам и их интерпретации. В конце книги приведен глоссарий, содержащий определения большинства статистических терминов. Издание адресовано исследователям в области статистики, маркетинга, социологии, психологии, а также широкому кругу читателей, желающих воспользоваться программой SPSS для профессионального анализа данных.

Версии SPSS.
По всем параметрам SPSS является сложным и мощным статистическим пакетом. Однако, несмотря на сложность, средства взаимодействия входящих в пакет программ с пользователем весьма дружественны. С помощью пакета SPSS можно проводить практически любой анализ данных, а последние версии программы находят применение в самых разных научных областях и в мире бизнеса.

Основой для данной книги послужила русифицированная версия 19.0 пакета IBM SPSS Statistics, распространяемая с сентября 2010 года. Говоря точнее, снимки экрана, присутствующие в книге, соответствуют русифицированной версии 19.0. Однако почти весь изложенный материал может быть с успехом применен и к более ранним версиям, начиная с SPSS 9.0. Основные отличия будут иметь место в интерфейсе программ: названиях диалоговых окон, их виде и т. п. Кроме того, начиная с версии SPSS 13.0 более совершенными стали графические возможности программы. Для отечественного пользователя программы наиболее значительное новшество введено начиная с версии SPSS 12.0 - стала доступной русифицированная версия интерфейса и окон вывода результатов.

Содержание
Предисловие
Глава 1. Введение
Обработка данных на компьютере
Необходимые знания
Версии SPSS
Содержание книги
Файлы примеров
Структура глав и элементы описания
Глава 2. Общий обзор SPSS
Запуск программы
Кнопки и другие элементы управления
Настройка параметров программы
Окна программы
Окно редактора командного языка Syntax
Окно вывода и его редактирование
Сохранение, экспорт, перенос и печать результатов
Глава 3. Создание и редактирование файлов данных
Структура файла данных
Ввод данных
Редактирование данных
Пример файла данных
Глава 4. Управление данными
Знакомство с возможностями управления данными
Получение информации о файле
Обработка пропущенных значений
Преобразование данных
Выбор наблюдений для анализа
Перекодировка в новую переменную
Перекодирование существующей переменной
Сортировка наблюдений
Объединение данных разных файлов
Агрегирование данных
Реструктурирование данных
Глава 5. Диаграммы
Графика в программе SPSS
Настройка диаграмм
Команды построения диаграмм
Редактирование диаграмм
Выход из программы
Глава 6. Частоты
Представление результатов
Глава 7. Описательные статистики
Представление результатов
Завершение анализа и выход из программы
Глава 8. Таблицы сопряженности и критерий хи-квадрат
Таблицы сопряженности
Критерий независимости хи-квадрат
Пошаговый алгоритм вычислений
Представление результатов
Завершение анализа и выход из программы
Глава 9. Корреляции
Понятие корреляции
Дополнительные сведения
Пошаговые алгоритмы вычислений
Представление результатов
Завершение анализа и выход из программы
Глава 10. Средние значения
Пошаговый алгоритм вычислений
Представление результатов
Завершение анализа и выход из программы
Глава 11. Сравнение двух средних и t-критерий
Уровень значимости
Пошаговые алгоритмы вычислений
Представление результатов
Завершение анализа и выход из программы
Глава 12. Непараметрические критерии
Параметрические и непараметрические критерии
Пошаговые алгоритмы и результаты вычислений
Завершение анализа и выход из программы
Глава 13. Однофакторный дисперсионный анализ
Пошаговые алгоритмы вычислений
Представление результатов
Терминология
Завершение анализа и выход из программы
Глава 14. Многофакторный дисперсионный анализ
Файлы данных для группы методов Общая линейная модель
Дисперсионный анализ с двумя факторами
Дисперсионный анализ с тремя и более факторами
Влияние ковариат
Пошаговые алгоритмы вычислений
Представление результатов
Терминология, используемая при выводе
Завершение анализа и выход из программы
Глава 15. Многомерный дисперсионный анализ
Пошаговые алгоритмы вычислений
Представление результатов
Завершение анализа и выход из программы
Глава 16. Дисперсионный анализ с повторными измерениями
Пошаговые алгоритмы вычислений
Представление результатов
Завершение анализа и выход из программы
Глава 17. Простая линейная регрессия
Простая регрессия
Оценка криволинейности
Пошаговые алгоритмы вычислений
Представление результатов
Терминология, используемая при выводе
Завершение анализа и выход из программы
Глава 18. Множественный регрессионный анализ
Уравнение множественной регрессии
Коэффициенты регрессии
Коэффициент детерминации и пошаговые методы
Условия получения приемлемых результатов анализа
Пошаговые алгоритмы вычислений
Представление результатов
Завершение анализа и выход из программы
Глава 19. Анализ надежности
Коэффициент альфа
Надежность половинного расщепления
Пошаговые алгоритмы вычислений
Представление результатов
Завершение анализа и выход из программы
Глава 20. Факторный анализ
Вычисление корреляционной матрицы
Извлечение факторов
Выбор и вращение факторов
Интерпретация факторов
Пошаговые алгоритмы вычислений
Представление результатов
Терминология, используемая при выводе
Завершение анализа и выход из программы
Глава 21. Кластерный анализ
Сравнение кластерного и факторного анализов
Этапы кластерного анализа
Кластерный анализ матрицы различий (сходства)
Пошаговые алгоритмы вычислений
Представление результатов
Завершение анализа и выход из программы
Глава 22. Дискриминантный анализ
Этапы дискриминантного анализа
Пошаговые алгоритмы вычислений
Представление результатов
Терминология, используемая при выводе
Завершение анализа и выход из программы
Глава 23. Многомерное шкалирование
Квадратная асимметричная матрица различий
Квадратная симметричная матрица различий
Модель индивидуальных различий
Пошаговые алгоритмы вычислений
Представление результатов
Завершение анализа и выход из программы
Глава 24. Логистическая регрессия
Математическое описание логистической регрессии
Пошаговые алгоритмы вычислений
Представление результатов
Терминология, используемая при выводе
Завершение анализа и выход из программы
Глава 25. Логлинейный анализ таблиц сопряженности
Понятие логлинейной модели
Логлинейный метод подбора модели
Пошаговые алгоритмы вычислений
Представление результатов
Завершение анализа и выход из программы
Глоссарий
Англо-русский словарь терминов
Литература.

Введение в

SPSS для Windows

Краткая справка о программе.

SPSS для Windows мощная система статистического анализа и управления данными. Многие возможности особенно полезны тем, кто занимается проведением опросов и маркетинговыми исследованиями.

Кроме простого интерфейса для статистического анализа данных, рассчитанного на работу с мышью, в SPSS для Windows есть:

Редактор данных . Гибкая система, внешне похожая на электронную таблицу, для определения, ввода, редактирования и просмотра данных.

Окно выходных результатов (Viewer ) . Окно выходных результатов упрощает просмотр результатов, позволяя показывать и скрывать отдельные элементы ввода, изменять порядок вывода результатов, перемещать готовые к презентации таблицы и графики изSPSSв другие приложения.

Редактор таблиц . Можно исследовать таблицы, перемещая строки, столбцы и слои для выявления важных моментов, которые могут потеряться в стандартных таблицах. Также можно сравнивать группы, расщеплять таблицы и др. возможности.

Редактор диаграмм . Высококачественная графика круговых и столбиковых диаграмм, гистограмм, гистограмм рассеяния, трехмерных диаграмм и множества других входят в базовый модульSPSS.

Редактор команд . Несмотря на то, что многие задачи могут быть выполнены с помощью мыши и диалоговых окон, вSPSSесть также мощный командный язык, позволяющий сохранять и автоматизировать многие повторяющиеся задачи.

Конструктор чтения баз данных позволяет загрузить данные из любого источника с помощью нескольких нажатий кнопки мыши.

Электронную почту , содержащую результаты анализа, можно создавать одним нажатием кнопки мыши. Также можно экспортировать таблицы и диаграммы в форматHTLMдля распространения через Интернет или Интранет.

Справочная система включает Электронный Учебник, предлагающий детальный обзор; контексную Справку в диалоговых окнах, помогающую разобраться в конкретных задачах; всплывающие определения в мобильных таблицах, объясняющие статистические термины; Репетитор по статистике, помогающий в поиске необходимой процедуры; а Примеры анализа помогают в интерпретации результатов.

Новый дополнительный модуль SPSS Complex Samples позволяет собой специальный инструмент для планирования и анализа данных опросов и обследований, в которых использовалась как простая, так и сложная выборка.

РЕДАКТОР ДАННЫХ

Редактор данных – это окно, похожее по внешнему виду на окно электронной таблицы, предназначенное для создания и редактирования файлов данных. Окно Редактора данных открывается автоматически при запускеSPSS.

В окне редактора одновременно присутствуют два листа, два окна работы с данными. В левом нижнем углу редактора можно увидеть две вкладки: «Данные» и «Переменные».

Данные. В этом режиме можно просматривать и редактировать фактические значения данных.

Переменные. В этом режиме можно просматривать и редактировать свойства переменных, включая метки переменных и значений, типы данных (например, текст, дата или число), типы шкал измерений (номинальная, порядковая или количественная) и определяемые пользователем пропущенные значения.

Например, представим себе, что речь идет о файле данных SPSSс результатами простейшего анкетрования работников.

В режиме «данные» мы увидим конкретные ответы на вопросы, полученные от каждого опрашиваемого. При этом каждая строка в электронной таблице – это наблюдение, то есть одна анкета (один респондент), а каждый столбец – переменная, то есть конкретный вопрос анкеты (или показатель). В каждой ячейке – ответ отдельного респондента на тот или иной вопрос анкеты.

В режиме «переменные» мы увидим описание упомянутых выше характеристик каждой переменной, то есть каждого вопроса обследования (программа наблюдения). Каждая строка – это отдельная переменная, или один вопрос. Каждый столбец – это конкретное свойство той или иной переменной.

Свойства переменных:

1. Имя переменной.

Имя должно начинаться с буквы и не должно заканчиваться точкой. В имени не должны использоваться пробелы и специальные символы (!, ?, * и др.), а также следует избегать в конце имени знака нижнего подчеркивания _. Длина имени не должны превышать 64 символа.

2. Тип переменной.

Указывается, о какой переменной идет речь: числовой, текстовой, формата даты или другие варианты.

3. Число цифр или символов в переменной. Задается максимальное число символов в значении переменной.

4. Число десятичных знаков. Задается число выводимых десятичных знаков.

5. и 6. Описательные метки переменных и значений.

Метки переменных поясняют содержательную часть переменной (по сути содержание самого вопроса или показателя), могут быть до 256 символов и содержать пробелы и символы, использование которых не допускается в именах переменных.

Метки значений поясняют содержательную часть каждого значения отдельной переменной (например, поясняют, что 1 означает мужской пол, 2 – женский пол) могут быть длиной до 60 символов и не применяются к длинным текстовым переменным.

7. Пропущенные значения.

Определенные значения переменной задаются как пользовательские пропущенные. Например, Вы хотите подводить итоги обследования по данному вопросу без учета тех анкет, а которых нет ответа на этот вопрос. Значения, помеченные как пользовательские пропущенные, помечаются для специальной обработки и исключаются из большинства вычислений.

Одновременно можно задать до трех отдельных пользовательских пропущенных значений для каждой переменной, диапазоны пропущенных значений могут быть заданы только для числовых переменных.

8. Ширина столбца.

9. Выравнивание значений в столбце. Возможно выравнивание по левому краю, правому краю, по центру.

10. Шкала измерений (имеет значение при построении таблиц).

Вы можете выбрать одну из трех шкал измерения:

Количественная. Значения данных представляют собой числовые значения (например, возраст, доход).

Порядковая. Значения данных представляют собой категории (градации) с некоторым естественным упорядочением (например: низкий, средний, высокий или: полностью не удовлетворен, скорее не удовлетворен, скорее удовлетворен, полностью удовлетворен). Порядковые переменные могут быть текстовыми или числовыми значениями, представляющими различные категории (например: 1-низкий, 2-средний, 3-высокий).

Номинальная. Значения данных представляют собой категории (градации) для которых не задано естественное упорядочение (примерами могут служить отделы компании, субъекты РФ).

Все свойства переменных могут быть изменены путем изменения значений в ячейках в закладке «переменные». Щелчок по конкретной ячейке вызывает окно, в котором можно изменить свойства переменной. Кроме того, значения ячеек могут быть скопированы и вставлены в другие ячейки. Это особенно полезно при задании меток значений и пропущенных значений для нескольких однотипных переменных.

ВВОД ДАННЫХ

Вводить данные можно прямо в Редактор данных в закладке Данные в любую ячейку. Для пременных всех типов, кроме простых числовых, прежде чем вводить данные, необходимо сначала задать тип переменной.

Если вводить значение в пустой столбец, Редактор данных автоматически создаст новую переменную и присвоит ей имя (VAR 00001 ) и формат по умолчанию (числовой) .

Кроме того, данные могут быть подготовлены заранее другими программными средствами. SPSSпозволяет открывать и работать с файлами данных любых форматов. Например, для открытия файла в формате *.xls, необходимо нажатьФайл…Открыть…Данные…

Если данных хранятся в базе данных, то для того, чтобы их открыть, нужно использовать Конструктор баз данных (Файл…Открыть базу данных…Новый запрос…) .

ПРЕОБРАЗОВАНИЕ ДАННЫХ

Вычисление переменных.

Выберите в меню:

Преобразовать

Вычислить переменную…

Введите имя вычисляемой переменной . Ей может быть существующая или новая переменная. Если Вы выбрали уже существующую, то следует иметь ввиду, что вычисленные новые значения заменят существующие значения и возврата к старым значениям не будет. Введем, например, имя« godrab » , что будет означать «Количество лет работы на данном месте». Эту метку введем, щелкнув мышкой по «Тип и метка».

После нажатия клавиши «продолжить», можно закладывать формулу расчета. При этом можно воспользоваться более 70 встроенных функций, включая арифметические, статистические, текстовые и функции рапсределения. У нас в примере есть переменная « jobtime» – время работы с момента поступления (месяцы). Для того, чтобы месяцы перевести в годы, нам достаточно разделить эту переменную на 12. Эту формулу и закладываем в расчет:

После нажатия клавиши «ОК», в редакторе данных появляется дополнительный столбик с переменной « godrab » , где стоит количество лет, отработанных на данном месте работы, а на вкладке переменные добавилась новая переменная.

Следует иметь ввиду, что в функциях и арифметических выражениях пропущенные значения обрабатываются по-разному. В выражении:

(var 1 + var 2 + var 3) / 3

результатом будет пропущенное значение в случае, если значение хотя бы одной из трех переменных является пропущенным значением.

В выражении:

MEAN (var 1, var 2, var 3)

результатом будет пропущенное значение только в том случае, если все три переменные являются пропущенными значениями.

Можно задать минимальное число значений, которые не должны иметь пропущенных значений, например, средняя величина из трех переменных может быть вычислена, если значения имеют минимум две из них:

MEAN.2 (var1, var2, var3)

Пользуясь кнопкой «Если» можно сделать вычисления не для всех значений исходной переменной, а только по тем, для которых выполняется то или иное условие.

Перекодировка переменных.

Первоначально собранные данные можно перекодировать с помощью средств SPSS. Это бывает необходимо, когда первоначальное разнообразие исходных данных не нужно для последующего анализа. Перекодирование в таком случае означает уменьшение объема обрабатываемой информации.

Выберите в меню:

Преобразовать

Перекодировать

В другие переменные…

Лучше всего выбирать перекодировку в другие переменные, нежели перекодировку в те же переменные. Представьте, что Вы делаете перекодировку возраста в числовых значениях в интервальные значения. Если же выбран режим перекодировки в те же переменные, то исходные данные возраста будут затерты интервалами и восстановить их уже не получится.

Введите имя для каждой выходной (новой) переменной и щелкните Изменить.

Щелкните по кнопке Старые и новые значения и задайте перекодировку значений.

Старое значение – перекодируемое(ые) значение(я).Значение. Отдельное старое значение, которое нужно перекодировать в новое.Системное пропущенное (или пользовательское тоже). Такие значения (не заполненные числовые поля, неответы респондентов) иногда необходимо выделять в отдельную группу.Диапазон. Доступен только для числовых переменных и позволяет объединять в одно новое значение несколько старых в выбранном диапазоне (интервальная группировка).

Новое значение – значение, в которое будут перекодированы одно или несколько старых значений. Можно выбратьСкопировать старое значение для тех, где перекодировка не нужна. Также старые значения числовой переменной можно перекодировать в новые текстовые, выбравНовые переменные – текстовые .

РАБОТА С ФАЙЛАМИ.

Сортировка наблюдений.

Выберите в меню:

Данные

Сортировать наблюдения…

Можно выбрать одну или несколько переменных. Если, например, выбраны пол инациональность , то сначала наблюдения сортируются пополу , а затем внутри каждой полученной категории сортируются по значениям переменнойнациональность .

Транспонировать.

Выберите в меню:

Данные

Транспонировать…

В результате транспонирования создается новый файл, в котором строки и столбцы меняются местами.

Объединение файлов данных.

Файлы можно объединить двумя различными способами:

– Слить файлы, содержащие одни и те же переменные, но различные наблюдения

– Слить файлы, содержащие одни и те же наблюдения, но различный состав переменных.

В первом случае выберите в меню:

Данные

Слить файлы

Добавить наблюдения…

После этого выберите файл данных, который нужно добавить к открытому файлу данных. Удалите из списка Переменные в новом рабочем файле данных все переменные, которых не должно быть в объединенном файле. Из спискаНепарные переменные добавьте любые пары переменных, представляющие одну и ту же переменную, но записанную под различными именами в двух файлах.

Во втором случае выберите в меню:

Данные

Слить файлы

Добавить переменные…

Перед слиянием необходимо убедиться, что наблюдения в обоих файлах отсортированы в одинаковом порядке, особенно если используется слияние по ключу. Имена переменных во втором файле данных, совпадающие с именами переменных в рабочем файле данных по умолчанию исключаются, поскольку предполагается, что они содержат одну и ту же информацию.

Если в одном из файлов отсутствуют некоторые отдельные наблюдения, то для корректного слияния можно использовать переменные – ключи.

Преобразования временных рядов.

Преобразования временных рядов предполагают такую структуру файла данных, в которой каждая строка (наблюдение) представляет набор характеристик в определенный момент времени, а интервалы времени между наблюдениями равны.

Процедура Задать даты генерирует переменные, которые могут быть использованы для выделения периодических компонент временного ряда.

Наблюдения – это . Здесь задаются единицы времени, которые будут использоваться для создания дат.

Первое наблюдение . Здесь задается значение начальной даты, которое будет присвоено первому наблюдению. Последующим наблюдениям будут присвоены последовательные значения, основанные на заданном интервале времени.

Выберите в меню:

Данные

Задать даты…

Выберите временной интервал из списка Наблюдения – это.

Введите значения даты в поля Первое наблюдение .

Переменные, созданные процедурой Задать даты отличаются от переменных, имеющих формат типаДанные , который определяется при задании свойств переменных. Значения переменных, созданных процедуройЗадать даты , - это целые положительные числа, каждое из которых представляет количество дней, недель, часов или других единиц времени, прошедших с заданного Вами начального момента времени.

Выберите в меню:

Преобразовать

Создать временной ряд…

Процедура создать временной ряд используется для создания новых переменных, которые являются функциями существующих переменных, образующих временной ряд.

Функции, предназначенные для создания временных рядов, включают разности, скользящие средние, скользящие медианы, функции задержки (лаги) и опережения.

Некоторые процедуры анализа временных рядов не работают при наличии пропущенных значений. В окне Заменить пропущенные значения задаются параметры новых переменных, содержащих временные ряды, в которых пропущенные значения заменены оценками, которые могут быть вычислены одним из нескольких способов.

Выберите в меню:

Преобразовать

Заменить пропущенные значения…

Выберите метод, который Вы хотите использовать для замены пропущенных значений.

ЧАСТОТЫ

Процедура Частоты дает возможность вычислять статистики и строить диаграммы, полезные для описания многих типов переменных.

Выберите в меню:

Анализ

Описательные статистики

Частоты…

Выберите одну или несколько категориальных или количественных переменных.

Дополнительно Вы можете:

    Щелкнуть мышью по кнопке Статистики, чтобы задать вычисление описательных статистик для количественных переменных (среднее, мода, медиана и др.).

    Щелкнуть мышью по кнопке Диаграммы, чтобы задать вывод столбиковых диаграмм, круговых диаграмм и гистограмм.

    Щелкнуть мышью по кнопке Формат, чтобы задать порядок, в котором будут выводиться результаты.

Пример вывода:

Статистики

Количество лет, потраченных на образование

Количество лет, потраченных на образование

Валидный процент

Кумулятивный процент

Валидные

Итого


ОПИСАТЕЛЬНЫЕ СТАТИСТИКИ

Процедура Описательные статистики осуществляет вывод одномерных итожащих статистик для нескольких переменных в одной таблице.

Выберите в меню:

Анализ

Описательные статистики

Описательные…


Пример вывода:

Описательные статистики

Максимум

Стд. отклонение

Количество лет, потраченных на образование

Начальная зарплата

Зарплата в настоящее время

Время работы с момента поступления (месяцы)

N валидных (целиком)

ТАБЛИЦЫ СОПРЯЖЕННОСТИ

Процедура Таблицы сопряженности формирует двумерные и многомерные таблицы, а также вычисляет целый ряд критериев и мер силы связи для двумерных таблиц. Таким образом, таблицы сопряжённости применяются, когда нас интересует двумерный анализ, а также когда необходимо выяснить, существует ли взаимосвязь между двумя переменными.

Выберите в меню:

Анализ

Описательные статистики

Таблицы сопряженности…


Выберите одну или несколько переменных для строк и одну или несколько переменных для столбцов.

Дополнительно Вы можете:

Выбрать одну или несколько переменных для слоев;

Щелкнуть мышью по кнопке Статистики и выбрать нужные критерии и меры силы связи для двумерных таблиц и подтаблиц;

Щелкнуть мышью по кнопке Ячейки, чтобы задать вывод наблюденных и ожидаемых значений, процентов, а также остатков;

Щелкнуть мышью по кнопке Формат для задания порядка, в котором следует располагать категории.

Пример вывода:

Принадлежность к национальному меньшинству

Сотрудник секретариата

Сотрудник среднего звена

Менеджер

Лучшие статьи по теме