Как сделать факторный анализ в spss

Добавил пользователь Дмитрий К.
Обновлено: 05.10.2024

я решил приобщиться к культуре и попробовать parallel analysis для выбора числа факторов, вместо стандартных критериев Кайзера, Джоллифе и прочих каменных осыпей. И, честно говоря, пожалел, т.к. это привнесло больше путаницы, чем пользы.

1) Как лучше обрабатывать пропущенные значения?
Дело в том, что у меня всего 81 наблюдение на 3 блока вопросов (35, 67 и 51 соответствено). Выбрасывать наблюдения listwise во время факторного анализа -- непозволительная роскошь, т.к. для соответствующих блоков остается всего по 26, 24 и 44 наблюдения и SPSS даже не отображает таблицу с результатами теста KMO и Bartlett. При этом /missing=omit в скрипте для MAP-теста предлагает 25/22/41 фактор, а raw_parallel -- 2/2/3. Хотя автор рекомендует использовать оба, т.к. она обычно более-менее сходятся в показаниях. В то же время /missing=accept даёт 3-6/64(sic!)/6-10 с точки зрения разных версий MAP, 4/9/3 по мнению raw_parallel и 7/7/9 по мнению простого parallel.

2) Правилно ли я понимаю, что работа с пропущенными значениями при parallel analysis и факторном анализе должна быть идентичной: т.е. число факторов, предложенных MAP/Parallel при удалении пропусков должно быть задано в процедуру ФА также с опцией удаления пропусков? Если да, то непонятно, как поступать в ситуации, когда факторный проводится с заменой пропусков средними.

3) Концептуальый вопрос: подходят ли эти тесты вообще для 10-балльной шкалы Ликерта и если да, то какой из вариантов parallel стоит предпочесть? Лично мне ближе и понятнее по смыслу raw_parallel, но по факту parallel выдаёт более желаемое число факторов. Я на радостях по всякому насчитал эти факторы, а потом увидел вот эту заметку и как-то погрустнел. Связываться в polychoric correlation мне сейчас хочется меньше всего.

Заранее благодарю и извиняюсь за кросс-пост.

У меня ничего не вышло уже на стадии импорта данных. Например, для проведения Velicer's MAP test автор предлагает (в комментариях файла со скриптом) 4 способа импорта данных:
1) Ввести матрицу значений вручную через команду compute;
2) Посчитать матрицы на активном файле;
3) Прочитать матрицу из файла через команду GET;
3) Прочитать матрицу из файла через команду MGET;

Первый способ у меня не сработал, т.к. SPSS ругается на фигурную скобку в начале команды compute cr = Способы 2 и 3 не сработали, т.к. SPSS не понимает синтаксис вида
GET cr / FILE = * / missing=omit / VAR = Question_01 to Question_12.
и
*GET cr / FILE = 'C:\data.sav' / missing=omit / VAR = var1 to var9.

Четвёртый способ (MGET /type= corr / FILE = 'C:\corrmat' ) не сработал потому, что SPSS не признаёт команды MGET, хотя в справке она есть.

Тестировал на версиях 13, 18 и 21.

Я сейчас ковыряюсь с его кодом в R, который не установился как пакет через install.packages("paramap_1.0.tar.gz",re pos=NULL, type="source", dependencies = TRUE), но функции по-отдельности (по крайней мере MAP) вроде бы загрузились без ошибок.

Но всё же мне бы хотелось понять, почему у меня не работает синтаксис SPSS.

Факторный анализ - это статистический инструмент, довольно часто используемый в психологии. Многочисленные варианты его использования включают конструирование тестов, выявление основных параметров личности и способностей, установление того, сколько отдельных психологических характеристик (т.е. черт) измеряется набором тестов или заданиями теста.

Оценки по полным тестам (а не по его отдельным заданиям) также могут подвергаться факторному анализу - на самом деле именно так эта методика и используется.

Факторный анализ в этом случае может показать, действительно ли тесты, которые, предположительно, измеряют один и тот же конструкт (структуру мотивации). Факторный анализ оценок, полученных на основе полных тестов, может быть чрезвычайно полезен для установления того, что именно измеряется группой тестов, поскольку многозначность языка допускает, что одному и тому же конструкту разными исследователями могут быть даны различные наименования.

Число терминов, используемых в психологии индивидуальных различий, потенциально безгранично, и без факторного анализа нет надежного способа установить, действительно ли несколько шкал измеряют один и тот же базисный психологический феномен.

В своей работе мы применим факторный анализ исследуемых факторов для определения структурных компонентов Я-концепции и для формирования представлении о структуре мотивации героя фильма.

Исходным элементом для дальнейших расчётов является корреляционная матрица. Для построенной корреляционной матрицы определяются, так называемые, собственные значения и соответствующие им собственные векторы, для определения которых используются оценочные значения диагональных элементов матрицы (так называемые относительные дисперсии простых факторов).

Собственные значения сортируются в порядке убывания, для чего обычно отбирается столько факторов, сколько имеется собственных значений, превосходящих по величине единицу. Собственные векторы, соответствующие этим собственным значениям, образуют факторы; элементы собственных векторов получили название факторной нагрузки. Их можно понимать как коэффициенты корреляции между соответствующими переменными и факторами. Для решения такой задачи определения факторов были разработаны многочисленные методы, наиболее часто употребляемым из которых является метод определения главных факторов (компонентов).

Описанные выше шаги расчёта ещё не дают однозначного решения задачи определения факторов. Основываясь на геометрическом представлении рассматриваемой задачи, поиск однозначного решения называют задачей вращения факторов. И здесь имеется большое количество методов, наиболее часто употребляемым из которых является ортогональное вращение по так называемому методу Varimax. Факторные нагрузки повёрнутой матрицы могут рассматриваться как результат выполнения процедуры факторного анализа. Кроме того на основании значений этих нагрузок необходимо попытаться дать толкование отдельным факторам.

Если факторы найдены и истолкованы, то на последнем шаге факторного анализа, отдельным наблюдениям можно присвоить значения этих факторов, так называемые факторные значения. Таким образом для каждого наблюдения значения большого количества переменных можно перевести в значения небольшого количества факторов.

Перейдем к описанию проведенной нами в ходе работы процедуры факторного анализа. В качестве наглядного примера рассмотрим факторный анализ мотивации киноперсонажа.

Результаты опроса для 82 человек сохраняем в файл в переменных а1-а15. Открываем сохраненный файл с переменными, выбираем в меню Analyze (Анализ) Data Reduction (Сокращение объема данных) Factor. (Факторный анализ). Откроется диалоговое окно Factor Analysis (Факторный анализ) (рис. 6).

Рис. 6. Диалоговое окно Factor Analysis (Факторный анализ)

Переменные a1-a15 с результатами помещаем в поле тестируемых переменных и ознакомимся с возможностями, предлагаемыми различными кнопками этого диалогового меню.

После щелчка по кнопке Descriptive Statistics (Дескриптивные статистики) оставим вывод первичных результатов, которые включают в себя первичные относительные дисперсии простых факторов, собственные значения и процентные доли объяснённой дисперсии. Довольно часто бывает необходим также вывод одномерных статистик и корреляционных коэффициентов.

С помощью кнопки Extraction. (Отбор) выбираем метод отбора; оставляем здесь анализ главных компонентов, установленный по умолчанию. Количество отобранных в этом случае факторов приравнивается к числу собственных значений, превосходящих единицу. Также есть возможность собственноручно указать это количество. Так как неповёрнутое факторное решение, предоставляет малозначимую информацию, предотвратим его вывод щелчком на соответствующей опции.

Выключатель Rotation. (Вращение) позволяет выбрать метод вращения. Активируем метод Varimax и оставляем активированным вывод повёрнутой матрицы факторов. Далее организовываем вывод факторных нагрузок в графическом виде, в котором первые три наиболее нагруженных фактора будут представлены в трёхмерном пространстве; в случае наличия только двух факторов в слое приводится только одно изображение, что соответствует нашему случаю.

Выключатель Options. (Опции) предназначен для обработки пропущенных значений. Здесь обеспечивается возможность заменить пропущенные значения средними значениями соответствующих переменных. Для проведения расчётов щёлкаем на ОК.

В окне обзора появятся результаты. Сначала приводятся первичные статистики (таблица 7).

Таблица 7. Extraction Method: Principal Component Analysis (Метод отбора: Анализ главных компонентов).

Факторный анализ можно выполнить во многих статистических программах, но наиболее популярны сейчас SPSS, Statistica и Stadia. Для работы в SPSS после открытия файла с нужной базой в командной строке выбираем опции Analyze (анализ), Data Reduction (сокращение объема данных), Factor (факторный анализ).

В открывшемся диалоговом окне Factor analyze переносим из левого блока в правый верхний Variables с помощью верхнего курсора нужные нам признаки (напоминаем, что они должны быть измерены с помощью абсолютной метрической и/или интервальной, и/или дихотомической шкал) (переменные). С помощью курсора переносим в правый нижний блок Selection variable суммарную, итоговую переменную.

Далее в этом же диалоговом окне последовательно активизируем кнопки нижнего ряда. Активизировав кнопку Descreptives (описания), входим в блок Descreptives (описательная статистика), где в подокошке Statistics (статистики) отмечаем Initial solution (первоначальное решение — первичные относительные дисперсии простых факторов), в подокошке Correlation Matrix (матрица корреляций) отмечаем Coefficiens. Significance levels, КМО and Bartlett’s test of sphericity (коэффициенты, доля объяснительной дисперсии, вывод одномерных статистик). Нажимаем на Continue (продолжить) и затем активизируем кнопку Extraction (отбор).

Активизируем кнопку Rotation (вращение), входим в это новое рабочее окно. В окне Rotation (вращение) в подокошке Method (метод) отмечаем Varimax, в подокошке Display (дисплей) отмечаем Rotation Solution (решение после вращения) и Loading plot(s) (графики нагрузки), которые покажут распределение факторных нагрузок в трехмерном пространстве. Нажимаем Continue (продолжить).

Активизируем кнопку Scores (значения), во вновь открывшемся окне отмечаем Save as variables (сохранить как переменные), метод решения задачи — Regression (регрессионный анализ) и Display factor score coefficient matrix (отобразить матрицу факторных коэффициентов). Нажимаем Continue (продолжить).

Активизируем кнопку Options (параметры) и в этом вновь открывшемся окне в Missing Values (пропущенные значения) отмечаем Exclude cases listwise (нет пропущенных значений), для более легкого чтения результатов факторного анализа в подокошке Coefficient Displlay Format отмечаем Sorted by size (сортировать по размерам), активизируем опцию Suppress absolute values less than (не отражать значения коэффициентов факторной нагрузки, если их значения менее. ), оставляем в окошке 0,1 (на экран не будут выводиться незначимые факторные нагрузки). Нажимаем Continue (продолжить) и Ok (завершение команды).

Современные информационные технологии представляют собой компьютерную обработку информации по заранее отработанным алгоритмам, хранение больших объёмов информации на разных носителях и передачу информации на любые расстояния в предельно минимальное время.
Разработка информационных технологий – это очень затратная отрасль, требующая высокой подготовки специалистов и наукоемкой техники, зато их реализация нередко сравнима с революционными преобразованиями.

Содержание

4
Порядок выполнения факторного анализа………………………..

22
Список используемой литературы……………………………

Работа состоит из 1 файл

Курсовая ИТ.doc

Министерство образования и науки Республики Татарстан

Альметьевский Государственный Нефтяной Институт

Выполнил: студент группы

Список используемой литературы………………………………………..

Введение.

Разработка информационных технологий – это очень затратная отрасль, требующая высокой подготовки специалистов и наукоемкой техники, зато их реализация нередко сравнима с революционными преобразованиями.

Информационная экономика изменила многие аспекты экономической реальности, в том числе, и функцию денег, которые из всеобщего эквивалента трудозатрат постепенно превратились в средство расчета. Виртуальные банки и системы оплаты – плод развития информационных технологий.

Таким образом, в самом общем виде информационные технологии в экономике можно определить как совокупность действий над экономической информацией при помощи компьютерной техники для получения оптимального конечного результата.

В экономике информационные технологии применяются для обработки, сортировки и агрегирования данных, для организации взаимодействия участников процесса и вычислительной техники, для удовлетворения информационных потребностей, для оперативной связи и так далее.

Понятно, что решение об инвестициях в развитие информационных технологий, как и другие управленческие решени я, должны приниматься с учетом экономической целесообразности. Но так уж получается, что эту самую выгоду удобнее всего просчитывать при помощи все тех же информационных технологий. Есть модели подсчета совокупного экономического эффекта, позволяющий учитывать, помимо всего прочего, дополнительные преимущества от внедрения информационных технологий, расширяемость и гибкость систем, а также возможные риски.

I. Факторный анализ

Факторный анализ - это процедура, с помощью которой большое число переменн ых, относящихся к имеющимся наблюдениям, сводят к меньшему количеству независимых влияющих величин, называемых факторами. При этом в один фактор объединяются переменные, сильно коррелирующие между собой. Переменные из разных факторов слабо коррелируют между собой.

Таким образом, целью факторного анализа является нахождение таких комплексных факторов, которые как можно более полно объясняют наблюдаемые связи между переменными, имеющимися в наличии.

В психологии факторный анализ широко используется при создании многофакторных тестов, а также при систематизации и обобщении комплексных наблюдений.

II. Порядок выполнения факторного анализа

На первом шаге процедуры факторного анализа происходит стандартизация заданных значений переменных (z-преобразование); затем при помощи стандартизированных значений рассчитывают корреляционные коэффициенты Пирсона между рассматриваемыми переменными. Исходным элементом для дальнейших расчётов является корреляционная матрица. Для построенной корреляционной матрицы определяются, так называемые, собственные значения и соответствующие им собственные векторы, для определения которых используются оценочные значения диагональных элементов матрицы (так называемые относительные дисперсии простых факторов). Собственные значения сортируются в порядке убывания, для чего обычно отбирается столько факторов, сколько имеется собственных значений, превосходящих по величине единицу. Собственные векторы, соответствующие этим собственным значениям, образуют факторы; элементы собственных векторов получили название факторной нагрузки. Их можно понимать как коэффициенты корреляции между соответствующими переменными и факторами. Для решения такой задачи определения факторов были разработаны многочисленные методы, наиболее часто употребляемым из которых является метод определения главных факторов (компонентов). Описанные выше шаги расчёта ещё не дают однозначного решения задачи определения факторов. Основываясь на геометрическом представлении рассматриваемой задачи, поиск однозначного решения называют задачей вращения факторов. И здесь имеется большое количество методов, наиболее часто употребляемым из которых является ортогональное вращение по так называемому методу варимакса. Факторные нагрузки повёрнутой матрицы могут рассматриваться как результат выполнения процедуры факторного анализа. Кроме того, на основании значений этих нагрузок необходимо попытаться дать толкование отдельным факторам. Если факторы найдены и истолкованы, то на последнем шаге факторного анализа, отдельным наблюдениям можно присвоить значения этих факторов, так называемые факторные значения. Таким образом, для каждого наблюдения значения большого количества переменных можно перевести в значения небольшого количества факторов.

Цель факторного анализа – сконцентрировать исходную информацию, выражая большое число рассматриваемых признаков через меньшее число более емких внутренних характеристики, которые, однако, не поддаются непосредственному измерению (являются латентными).

Факторный метод будет изложен на примере опроса, проведенного с целью выяснения политических ориентаций жителей города. В ходе опроса респондентам предложили выбрать высказывания, соответствующие их мнению, и отдать свой голос в поддержку тех, кто:

согласен с нынешним политическим курсом (var 21.1)
выступает с критикой нынешнего политического курса (var 21.2)
выступает за вхождение России в западную цивилизацию (var 22.1)
против сближения России с Западом (var 22.2)
выступает за наведение жесткого порядка (var 23.1)
считает главным демократию, политические и личные свободы граждан (var 23.2)
выступает за усиление влияния Церкви на государство (var 24.1)
считает, что государство и Церковь не должны вмешиваться в жизнь граждан (var 24.2)
считает, что государство не должно вмешиваться в свободную рыночную экономику (var 25.1)
выступает за государственный контроль бизнеса (var 25.2)
выступает за объединение граждан в интересах государства (var 26.1)
считает, что граждане должны добиваться успеха сами (var 26.2)

Оценки ставились по двухбалльной шкале: 1) поддерживаю, 2) не поддерживаю.

Для факторного анализа:

Выбираю в меню Analyze (Анализ) Data Reduction (Сокращение объема данных) Factor. (Факторный анализ)

Откроется диалоговое окно Factor Analysis (Факторный анализ)

Переменные var21-….var26 помещаю в поле тестируемых переменных и ознакомьтесь с возможностями, предлагаемыми различными кнопками этого диалогового меню.

После щелчка по кнопке Descriptive Statistics (Дескриптивные статистики) оставьте вывод первичных результатов, которые включают в себя первичные относительные дисперсии простых факторов, собственные значения и процентные доли объяснённой дисперсии. Довольно часто бывает необходим также вывод одномерных статистик и корреляционных коэффициентов. В группе Correlation Matrix (Корреляционная матрица) целесообразно отметить флажком KMO and Barltett test of sphericity (Критерии КМО и сферичности Бартлетта), вычисляется два критерия – на многомерную нормальность (Бартлетта) и адекватность выборки (КМО определяет применимость факторного анализа к выбранным переменным).

С помощью кнопки Extraction. (Отбор) можно выбрать метод отбора. Если оставить здесь анализ главных компонентов, установленный по умолчанию, то количество отобранных в этом случае факторов приравнивается к числу собственных значений, превосходящих единицу. Также есть возможность собственноручно указать это количество.

Щёлкните на выключателе Extraction. (Извлечение), оставьте установку Principal components (Анализ главных компонентов). В нашем примере количество факторов сознательно ограничим тремя. Если бы мы не сделали такого ограничения, то в соответствии с начальными установками было бы создано двенадцать факторов, количество, которое очень тяжело поддаётся обзору.

Можно построить график собственных значений или диаграмму каменистой осыпи, установив флажок на Scree plot. Точками показаны соответствующие собственные значения, в пространстве двух координат. Этот тип диаграммы обычно используется при определении достаточного числа факторов перед вращением. При этом руководствуются следующим правилом: оставлять нужно лишь те факторы, которым соответствуют первые точки на графике до того, как кривая станет более пологой.

Выключатель Rotation. (Вращение) позволяет выбрать метод вращения. Вращение требуется потому, что изначально структура факторов, будучи математически корректной, как правило, трудна для интерпретации. Целью враще ния является получение простой структуры, которой соответствует большое значение нагрузки каждой переменной только по одному фактору и малое по всем остальным факторам.

Факторные нагрузки можно представить как коэффициенты корреляции каждой переменной с каждым из выявленных факторов. Чем теснее связь переменной с рассматриваемым фактором, тем выше значение факторной нагрузки. Положительный знак факторной нагрузки указывает на прямую, а отрицательный знак – на обратную связь переменной с фактором.

Активируйте метод варимакса (Varimax) и оставьте активированным вывод повёрнутой матрицы факторов. Далее вы можете организовать вывод факторных нагрузок в графическом виде, в котором первые три фактора будут представлены в трёхмерном пространстве; в случае наличия только двух факторов в слое приводится только одно изображение. При этом установите флажок на Loading plot(s).

Если Вы хотите найти значения факторов и сохранить их в виде дополнительных переменных задействуйте выключатель Scores. (Значения) и отметьте Save as variables (Сохранить как переменные). По умолчанию установлен регрессионный метод.

Можно запретить вывод малых факторных нагрузок и для этого установим граничное знач ение выводимых нагрузок равным 0,4. Достоинство этого шага состоит в том, что устраняется непривлекательное отображение малых значений в Е-формате. Для этого активируйте опцию Suppress absolute values less then: (He выводить абсолютные значения меньшие, чем:) и введите предельное значение 0,4.

Для проведения расчётов щёлкните на ОК.
В окне обзора появятся результаты. Сначала приводятся первичные статистики: Критерий сферичности Бартлетта показывает статистически достоверный результат (p

Читайте также: