В О Климчук - Факторний аналіз використання у психологічнихдослідженнях - страница 1

Страницы:
1  2 

Климчук В. О. Факторний аналіз: використання у психологічних дослідженнях //Практична психологія та соціальна робота. — 2006. — №8. — С. 43-48.

ФАКТОРНИЙ АНАЛІЗ: ВИКОРИСТАННЯ У ПСИХОЛОГІЧНИХ

ДОСЛІДЖЕННЯХ

Анотація.

У статті робиться спроба в доступній для психологів формі викласти основи факторного аналізу. Аналіз проводиться на матеріалі реальних психологічних досліджень. Також описується "ручний" варіант факторного аналізу. Постановка проблеми.

Останнім часом спостерігається значне зростання інтересу психологів-дослідників і психологів-практиків до методів математичної обробки результатів досліджень. Однак, хоч інтерес і зростає, та українські видавці поки що не відгукуються, і тому доступної для розуміння літератури українською мовою з математичних методів у психології немає. Частково потребу психологів у виданнях такого виду задовольняє Росія [6, 11], але - лише частково (книги ці мають досить таки високу ціну і не досить великі тиражі, які зникають відразу після виходу в світ). І якщо спостерігається такий брак інформації з використання найпростіших математичних методів у психології (аналіз середніх та варіації, аналіз зв'язку, методи статистичного висновку, аналіз тенденцій), то ситуація з методами багатомірного статистичного аналізу просто катастрофічна. А між тим, багатомірний статистичний аналіз у унікальним та водночас універсальним методом роботи, який дозволяє максимально повно реконструювати і моделювати не лише внутрішній, але й зовнішній психологічний світ людини. Для того, щоб виправити цю ситуацію, ми задумали створити серію статей, присвячених безпосередньо використанню методів багатомірного статистичного аналізу у психології. Ми обговоримо використання факторного аналізу, багатомірного шкалювання та кластерного аналізу. При цьому, ми будемо спиратися на роботу з програмою Statistica 5.5 (зважаючи на брак місця, відсилаємо до російських видань [17-21]).

Мета статті.

Наша розвідка ставить на меті проаналізувати особливості використання факторного аналізу і зробити його доступним інструментом психологічних досліджень.

Мета факторного аналізу. Факторно-аналітичний підхід ґрунтується на уявленні про комплексний характер досліджуваного явища, що виявляється, зокрема, у взаємозв' язках між окремими його ознаками. Мета факторного аналізу -сконцентрувати вихідну інформацію, представлену у вигляді масиву даних і виразити якомога більшу кількість ознак через якомога меншу кількість характеристик. Вважається, що наймісткіші характеристики і будуть найсуттєвішими. Саме ці узагальнені місткі характеристики і називаються факторами.

Можна виділити чотири напрямки, в яких можна використовувати факторний аналіз: зменшення кількості змінних (редукція даних); групування, класифікація та компактна візуалізація даних; пошук прихованих змінних; генерація нових ідей.

Підготовка даних до факторного аналізу. Факторний аналіз спирається на обчислення коефіцієнтів кореляції між змінними, а тому масив даних, які готуються для факторного аналізу, повинен відповідати певним вимогам.

1. Масив повинен бути представлений у вигляді двовимірної матриці.

2. У стовпчиках матриці повинні бути занесені аналізовані змінні, а в рядках -значення цих змінних.

3. У матриці не повинно бути пропусків.

4. Бажано, щоб кількість рядків була більшою за кількість стовпчиків.

5. Кількість змінних (стовпчиків) повинна бути достатньо великою (більше 10). Нижче наведено приклад масиву даних, підготовленого для факторного аналізу.

Нехай ми провели опитування, в якому просили людей оцінити політичних лідерів за якістю "розум" (за 10-бальною шкалою). Після цього дані представили у табл. 1, де стовпчики - закодовані імені лідерів (змінні), а рядки - опитані особи (значення змінних). Дійсно, факторний аналіз може дати відповідь на питання, як сприймаються людьми політичні лідери, оскільки це і є задача на з' ясування структури зв' язків між змінними.

Таблиця 1.

Дані, підготовлені для факторного аналізу

-

х и н н

і

м

з

к ю о о о

і

н а т и п

О

Політичні лідери (змінні)

 

1

23456789 10

1

2

1

3

7

8

6

9

9

4

5

2

1

5

3

6

4

8

9

9

2

7

3

3

1

5

4

7

7

7

7

6

2

4

2

3

5

6

6

1

6

6

6

4

5

1

2

3

6

7

8

9

9

5

4

6

6

1

4

9

7

8

3

2

10

5

7

4

1

2

10

5

8

3

7

9

6

8

5

1

4

7

6

10

8

2

9

3

9

10

5

6

3

9

2

8

1

4

7

10

9

4

5

6

1

3

10

7

8

2

11

4

3

6

7

1

5

2

9

8

10

12

8

1

2

7

6

9

3

5

10

4

13

10

3

4

9

5

8

2

6

7

1

14

2

3

6

7

4

5

1

8

9

10

15

5

1

2

8

10

9

7

3

4

6

16

7

2

3

1

10

6

5

9

8

4

17

6

1

3

9

8

10

5

2

4

7

18

4

1

2

9

5

10

6

3

7

8

19

2

1

4

6

5

8

9

7

10

3

20

2

1

4

6

5

8

9

7

10

3

Після того, як дані введено до програми Statistica, вона їх автоматично обробляє і видає досліднику набір результатів. Саме на цьому етапі виникає найбільше проблем. Що це за дані? Що вони означають? Чому тут так багато цифр? Як все це звести до однієї цілісної картини? Відповідь на ці питання ми зараз і спробуємо дати.

Інтерпретація результатів факторного аналізу. Основні результати факторного аналізу виражаються у

С. 43

факторних навантаженнях, факторних полях, факторних вагах, власних значеннях факторів.

Факторні навантаження (factor loadings) - це коефіцієнти кореляції кожної із аналізованих змінних із кожним з виділених факторів.

Чим тісніший зв' язок змінної із фактором, тим більшим є її факторне навантаження. Позитивний знак факторного навантаження вказує на прямий зв' язок змінної з фактором, негативний - на обернений. Таблиця факторних навантажень, отримана в результаті факторного аналізу, містить кількість стрічок, рівну кількостізмінних (стовпчиків у вихідній матриці), та кількість стовпчиків, рівну кількості виділених факторів. Факторні навантаження наведені в табл. 2.

Таблиця 2.

Факторні навантаження

 

Factor

 

1

2

Політик 1

-0,03995

-0,05209

Політик 2

-0,83896

-0,02758

Політик 3

-0,78238

-0,29903

Політик 4

0,612751

-0,52075

Політик 5

0,321634

0,69117

Політик 6

0,877572

0,02443

Політик 7

-0,17285

0,745851

Політик 8

-0,38113

-0,06763

Політик 9

0,215095

-0,57704

Політик 10

-0,10559

-0,41135

Expl.Var

2,799167

1,905432

Prp.Totl

0,279917

0,190543

Як бачимо, виділилося 2 фактори. Найтісніше пов'язаними з першим фактором виявилися лідери 2, 3, 4, та 6, причому 2 та 3 протистоять 4 та 6. Якщо подивитися на характер оцінок цих лідерів (табл. 1), то стане зрозуміло, що як розумних оцінюють лідерів 4 та 6 (у них вищі бали), а як не зовсім розумних - 2 та 3. Інші лідери не потрапили до цього фактору, а тому нічого про них сказати ми не можемо.

Аналогічно аналіз проводиться по другому фактору. Тут ми бачимо протиставлення лідерів 5 та 7 лідерам 4 та 9. Така ситуація може стати джерелом подальших досліджень, оскільки наявність другого фактору не передбачалася (згадайте, що оцінювання проводилося лише за параметром "розум").

Цікаво, що факторні навантаження можна представити графічно у так званому факторному полі (рис. 1.).

Factor Loadings, Factor 1 vs. Factor 2 Rotation: Unrotated Extraction: Principal components

1,0 0,8 0,6 0,4

20,2

О

о го

0,0

-0,2 -0,4 -0,6

-0,8

.                                           Політик 7

 

і °

Політик 5

о

 

 

Політик 2              Політик о Політик

Політик 6

1

-1 ЮЛііиКо-                 ,WJ      if in

о о

—1-1-"—^

Політик 3     і і

Політик

1

 

Політик 4

Політик 9

...JQ.... .

 

 

-1,0

-0,6

-0,2

0,2

0,6

1,0

Factor 1

Рис. 1. Графічне представлення факторних навантажень (факторне поле)

Можна висунути таку гіпотезу стосовно причин виділення другого непередбачуваного фактора:

причиною виділення другого фактора може бути різне розуміння опитаними людьми поняття "розум": для одного - це інтелект, а для другого - життєва практичність.

З'ясувати це дозволить наступний результат факторного аналізу - факторні ваги.

Факторні ваги (factor scores) - кількісні значення зв'язку виділених факторів з об'єктами.[1]

Об'єкту з більшою факторною вагою властивий більший рівень прояву властивостей виділеного фактора (більший рівень зв' язку з фактором). Позитивні факторні ваги відповідають об' єктам, що мають рівень прояву властивостей фактора більше середнього, а негативні - нижче середнього. Таблиця факторних ваг складається з кількості стрічок, рівної кількості об'єктів, та кількості стовпчиків,рівної кількості виділених факторів. Нижче наведена таблиця факторних ваг, отримана в результаті дослідження сприймання політичних лідерів (табл. 3.).

Таблиця 3.

Факторні ваги

 

Factor

 

1

2

1

0,111905

1,112585

2

-0,88068

0,698867

3

-0,28344

0,870449

4

-1,23565

0,138548

5

0,041222

1,062457

6

0,93953

-0,8847

7

1,075413

-1,08295

8

0,829232

0,209612

9

-1,85359

1,07553

10

-1,52139

-0,20612

11

-1,19151

-2,17375

12

1,080925

-0,51853

13

0,188427

-0,72121

14

-0,94014

-1,95754

15

1,180397

1,103994

16

-0,41152

1,155574

17

1,174646

0,219696

18

1,256649

-0,41478

19

0,21979

0,156133

20

0,21979

0,156133

Як бачимо з таблиці, найбільші факторні ваги по першому фактору мають опитані 6, 7, 8, 12, 15, 17, 18. По другому фактору - 1, 3, 5, 9, 15, 16. Таким чином, виявилося, що опитувані по різному пов'язані з виділеними факторами, а значить, і за основу для оцінки брали різні уявлення про "розум". Провівши додаткове дослідження, можна буде визначити, з яким фактором (першим чи другим) який тип "розуму" пов'язується, а значить, можна буде встановити фактори уявлень про розум політичних лідерів у масовій свідомості.

Однак, це ще не всі можливості факторного аналізу - з його допомогою можна встановити, який із факторів найбільш значимий. Для цього використовується аналіз власних значень факторів.

С. 44

Власні значення (eigenvalues) - це дисперсії, які пояснюються факторами. В табл. 4. наведені власні значення виділених факторів.

Таблиця 4.

Власні значення факторів

Eigenvalues (factor1.sta) Extraction: Principal components

Factors

Eigenval

% total Variance

Cumul. Eigenval

Cumul.

%

1

2

2,799167 1,905432

27,99167  2,799167 27,99167 19,05432  4,704598 47,04598

У стовпчику (Eigenval) наведено дисперсії кожного фактора, а в стовпчику (% total Variance) - відсоток від загальної дисперсії для кожного фактора. У нашому випадку перший фактор пояснює приблизно 28% дисперсії, а другий фактор - 19% дисперсії. Стовпчик (Cumul.Eigenval) містить накопичену або кумулятивну дисперсію виділених факторів, а стовпчик (Cumul%) - накопичений відсоток від загальної дисперсії.

Для аналізу важливими є такі показники:

- накопичений відсоток дисперсії обох факторів (47%), який визначає, наскільки повно вдалося описати нашу сукупність даних з допомогою виділених факторів. Чим вищий цей показник, тим більшу частину масиву даних вдалося факторизувати;

- відсоток загальної дисперсії для кожного фактора, який вказує на значимість цього фактора. Чим більший відсоток дисперсії пояснює фактор, тим він значиміший і тим більше змінних він в себе включає.

У нашому випадку перший фактор пояснює 28% дисперсії, а другий - 19%. Разом вони описують 47% дисперсії, тобто, майже половину масиву даних. Це означає, що факторизація не повна, і що існують ще й інші фактори, менш значимі, але теж достатньо важливі. Постає питання: скільки ж факторів варто виділити, щоб, з одного боку, вони максимально повно описували весь масив даних, а з іншого - були достатньо значимими? Про це ми поговоримо далі.

Зробимо підсумок. Для інтерпретації результатів факторного аналізу необхідні такі величини: факторні навантаження; факторне поле; факторні ваги; власні значення факторів. В текстах наукових робіт представляють лише факторні поля, а при описі цих факторних полів поруч з кожною змінною в дужках ставлять її факторненавантаження. Самі факторні навантаження, ваги та власні значення факторів представляють у додатках.

Задача про кількість факторів. Взагалі, рішення про кількість виділених факторів достатньо довільне. Зазвичай, спочатку виділяють максимально можливу кількість факторів, а потім на основі аналізу таблиці власних значень приймають рішення про найбільш збалансовану кількість виділених факторів і проводять знову аналіз вже для обраної їх кількості. Однак, існують загальні рекомендації, слідування яким дасть непоганий результат.

Критерій Кайзера. Цей критерій, розроблений Х.Ф. Кайзером (1960), найширше використовується і полягає у тому, що відбираються лише фактори, власні значення яких більше 1. Цей критерій автоматично включається в модулі факторного аналізу програми STATISTICA.

Критерій кам'янистого насипу. Це є графічний критерій, вперше описаний Р.Б. Кеттелом [15, 16]. На графіку в порядку спадання зображують власні значення кожного виділеного фактора (рис. 2.). Р.Б. Кеттел запропонував знайти таке місце на графіку, де зменшення власних значень зліва направо максимально сповільнюється. Відповідно до цього критерію варто залишити 2 фактори. Назва цього критерію походить від геологічного терміну, яким позначають уламки гірських порід, які накопичуються в нижній частині скелястого схилу - фактори справа і є тими уламками.

Plot of Eigenvalues |

3,5 3,0 2,5 2,0

> 1,5 1,0

0,5

0,0

0 1 23456789        10 11

Number of Eigenvalues

Рис. 2. Критерій кам 'янистого насипу

Який же критерій використовувати? Критерій Кайзера іноді зберігає занадто багато факторів, а критерій кам'янистого насипу - навпаки, іноді зберігає занадто мало факторів. Однак, обидва критерії дають непоганий результат, якщо їх застосовувати в нормальних умовах (невелика кількість факторів та велика кількість змінних і об'єктів). Часто використовують обидва критерії послідовно - відсікають зовсім незначимі фактори з допомогою критерію Кайзера, а потім до тих факторів, які залишилися, застосовують критерій кам' янистого насипу.

Особливості факторного аналізу. Результати факторного аналізу будуть вдалими, якщо вдасться їх проінтерпретувати, виходячи із смислу показників, які характеризують виділені фактори. Цей етап роботи є надзвичайно відповідальним, оскільки вимагає від дослідника досвіду аналізу та чіткого уявлення про аналізовані змінні. Саме тому включення в набір змінних якомога більшої кількості різноманітних показників ні до чого не призведе. Факторний аналіз не дає якогось нового знання, він лише допомагає виявити структуру заданих дослідником змінних. У зв'язку з цим при підборі змінних для факторного аналізу варто керуватися не бажанням "объять необъятное", а смисловим наповненням цих змінних.

Страницы:
1  2 


Похожие статьи

В О Климчук - Психологічні чинники формування центрованості на шлюбі у юнацькому віці

В О Климчук - Факторний аналіз використання у психологічнихдослідженнях

В О Климчук - Багатомірне шкалювання у психології можливості обробки даних без комп'ютера

В О Климчук - Викладання курсу математичні методи у психології в умовах кредитно-модульної системи

В О Климчук - Дослідження особливостей розвитку внутрішньої мотивації студентів у навчальній діяльності