Phân biệt PCA và PAF trong Phân tích nhân tố khám phá
Trong quá trình thực hiện luận văn kinh tế, quản trị hay khoa học xã hội, phân tích nhân tố khám phá (EFA) là kỹ thuật được sinh viên và học viên cao học sử dụng rất phổ biến khi xử lý dữ liệu bằng SPSS. Tuy nhiên, một khó khăn thường gặp là không phân biệt được EFA, PCA và PAF, dẫn đến lựa chọn sai phương pháp trích nhân tố và diễn giải kết quả không đúng bản chất nghiên cứu.
Bài viết này sẽ giúp bạn hiểu rõ sự khác nhau giữa EFA, PCA và PAF trong SPSS, biết khi nào nên sử dụng từng phương pháp, đồng thời hướng dẫn cách trình bày kết quả chuẩn học thuật, dễ đưa vào luận văn.
1. EFA, PCA và PAF là gì?
Phân tích nhân tố khám phá (EFA) (Exploratory Factor Analysis) là kỹ thuật thống kê được sử dụng để khám phá cấu trúc tiềm ẩn của tập biến quan sát, nhằm xác định các nhân tố đại diện cho dữ liệu nghiên cứu. Phương pháp này thường được áp dụng khi người nghiên cứu chưa biết rõ các biến quan sát đang đo lường bao nhiêu khái niệm bên trong, đặc biệt phổ biến trong các nghiên cứu kinh tế, quản trị và khoa học xã hội.
Trong quá trình thực hiện EFA bằng SPSS, người nghiên cứu sẽ gặp hai phương pháp trích nhân tố được sử dụng nhiều nhất là PCA và PAF. Tuy nhiên, hai phương pháp này có mục tiêu và bản chất hoàn toàn khác nhau, dù cùng xuất hiện trong cửa sổ phân tích EFA của SPSS.
PCA (Principal Component Analysis – Phân tích thành phần chính) là kỹ thuật dùng để giảm số lượng biến, bằng cách gộp các biến quan sát thành một số ít thành phần sao cho vẫn giữ được nhiều thông tin nhất. PCA sử dụng toàn bộ phương sai của dữ liệu và không phân biệt giữa phương sai chung và sai số đo lường, do đó không phản ánh đầy đủ bản chất nhân tố tiềm ẩn.
Ngược lại, PAF (Principal Axis Factoring – Trích trục chính) là phương pháp đúng nghĩa của phân tích nhân tố khám phá (EFA). PAF chỉ tập trung vào phương sai chung giữa các biến quan sát, qua đó phản ánh chính xác các nhân tố tiềm ẩn mà nghiên cứu hướng đến. Vì lý do này, PAF được khuyến nghị sử dụng trong luận văn, luận án và các nghiên cứu khoa học xã hội.
Tóm lại, PCA phù hợp khi mục tiêu là giảm biến, trong khi PAF phù hợp khi mục tiêu là khám phá và diễn giải nhân tố tiềm ẩn. Việc hiểu đúng sự khác nhau giữa PCA và PAF giúp người nghiên cứu lựa chọn phương pháp phù hợp và đảm bảo kết quả phân tích có giá trị học thuật.
2. Khi nào cần sử dụng PCA hoặc PAF?
Việc lựa chọn PCA hay PAF phụ thuộc trực tiếp vào mục tiêu nghiên cứu. Mặc dù cả hai đều được sử dụng trong EFA của SPSS, nhưng PCA và PAF phục vụ những mục đích hoàn toàn khác nhau. Nếu chọn sai phương pháp, kết quả phân tích có thể không phản ánh đúng bản chất nghiên cứu, đặc biệt trong luận văn.
PCA (Principal Component Analysis) nên được sử dụng khi mục tiêu chính là giảm số lượng biến quan sát, không đặt nặng việc khám phá hay diễn giải nhân tố tiềm ẩn. PCA giúp gộp nhiều biến có tương quan cao thành các thành phần chính nhằm tóm tắt dữ liệu một cách hiệu quả.
Bạn nên sử dụng PCA khi:
-
Cần rút gọn dữ liệu từ nhiều biến xuống ít biến hơn
-
Nghiên cứu mang tính xử lý dữ liệu hoặc kỹ thuật
-
Không yêu cầu giải thích sâu về ý nghĩa học thuật của nhân tố
-
PCA được dùng như bước tiền xử lý trước các phân tích khác
Lưu ý quan trọng: PCA không tách sai số đo lường, vì vậy không phù hợp nếu mục tiêu là nghiên cứu hành vi, thái độ hoặc xây dựng thang đo cho luận văn.
PAF (Principal Axis Factoring) là phương pháp đúng bản chất của phân tích nhân tố khám phá (EFA) và được khuyến nghị sử dụng trong nghiên cứu học thuật. PAF chỉ sử dụng phương sai chung giữa các biến, giúp phản ánh chính xác các nhân tố tiềm ẩn thực sự.
Bạn nên sử dụng PAF khi:
-
Thực hiện luận văn, luận án, bài báo khoa học
-
Nghiên cứu hành vi, thái độ, nhận thức của con người
-
Mục tiêu là xây dựng hoặc kiểm định thang đo
-
Cần kết quả EFA để đưa vào hồi quy, SEM, SmartPLS
Trong hầu hết các nghiên cứu xã hội và kinh tế, PAF là lựa chọn an toàn và đúng chuẩn học thuật hơn PCA.
Ví dụ: Giả sử bạn khảo sát sự hài lòng của khách hàng với 20 câu hỏi.
-
Nếu mục tiêu chỉ là giảm 20 câu hỏi xuống còn 5–6 biến đại diện để phân tích tiếp, bạn có thể sử dụng PCA.
-
Nếu mục tiêu là xác định các nhân tố tiềm ẩn như chất lượng dịch vụ, giá cả, trải nghiệm, bạn nên sử dụng PAF để đảm bảo kết quả phản ánh đúng bản chất hành vi của khách hàng.
3. Quy trình thực hiện phân tích EFA trong SPSS
Quy trình thực hiện PCA và PAF trong SPSS về cơ bản tuân theo các bước của phân tích nhân tố khám phá (EFA). Người đọc có thể tham khảo chi tiết tại bài phân tích nhân tố khám phá (EFA), trong đó trình bày đầy đủ điều kiện thực hiện, thao tác trên SPSS và cách kiểm tra mô hình. Trong phạm vi bài viết này, nội dung sẽ tập trung vào việc lựa chọn PCA hay PAF và diễn giải kết quả thu được, phục vụ trực tiếp cho viết luận văn và nghiên cứu khoa học.
4. Diễn giải kết quả PCA và PAF trong luận văn
Diễn giải kết quả PCA và PAF trong phân tích nhân tố khám phá (EFA) là bước quan trọng nhất, bởi đây là cơ sở để khẳng định cấu trúc thang đo, loại bỏ biến không phù hợp và hình thành các nhân tố đại diện cho mô hình nghiên cứu. Việc diễn giải cần dựa trên các bảng kết quả cốt lõi trong SPSS, bao gồm KMO and Bartlett’s Test, Total Variance Explained và Rotated Matrix,.....
4.1 Diễn giải kiểm định KMO và Bartlett’s Test
.jpg)
Kết quả kiểm định cho thấy chỉ số KMO = 0,841, lớn hơn ngưỡng 0,5. Điều này chứng tỏ mức độ thích hợp của mẫu là tốt, các biến quan sát có đủ mối liên hệ để tiến hành phân tích nhân tố khám phá.
Bên cạnh đó, kiểm định Bartlett’s Test of Sphericity có giá trị Sig. = 0,000 < 0,05, cho thấy ma trận tương quan giữa các biến khác ma trận đơn vị. Nói cách khác, các biến quan sát có tương quan tuyến tính với nhau và đủ điều kiện thực hiện EFA.
Kết luận: Dữ liệu hoàn toàn phù hợp để tiến hành phân tích nhân tố bằng cả PCA và PAF.
4.2 Diễn giải kết quả PCA (Principal Component Analysis)
.jpg)
a. Số lượng nhân tố được trích
Dựa trên bảng Total Variance Explained, kết quả PCA trích được 4 nhân tố có Eigenvalue > 1, cụ thể:
-
Nhân tố 1: Eigenvalue = 4,753
-
Nhân tố 2: Eigenvalue = 2,839
-
Nhân tố 3: Eigenvalue = 2,611
-
Nhân tố 4: Eigenvalue = 2,534
Theo tiêu chuẩn Kaiser (Eigenvalue > 1), việc giữ lại 4 nhân tố là phù hợp và có ý nghĩa thống kê.
b. Tổng phương sai trích
Bốn nhân tố này giải thích được 70,762% tổng phương sai của dữ liệu, vượt ngưỡng tối thiểu 50%. Điều này cho thấy các nhân tố trích ra giải thích tốt sự biến thiên của tập biến quan sát.
Sau khi xoay Varimax:
-
Nhân tố 1 giải thích 19,593%
-
Nhân tố 2 giải thích 19,401%
-
Nhân tố 3 giải thích 16,710%
-
Nhân tố 4 giải thích 15,057%
Tỷ lệ phương sai được phân bổ tương đối đồng đều giữa các nhân tố, giúp mô hình dễ diễn giải và ổn định hơn.
c. Diễn giải hệ số tải nhân tố (Rotated Component Matrix)
.jpg)
Kết quả bảng Rotated Component Matrix cho thấy:
-
Các biến GC1–GC5 đều có hệ số tải từ 0,807 đến 0,841 trên cùng một nhân tố
-
Các biến HI1–HI5 có hệ số tải từ 0,792 đến 0,853
-
Các biến SD1–SD4 có hệ số tải từ 0,853 đến 0,861
-
Các biến BM1–BM4 có hệ số tải từ 0,810 đến 0,832
Tất cả các hệ số tải đều lớn hơn 0,5, không xuất hiện tải chéo đáng kể. Điều này chứng tỏ các biến quan sát hội tụ tốt vào từng nhân tố riêng biệt, thang đo đạt giá trị hội tụ.
Kết luận PCA: PCA giúp nhóm 18 biến quan sát thành 4 nhóm thành phần rõ ràng, phù hợp với mục tiêu giảm chiều dữ liệu và tóm tắt thông tin.
4.3 Diễn giải kết quả PAF (Principal Axis Factoring)
a. Communalities – Mức độ giải thích của nhân tố
.jpg)
Kết quả bảng Communalities cho thấy các giá trị Extraction đều lớn hơn 0,5, dao động từ 0,535 đến 0,685. Điều này nghĩa là mỗi biến quan sát được các nhân tố trích giải thích từ 53,5% đến 68,5% phương sai, đạt yêu cầu trong nghiên cứu xã hội.
b. Số lượng nhân tố và phương sai trích
.jpg)
Tương tự PCA, phương pháp PAF trích được 4 nhân tố có Eigenvalue > 1. Tuy nhiên, tổng phương sai trích sau khi trích chỉ đạt 62,421%, thấp hơn PCA. Đây là đặc điểm bình thường vì PAF chỉ trích phương sai chung, không tính phương sai riêng và sai số.
c. Diễn giải Pattern Matrix
.jpg)
Khi sử dụng phép xoay Promax, kết quả được diễn giải dựa trên Pattern Matrix. Cụ thể:
-
Các biến GC có hệ số tải từ 0,755 đến 0,811
-
Các biến HI có hệ số tải từ 0,736 đến 0,832
-
Các biến SD có hệ số tải từ 0,805 đến 0,824
-
Các biến BM có hệ số tải từ 0,734 đến 0,779
Tất cả hệ số tải đều ≥ 0,5, các biến hội tụ tốt vào từng nhân tố, không có hiện tượng tải chéo nghiêm trọng. Điều này cho thấy các nhân tố tiềm ẩn được xác định rõ ràng và có ý nghĩa lý thuyết.
Kết luận PAF: PAF phản ánh đúng bản chất phân tích nhân tố khám phá, phù hợp cho các nghiên cứu hành vi, xã hội và quản trị.
5. Câu hỏi thường gặp
EFA có bắt buộc dùng PAF không?
Không bắt buộc, nhưng trong nghiên cứu khoa học xã hội, PAF được khuyến nghị sử dụng.
PCA có dùng cho luận văn được không?
Có thể, nhưng cần giải thích rõ mục tiêu là giảm biến, không phải khám phá nhân tố.
Factor Loading bao nhiêu là đạt?
Thông thường từ 0.5 trở lên, tùy lĩnh vực nghiên cứu.
6. Kết luận
Phân tích nhân tố khám phá (EFA) là bước quan trọng giúp xác định cấu trúc thang đo trong nghiên cứu định lượng. Trong EFA, PCA và PAF là hai phương pháp trích nhân tố phổ biến, mỗi phương pháp phù hợp với mục tiêu phân tích khác nhau. PCA thích hợp khi cần rút gọn dữ liệu, trong khi PAF phản ánh đúng bản chất nhân tố tiềm ẩn và thường được khuyến nghị trong luận văn. Việc lựa chọn đúng phương pháp giúp kết quả phân tích chính xác, dễ diễn giải và đạt yêu cầu học thuật.
Để hạn chế sai sót trong quá trình xử lý dữ liệu và đảm bảo kết quả phân tích phản ánh đúng bản chất nghiên cứu, bạn nên tham khảo thêm bài viết tổng hợp những điều cần lưu ý khi chạy SPSS cho kết quả tốt , trong đó trình bày toàn diện các vấn đề quan trọng từ chuẩn bị dữ liệu, kiểm định thang đo đến phân tích và diễn giải kết quả.
------------------------
Resdata hỗ trợ bạn những gì?
✅ Tư vấn & định hướng toàn bộ quy trình xử lý dữ liệu SPSS: Rà soát thang đo, phát hiện và xử lý các biến không phù hợp, đồng thời định hướng từng bước phân tích (Cronbach’s Alpha, EFA, hồi quy/SEM…) theo đúng bản chất dữ liệu, bối cảnh nghiên cứu và mục tiêu đề tài, giúp kết quả phản ánh thực tế nghiên cứu và đáp ứng yêu cầu học thuật.
✅ Hỗ trợ SPSS 1 kèm 1 qua ultraview: Hướng dẫn chi tiết từng bước thực hành và cách viết nhận xét chuẩn học thuật.
✅ Xử lý nhanh – đúng chuẩn: Xử lý kết quả trong ngày. Phù hợp cho khóa luận, luận văn, luận án và bài báo khoa học.
✅ Cam kết chỉnh sửa theo góp ý của giảng viên/hội đồng cho đến khi đạt yêu cầu.
Nếu bạn đang gặp phải các tình huống trên và chưa tìm được hướng xử lý phù hợp, đừng ngần ngại liên hệ ngay: Hotline: 0907 786 895.
Resdata luôn sẵn sàng đồng hành cùng bạn với phương châm: Nhanh chóng – Tin cậy – Bảo mật – Chi phí hợp lý.

