Bước 1: Xác định vấn đề
Đây là bước đầu tiên và đóng vai trò quan trong trong toàn bộ quá trình nghiên cứu và phân tích. Bước 1 bao gồm các nhiệm vụ dưới đây 1)Xác định mục tiêu nghiên cứu; 2)Xây dựng mô hình nghiên cứu và các tập hợp chỉ báo đo; 3)Lựa chọn cỡ mẫu; 4)Xác định phương pháp thu thập thông tin.
Trước tiên, mục tiêu nghiên cứu phải được xác định. Việc xác định đúng mục tiêu nghiên cứu sẽ giúp cho việc định hình các mô hình. Nếu xác định mục tiêu nghiên cứu là các yếu tố ảnh hưởng chất lượng dịch vụ đặt chỗ, các biến trong mô hình sẽ hoàn toàn khác khi mục tiêu nghiên cứu là chất lượng dịch vụ trên máy bay.
Sau khi đã xác định mục tiêu rõ ràng, nhiệm vụ 2 là xác định các nhân tố trong mô hình phân tích nhân tố. Các nhân tố có thể được xác định dựa trên các nghiên cứu đã được tiến hành trước đây, dựa trên lý thuyết hoặc sự cân nhắc của nhà nghiên cứu. Mỗi nhân tố sẽ được gắn với một tập hợp các chỉ báo là các biến quan sát được trực tiếp. Việc xác định xem có bao nhiêu chỉ báo trong một nhân tố cũng là một quyết định cần phải cân nhắc kĩ càng, do việc có quá nhiều chỉ báo sẽ dẫn đến những khó khăn trong việc thu thập thông tin, và có quá ít chỉ báo sẽ không đầy đủ để đo một nhân tố. Cần phải có đủ số biến sao cho mỗi nhân tố đươc đại diện bởi ít nhất ba đến bốn biến.
Velicer & Fava đã tóm tắt các nghiên cứu về lựa chọn số biến và đưa ra các điểm chính sau:
1. Những nhân tố không có ít nhất ba biến với hệ số tải cao không nên được lựa chọn. Điều đó có nghĩa là cần phải có ít nhất ba biến mỗi nhân tố. Vì không phải lúc nào kết quả phân tích cũng diễn ra đúng như dự kiến nên khi xây dựng mô hình nên đưa ít nhất 6-10 biến vào mỗi nhân tố.
2. Cần phải có số lượng biến lớn hơn nếu hệ số tải thấp, 10 đến 20 biến mỗi nhân tố.
Số quan sát càng lớn, số lượng biến mỗi nhân tố càng lớn và các hệ số tải càng lớn thì mô hình được lấy ra từ mẫu sẽ càng gần với mô hình nhân tố của toàn bộ tổng thể do điểm mạnh và điểm yếu được bổ sung cho nhau – ví dụ: hệ số tải thấp
và số biến nhỏ sẽ được bù lại bởi số lượng quan sát lớn. Nếu không có số quan sát lớn, có thể bù lại bằng số lượng biến mỗi nhân tố lớn (lưu ý tránh trường hợp có nhiều biến hơn số quan sát).
Mac Callum & AustinJT (2000) [22] đã chứng minh qua lý thuyết và thực nghiệm rằng tỉ lệ cỡ mẫu và số biến không phải bất biến, mà có quan hệ với các khía cạnh khác của việc nghiên cứu. Kết luận được đưa ra là không nên đưa ra các nguyên tắc chung về cỡ mẫu. Các kết luận cơ bản khác như sau:
1. Cỡ mẫu càng lớn thì càng có hệ số communalties cao (Communality : là tỉ lệ của phương sai của một biến được giải thích bởi nhân tố tiềm ẩn, hệ số communalities thấp thường có nghĩa là có những nhân tố dị biệt có tương quan với nhau và với các nhân tố chung), và có ra được mô hình được định nghĩa tốt [mỗi nhân tố có ít nhất ba hoặc bốn hệ số tải cao và có một cấu trúc đơn giản (số nhân tố ít và không bị trùng lắp)]. Điều này sẽ làm tăng cơ hội có được mô hình nhân tố phản ánh đúng bản chất của toàn bộ tổng thể.
2. Khi hệ số communalities lớn (> .6), N dưới 100 vẫn có các kết quả phân tích tin cậy.
3. Với communalities trung bình (khoảng .5) và các nhân tố được định nghĩa tốt, nên có 100 đến 200 quan sát.
4. Với hệ số communalities thấp (< .5) nhưng có số nhân tố không nhiều và mỗi nhân tố đại diện cho 6-7 biến, cần có hơn 100 quan sát.
5. Với communalities thấp và chỉ có 3 hoặc 4 hệ số tải cao trên mỗi nhân tố, cần khoảng hơn 300 quan sát.
6. Với communalities thấp và các nhân tố không được định nghĩa tốt, cần phải có hơn 500 quan sát.
Tuy nhiên, do không thể biết trước được liệu các hệ số communalities cao hay thấp hoặc các nhân tố có được định nghĩa tốt hay không, nên có một nguyên tắc là “càng nhiều quan sát càng tốt”.
Một lý luận khác do Darlington, 2006, đưa ra cũng có kết luận gần tương tự. Cỡ mẫu cần thiết được xác định dựa trên nhiều yếu tố. Mô hình có cấu trúc càng rõ ràng thì số lượng đơn vị trong mẫu càng giảm. Tuy nhiên, theo Darlington, 2006, một mô hình rất mạch lạc và rõ ràng cũng cần ít nhất 50 quan sát và cần 100 quan sát hoặc nhiều hơn cho các mô hình có cấu trúc thiếu mạch lạc hơn. Nguyên tắc về số lượng biến trong phân tích nhân tố rất khác so với hồi qui. Trong phân tích nhân tố, số biến nhiều hơn số quan sát có thể được chấp nhận. Trên thực tế số biến càng nhiều càng tốt, với điều kiện là các biến đó phù hợp với các nhân tố tiềm ẩn mà chúng đang đo (Darlington, 2006). Điều này khá mâu thuẫn với các kết luận của các tác giả khác rằng số biến không nên nhiều hơn số quan sát.
Trong ví dụ trên về dịch vụ hàng không, mục tiêu nghiên cứu là các nhân tố ảnh hưởng đến sự hài lòng của hành khách về chất lượng dịch vụ trên máy bay. Số biến được nghiên cứu là 33 biến, bao gồm tất cả các khía cạnh cấu thành nên dịch vụ trên khoang máy bay. 33 câu hỏi tương ứng với 33 biến được thiết kế trong bảng hỏi. Nếu theo nguyên tắc số quan sát cần gấp ít nhất 4-5 lần số biến thì cỡ mẫu tối thiếu cần thiết là 165 hành khách điền vào bảng hỏi. Bước tiếp theo là giảm bớt số biến xuống thành các nhân tố, trong đó mỗi nhân tố là một biến độc lập có quan hệ nhân quả với các biến quan sát “kết quả” trong tập hợp biến-nhân tố đó.
Bước 2: Xác định mức độ tương quan giữa các biến qua ma trận tương quan
Sau khi thông tin đã được thu thập và tổng hợp, một ma trận hệ số tương quan sẽ được thiết lập. Đây là một ma trận thể hiện các tương quan cặp của từng cặp biến. Trong thực tế, nếu sự tương quan giữa các biến tương đối nhỏ thì phân tích nhân tố có thể không phù hợp.
Để minh họa, có thể đơn giản hóa ví dụ trên bằng cách giả định rằng 7 biến đầu tiên (trong số 33 biến ) có tương quan cặp như sau (vì là ví dụ minh họa nên tác giả chỉ lấy 7 biến cho ngắn gọn, thay vì đưa ví dụ cả 33 biến):
Bảng 2.1 : Ma trận tương quan
V1 | V2 | V3 | V4 | V5 | V6 | V7 | |
V1 | 1.00 | ||||||
V2 | 0.78 | 1.00 | |||||
V3 | 0.82 | 0.75 | 1.00 | ||||
V4 | 0.23 | 0.16 | 0.12 | 1.00 | |||
V5 | 0.15 | 0.23 | 0.36 | 0.81 | 1.00 | ||
V6 | 0.35 | 0.59 | 0.12 | 0.84 | 0.67 | 1.00 | |
V7 | 0.41 | 0.20 | 0.23 | 0.72 | 0.87 | 0.73 | 1.00 |
Có thể bạn quan tâm!
- Nhóm Thông Tin Đánh Giá Chất Lượng Chức Năng
- Bản Chất Và Tác Dụng Của Phương Pháp
- Nguyên Tắc Cơ Bản Trong Phân Tích Nhân Tố
- Bản Chất Của Phương Pháp Mô Hình Phương Trình Cấu Trúc
- Sáu Bước Trong Quá Trình Xây Dựng Mô Hình Phương Trình Cấu Trúc
- Chất lượng dịch vụ hàng không của Hãng hàng không quốc gia Việt Nam - 13
Xem toàn bộ 204 trang tài liệu này.
Trong đó:
V1: Máy bay của hãng rất hiện đại V2: Ghế ngồi rộng rãi, thoải mái V3: Độ ngả thân ghế
V4: Sử dụng các thiết bị tại ghế ngồi rất thuận lợi V5: Thái độ của tiếp viên chân thành, thân thiện V6: Tiếp viên nhã nhặn, lịch sự khi giao tiếp
V7: Tiếp viên nhiệt tình chu đáo với hành khách
Nhận xét:
Ma trận tương quan giữa 7 biến (V1(V7) biểu hiện quan hệ tương quan theo từng cặp biến. Theo kết quả bảng ...., các biến V4, V6, V5 và V7 có tương quan rất cao. Nhóm này sẽ được đặt tên là nhân tố F2, cụ thể là nhân tố “tiếp viên” . Tương tự, các biến V1, V2 và V3 được đại diện bởi nhân tố chung F1, được đặt tên là nhân tố “thiết bị”. Bước tiếp theo sẽ giúp khẳng định lại giả thuyết này.
Bảng 2.2 : Các nhân tố được tập hợp từ các biến
Eigenvalue | % of variance | Cumulative % of variance | |
1 | 2.6379 | 44.5 | 44.5 |
2 | 1.9890 | 31.3 | 75.8 |
3 | 0.8065 | 11.2 | 87.0 |
4 | 0.6783 | 5.7 | 92.7 |
5 | 0.5421 | 3.4 | 96.1 |
6 | 0.3420 | 2.3 | 98.4 |
7 | 0.2341 | 1.6 | 100% |
Giải thích:
Eigenvalue: Phương sai tổng hợp của từng nhân tố Percent of variance: Phương sai của từng nhân tố tính bằng %
Cumulative Percentage: Phương sai tích lũy [cột (6) = cột (5) cộng dồn]
Bước 3: Xác định số nhân tố
Trong nghiên cứu thường số nhân tố sau khi xử lý ít hơn số biến ban đầu. Rất hiếm có trường hợp tất cả các biến ban đầu đều là các nhân tố ảnh hưởng hay tác động đến vấn đề nghiên cứu. Theo ví dụ trên, trong 7 biến ban đầu nhưng chỉ có hai nhân tố (V1) và (V2) là có trọng số cao về phương sai thể hiện kết quả trong cột 5 (48,3% và 28,0%) làm đại diện. Tuy nhiên, có rất nhiều cách để xác định số nhân tố trong mô hình phù hợp:
1. Quyết định trước số nhân tố: thỉnh thoảng nhà nghiên cứu biết trước có bao nhiêu nhân tố trước khi tiến hành phân tích. Số nhân tố có giảm đi hay không là do nhà nghiên cứu hoàn toàn quyết định.
2. Quyết định dựa vào phương sai tổng hợp của từng nhân tố (Eigenvalue): Trong cách tiếp cận này chỉ có những nhân tố có Eigenvalue lớn hơn 1 mới được đưa vào mô hình. Nguyên tắc này do Henry Kaiser đưa ra. Tiêu chuẩn này cho phép
chắc chắn rằng những nhân tố được giữ lại trong mô hình sẽ nắm giữ phương sai của ít nhất một trong số các biến được sử dụng trong mô hình. Tuy nhiên khi áp dụng tiêu chuẩn này, nếu số biến quá nhỏ, kết quả phân tích có thể dẫn đến việc có ít nhân tố hơn số nhân tố tồn tại thực tế, và nếu số biến quá lớn sẽ dẫn đến có nhiều nhân tố hớn là những nhân tố thực sự có ý nghĩa.
3. Quyết định dựa trên phép kiểm tra Scree test của Raymond B. Cattell. Với phương pháp này các giá trị Eigenvalues sẽ được vẽ kế tiếp trên đồ thị, và tìm kiếm các điểm tại đó đồ thị đồ thị đột ngột trở nên phẳng. Nhược điểm của phương pháp này tác giả không giải thích được vì sao Eigenvals lại là một chỉ tiêu tốt nhất để vẽ đồ thị, thay vì dùng các chỉ tiêu khác.
4. Theo Fabrigar, L. R., Wegener, D. T., MacCallum, R. C., & Strahan, E. J.,1999), quá nhiều nhân tố thì tốt hơn là quá ít nhân tố. Quá nhiều nhân tố có thể dẫn đến việc có một số nhân tố được ước lượng rất tốt từ các hệ số tải nhưng cũng có cả những nhân tố không được định nghĩa tốt đưa vào mô hình. Quá ít nhân tố đẫn đến việc có những nhân tố không được ước lượng tốt (sự kém tướng ứng giữa cấu trúc thực sự của nhân tố và cấu trúc ước lượng của nhân tố).
5. Cũng theo Wegner, 2004, hai tiêu chuẩn Kaiser "Eigenvalue lớn hơn 1" và Cattell's scree test đã trở nên lạc hậu. Một đề xuất được đưa ra là so sánh giá trị Eigenvalues tính được với các giá trị mà nhà nghiên cứu kì vọng sẽ xuất hiện từ một tập hợp dữ liệu ngẫu nhiên. Nếu m Eigenvalues đầu tiên có giá trị lớn hơn những giá trị được kì vọng từ tập hợp dữ liệu ngẫu nhiên, như vậy giải pháp với m nhân tố sẽ được chấp nhận. Tuy nhiên không có phần mềm thống kê nào được lập trình trên quan điểm này.
6. Tiêu chuẩn thống kê GOF (mức độ phù hợp của mô hình) từ lệnh ML trong phân tích nhân tố cũng có ích trong việc xác định số lượng nhân tố trong mô hình. Nhà nghiên cứu trước hết xác định xem nên có nhiều nhất bao nhiêu nhân tố trong mô hình, được gọi là e. Sau đó lần lượt chạy thử các mô hình với e bằng 0, 1, 2, 3, ... lần lượt cho tới số lượng nhân tố lớn nhất, sau đó so sánh các GOF của các mô hình với nhau.
Việc lựa chọn mô hình cuối cùng mang tính khá cảm tính. Theo Wegner, một mô hình không đưa ra được một giải pháp có thể diễn giả được và không phù hợp với các lập luận lý thuyết sẽ không có nhiều giá trị”. Các nhà nghiên cứu khác cũng đồng ý với quan điểm này. Một cách diễn đạt khác về lựa chọn mô hình như sau “tôi sẽ lựa chọn thêm các mô hình, bên cạnh mô hình dường như có số nhân tố chính xác nhất, các giải pháp về mô hình có 1 hoặc 2 nhân tố. Sau đó tôi sẽ chọn mô hình hợp lý nhất đối với tôi” (Wuesch, 2004)
7. Cũng theo Wuesch, 2004, có một số lựa chọn khác nhau về phương pháp “chiết xuất nhân tố” (Factor extraction). Phương pháp Maximum Likelihood hay gọi tắt là ML cho phép tính các chỉ số “phù hợp của mô hình” hay GOF (của các dữ liệu của mô hình)” và kiểm định mức ý nghĩa của các hệ số tải và tương quan giữa các nhân tố, nhưng đi với giả thiết là các biến phân phối chuẩn. Tuy nhiên phương pháp ML được nhiều tác giả ưa thích hơn. Để thực hiện ML, trước hết kiểm tra tính chuẩn của các biến quan sát được. Trừ khi |skew| > 2 và kurtosis > 7, phương pháp ML có thể được áp dụng. Nếu tính chuẩn bị vi phạm, nên sửa chữa vấn đề này bằng cách chuyển hóa các biến hơn là sử dụng phương pháp PF.
Quay trở lại ví dụ về chất lượng dịch vụ trên máy bay, vì chỉ có hai nhân tố đầu tiên có Eigenvalues >1, mô hình hai nhân tố sẽ đại diện cho 75.8% toàn bộ phương sai trong dữ liệu. Hệ số tải (loadings) ở cột “nhân tố” thể hiện mối quan hệ giữa biến đó với toàn bộ nhân tố. Tương tự như hệ số tương quan Pearson, hệ số này có khoảng từ -1 to 1. Bước tiếp theo của phân tích nhân tố sẽ cho kết quả như bảng dưới đây:
Bảng 2.3 : Ma trận nhân tố chưa quay
Nhân tố 1 | Nhân tố 2 | Communality | |
V1 | .62 | 0.32 | .69 |
V2 | .81 | -.45 | .87 |
V3 | .84 | -.31 | .79 |
V4 | .80 | -.29 | .90 |
V5 | .89 | .37 | .88 |
V6 | .79 | .51 | .67 |
V7 | .45 | .43 | .72 |
Communality : là tỉ lệ của phương sai của một biến được giải thích bởi nhân tố tiềm ẩn.
Tất cả các biến đều có hệ số tải cao trong nhân tố 1. Đây là điều thường gặp khi chưa quay các biến vào trong các nhân tố. Giải pháp cho vấn đề này là thực hiện phép quay, và thông thường các phần mềm thường sử dụng phép varimax để thực hiện việc xoay các biến. Varimax là phép quay cho ra các nhân tố không tương quan với nhau. Tuy nhiên, có khá nhiều tranh luận về việc dùng phép quay nào là hợp lý nhất. Wuesch, 2004 rất ủng hộ việc dùng phép quay trong đó vẫn duy trì sự tương quan giữa các nhân tố hơn là (oblique rotations) hơn là phép quay tạo ra các nhân tố không tương quan với nhau (orthogonal solutions). Nguyên nhân là các nghiên cứu áp dụng phân tích nhân tố thường gắn với yếu tố tâm lý (nghiên cứu về sự hài lòng của hành khách cũng gắn liền với tâm lý-TG), do vậy thường các nhân tố vẫn có sự tương quan với nhau. Nếu trên thực tế các nhân tố tiềm ẩn vẫn có sự tương quan, lúc đó phép quay oblique rotation sẽ đưa ra kết quả tốt hơn và có một cấu trúc mô hình đơn giản hơn phép quay orthogonal rotation – và nếu phép quay oblique rotation chỉ ra rằng các nhân tố có hệ tương quan gần zero, lúc đó các nhà nghiên cứu có thể thực hiện phép quay orthogonal rotation (lúc đó cũng sẽ có kết quả như phép quay oblique rotation).
Bảng dưới đây chỉ ra kết quả sau khi đã xoay các biến và các nhân tố:
Bảng 2.4 : Kết quả sau khi quay
Factor 1 (Nhân tố 1) | Factor 2 (Nhân tố 2) | Communality | |
V1 | .68 | .17 | .87 |
V2 | .87 | .24 | .79 |
V3 | .65 | .07 | .90 |
V4 | .21 | .79 | .69 |
V5 | .16 | .76 | .88 |
V6 | .30 | .83 | .67 |
V7 | .19 | .69 | .72 |