Cơ Cấu Nhóm Dữ Liệu Khách Hàng Sử Dụng Trong Mô Hình Logit

các tác động của chúng đã được xem xét, đánh giá một cách đầy đủ và đã được đơn vị nêu rõ trong phần thuyết minh báo cáo tài chính.

Ngoài các biến chỉ tiêu dựa trên cơ sở lý thuyết để đưa vào mô hình, em đưa vào bốn chỉ tiêu (4 biến độc lập) dựa trên mục đích nghiên cứu cũng như phương pháp kinh nghiệm:

 Chỉ tiêu Quy mô (X2): thông thường các nghiên cứu xem xét quy mô là DN vừa và nhỏ so với doanh nghiệp lớn, song trong mẫu nghiên cứu của em thì hầu hết các doanh nghiệp đều là doanh nghiệp vừa và nhỏ do đó em xem xét quy mô theo tiêu chí DN quy mô siêu nhỏ và DN khác.

 Chỉ tiêu BCTC được kiểm toán (X3): được đưa vào mô hình nhằm đánh giá khả năng trả nợ của một doanh nghiệp được kiểm toán và không được kiểm toán. Đánh giá tác động của yếu tố BCTC được kiểm toán ảnh hưởng như thế nào đển xác suất trả nợ của doanh nghiệp.

 Chỉ tiêu kinh nghiệm của chủ doanh nghiệp (X14), năm hoạt động của doanh nghiệp (X15) và số năm quan hệ tín dụng với VIB (X16) có thực sự ảnh hưởng tới xác suất trả nợ của doanh nghiệp hay không. Từ đó đề xuất các dự báo và tập trung chính sách tín dụng cho những đối tượng KH có mức độ rủi ro thấp hơn.

2.3.3. Chọn mẫu

Thu thập các thông tin, số liệu liên quan đến XHTD là một quá trình quan trọng trong bất kỳ một nghiên cứu thống kê nào, bởi việc lựa chọn số liệu chính xác sẽ mô tả tốt nhất cho việc nhận biết mô hình. Bộ số liệu sử dụng trong đề tài là thông tin về việc vay và trả nợ và các thông tin về KH được cung cấp bởi phòng tín dụng Doanh nghiệp tại NH Quốc tế VIB, trong thời gian từ tháng 01 năm 2010 đến tháng 04 năm 2012.

Trong mẫu của nghiên cứu gồm 41 KH, trong đó có 05 KH không có đủ dữ kiện, còn lại 36 KH khác đều có đủ dữ liệu về lịch sử trả nợ, các thông tin về tài chính và phi tài chính của doanh nghiệp. 36 KH này gồm 26 KH (chiếm 72.22%) còn quan hệ tín dụng và 10 KH (chiếm 27.78%) không còn quan hệ tín dụng với ngân hàng. Nhóm KH đầy đủ thông tin được chia thành 2 nhóm, Nhóm 1 là nhóm các KH có nợ đủ tiêu chuẩn (với 𝑌𝑖 = 1) và nhóm 0 là nhóm KH nợ không đủ tiêu chuẩn (với

𝑌𝑖 = 0). Dưới đây là bảng mô tả phân nhóm KH:

Bảng 2.9 Cơ cấu nhóm dữ liệu khách hàng sử dụng trong mô hình Logit

Nhóm	Số lượng	Cơ cấu
0	15	41.67%
1	21	58.33%
Tổng	36	100.00%

Có thể bạn quan tâm!

Xem toàn bộ 117 trang tài liệu này.

Số lượng KH sử dụng trong nghiên cứu

sát cho mỗi biến dự báo, cũng có kết quả cho rằng có tối thiểu 05 quan sát cho mỗi biến dự báo, theo Hoàng Trọng và Chu Nguyễn Mộng Ngọc, (2008). Mẫu quan sát của nghiên cứu này có 36 quan sát, với số biến dự định đưa vào mô hình là 15 biến, thì theo các kết quả nghiên cứu trên mô hình của chúng ta, tuy chưa thể dựa đoán chính xác để suy ra tổng thể, song kết luận của bài nghiên cứu sẽ có những kết luận có giá trị ở một mức ý nghĩa hợp lý.

Sau đây là một số chỉ số thống kê mô tả mẫu nghiên cứu:

Phân tích hồi quy Logit cũng như các kỹ thuật khác, kết quả của phân tích đều bị ảnh hưởng bởi kích thước mẫu. Kích thước mẫu quá nhỏ có thể dẫn đến những kết luận khó có thể chính xác. Đã có nhiều kết quả nghiên cứu đưa ra một tỷ lệ 20 quan

Bảng 2.10: Bảng chỉ số thống kê mô tả mẫu nghiên cứu

	Mean	Median	Maximum	Minimum	Std. Dev.	Probability
Y	0.583	1.000	1.000	0.000	0.500	0.049
X2	0.361	0.000	1.000	0.000	0.487	0.046
X3	0.222	0.000	1.000	0.000	0.422	0.005
X4	1.727	1.655	7.230	-7.820	2.099	0.000
X5	0.915	0.875	5.740	-7.820	1.771	0.000
X6	0.215	0.180	0.960	-0.050	0.207	0.000
X7	2.676	2.355	6.350	0.790	1.440	0.157
X8	7.347	5.610	30.250	0.740	6.239	0.000
X9	10.864	7.355	56.180	2.090	11.491	0.000
X10	123.777	21.275	2839.860	0.250	469.637	0.000
X11	0.517	0.550	0.790	0.140	0.184	0.313
X12	0.202	0.170	0.660	0.010	0.172	0.021
X13	0.092	0.085	0.290	0.005	0.071	0.068
X14	11.556	11.000	33.000	1.000	5.779	0.000
X15	6.361	6.000	17.000	1.000	3.885	0.143
X16	3.056	3.000	8.000	0.000	2.329	0.330

2.3.4. Tiến hành xây dựng mô hình Logit nhằm kiểm định XHTD doanh nghiệp tại ngân hàng Quốc tế Việt Nam (VIB) – Chi nhánh Hoàn Kiếm

2.3.4.1. Khái quát về mô hình Logit được áp dụng

Mô hình Logistic là mô hình hồi quy trong đó biến phụ thuộc là biến giả. Có rất nhiều hiện tượng, nhiều quá trình mà khi mô tả bằng mô hình kinh tế lượng, biến phụ thuộc lại là biến chất, do đó cần phải dùng đến biến giả (biến giả là biến rời rạc, nó có thể nhận một trong hai giá trị: 0 và 1)

Từ biến phụ thuộc nhị phân Y, hàm hồi Logit sẽ tính xác suất xảy ra Y theo quy tắc: xác suất ≥ 0.75 thì KH có nợ đủ tiêu, nếu xác suất < 0.75 thì KH không có nợ đủ tiêu chuẩn (Sử dụng xác suất 0.75 bởi vì điểm tín dụng quy ra thang phần trăm trong XHTD tại ngân hàng Quốc tế khi xếp KH vào mức có nợ đủ tiêu chuẩn là từ 75% trở lên) . Và hàm hồi quy Logit được viết như sau:

𝑃(𝑌𝑖

= 1) = 𝑃𝑖

= ( exp(𝛽1 + 𝛽2𝑋2 + ⋯ + 𝛽𝑛𝑋𝑛)

1 + exp(𝛽1 + 𝛽2𝑋2 + ⋯ + 𝛽𝑛𝑋𝑛)

) = exp(𝑋𝑖 𝛽)

1 + exp(𝑋𝑖 𝛽)

(∗)

Trong đó 𝑃𝑖 là xác suất KH thứ i trả nợ tốt với n biến độc lập 𝑋2, … . . , 𝑋𝑛 được tính toán từ cơ sở dữ liệu của KH thứ i; 𝛽1, … . . , 𝛽𝑛 là các hệ số hồi quy của hàm Logit.

Có hai phương pháp để xây dựng mô hình Logit, đó là phương pháp Berkson và phương pháp Goldberger. Với mẫu có được, các quan sát là các biến rời rạc nên em lựa chọn phương pháp Goldberger để giải quyết mô hình.

Phương pháp Berkson nhằm xác định xác suất Pi xảy ra của một biến nào đó với một điều kiện cho trước bằng cách đặt 𝑍𝑖 = 𝛽1 + 𝛽2𝑋2 + ⋯ + 𝛽𝑛𝑋𝑛, khi đó có thể viết:

𝑃𝑖

1 − 𝑃𝑖

1 + 𝑒𝑧𝑖

= 1 + 𝑒−𝑧𝑖 = 𝑒

𝑧𝑖

Tỷ số Pi/(1-Pi) đơn giản là tỷ số odds ratio – tỷ lệ chênh lệch về việc xác suất để Yi = 1. Lấy Loga tự nhiên hai vế ta được:

𝐿 = ln ( 𝑃𝑖

) = 𝑍 = 𝛽

+ 𝛽 𝑋

(∗∗)

𝑖 1 − 𝑃𝑖

𝑖 1

𝑖 𝑖

Từ đây ta thấy, L, loga của tỷ lệ chênh lệch, không chỉ tuyến tính đối với X, mà còn (từ quan điểm của việc ước lượng) tuyến tính đối với tham số. L gọi là logit, và vì thế có tên mô hình Logit cho các mô hình có dạng (**).

Song phương pháp này áp dụng khi ta tính được xác suất Pi của việc Yi = 1 với 1 biến độc lập Xi nào đó. Nếu biến Xi là rời rạc thì xác suất Pi = 0 hoặc 1, do đó tỷ số odds ratio là vô nghĩa. Khi đó ta phải dùng phương pháp Goldberger.

Phương pháp Goldberger cũng xuất phát từ phương trình (*) như phương pháp Berkson. Trong hàm này khi 𝑋𝑖 𝛽 nhận các giá trị từ −∞ đến +∞ thì Pi nhận giá trị từ 0 → 1. Pi phi tuyến đối với cả X và các tham số 𝛽. Điều này có nghĩa là ta không thể áp dụng trực tiếp OLS để ước lượng. Người ta dùng ước lượng hợp lý tối đa để ước lượng 𝛽. Vì Y chỉ nhận một trong hai giá trị 0 – 1, Y có phân bố nhị thức, nên hàm hợp lý với mẫu kích thước n có dạng sau đây:

𝑛 𝑒𝑥𝑝(𝛽′ ∑𝑛

𝑋 𝑌 )

𝐿 = ∏ 𝑝𝑌𝑖 (1 − 𝑝𝑖 )1− 𝑌𝑖 =

𝑖=1 𝑖 𝑖

𝑖 ∏𝑛

(1 + 𝑒𝑥𝑝(𝑋𝑖 𝛽))

𝑖=1

Đặt 𝑡∗ = ∑𝑛 𝑋𝑖 𝑌𝑖 , t* là véc tơ hai chiều (số hệ số hồi quy). Ta cần tìm ước

lượng hợp lý tối đa của 𝛽 , ta có:

𝑛

𝐿𝑛(𝐿) = 𝛽′𝑡∗ − ∑ 𝐿𝑛(1 + exp(𝑋𝑖 𝛽))

𝑖=1

𝜕𝐿𝑛(𝐿)

𝜕𝛽

𝑛

= 𝑆(𝛽) = − ∑

𝑖=1

exp(𝑋𝑖 𝛽)

1 + exp(𝑋𝑖 𝛽)

𝑋𝑖 + 𝑡∗ = 0 (∗∗∗)

𝑛

𝑆(𝛽̂) = − ∑

exp(𝑋𝑖 𝛽̂)

𝑋𝑖 + 𝑡∗

𝑖

1 + exp(𝑋 𝛽̂)

𝑖=1

Phương trình trên phi tuyến đối với 𝛽 , người ta dùng phương pháp Newton- Raphson để giải hệ phương trình này :

𝐼(𝛽)

= 𝐸 (−

𝜕2𝐿𝑛(𝐿)

𝜕𝛽𝜕𝛽′ ) = 𝐸 (

𝜕𝑆(𝛽)

𝜕𝛽 )

𝑛 (1 + exp(𝑋 𝛽))𝑒𝑥𝑝(𝑋 𝛽)𝑋 − (exp(𝑋 𝛽))2𝑋

= ∑𝑖 𝑖 𝑖 𝑖 𝑖

(1 + exp(𝑋𝑖 𝛽))2

𝑖=1

𝑛 exp(𝑋 𝛽)

𝑖 𝑖

= ∑𝑖 𝑖 𝑋 . 𝑋 ′

(1 + exp(𝑋𝑖 𝛽))2

𝑖=1

Nếu như ˆ là nghiệm của S( ˆ ), khai triển Taylor tại 𝛽, ta có:

̂ 𝜕𝐿𝑛(𝐿) 𝜕2𝐿𝑛(𝐿) ̂

𝑆(𝛽) =

𝜕𝛽 +

𝜕𝛽𝜕𝛽′ (𝛽 − 𝛽)

(𝛽̂ − 𝛽) = − [

𝜕2𝐿𝑛(𝐿) −1

𝜕𝛽𝜕𝛽′ ]

𝑆(𝛽) = [𝐼(𝛽)]−1𝑆(𝛽)

Ta có quá trình lặp lại như sau: Bắt đầu với giá trị ban đầu nào đó của 𝛽, chẳng hạn, 𝛽𝑜 ta tính được S(𝛽𝑜) và I(𝛽𝑜), sau đó tìm 𝛽 mới bằng công thức sau đây:

𝛽1 = 𝛽𝑜 + [𝐼(𝛽0)]𝑆(𝛽𝑜)

Quá trình lặp trên sẽ được thực hiện cho đến khi hội tụ. Do I(𝛽) là dạng toàn phương xác định dương, nên quá trình trên sẽ cho ước lượng hợp lý cực đại. Tương ứng với 𝛽̂, ta có [𝐼(𝛽̂)]−1 là ma trận hiệp phương sai của 𝛽̂. Chúng ta sử dụng ma trận này để kiểm định giả thiết và thực hiện các suy đoán thống kê khác.

Sau khi ước lượng được 𝛽̂, ta có thể tính được ước lượng xác suất Pi=P(Y=1/Xi)

𝑃̂𝑖

= exp(𝑋𝑖 𝛽̂)

1 + exp(𝑋𝑖 𝛽̂)

Kết hợp với (***) ta có ∑ 𝑃̂𝑖𝑋𝑖= ∑ 𝑌𝑖𝑋𝑖, phương trình này để kiểm định lại các

𝑃̂𝑖. Như vậy trong mô hình Logit chúng ta không nghiên cứu ảnh hưởng trực tiếp của biến độc lập Xk đối với Y mà xem xét ảnh hưởng của Xk đến xác suất Y để nhận giá trị bằng 1 hay kỳ vọng của Y.

Ảnh hưởng của Xk đến Pi được tính toán như sau:

𝜕 𝑃

= exp(𝑋𝑖 𝛽̂)

𝛽 = 𝑃 (1 − 𝑃 )𝛽

𝜕𝑋𝑖 𝑖

(exp(𝑋𝑖𝛽̂))2𝑘 𝑖

𝑖 𝑘

2.3.4.2. Các tiêu chuẩn được áp dụng trong mô hình Logit

Các tiêu chuẩn đánh giá độ phù hợp của mô hình nghiên cứu gồm:

 Mức ý nghĩa lựa chọn cho mô hình là 10%, nguyên nhân là do số liệu không đủ lớn nên mức ý nghĩa của nghiên cứu được lấy ở mức thấp, nhưng vẫn đám bảo mức độ chính xác của kết quả

 Sử dụng thống kê t – student để kiểm định ý nghĩa thống kê của các hệ số hồi quy. Dựa vào giá trị p – value ( [𝑃𝑟𝑜𝑏]) và ý nghĩa kinh tế của các hệ số để xem xét việc tiến hành kiểm định loại bỏ biến ra khỏi mô hình.

 Kiểm định Wald Test: Đây là kiểm định rất quan trọng trong phân tích hồi quy bội bằng cách tính một thống kê kiểm định dựa trên hồi quy không bị ràng buộc. Thống kê Wald cho biết mức độ các ước lượng không bị ràng buộc thỏa mãn các ràng buộc như thế nào dưới giả thiết không (Ho).

Nếu các ràng buộc thực sự đúng, thì các ước lượng không bị ràng buộc sẽ thỏa mãn các ràng buộc. Ta dùng kiểm định này để kiểm định loại bỏ biến ra khỏi mô hình. Quyết định bác bỏ Ho khi kiểm định F và Chi – bình phương có giá trị p – value ( [Prob] < 𝛼 ) với 𝛼 là mức ý nghĩa của mô hình lựa chọn. (ví dụ 𝛼 = 5%, 10%, 15% …). Chấp nhận Ho khi [𝑃𝑟𝑜𝑏] > 𝛼 ).

 Đánh giá độ thích hợp của mô hình dùng giá trị Psedo R2 = Mc Fadden R2 = 1 – (LLFUR – LLFR), Giá trị Likehood ratio (LR statics) càng nhỏ càng tốt.

2.3.5. Kết quả thực nghiệm

Trong phần tiếp theo của nghiên cứu sẽ trình bày kết quả thực nghiệm của ước lượng hàm hồi quy Logit theo mẫu được trình bày như trên. Đầu tiên, ta cần xem xét bảng thể hiện mức độ tương quan của các biến được đưa vào mô hình. Nếu hệ số tương quan cặp > 0.8 thì sẽ dẫn đến hiện tượng đa cộng tuyến nếu đưa biến này vào mô hình. Bảng 4.1 là bảng ma trận thể hiện các chỉ số tương quan cặp của các biến định lượng theo mô hình.

Ta thấy hệ số tương quan của một số cặp biến có hệ số tương quan rất lớn, như: r(X4,X5) = 0.926 > 0.8

r(X12,X13) = 0.847 > 0.8

Tức là các biến có tương quan chặt với nhau, nếu giữ nguyên các biến đó và hồi quy thì kết quả sẽ không chính xác vì có thể xảy ra các hiện tượng là không tách được ảnh hưởng của các biến tới biến phụ thuộc, ý nghĩa của các biến sai về mặt kinh tế. Hướng giải quyết đa cộng tuyến đó là hoặc loại bỏ các biến hoặc tăng kích thướng mẫu hoặc tái thiết lập mô hình. Hướng đơn giản nhất là loại bỏ biến khỏi mô hình.

Y	X2	X3	X4	X5	X6	X7	X8	X9	X10	X11	X12	X13	X14	X15	X16
Y	1
X2	-0.42	1
X3	0.18	-0.12	1
X4	0.14	0.19	-0.07	1
X5	0.20	0.14	0.01	0.926	1
X6	0.22	0.30	0.10	0.29	0.39	1
X7	0.08	-0.41	0.09	-0.19	-0.16	-0.34	1
X8	0.14	0.06	0.13	-0.12	0.03	0.23	0.47	1
X9	-0.02	0.17	-0.03	-0.05	0.03	0.01	0.18	0.55	1
X10	0.17	-0.16	-0.12	0.02	0.04	0.03	0.07	-0.05	-0.05	1
X11	0.02	-0.25	0.23	-0.62	-0.45	-0.23	0.40	0.24	0.17	-0.08	1
X12	0.31	-0.15	-0.36	-0.08	-0.04	-0.08	0.44	0.23	0.11	0.06	0.36	1
X13	0.33	0.00	-0.42	0.03	0.05	0.01	0.33	0.34	0.17	0.08	0.08	0.847	1
X14	-0.18	0.11	-0.30	-0.28	-0.32	-0.26	0.03	-0.10	0.12	-0.04	0.13	0.10	0.05	1
X15	0.01	-0.04	-0.26	-0.27	-0.27	-0.38	0.20	0.10	0.04	0.09	0.12	0.16	0.21	0.63	1
X16	0.07	-0.04	-0.45	0.03	0.01	-0.29	0.20	0.09	0.03	0.39	-0.11	0.21	0.26	0.21	0.56	1
Bảng 2.11 Ma trận hệ số tương quan giữa các biến trong mô hình Logit

Bằng phần mềm Eviews 5.1, ta ước lượng mô hình với đầy đủ biến ta được kết quả như sau:

Biến

Ký hiệu	G T	Bước 1		Bước 2		Bước 3		Bước 4		Bước 5		Bước 6
Ký hiệu	G T	β	Prob	β	Prob	β	Prob	β	Prob	β	Prob	β	Prob
Hằng số	C		-0.529	0.940	-0.791	0.874	-0.865	0.857	1.277	0.684	1.423	0.623	-1.708	0.332
Quy mô	X2	-/+	-9.738	0.074	-6.334	0.037	-6.313	0.038	-6.485	0.042	-5.741	0.034	-4.400	0.022
BCTC được kiểm toán	X3	+/-	6.798	0.058	5.621	0.064	5.737	0.055	6.528	0.036	5.404	0.028	3.703	0.028
Thanh toán hiện tại	X4	+	1.375	0.380	0.338	0.636	0.335	0.629
Thanh toán nhanh	X5	+	-1.437	0.389
Thanh toán tức thời	X6	+	12.360	0.131	7.322	0.145	7.417	0.141	8.460	0.098	6.187	0.132	7.257	0.069
Vòng quay VLĐ	X7	+	-2.347	0.098	-1.609	0.112	-1.582	0.110	-1.638	0.101	-1.598	0.098	-1.170	0.085
Vòng quay HTK	X8	+	-0.280	0.420
Vòng quay KPThu	X9	+	0.173	0.379	0.017	0.883
Hiêu suất sử dụng TSCĐ	X10	+	-0.001	0.970
Nợ phải trả/Tổng tài sản	X11	-	-5.441	0.643	-5.165	0.555	-5.239	0.543	-10.02	0.149	-6.615	0.148
LNST/VCSH	X12	+	20.409	0.393	10.983	0.533	11.204	0.503	21.675	0.034	21.801	0.038	14.760	0.032
LNST/TTS	X13	+	21.456	0.554	20.572	0.590	20.484	0.555
Kinh nghiệp chủ DN	X14	+	-0.141	0.463
Năm hoạt động của DN	X15	+	0.355	0.332	0.215	0.416	0.227	0.377	0.272	0.338
Số năm quan hệ TD với VIB	X16	+	0.977	0.228	0.634	0.238	0.639	0.233	0.705	0.165	0.829	0.088	0.637	0.077
Likelihood ratio (LR statistic)			31.29826		29.754		29.73116		28.98232		27.93388		25.30607
Mc Fadden R - squared			64.002%		60.844%		60.798%		59.266%		57.122%		51.749%
Bảng 2.12: Kết quả ước lượng mô hình với đẩy đủ các biến

Gửi bình luận