Cơ Cấu Nhóm Dữ Liệu Khách Hàng Sử Dụng Trong Mô Hình Logit

các tác động của chúng đã được xem xét, đánh giá một cách đầy đủ và đã được đơn vị nêu rõ trong phần thuyết minh báo cáo tài chính.

Ngoài các biến chỉ tiêu dựa trên cơ sở lý thuyết để đưa vào mô hình, em đưa vào bốn chỉ tiêu (4 biến độc lập) dựa trên mục đích nghiên cứu cũng như phương pháp kinh nghiệm:

Chỉ tiêu Quy mô (X2): thông thường các nghiên cứu xem xét quy mô là DN vừa và nhỏ so với doanh nghiệp lớn, song trong mẫu nghiên cứu của em thì hầu hết các doanh nghiệp đều là doanh nghiệp vừa và nhỏ do đó em xem xét quy mô theo tiêu chí DN quy mô siêu nhỏ và DN khác.

Chỉ tiêu BCTC được kiểm toán (X3): được đưa vào mô hình nhằm đánh giá khả năng trả nợ của một doanh nghiệp được kiểm toán và không được kiểm toán. Đánh giá tác động của yếu tố BCTC được kiểm toán ảnh hưởng như thế nào đển xác suất trả nợ của doanh nghiệp.

Chỉ tiêu kinh nghiệm của chủ doanh nghiệp (X14), năm hoạt động của doanh nghiệp (X15) và số năm quan hệ tín dụng với VIB (X16) có thực sự ảnh hưởng tới xác suất trả nợ của doanh nghiệp hay không. Từ đó đề xuất các dự báo và tập trung chính sách tín dụng cho những đối tượng KH có mức độ rủi ro thấp hơn.

2.3.3. Chọn mẫu

Thu thập các thông tin, số liệu liên quan đến XHTD là một quá trình quan trọng trong bất kỳ một nghiên cứu thống kê nào, bởi việc lựa chọn số liệu chính xác sẽ mô tả tốt nhất cho việc nhận biết mô hình. Bộ số liệu sử dụng trong đề tài là thông tin về việc vay và trả nợ và các thông tin về KH được cung cấp bởi phòng tín dụng Doanh nghiệp tại NH Quốc tế VIB, trong thời gian từ tháng 01 năm 2010 đến tháng 04 năm 2012.

Trong mẫu của nghiên cứu gồm 41 KH, trong đó có 05 KH không có đủ dữ kiện, còn lại 36 KH khác đều có đủ dữ liệu về lịch sử trả nợ, các thông tin về tài chính và phi tài chính của doanh nghiệp. 36 KH này gồm 26 KH (chiếm 72.22%) còn quan hệ tín dụng và 10 KH (chiếm 27.78%) không còn quan hệ tín dụng với ngân hàng. Nhóm KH đầy đủ thông tin được chia thành 2 nhóm, Nhóm 1 là nhóm các KH có nợ đủ tiêu chuẩn (với 𝑌𝑖 = 1) và nhóm 0 là nhóm KH nợ không đủ tiêu chuẩn (với

𝑌𝑖 = 0). Dưới đây là bảng mô tả phân nhóm KH:


Bảng 2.9 Cơ cấu nhóm dữ liệu khách hàng sử dụng trong mô hình Logit

Nhóm

Số lượng

Cơ cấu

0

15

41.67%

1

21

58.33%

Tổng

36

100.00%

Có thể bạn quan tâm!

Xem toàn bộ 117 trang tài liệu này.

Ứng dụng mô hình Logit nhằm nâng cao chất lượng xếp hạng tín dụng doanh nghiệp tại ngân hàng quốc tế chi nhánh Hoàn Kiếm - 10

Số lượng KH sử dụng trong nghiên cứu

sát cho mỗi biến dự báo, cũng có kết quả cho rằng có tối thiểu 05 quan sát cho mỗi biến dự báo, theo Hoàng Trọng và Chu Nguyễn Mộng Ngọc, (2008). Mẫu quan sát của nghiên cứu này có 36 quan sát, với số biến dự định đưa vào mô hình là 15 biến, thì theo các kết quả nghiên cứu trên mô hình của chúng ta, tuy chưa thể dựa đoán chính xác để suy ra tổng thể, song kết luận của bài nghiên cứu sẽ có những kết luận có giá trị ở một mức ý nghĩa hợp lý.

Sau đây là một số chỉ số thống kê mô tả mẫu nghiên cứu:

Phân tích hồi quy Logit cũng như các kỹ thuật khác, kết quả của phân tích đều bị ảnh hưởng bởi kích thước mẫu. Kích thước mẫu quá nhỏ có thể dẫn đến những kết luận khó có thể chính xác. Đã có nhiều kết quả nghiên cứu đưa ra một tỷ lệ 20 quan



Bảng 2.10: Bảng chỉ số thống kê mô tả mẫu nghiên cứu


Mean

Median

Maximum

Minimum

Std. Dev.

Probability

Y

0.583

1.000

1.000

0.000

0.500

0.049

X2

0.361

0.000

1.000

0.000

0.487

0.046

X3

0.222

0.000

1.000

0.000

0.422

0.005

X4

1.727

1.655

7.230

-7.820

2.099

0.000

X5

0.915

0.875

5.740

-7.820

1.771

0.000

X6

0.215

0.180

0.960

-0.050

0.207

0.000

X7

2.676

2.355

6.350

0.790

1.440

0.157

X8

7.347

5.610

30.250

0.740

6.239

0.000

X9

10.864

7.355

56.180

2.090

11.491

0.000

X10

123.777

21.275

2839.860

0.250

469.637

0.000

X11

0.517

0.550

0.790

0.140

0.184

0.313

X12

0.202

0.170

0.660

0.010

0.172

0.021

X13

0.092

0.085

0.290

0.005

0.071

0.068

X14

11.556

11.000

33.000

1.000

5.779

0.000

X15

6.361

6.000

17.000

1.000

3.885

0.143

X16

3.056

3.000

8.000

0.000

2.329

0.330

2.3.4. Tiến hành xây dựng mô hình Logit nhằm kiểm định XHTD doanh nghiệp tại ngân hàng Quốc tế Việt Nam (VIB) – Chi nhánh Hoàn Kiếm

2.3.4.1. Khái quát về mô hình Logit được áp dụng

Mô hình Logistic là mô hình hồi quy trong đó biến phụ thuộc là biến giả. Có rất nhiều hiện tượng, nhiều quá trình mà khi mô tả bằng mô hình kinh tế lượng, biến phụ thuộc lại là biến chất, do đó cần phải dùng đến biến giả (biến giả là biến rời rạc, nó có thể nhận một trong hai giá trị: 0 và 1)

Từ biến phụ thuộc nhị phân Y, hàm hồi Logit sẽ tính xác suất xảy ra Y theo quy tắc: xác suất ≥ 0.75 thì KH có nợ đủ tiêu, nếu xác suất < 0.75 thì KH không có nợ đủ tiêu chuẩn (Sử dụng xác suất 0.75 bởi vì điểm tín dụng quy ra thang phần trăm trong XHTD tại ngân hàng Quốc tế khi xếp KH vào mức có nợ đủ tiêu chuẩn là từ 75% trở lên) . Và hàm hồi quy Logit được viết như sau:

𝑃(𝑌𝑖

= 1) = 𝑃𝑖

= ( exp(𝛽1 + 𝛽2𝑋2 + ⋯ + 𝛽𝑛𝑋𝑛)

1 + exp(𝛽1 + 𝛽2𝑋2 + ⋯ + 𝛽𝑛𝑋𝑛)

) = exp(𝑋𝑖 𝛽)

1 + exp(𝑋𝑖 𝛽)

(∗)

Trong đó 𝑃𝑖 là xác suất KH thứ i trả nợ tốt với n biến độc lập 𝑋2, … . . , 𝑋𝑛 được tính toán từ cơ sở dữ liệu của KH thứ i; 𝛽1, … . . , 𝛽𝑛 là các hệ số hồi quy của hàm Logit.

Có hai phương pháp để xây dựng mô hình Logit, đó là phương pháp Berkson và phương pháp Goldberger. Với mẫu có được, các quan sát là các biến rời rạc nên em lựa chọn phương pháp Goldberger để giải quyết mô hình.

Phương pháp Berkson nhằm xác định xác suất Pi xảy ra của một biến nào đó với một điều kiện cho trước bằng cách đặt 𝑍𝑖 = 𝛽1 + 𝛽2𝑋2 + ⋯ + 𝛽𝑛𝑋𝑛, khi đó có thể viết:

𝑃𝑖

1 − 𝑃𝑖

1 + 𝑒𝑧𝑖

= 1 + 𝑒−𝑧𝑖 = 𝑒

𝑧𝑖

Tỷ số Pi/(1-Pi) đơn giản là tỷ số odds ratio – tỷ lệ chênh lệch về việc xác suất để Yi = 1. Lấy Loga tự nhiên hai vế ta được:

𝐿 = ln ( 𝑃𝑖

) = 𝑍 = 𝛽

+ 𝛽 𝑋

(∗∗)

𝑖 1 − 𝑃𝑖

𝑖 1

𝑖 𝑖

Từ đây ta thấy, L, loga của tỷ lệ chênh lệch, không chỉ tuyến tính đối với X, mà còn (từ quan điểm của việc ước lượng) tuyến tính đối với tham số. L gọi là logit, và vì thế có tên mô hình Logit cho các mô hình có dạng (**).

Song phương pháp này áp dụng khi ta tính được xác suất Pi của việc Yi = 1 với 1 biến độc lập Xi nào đó. Nếu biến Xi là rời rạc thì xác suất Pi = 0 hoặc 1, do đó tỷ số odds ratio là vô nghĩa. Khi đó ta phải dùng phương pháp Goldberger.

Phương pháp Goldberger cũng xuất phát từ phương trình (*) như phương pháp Berkson. Trong hàm này khi 𝑋𝑖 𝛽 nhận các giá trị từ −∞ đến +∞ thì Pi nhận giá trị từ 0 → 1. Pi phi tuyến đối với cả X và các tham số 𝛽. Điều này có nghĩa là ta không thể áp dụng trực tiếp OLS để ước lượng. Người ta dùng ước lượng hợp lý tối đa để ước lượng 𝛽. Vì Y chỉ nhận một trong hai giá trị 0 – 1, Y có phân bố nhị thức, nên hàm hợp lý với mẫu kích thước n có dạng sau đây:

𝑛 𝑒𝑥𝑝(𝛽𝑛

𝑋 𝑌 )

𝐿 = ∏ 𝑝𝑌𝑖 (1 − 𝑝𝑖 )1− 𝑌𝑖 =

𝑖=1 𝑖 𝑖

𝑖 𝑛

(1 + 𝑒𝑥𝑝(𝑋𝑖 𝛽))

𝑖=1

𝑖=1

𝑖=1

Đặt 𝑡= ∑𝑛 𝑋𝑖 𝑌𝑖 , t* là véc tơ hai chiều (số hệ số hồi quy). Ta cần tìm ước

lượng hợp lý tối đa của 𝛽 , ta có:

𝑛

𝐿𝑛(𝐿) = 𝛽𝑡− ∑ 𝐿𝑛(1 + exp(𝑋𝑖 𝛽))

𝑖=1

𝜕𝐿𝑛(𝐿)

𝜕𝛽

𝑛

= 𝑆(𝛽) = − ∑

𝑖=1

exp(𝑋𝑖 𝛽)

1 + exp(𝑋𝑖 𝛽)


𝑋𝑖 + 𝑡= 0 (∗∗∗)

𝑛

𝑆(𝛽̂) = − ∑

exp(𝑋𝑖 𝛽̂)


𝑋𝑖 + 𝑡

𝑖

1 + exp(𝑋 𝛽̂)

𝑖=1

Phương trình trên phi tuyến đối với 𝛽 , người ta dùng phương pháp Newton- Raphson để giải hệ phương trình này :

𝐼(𝛽)

= 𝐸 (−

𝜕2𝐿𝑛(𝐿)

𝜕𝛽𝜕𝛽) = 𝐸 (

𝜕𝑆(𝛽)

𝜕𝛽 )


𝑛 (1 + exp(𝑋 𝛽))𝑒𝑥𝑝(𝑋 𝛽)𝑋 − (exp(𝑋 𝛽))2𝑋

= 𝑖 𝑖 𝑖 𝑖 𝑖

(1 + exp(𝑋𝑖 𝛽))2

𝑖=1


𝑛 exp(𝑋 𝛽)

𝑖 𝑖

= ∑𝑖 𝑖 𝑋 . 𝑋

(1 + exp(𝑋𝑖 𝛽))2

𝑖=1


Nếu như ˆ là nghiệm của S( ˆ ), khai triển Taylor tại 𝛽, ta có:

̂ 𝜕𝐿𝑛(𝐿) 𝜕2𝐿𝑛(𝐿) ̂


𝑆(𝛽) =

𝜕𝛽 +

𝜕𝛽𝜕𝛽(𝛽 − 𝛽)


(𝛽̂ − 𝛽) = − [

𝜕2𝐿𝑛(𝐿) −1

𝜕𝛽𝜕𝛽]


𝑆(𝛽) = [𝐼(𝛽)]−1𝑆(𝛽)


Ta có quá trình lặp lại như sau: Bắt đầu với giá trị ban đầu nào đó của 𝛽, chẳng hạn, 𝛽𝑜 ta tính được S(𝛽𝑜) và I(𝛽𝑜), sau đó tìm 𝛽 mới bằng công thức sau đây:

𝛽1 = 𝛽𝑜 + [𝐼(𝛽0)]𝑆(𝛽𝑜)


Quá trình lặp trên sẽ được thực hiện cho đến khi hội tụ. Do I(𝛽) là dạng toàn phương xác định dương, nên quá trình trên sẽ cho ước lượng hợp lý cực đại. Tương ứng với 𝛽̂, ta có [𝐼(𝛽̂)]1 là ma trận hiệp phương sai của 𝛽̂. Chúng ta sử dụng ma trận này để kiểm định giả thiết và thực hiện các suy đoán thống kê khác.

Sau khi ước lượng được 𝛽̂, ta có thể tính được ước lượng xác suất Pi=P(Y=1/Xi)


𝑃̂𝑖

= exp(𝑋𝑖 𝛽̂)

1 + exp(𝑋𝑖 𝛽̂)


Kết hợp với (***) ta có ∑ 𝑃̂𝑖𝑋𝑖= ∑ 𝑌𝑖𝑋𝑖, phương trình này để kiểm định lại các

𝑃̂𝑖. Như vậy trong mô hình Logit chúng ta không nghiên cứu ảnh hưởng trực tiếp của biến độc lập Xk đối với Y mà xem xét ảnh hưởng của Xk đến xác suất Y để nhận giá trị bằng 1 hay kỳ vọng của Y.

Ảnh hưởng của Xk đến Pi được tính toán như sau:

𝜕 𝑃

= exp(𝑋𝑖 𝛽̂)


𝛽 = 𝑃 (1 − 𝑃 )𝛽

𝜕𝑋𝑖 𝑖

(exp(𝑋𝑖𝛽̂))2𝑘 𝑖

𝑖 𝑘

2.3.4.2. Các tiêu chuẩn được áp dụng trong mô hình Logit

Các tiêu chuẩn đánh giá độ phù hợp của mô hình nghiên cứu gồm:

Mức ý nghĩa lựa chọn cho mô hình là 10%, nguyên nhân là do số liệu không đủ lớn nên mức ý nghĩa của nghiên cứu được lấy ở mức thấp, nhưng vẫn đám bảo mức độ chính xác của kết quả

Sử dụng thống kê t – student để kiểm định ý nghĩa thống kê của các hệ số hồi quy. Dựa vào giá trị p – value ( [𝑃𝑟𝑜𝑏]) và ý nghĩa kinh tế của các hệ số để xem xét việc tiến hành kiểm định loại bỏ biến ra khỏi mô hình.

Kiểm định Wald Test: Đây là kiểm định rất quan trọng trong phân tích hồi quy bội bằng cách tính một thống kê kiểm định dựa trên hồi quy không bị ràng buộc. Thống kê Wald cho biết mức độ các ước lượng không bị ràng buộc thỏa mãn các ràng buộc như thế nào dưới giả thiết không (Ho).

Nếu các ràng buộc thực sự đúng, thì các ước lượng không bị ràng buộc sẽ thỏa mãn các ràng buộc. Ta dùng kiểm định này để kiểm định loại bỏ biến ra khỏi mô hình. Quyết định bác bỏ Ho khi kiểm định F và Chi – bình phương có giá trị p – value ( [Prob] < 𝛼 ) với 𝛼 là mức ý nghĩa của mô hình lựa chọn. (ví dụ 𝛼 = 5%, 10%, 15% …). Chấp nhận Ho khi [𝑃𝑟𝑜𝑏] > 𝛼 ).

Đánh giá độ thích hợp của mô hình dùng giá trị Psedo R2 = Mc Fadden R2 = 1 – (LLFUR – LLFR), Giá trị Likehood ratio (LR statics) càng nhỏ càng tốt.

2.3.5. Kết quả thực nghiệm

Trong phần tiếp theo của nghiên cứu sẽ trình bày kết quả thực nghiệm của ước lượng hàm hồi quy Logit theo mẫu được trình bày như trên. Đầu tiên, ta cần xem xét bảng thể hiện mức độ tương quan của các biến được đưa vào mô hình. Nếu hệ số tương quan cặp > 0.8 thì sẽ dẫn đến hiện tượng đa cộng tuyến nếu đưa biến này vào mô hình. Bảng 4.1 là bảng ma trận thể hiện các chỉ số tương quan cặp của các biến định lượng theo mô hình.

Ta thấy hệ số tương quan của một số cặp biến có hệ số tương quan rất lớn, như: r(X4,X5) = 0.926 > 0.8

r(X12,X13) = 0.847 > 0.8

Tức là các biến có tương quan chặt với nhau, nếu giữ nguyên các biến đó và hồi quy thì kết quả sẽ không chính xác vì có thể xảy ra các hiện tượng là không tách được ảnh hưởng của các biến tới biến phụ thuộc, ý nghĩa của các biến sai về mặt kinh tế. Hướng giải quyết đa cộng tuyến đó là hoặc loại bỏ các biến hoặc tăng kích thướng mẫu hoặc tái thiết lập mô hình. Hướng đơn giản nhất là loại bỏ biến khỏi mô hình.




Y

X2

X3

X4

X5

X6

X7

X8

X9

X10

X11

X12

X13

X14

X15

X16

Y

1
















X2

-0.42

1















X3

0.18

-0.12

1














X4

0.14

0.19

-0.07

1













X5

0.20

0.14

0.01

0.926

1












X6

0.22

0.30

0.10

0.29

0.39

1











X7

0.08

-0.41

0.09

-0.19

-0.16

-0.34

1










X8

0.14

0.06

0.13

-0.12

0.03

0.23

0.47

1









X9

-0.02

0.17

-0.03

-0.05

0.03

0.01

0.18

0.55

1








X10

0.17

-0.16

-0.12

0.02

0.04

0.03

0.07

-0.05

-0.05

1







X11

0.02

-0.25

0.23

-0.62

-0.45

-0.23

0.40

0.24

0.17

-0.08

1






X12

0.31

-0.15

-0.36

-0.08

-0.04

-0.08

0.44

0.23

0.11

0.06

0.36

1





X13

0.33

0.00

-0.42

0.03

0.05

0.01

0.33

0.34

0.17

0.08

0.08

0.847

1




X14

-0.18

0.11

-0.30

-0.28

-0.32

-0.26

0.03

-0.10

0.12

-0.04

0.13

0.10

0.05

1



X15

0.01

-0.04

-0.26

-0.27

-0.27

-0.38

0.20

0.10

0.04

0.09

0.12

0.16

0.21

0.63

1


X16

0.07

-0.04

-0.45

0.03

0.01

-0.29

0.20

0.09

0.03

0.39

-0.11

0.21

0.26

0.21

0.56

1

Bảng 2.11 Ma trận hệ số tương quan giữa các biến trong mô hình Logit


Bằng phần mềm Eviews 5.1, ta ước lượng mô hình với đầy đủ biến ta được kết quả như sau:


Biến

Ký hiệu

G T

Bước 1

Bước 2

Bước 3

Bước 4

Bước 5

Bước 6

β

Prob

β

Prob

β

Prob

β

Prob

β

Prob

β

Prob

Hằng số

C


-0.529

0.940

-0.791

0.874

-0.865

0.857

1.277

0.684

1.423

0.623

-1.708

0.332

Quy mô

X2

-/+

-9.738

0.074

-6.334

0.037

-6.313

0.038

-6.485

0.042

-5.741

0.034

-4.400

0.022

BCTC được kiểm toán

X3

+/-

6.798

0.058

5.621

0.064

5.737

0.055

6.528

0.036

5.404

0.028

3.703

0.028

Thanh toán hiện tại

X4

+

1.375

0.380

0.338

0.636

0.335

0.629







Thanh toán nhanh

X5

+

-1.437

0.389











Thanh toán tức thời

X6

+

12.360

0.131

7.322

0.145

7.417

0.141

8.460

0.098

6.187

0.132

7.257

0.069

Vòng quay VLĐ

X7

+

-2.347

0.098

-1.609

0.112

-1.582

0.110

-1.638

0.101

-1.598

0.098

-1.170

0.085

Vòng quay HTK

X8

+

-0.280

0.420











Vòng quay KPThu

X9

+

0.173

0.379

0.017

0.883









Hiêu suất sử dụng TSCĐ

X10

+

-0.001

0.970











Nợ phải trả/Tổng tài sản

X11

-

-5.441

0.643

-5.165

0.555

-5.239

0.543

-10.02

0.149

-6.615

0.148



LNST/VCSH

X12

+

20.409

0.393

10.983

0.533

11.204

0.503

21.675

0.034

21.801

0.038

14.760

0.032

LNST/TTS

X13

+

21.456

0.554

20.572

0.590

20.484

0.555







Kinh nghiệp chủ DN

X14

+

-0.141

0.463











Năm hoạt động của DN

X15

+

0.355

0.332

0.215

0.416

0.227

0.377

0.272

0.338





Số năm quan hệ TD với

VIB

X16

+

0.977

0.228

0.634

0.238

0.639

0.233

0.705

0.165

0.829

0.088

0.637

0.077

Likelihood ratio (LR statistic)

31.29826

29.754

29.73116

28.98232

27.93388

25.30607

Mc Fadden R - squared

64.002%

60.844%

60.798%

59.266%

57.122%

51.749%

Bảng 2.12: Kết quả ước lượng mô hình với đẩy đủ các biến

Xem tất cả 117 trang.

Ngày đăng: 17/05/2023
Trang chủ Tài liệu miễn phí