Phương pháp lựa chọn mô hình theo trường phái thống kê tần số là phương pháp Stepwise (Efroymson, M. A., 1960), phương pháp này sử dụng chỉ số AIC để làm thước đo mô hình (Hocking, R. R.,1976). Giá trị chính của phương pháp Stepwise là nó có thể được sử dụng để chọn một tập hợp con các biến độc lập bằng cách sử dụng các tiêu chí thống kê. Số lượng tham số trong mô hình cuối cùng thu được dự kiến sẽ ít hơn so với mô hình có đầy đủ các biến độc lập và phương sai của các tham số ước tính có thể được giảm bớt. Tuy nhiên, những nghiên cứu gần đây đã nhấn mạnh những hạn chế của việc lựa chọn từng bước, chẳng hạn như sự thiếu ổn định của tập hợp các biến đã chọn và độ chệch trong các ước lượng tham số và phương pháp BMA đã được đề xuất như một giải pháp thay thế (Lorène Prost và cộng sự, 2008). Đặc biệt, phương pháp stepwise càng kém hiệu quả khi số lượng biến độc lập trong mô hình càng lớn (Gary Smith, 2018).
Bên cạnh đó, phương pháp lựa chọn mô hình theo trường phái thống kê Bayes là phương pháp mô hình trung bình Bayesian (BMA), phương pháp này sử dụng xác suất hậu định và chỉ số BIC đề làm thước đo mô hình (Raftery, 1995). Ưu điểm của việc sử dụng phương pháp BMA là tính đến độ không đảm bảo của mô hình bằng các xem xét tất cả các mô hình có thể có của nghiên cứu. Phương pháp BMA đã được đánh giá cho một số loại mô hình khác nhau, bao gồm hồi quy tuyến tính, và mô hình đồ họa rời rạc (Madigan D và cộng sự , 1996; Volinsky C và cộng sự, 1997; Murphy M và Wang D, 2001). Hơn nữa, trong hầu hết các trường hợp, phương pháp BMA sẽ chọn đúng mô hình và hoạt động hiệu quả trong dự đoán một sự kiện quan tâm (Wang và cộng sự, 2004). Đồng thời, phương pháp BMA có xác suất chọn các biến độc lập đưa vào mô hình chính xác hơn phương pháp Stepwise (Genell và cộng sự, 2010). Đồng thời, phương pháp BMA cung cấp cho chúng ta xác suất hậu định của mô hình và xác suất của từng biến độc lập tác động đến biến phụ thuộc (Raftery, 1995). Cuối c ng, phương pháp BMA c n có ưu điểm là sẽ kiểm tra tính đa cộng tuyến của mô hình c n phương pháp Stepwise thì không (Steven S. Henley và cộng sự, 2020). Xuất phát từ thực tế đó, tác giả sẽ sử dụng
phương pháp BMA theo hồi quy logistic và phương pháp BMA hồi quy probit để lựa chọn mô hình cần nghiên cứu.
Triển khai BMA
Trong thống kê Bayes, phương pháp BMA chọn một tập hợp con của tất cả các mô hình có thể có và sử dụng các xác suất hậu định của các mô hình để thực hiện tất cả các phân tích (Raftery, 1995; Raftery, 1996; Viallefont và cộng sự, 2001). Số mô hình tối đa có thể có là, bỏ qua sự tương tác giữa các yếu tố độc lập (Raftery, 1995).
Đặt *+ là tập hợp tất cả các mô hình có thể được xem xét,
là dữ liệu, là đại lượng quan tâm chẳng hạn như việc sẵn lòng tham gia bảo hiểm cây cà phê theo chỉ số năng suất của hộ nông dân tỉnh Đắk Lắk. Theo Viallefont và cộng sự (2001) thì phân phối hậu định của cho dữ liệu là:
( | ) ∑ ( | ) (| )
( )
( ( | )) là trung bình của các phân phối hậu định theo từng mô hình, trọng số được tính bởi xác suất của mô hình hậu định ( (| ))( ) tương ứng với dữ liệu. Theo Wang và cộng sự (2004), trong phương trình (2.14), phân phối dự báo (predictive distribution) của được cho bởi một mô hìnhriêng biệt là
( | ) ∫ ( | ) (| )
Với () là véc-tơ của các tham số hồi quy cho mô hình
và xác suất hậu định của mô hình được đưa ra bởi phương trình
(
( |) ()
| )
( )
∑ ( | ) ( )
Với
( |) ∫ ( |) (|)( )
là khả năng tích hợp (integrated likelihood) của mô hình;
(|) là mật độ tiền định củatheo;
( |) là hàm khả năng (likehood) của véc-tơ tham sốtrong mô hình
với dữ liệu D.
() là xác suất tiền định vớilà mô hình phù hợp nhất.
Trong tập hợp tất cả các mô hình đang được xem xét, tất cả xác suất điều có điều kiện M.
Đặt
̂ , | -
Trung bình hậu định và phương sai hậu định của :
, | - ∫ (∑ ( | ) (| ))
∑ (∫ ( | ) ) (| )
∑ ̂ ( | )
, | - ∑ ( , | - ̂) ( | ) , | -
Có một số vấn đề khó khăn khi thực hiện BMA, bao gồm đặc điểm kỹ thuật của hai loại đại lượng tiền định (xác suất tiền định () của các mô hình và phân phối tiền định của các tham số), việc định lượng tích phân trong phương trình (2.16) thường không có dạng giải tích nên khó tính toán, ngay cả khi sử dụng phương pháp MCMC và việc tính tổng phương trình (2.14) cho một số lượng rất lớn các mô hình nên không thể tổng hợp trên tất cả các mô hình.
Khi có ít thông tin tiền định về các mô hình được xem xét, chúng ta coi tất cả mô hình đều có khả năng là tiền định như nhau là sự lựa chọn hợp lý. Đây là chiến lược được sử dụng trong nghiên cứu này. Vì vậy, chúng ta sẽ lấy ()
() () , sự phân bố đồng đều trên không gian mô hình để không ưu tiên bất kỳ mô hình nào. Đối với thông tin tiền định của tham số, phân phối tiền định là chuẩn đa biến với giá trị trung bình tại khả năng xảy ra lớn nhất và phương sai bằng với ma trận thông tin kỳ vọng, điều này đã được Raftery đề xuất và chứng minh là hợp lý (Raftery, 1999).
Tích phân trong phương trình (2.16) được giải quyết một cách gần đúng
( |) dựa vào phương pháp xấp xỉ ước lượng hợp lí cực đại (MLE)
( | ) ( | ̂ )
và xấp xỉ Laplace (Raftery và cộng sự, 1996)
( | ) ( | ̂) ( )
với ̂
là trung bình hậu định của véc-tơ tham sốtheo mô hình
,
là số tham
số trong mô hìnhvà là số quan sát trong dữ liệu. Đây được gọi là số Schwarz Bayesian information criterion (gọi tắt là BIC). Trong đó,là chỉ số đo khả năng giải thích của mô hìnhđối với dữ liệu (Raftery, 1999).
Đối với một phân tích với có biến độc lập tiềm năng, số lượng mô hình K có thể rất lớn. Để giải quyết vấn đề này, chúng tôi ước tính tổng đầy đủ bằng cách loại trừ các mô hình ít có khả năng xảy ra hơn so với mô hình nhiều khả năng hơn. Chiến lược này c n được gọi là cách tiếp cận Occam‟s Window (Madigan D, Raftery AE, 1994). Cách tiếp cận Occam‟s Window chỉ bao gồm những mô hình có xác suất mô hình hậu định cao nhất trong phương trình (2.15), được tính bằng phương trình (2.16) trên cơ sở rằng nếu một mô hình ít có khả năng được cung cấp dữ liệu từ các mô hình có khả năng nhất thì mô hình đó không hiệu quả và không c n được xem xét. Đầu tiên, những mô hình có xác suất hậu định rất nhỏ so với mô hình có xác suất hậu định lớn nhất sẽ bị loại bỏ, còn lại các mô hình trong tập hợp sau:
́ *
( | )
+ ( )
( | )
Trong đó là hằng số và được khuyến nghị là 20 (Madigan D, Raftery AE, 1994).
Tiếp đó, loại bỏ những mô hình có nhiều biến nhưng xác suất hậu định lại nhỏ hơn mô hình ít biến hơn:
*
́
(| )
+
(| )
Đặt ́thì phương trình (2.14) được rút gọn lại thành phương trình
( | ) ∑ ( | ) (| )
Thêm vào đó, khả năng tích hợp của mô hìnhtrong phương trình (2.16) sẽ được tính bằng cách sử dụng xấp xỉ tiêu chí thông tin Bayesian được mô tả trong phương trình (2.17), loại bỏ những mô hình không có trong được xác định trong phương trình (2.18) và tự động tìm những mô hình đó nằm trong Occam‟s Window. Xác suất của mô hình hậu định, ước lượng tham số và sai số chuẩn cũng được tính đối với m i mô hình .
Suy luận BMA
Xác suất hậu định được đưa ra bởi phương trình (2.14) cung cấp trực tiếp các kiểm định giả thuyết, ước lượng điểm và khoảng tin cậy cho có tính đến độ không đảm bảo của mô hình. Việc diễn giải ảnh hưởng của một biến độc lập cụ thể đến khả năng xảy ra sự kiện có thể được thực hiện theo những cách sau.
Đầu tiên, xác suất hậu định ( | ) cho bởi biếnvới (j = 1, 2,..., p) chỉ ra khả năng biến độc lập có ảnh hưởng đến sự xuất hiện của sự kiện (hoặc ảnh hưởng không bằng 0).
( | ) ∑ (| )
( ) ( )
trong đó là một tập hợp các mô hình được chọn trong Occam‟s Window được mô tả trong phương trình (2.17) và( )là 1 khitrong mô hìnhvà 0 nếu trường hợp khác. Thuật ngữ (| )( ) trong phương trình trên có
nghĩa là xác suất hậu định của mô hìnhkhông bao gồm . Các quy tắc giải thích xác suất hậu định này như sau (Kass và Raftery, 1995):
Nhỏ hơn 50 : bằng chứng chống lại tác động;
Từ 50 đến 75%: bằng chứng yếu cho tác động; Từ 75 đến 95%: bằng chứng tích cực;
Từ 95 đến 99%: bằng chứng mạnh mẽ; Từ 99%: bằng chứng rất mạnh mẽ;
Thứ hai, ước lượng điểm Bayes (trung bình hậu định) và sai số chuẩn (độ lệch chuẩn hậu định) củađược đưa ra bởi công thức
( | ) ∑ ̂ (
| )
( )
( | )
∑ {[ ( |
) ̂] (
| )} ( | )
( )
√
với ̂là trung bình hậu định của
trong mô hình
. Suy luận về
được suy ra
từ phương trình (2.19); phương trình (2.20) và phương trình (2.21).
2.4. Các nghiên cứu về hư ng h ô hình trung bình Ba es ứng dụng trong kinh tế
Hiện nay, phương pháp BMA của trường phái thống kê Bayes để lựa chọn mô hình phù hợp với dữ liệu là một phương pháp mới và được sử dụng rộng rãi trong nhiều lĩnh vực. Tác giả xin giới thiệu một số nghiên cứu tiêu biểu như sau: lĩnh vực năng lượng có nghiên cứu của Zhanga và Yang (2015) về dự báo tiêu thụ khí đốt tự nhiên tại Trung Quốc; lĩnh vực kỹ thuật có nghiên cứu của Notaro và cộng sự (2016) về tác động của đô thị hóa và biến đổi khí hậu đối với dòng chảy đầu nguồn đô thị; lĩnh vực nông nghiệp có nghiên cứu của Huang, X. và cộng sự (2017) về cải thiện dự đoán năng suất trên diện rộng của tổ hợp mô hình nhiều cây trồng; lĩnh vực y học có nghiên cứu của S.L. Klijn và cộng sự (2019) về khả năng sống sót ngoại suy: quan điểm toàn khối u Nivolumab và Ipilimuma; lĩnh vực môi trường có
nghiên cứu của Yanlai Zhou và cộng sự (2020) về dự báo bụi mịn PM2.5...Đặc biệt, các nghiên cứu về phương pháp BMA trong lĩnh vực kinh tế được tác giả tổng hợp thì chưa có nghiên cứu thực nghiệm nào được áp dụng trong lĩnh vực bảo hiểm nói chung và bảo hiểm cây trồng nói riêng (xem Bảng 2.1).
Bảng 2.1: Tổng hợp các nghiên cứu về hư ng h ô hình trung bình Ba es ứng dụng trong kinh tế
T c giả (Nă ) | Vấn đề nghiên cứu | Số biến độc lập nghiên cứu thu thậ được | Số biến độc lập BMA chọn l a sử dụng trong mô hình | |
1 | Maltritz, D. vả Molchanov, A. (2013) | Phân tích các yếu tố quyết định chênh lệch lợi suất trái phiếu | 34 | 5 |
2 | Georg Man (2015) | Sự phát triển và cạnh tranh của các quốc gia | 31 | 4 |
3 | V.M.Giang và N.T.Thiên (2017) | Mô hình chấm điểm rủi ro tín dụng cho doanh nghiệp vừa và nhỏ tại Việt Nam | 22 | 5 |
4 | Ali, A., và Ali, S. I. (2020) | Xu hướng tìm hiểu các phương pháp quản lý và tác động của chúng đối với kết quả của doanh nghiệp ở các thị trường mới nổi | 45 | 10 |
5 | Gernát, P. và cộng sự (2020) | Sự biến động của khu vực tài chính Hoa Kỳ | 29 | 7 |
Có thể bạn quan tâm!
- Nghiên cứu ứng dụng thống kê Bayes phân tích việc sẵn lòng tham gia bảo hiểm cây cà phê theo chỉ số năng suất của hộ nông dân tỉnh Đắk Lắk - 2
- Giới Thiệu Vấn Đề Nghiên Cứu
- Cơ Sở Lý Thuyết Và Tổng Quan Các Nghiên Cứu Liên Quan
- Bảo Hiểm Theo Chỉ Số Năng Suất Cho Cây Cà Phê Tỉnh Đắk Lắk
- Hộ Nông Dân Sẵn Lòng Tham Gia Bảo Hiểm Cây Cà Phê Theo Chỉ Số Năng Suất
- Nghiên cứu ứng dụng thống kê Bayes phân tích việc sẵn lòng tham gia bảo hiểm cây cà phê theo chỉ số năng suất của hộ nông dân tỉnh Đắk Lắk - 8
Xem toàn bộ 251 trang tài liệu này.
Ngu n: Tác gi t ng hợp
2.5. Tóm tắt một số lý thuyết hành vi của con người
2.5.1. Lý thuyết hành động hợp lý
Lý thuyết hành động hợp lý (Theory of Reasoned Action - TRA) (Ajzen và Fishbein, 1975) là một trong những lý thuyết được phát triển và ứng dụng rộng rãi đối với ngành tâm lý xã hội. Lý thuyết này “được thiết kế để giải thích cho các hành vi nói chung của con người”. Lý thuyết hành động hợp lý khẳng định con người thường cân nhắc kết quả của các hành động khác nhau trước khi thực hiện chúng và họ sẽ chọn thực hiện hành động mà hy vọng sẽ dẫn tới kết quả họ mong muốn. Các nhà nghiên cứu sử dụng yếu tố hành vi ý định là một biến phụ thuộc và tập trung nghiên cứu yếu tố này, bởi hành vi ý định là yếu tố dự đoán tốt nhất về hành vi thực tế.
2.5.2. Lý thuyết hành vi sẵn lòng
Theo Gibbons, F.X. (2006), các nhà nghiên cứu đã khám phá loại thước đo khác nhằm tăng mối quan hệ quan sát giữa hành vi tiền đề và hành vi sẵn lòng (Behavioral Willingness - BW). Cụ thể, theo Pomery và cộng sự (2009), hành vi sẵn lòng được định nghĩa là sự sẵn lòng tham gia vào một hành vi rủi ro trong môi trường có lợi cho rủi ro. Cách đo lường tiêu biểu của hành vi sẵn lòng là trình bày tình huống giả sử có lợi cho rủi ro và sau đó đặt câu hỏi “Bạn sẵn sàng thực hiện m i điều sau đây như thế nào? (Trình bày với các tùy chọn khác nhau về mức độ rủi ro)”. Một cách ngắn gọn, hành vi sẵn lòng phản ánh sự cởi mở của một cá nhân đối với cơ hội, nghĩa là họ sẵn sàng thực hiện một hành vi nhất định trong các tình huống có lợi cho hành vi đó.
Một số nhà nghiên cứu coi hành vi sẵn lòng là các dạng thay thế của hành vi ý định (Ajzen và Fishbein, 2005; Fishbein, 2008). Trên thực tế, cấu trúc của hành vi sẵn lòng và hành vi ý định khá giống nhau và có xu hướng tương quan cao (Pomery và cộng sự, 2009). Tuy nhiên, chúng là những yếu tố dự đoán độc lập về hành vi. Những nghiên cứu của Gerrard và cộng sự (2006) và Van Empelen và Kok (2006) đã cung cấp bằng chứng về ảnh hưởng tương đối của kinh nghiệm đối với hành vi