Cơ Sở Lý Thuyết Và Tổng Quan Các Nghiên Cứu Liên Quan

lòng tham gia bảo hiểm cây cà phê theo chỉ số năng suất của hộ nông dân tỉnh Đắk Lắk.

Nghiên cứu sẽ giúp cho các nhà nghiên cứu, các nhà hoạch định chính sách, nghiên cứu thị trường, ngân hàng thương mại, công ty bảo hiểm nắm bắt được nhiều thông tin về việc sẵn lòng tham gia bảo hiểm cây cà phê theo chỉ số năng suất của hộ nông dân tỉnh Đắk Lắk. Từ đó có thể có những giải pháp, đề xuất nhằm xây dựng sản phẩm bảo hiểm cho cây cà phê.

Xây dựng toán đồ bằng hình thức trực tuyến của mô hình nghiên cứu hộ nông dân sẵn l ng tham gia bảo hiểm cây cà phê theo chỉ số năng suất.

Nghiên cứu này có thể làm tài liệu tham khảo cho các nhà nghiên cứu, giảng viên và sinh viên khi nghiên cứu về việc sẵn l ng tham gia bảo hiểm cây công nghiệp theo chỉ số năng suất của hộ nông dân nói chung và bảo hiểm cây cà phê theo chỉ số năng suất tại tỉnh Đắk Lắk nói riêng.

1.6. ết cấu uận n

Luận án kết cấu được phân thành 5 chương:

ề vấ ề ứ

Có thể bạn quan tâm!

Xem toàn bộ 251 trang tài liệu này.

Chương này trình bày lý do chọn đề tài của luận án, mục tiêu nghiên cứu, câu hỏi nghiên cứu, đối tượng nghiên cứu, phạm vi nghiên cứu, phương pháp nghiên cứu và những đóng góp mới nghiên cứu.

2 ở lý thuyết và t ứ

Chương này trình bày lý thuyết về thống kê Bayes, lựa chọn mô hình, hành vi, bảo hiểm cây trồng; các công trình thực nghiệm nghiên cứu về việc sẵn lòng tham gia bảo hiểm cây trồng. Qua đó, xác định khoảng trống nghiên cứu.

3 ứ

Chương này chủ yếu trình bày phương pháp nghiên cứu.

4. Kết qu nghiên cứu

Chương này trình bày kết quả nghiên cứu định lượng chính thức gồm mô tả đặc điểm dữ liệu, so sánh phương pháp BMA cho mô hình hồi quy logistic và mô

hình hồi quy probit, đồng thời tác giả sử dụng phương pháp tách dữ liệu để ước lượng tham số mô hình. Khi có được những mô hình phù hợp nhất với dữ liệu, tác giả sử dụng phương pháp thống kê Tần số và phương pháp thống kê Bayes để so sánh ước lượng mô hình nghiên cứu. Cuối cùng, tác giả xây dựng toán đồ trực tuyến của mô hình nghiên cứu hộ nông dân sẵn l ng tham gia bảo hiểm cây cà phê theo chỉ số năng suất nhằm cung cấp khả năng dự đoán việc sẵn lòng tham gia bảo hiểm cây cà phê theo chỉ số năng suất của hộ nông dân tỉnh Đắk Lắk một các nhanh chóng.

5. ế

Chương này trình bày tóm tắt kết quả nghiên cứu, hàm ý về lý thuyết, chính sách, quản trị, nêu những hạn chế và hướng nghiên cứu tiếp theo.

CHƯƠNG 2: CƠ SỞ LÝ THUYẾT VÀ TỔNG QUAN CÁC NGHIÊN CỨU LIÊN QUAN

Chương 2 được chia thành 9 phần khác nhau gồm: Mục 2.1 tóm tắt về thống kê Bayes. Mục 2.2 và mục 2.3 trình bày mô hình hồi quy với biến phụ thuộc nhị phân và việc lựa chọn mô hình bằng phương pháp BMA. Mục 2.4 trình bày các nghiên cứu về phương pháp BMA ứng dụng trong kinh tế. Mục 2.5 trình bày tóm tắt lý thuyết hành vi của nông hộ. Mục 2.7 trình bày các nghiên cứu thực nghiệm trong và ngoài nước về sự sẵn sàng tham gia bảo hiểm cây trồng trong nông nghiệp. Mục 2.8 và mục 2.9 chỉ ra khoảng trống nghiên cứu nhằm xác định vấn đề nghiên cứu của luận án và kết luận của chương 2.

2.1. Thống kê Bayes

Hiện nay, có hai trường phái thống kê. Một là, thống kê theo trường phái tần số. Hai là, thống kê theo trường phái Bayes. Thống kê theo trường phái tần suất đã ra đời trước. Trường phái này chỉ dựa trên những kết quả quan sát mẫu của hiện tại. Sau đó, thống kê theo trường phái Bayes đã ra đời từ thế kỷ 18 do Thomas Bayes đề xuất (Thomas Bayes, 1763), trường phái này dựa trên những gì chúng ta đã biết từ trước kết hợp với chứng cứ thực tế để suy luận cho hiện tại. Bên cạnh đó, sự khác nhau cơ bản về mặt toán học của thống kê Bayes là có luật phân phối riêng cho các giá trị trung bình, độ lệch chuẩn,…còn các giá trị này đối với thống kê tần số là cố định và không có luật phân phối (Howson, 1989). Ngày nay, thống kê Bayes được ứng dụng trong hầu hết các lĩnh vực khoa học như dự báo kinh tế (dự báo giá chứng khoán), công nghệ thông tin (ứng dụng Bayes trong việc ngăn chặn thư rác điện tử), phân tích các mối quan hệ xã hội (kết quả học tập của sinh viên với các hiệu ứng ngẫu nhiên trong giảng viên đại học),...(Nguyễn Văn Tuấn, 2017).

2.1.1. Định lý Bayes

Gọi H là giả thuyết và D là dữ liệu thực tế có được do thu thập. Định lý Bayes (Thomas Bayes, 1763) phát biểu rằng xác suất H với điều kiện D xảy ra, được ký hiệu là: ( ). Khi đó, ta có:

( ) ( | )

( )

với ( ) là xác suất giả thuyết trước khi thu thập dữ liệu; ( | ) là xác suất dữ liệu xảy ra với điều kiện giả thuyết H đúng; ( ) là phân bố của dữ liệu.

Theo Nguyễn Văn Tuấn (2017), giả thuyết H trong định lý Bayes có thể được thay bằng như một thông số mà chúng ta muốn biết. Trường phái thống kê tần số xem là cố định nhưng trường phái thống kê Bayes xem có một phân bố riêng nên không cố định. Định lý Bayes có thể biểu diễn theo hàm số như sau:

hay

( )

( ) ( | )

( )

( ) ( ) ( | ) ( )

với ( | ) là phân bố của dữ liệu; ( ) là xác suất hậu định của giả thuyết;

( ) là xác suất tiền định của giả thuyết.

2.1.2. Suy luận Bayes

Suy luận Bayes là một phương pháp suy luận thống kê trong đó định lý Bayes được sử dụng để cập nhật xác suất cho một giả thuyết khi có thêm bằng chứng hoặc thông tin. Trong lý thuyết quyết định, suy luận Bayes có liên quan chặt chẽ với xác suất chủ quan, thường được gọi là "xác suất Bayes". (Winkler, Robert L, 2003).

Theo Gelman và cộng sự (2013) và Nguyễn Văn Tuấn (2017), từ định lý Bayes, có thể thấy được suy luận Bayes có 3 thông tin, thứ nhất là thông tin chúng ta muốn biết [thông tin mới (hậu định) - posterior information], thứ hai là thông tin

chúng ta đã biết [thông tin trước đây (tiền định) - prior information] và thứ ba là thông tin thực tế [thông tin đang có - likelihood]. Ở đây, “thông tin” có thể hiểu là xác suất hay phân bố. Do đó, suy luận Bayes có thể được khái quát dưới dạng như sau:

Thông tin mới Thông tin trước đây Thông tin đang có

2.2. Hồi quy với biến phụ thuộc nhị phân

2.2.1. Biến phụ thuộc nhị phân và mô hình xác suất tuyến tính

Giả sử có mô hình với biến phụ thuộclà nhị phân (nhận giá trị bằng 1 nếu sẵn lòng tham gia bảo hiểm và nhận giá trị bằng 0 nếu không sẵn lòng tham gia bảo hiểm), thông thường chúng ta sử dụng phương pháp bình phương bé nhất (Ordinary least squares - OLS) để xác định hành vi tham gia bảo hiểm trong mối quan hệ với các biến độc lập. Nghĩa là mô hình sau đây:

∑( )

với ;sai số. Theo Hanck, C và cộng sự (2020), mô hình trong công thức (2.6) được gọi là mô hình xác suất tuyến tính (Linear Probability Model - LPM) bởi vì kỳ vọng có điều kiện của biến phụ thuộc (khi cho trước các giá trị của biến độc lập) có thể được giải thích như xác suất có điều kiện mà biến cố (tức sẵn lòng tham gia bảo hiểm) sẽ xảy ra (Gujarati, 2011). Trong mô hình xác suất tuyến tính, ta có

( | ) ( | ) ( )

với

( |) ∑( )

Theo Gujarati (2011), mô hình LPM không phải là sự lựa chọn phù hợp đối

với mô hình có biến phụ thuộc biến nhị phân. Do đó, mô hình LMP được thay thế bằng mô hình logistic và mô hình probit. Vì giá trị xác suất phải nằm giữa 0 và 1

nhưng không có gì đảm bảo rằng các giá trị xác suất ước lượng mô hình LPM sẽ nằm trong giới hạn này, vì phương pháp OLS không xét đến sự ràng buộc rằng các giá trị xác suất ước lượng phải nằm giữa các giới hạn 0 và 1. Sai số trong mô hình LPM có phương sai thay đổi và điều này làm cho các kiểm định ý nghĩa truyền thống không thể tin cậy được (Hanck, C và cộng sự, 2020).

2.2.2. Mô hình probit và mô hình logistic

2.2.2.1. Mô hình probit

Theo Hanck, C và cộng sự (2020), mô hình trong công thức (2.6) được gọi là

mô hình probit với

( |) ( ∑)

( )

với ( )

./ là hàm phân phối tích lũy chuẩn tắc (Çağlayan-

∫√

Akay và Sedefoğlu, 2017).

2.2.2.2. Mô hình logistic

Theo Hanck, C và cộng sự (2020), mô hình trong công thức (2.6) được gọi là

mô hình logistic nếu

( |) ( ∑)

( )

với ( )

là hàm phân phối tích luỹ logistic. Hàm số này luôn nhận giá trị

giữa 0 và 1 với mọi số thực z.

Các tham số của mô hình logistic và mô hình probit thường được ước lượng bằng phương pháp ước lượng hợp lý cực đại (Maximum Likelihood Estimation - MLE). Trong mô hình logistic thì sai số được giả định có phân phối logistic và được giả định sai số trong mô hình probit có phân phối chuẩn. Đó là sự khác biệt giữa mô hình logistic và mô hình probit. Hàm mật độ xác suất (Probability Density Function

- PDF) và hàm phân phối tích lũy (Cumulative Distribution Function - CDF) trong

mô hình logistic có các đuôi dầy hơn mô hình probit. Trong thực tế các mô hình logistic và probit cho các kết quả tương tự và không có lý do nào để chọn lựa mô hình này chứ không phải mô hình kia. Mặt khác, theo Gujarati (2011), khi nhân hệ số ước lượng của mô hình probit cho khoảng 1,81 thì các giá trị này sẽ xấp xỉ hệ số ước lượng của mô hình logistic (do phân phối của mô hình logistic và mô hình probit đều có trung bình bằng 0 nhưng phương sai bằng 1 đối với phân phối chuẩn hóa và đối với phân phối logistic). Nhiều nhà nghiên cứu chọn logistic hơn bởi vì sự tương đối đơn giản về mặt toán học của nó. Ngoài ra, sự lựa chọn giữa chúng phụ thuộc vào sự sẵn có của phần mềm và sự dễ dàng trong việc giải thích kết quả (Gujarati, 2011).

2.2.3. Hồi quy logistic Bayesian và hồi quy probit Bayesian

Theo Gelman và cộng sự (2013), suy luận Bayes dựa trên định lý Bayes như

( | ) ( ) ( | ) ( )

với ( | )là phân phối xác suất hậu định, ( )là phân phối xác suất tiền định và

( | )là hàm likelihood. Theo Kor và cộng sự (2019), mô hình hồi quy probit Bayesian kết hợp phân phối xác suất tiền định và hàm likelihood để ước tính phân phối xác suất hậu định. Phân phối xác suất hậu định của mô hình hồi quy probit Bayesian có dạng sau:

( | ) ( ) ∏ ( ∑)

( ( ∑))

( )

Tương tự như mô hình hồi quy probit Bayesian thì mô hình hồi quy logistic Bayesian có phân phối xác suất hậu định như sau (Workie MS và Belay DB, 2019):

∑

( | ) ( ) ∏ (

∑

) (∑

) ( )

Sự khác biệt giữa mô hình logistic và mô hình probit là nhỏ và sẽ mang lại kết quả tương tự. Với các mô hình nhị thức mô hình logistic thường nhanh hơn một chút so với mô hình probit. Trừ khi người d ng có lý do cụ thể để thích mô hình probit, chúng tôi khuyên bạn nên sử dụng mô hình logistic vì nó sẽ nhanh hơn một chút và ổn định hơn về mặt số học (Jonah Gabry và Ben Goodrich, 2020).

Khi kết hợp với những thông tin trước đó, chúng ta có thể định lượng sự không chắc chắn xung quanh các điểm ước lượng bằng phân phối hậu định. Do đó, ưu thế của thống Bayesian so với thống kê tần số là nó cung cấp cho chúng ta phân phối hậu định của những tham số thay vì một ước lượng điểm đơn lẻ về vấn đề đang quan tâm (Gelman và Hill, 2007). Lĩnh vực này sẽ mở ra một xu hướng mới cho những nghiên cứu trong tương lai từ chẩn đoán y tế đến dự báo kinh tế hoặc giáo dục (Silver, N., 2012). Một số nghiên cứu tiêu biểu sử dụng thống kê Bayesian cho mô hình có biến phụ thuộc nhị phân: tình trạng nghèo đói dựa vào giới tính chủ hộ (Çağlayan-Akay và Sedefoğlu, 2017), nghiên cứu hen suyễn (Spyroglou, Ioannis và cộng sự, 2018), nghiên cứu sâu răng (Workie MS và Belay DB, 2019) và nghiên cứu kết quả học tập của sinh viên với các hiệu ứng ngẫu nhiên trong giảng viên đại học và chuyên ngành (Arreola EV và cộng sự, 2020).

2.3. L a chọn mô hình bằng hư ng h ô hình trung bình Ba esian (BMA)

Thông thường, cách xác định mô hình cho vấn đề nghiên cứu, để đơn giản người ta chỉ đưa ra một mô hình duy nhất (mô hình bao gồm tất cả các biến thu thập được) để ước lượng và sau đó suy luận như thể mô hình đó là mô hình ph hợp nhất với dữ liệu. Do đó, phương pháp này có thể bỏ qua các mô hình khác được xây dựng với một số biến từ tập hợp các biến thu thập được và có thể mô hình nào đó trong số các mô hình này là phù hợp hơn. Vì vậy, cần phải xem xét một cách đầy đủ các mô hình của một vấn đề nghiên cứu nào đó và so sánh chúng với nhau nhằm tìm được mô hình nào thực sự là mô hình ph hợp nhất đối với dữ liệu (cũng có thể hiểu là mô hình “tốt nhất”) (Raftery, 1995).

Gửi bình luận