a. Biểu diễn đồ thị của việc ước lượng mô hình
Chúng ta quay trở lại mô hình lựa chọn nhị phân đơn giản với hai biến và không có hằng số được mô tả trong ví dụ phần 2.1.3 ở hình 2.4. Trong ví dụ này, một người thực hiện chuyến đi chỉ có hai phương án lựa chọn để thực hiện chuyến đi của mình là đi xe máy và đi xe buýt, hai nhân tố ảnh hưởng tới thỏa dụng của người thực hiện chuyến đi là thời gian đi lại (TG) và chi phí đi lại (CP). Hàm thỏa dụng có thể quan sát đối với hai phương án được cho như sau:
(3. 36) | |
| (3. 37) |
Có thể bạn quan tâm!
- Số Liệu Phục Vụ Dự Báo Phân Bổ Nhu Cầu Đi Lại
- Mô Hình Logit Đa Thức Trong Dự Báo Phân Bổ Nhu Cầu Đi Lại Cho Các Phương Thức Vận Tải (Dự Báo Lựa Chọn Phương Thức Vận Tải)
- Phương Pháp Ước Lượng Mô Hình Logit Đa Thức
- Kết Quả Nghiên Cứu Dự Báo Phân Bổ Nhu Cầu Đi Lại Cho Các Phương Thức Vận Tải Ứng Dụng Tại Thành Phố Hồ Chí Minh
- Nghiên cứu dự báo phân bổ nhu cầu đi lại theo phương thức vận tải trong các đô thị Việt Nam - 18
- Tầm Quan Trọng Của Các Nhân Tố Ảnh Hưởng
Xem toàn bộ 203 trang tài liệu này.
Xe máy 2
Người 1 chọn xe buýt
Người 2 chọn xe máy
Xe máy 1
Xe buýt 1
Xe buýt 2
Thời gian ngắn
Giả định đặt ra trong ví dụ này là xe buýt có thời gian di chuyển dài hơn và chi phí thấp hơn so với xe máy. Đối với người thực hiện chuyến đi, việc lựa chọn một phương thức di chuyển phụ thuộc vào sự đánh giá tương đối của người đó về thời gian và chi phí. Nếu người thực hiện chuyến đi đánh giá thời gian cao hơn chi phí sẽ có thỏa dụng lớn hơn đối với xe máy; ngược lại, một người đánh giá thời gian thấp hơn chi phí sẽ có thỏa dụng cao hơn nếu chọn xe buýt. Người thực hiện chuyến đi sẽ lựa chọn phương thức nào mang lại thỏa dụng lớn hơn cho họ.
Chi phí thấp
Hình 3. 4 Sự ước lượng của độ dốc của đường đồng mức thỏa dụng với dữ liệu chọn quan sát được
Khái niệm đường đồng mức thỏa dụng có thể được sử dụng để mô tả bằng đồ thị sự ước lượng của các tham số mô hình bằng cách sử dụng dữ liệu lựa chọn quan sát được. Hình 3.4, mô tả dữ liệu lựa chọn quan sát được cho hai người thực hiện chuyến đi với hai lựa chọn khả dụng: xe buýt và xe máy. Người đầu tiên chọn xe buýt (Buýt 1) trong khi đó người thứ hai chọn xe máy (Xe máy 2). Mục tiêu là tìm một đường đồng mức thỏa dụng đủ dốc để đặt Buýt 1 ở phía trên Xe máy 1 và đủ thoải để đặt Buýt 2 ở phía dưới Xe máy 2. Hình vẽ cho thấy rằng có rất nhiều các đường đồng mức thỏa dụng với độ dốc khác nhau thỏa mãn các điều kiện trên. Tuy nhiên, ngay cả với chỉ hai quan sát, miền giá trị của các độ dốc của những đường này là giới hạn. Nếu tất cả người chọn bị khống chế bởi các phương trình thỏa dụng chặt (3.36) và (3.37); các quan sát bổ sung sẽ thu hẹp miền giá trị của các kết quả với một độ chính xác như mong muốn.
Tuy nhiên, người xây dựng và phân tích mô hình sẽ không biết tất cả các biến ảnh hưởng đến sự lựa chọn của người thực hiện chuyến đi, vì thế có thể sẽ đo lường một số biến khác với người thực hiện chuyến đi. Trong trường hợp này, cần thiết phải sử dụng một phương pháp ước lượng, cho phép đánh giá các kết quả ước lượng khác nhau theo nghĩa chúng xác định các phương án lựa chọn tốt như thế nào. Điều này được thực hiện bằng cách sử dụng các phương pháp ước lượng hợp lý cực đại (maximum likelihood estimation method) [40]. Phương pháp ước lượng hợp lý cực đại bao gồm việc tìm kiếm các tham số mô hình sao cho chúng cực đại hóa sự hợp lý (xác suất hậu nghiệm) của những lựa chọn quan sát được phụ thuộc vào mô hình, tức là phải cực đại hóa sự hợp lý rằng mẫu được sinh ra từ mô hình với giá trị của các tham số được chọn.
b. Lý thuyết ước lượng hợp lý cực đại
Thủ tục ước lượng hợp lý cực đại bao gồm hai bước quan trọng: (1) xây dựng một hàm mật độ xác suất đồng thời của mẫu được quan sát, gọi là hàm hợp lý (likelihood function), và (2) ước lượng các giá trị tham số sao cho chúng làm cực đại hóa hàm hợp lý. Hàm hợp lý cho một mẫu gồm T cá thể với J lựa chọn được định nghĩa như sau:
∏ ∏ ( )
(3. 38)
Trong đó: : là hàm đặc trưng/chỉ báo (=1 nếu j được chọn bởi cá thể t và = 0 nếu ngược lại)
Pjt : là xác suất để cá thể t lựa chọn phương án j.
Các giá trị của các tham số mà chúng cực đại hóa hàm hợp lý thu được bằng cách tìm đạo hàm bậc nhất của hàm hợp lý và cho nó bằng 0. Vì điểm cực đại hóa một hàm thì cũng cực đại hóa logarit của hàm đó và lấy đạo hàm của hàm logarit thuận tiện hơn, nên chúng ta sẽ cực đại hóa hàm log-hợp lý (log- likelihood function) thay cho chính hàm hợp lý. Các biểu thức cho hàm log-hợp lý và đạo hàm bậc nhất được biểu diễn tương ứng trong phương trình (3.39) và (3.40)
t T j J
L L(β) = log( L (β))= ∑ ∑ δjt× ln ( P jt (β)) (3. 39)
∂ L L= ∑ ∑
δ ×1 × ∂ P jt (β)
k (3. 40)
∂ βk
t T
j J jt
P jt ∂ β
Sự phát triển tiếp theo của đạo hàm đòi hỏi việc biểu diễn hàm xác suất Pjt dưới dạng:
(3. 41)
∑
và đạo hàm bậc nhất theo mỗi thành phần của là:
∂ P jt
∂ βk
= P jt (X '
jkt− ∑ j '
P j ' t X
j ' kt )
k (3. 42)
∑
Thế phương trình (3.42) vào phương trình (3.40) nhận được:
∂( L L)
∂ βk
=
∑
t T
j J
δjt (X '
jt− ∑
P j ' t
X j ' t )
(3. 43)
j '
= ∑
t T
∑j J
(δjt− P j ' t )X ' jt k
cho đạo hàm của hàm log-hợp lý theo. Điểm hợp lý cực đại thu được bằng cách đặt biểu thức (3.43) bằng 0 và giải ra các giá trị tốt nhất của véc tơ tham số,
β . Chúng ta có thể chắc chắn rằng đó là nghiệm cho giá trị cực đại của hàm
hợp lý với điều kiện là đạo hàm bậc hai là xác định âm. Trong trường hợp này,
đạo hàm bậc hai của hàm log-hợp lý theo là:
∂2 ( L L)
∂ β ∂ β'
= ∑
t T
∑j J − P
j ' t
(X '
jt− X
t )(X '
jt− X
t )' (3. 44)
xác định âm với mọi giá trị của . Các phương trình (3.43) và (3.44) được dùng để giải bài toán hợp lý cực đại bằng cách sử dụng nhiều thuật toán khả dụng cũng như nhiều phần mềm hỗ trợ.
3.3.2.3 Một số kiểm định đối với mô hình logit đa thức
a. Kiểm định các tham số riêng biệt
Với mỗi mẫu số liệu thu thập chúng ta sẽ ước lượng ra các bộ tham số khác nhau cho mô hình, như vậy các tham số ước lượng được có sai lệch so với kỳ vọng của nó. Nói cách khác, luôn có sai số trong việc ước lượng các tham số mô hình bởi vì mô hình được ước lượng chỉ từ một mẫu của tập tổng thể liên quan. Độ lớn của sai số lấy mẫu trong một tham số được đo bằng sai số chuẩn của tham số đó. Sai số chuẩn càng lớn thì độ chính xác của việc ước lượng tham số tương ứng càng thấp. Sai số chuẩn đóng một vai trò quan trọng trong kiểm định, ở đó một tham số cụ thể bằng một giá trị giả thiết nào đó.
Để kiểm định cặp giả thiết:
người ta chọn tiêu chuẩn kiểm định:
̂
Ở đó:
(3. 45)
̂
: là ước lượng cho tham số thứ k,
: là giá trị giả thiết cho tham số thứ k, và Sk: là sai số tiêu chuẩn của ước lượng.
Với các giả thiết về sai số ngẫu nhiên trong mô hình logit, thống kê t
tuân theo (tiệm cận) phân phối Student do đó quy tắc kiểm định đối với trường hợp này là:
- Bác bỏ giả thiết
nếu như | |
- Không bác bỏ giả thiết
nếu như | |
Với n là kích thước mẫu, k là số biến trong mô hình, α là mức ý nghĩa. Các giá trị tới hạn của thống kê t làđược tính toán sẵn trong các
bảng tra thống kê Student.
Trong trường hợp kiểm định giả thiết , nếu bác bỏ giả thiết này có nghĩa là biến ảnh hưởng gắn với tham sốcó ảnh hưởng có ý nghĩa tới hàm thỏa dụng hay tới xác suất lựa chọn phương thức vận tải và biến đó nên được giữ lại trong mô hình. Nếu không bác bỏ giả thiết này, có nghĩa là biến đó đóng góp không nhiều vào việc giải thích hành vi lựa chọn phương thức vận tải và có thể xem xét loại bỏ biến đó ra khỏi mô hình.
Chúng ta cần lưu ý rằng một thống kê – t thấp không đòi hỏi việc loại bỏ của biến tương ứng khỏi mô hình. Nếu nhà phân tích có lý do đủ mạnh để tin rằng một biến là quan trọng, và dấu của tham số là chính xác, việc giữ lại biến đó trong mô hình là hợp lý. Một thống kê – t thấp và mức ý nghĩa tương ứng thấp nên được hiểu tốt nhất là nó cung cấp ít hoặc không cung cấp thông tin, chứ không nên coi là một cơ sở để loại bỏ một biến. Tương tự, ta cũng nên thận trọng với việc loại bỏ một cách vội vàng các biến vì những biến này có thể có ý nghĩa khi các biến khác được thêm vào hoặc bỏ đi khỏi mô hình.
b. Các kiểm định toàn bộ mô hình
Như đã trình bày trong các phần trước thống kê t được sử dụng để kiểm định giả thuyết rằng một tham số riêng lẻ bằng một giá trị cho trước. Đối với kiểm định đồng thời nhiều giả thuyết, kiểm định trên cơ sở thống kê t không còn phù hợp. Để thực hiện kiểm định đồng thời nhiều giả thuyết người ta tạo ra một thống kê kiểm định có thể so sánh hai mô hình, với điều kiện là một mô hình là phiên bản hạn chế của mô hình kia. (Đến đây chúng ta đưa ra khái niệm mô hình hạn chế. Mô hình 2 được gọi là mô hình hạn chế so với mô hình 1 nếu mô hình 2 được xác định bằng cách áp đặt các hạn chế hay các điều kiện đối với các tham số trong mô hình 1. Lúc này mô hình 1 được gọi là mô hình không hạn chế). Thống kê kiểm định này có thể được sử dụng cho bất kì trường hợp nào khi một hoặc nhiều hạn chế được áp đặt trên một mô hình để nhận được mô hình
còn lại. Kiểm định loại này còn được biết đến như là kiểm định tỷ số hợp lý.
Cơ sở của kiểm định tỷ số hợp lý dựa trên lập luận rằng: nếu tất cả các hạn chế giúp phân biệt giữa mô hình hạn chế và mô hình không hạn chế là có hiệu lực, ta kì vọng rằng sự sai khác giữa các giá trị log-hợp lý (ở trạng thái hội tụ) của các mô hình hạn chế và không hạn chế là nhỏ, còn nếu một số các hạn chế là không có hiệu lực, sự sai khác giữa các giá trị log-hợp lý của các mô hình hạn chế và không hạn chế sẽ đủ lớn để bác bỏ các giả thuyết.
Với giả thiết H0 là các hạn chế hay điều kiện được đưa ra, người ta chọn tiêu chuẩn kiểm định là:
(3. 46)
Trong đó:
LLR : là giá trị log-hợp lý của mô hình hạn chế, và LLU : là giá trị log-hợp lý của mô hình không hạn chế.
Thống kênày có phân phối khi-bình phương (Chi-squared distribution) với số bậc tự do là số lượng những hạn chế hay điều kiện của mô hình hạn chế. (Số lượng các hạn chế ở đây được hiểu là số lượng những ràng buộc được áp đặt trên mô hình không hạn chế để nhận được mô hình hạn chế, chẳng hạn, nếu ba biến bị xóa khỏi mô hình không hạn chế, các tham số của chúng được đặt bằng 0 thì số lượng các ràng buộc bằng 3).
Quy tắc kiểm định tổng quát là:
Bác bỏ giả thiết H0
nếu:
Vớilà giá trị tính toán của tiêu chuẩn kiểm định,là giá trị tính toán sẵn của phân phối khi bình phương (có thể tra trong bảng tính) với mức ý nghĩa (α) và số bậc tự do (n).
Kiểm định tỉ số hợp lý có thể áp dụng để kiểm định giả thuyết gốc liên quan đến sự loại bỏ một nhóm các biến khỏi mô hình.
c. Các kiểm định giả thuyết không lồng nhau
Kiểm định tỉ số hợp lý chỉ có thể áp dụng để so sánh các mô hình khác nhau do áp dụng một số các hạn chế cho một trong số các mô hình đó. Các trường hợp đó được gọi là các kiểm định giả thuyết lồng nhau. Tuy nhiên, có
những trường hợp quan trọng khác, ở đó các mô hình so sánh không thỏa mãn quan hệ hạn chế – không hạn chế này. Ví dụ, chúng ta cần so sánh mô hình cơ sở với một mô hình khác, ở đó biến chi phí trên (chia cho) thu nhập được sử dụng để thay thế biến chi phí. Điều này phản ánh kỳ vọng rằng tầm quan trọng của chi phí bị loại trừ dần theo sự tăng lên của thu nhập. Phân tích này có thể được thực hiện bằng cách sử dụng kiểm định giả thuyết không lồng nhau, được đề xuất bởi Horowitz [46]. Kiểm định giả thuyết không lồng nhau sử dụng tỉ số hợp lý hiệu chỉnh ρ2 , để kiểm định giả thuyết rằng mô hình có giá trị ρ2 thấp hơn là mô hình thật. Trong kiểm định này, giả thuyết gốc (mô hình có giá trị ρ2 thấp hơn là mô hình thật) bị bác bỏ tại mức ý nghĩa được xác định bởi phương trình sau:
( ̅ ̅ )(3. 47)
Trong đó:
- ̅: là tỉ số hợp lý hiệu chỉnh cho mô hình có giá trị thấp hơn,
- ̅: là tỉ số hợp lý hiệu chỉnh cho mô hình có giá trị cao hơn,
- KH, KL: là số lượng các tham số trong các mô hình H và L tương ứng,
- : là hàm phân phối xác suất chuẩn tắc.
Kết luận chương 3
Một mô hình dự báo nhu cầu đi lại nói chung và dự báo lựa chọn phương thức vận tải của người thực hiện chuyến đi nói riêng có tốt hay không phụ thuộc vào nhiều yếu tố, trong đó có hai yếu tố quan trọng quyết định sự thành công hay thất bại khi xây dựng mô hình là phương pháp nghiên cứu để xây dựng mô hình và bộ số liệu khảo sát phục vụ việc ước lượng tham số cho mô hình.
Chương 3 giải quyết hai vấn đề trên bằng cách làm rò phương pháp nghiên cứu được sử dụng trong quá trình xây dựng mô hình dự báo lựa chọn phương thức vận tải của người thực hiện chuyến đi và cách thức thu thập, xử lý số liệu trong quá trình đó.
Nghiên cứu nhân tố ảnh hưởng được thiết kế làm 3 giai đoạn: nghiên cứu
sơ bộ, nghiên cứu thử nghiệm và nghiên cứu chính thức với quy trình và thời gian thực hiện được mô tả rò trong chương 3. Hai giai đoạn đầu nhằm hoàn thiện bộ câu hỏi điểu tra cũng như xác định các nhân tố có thể ảnh hưởng tới quyết định lựa chọn phương thức vận tải của người thực hiện chuyến đi. Giai đoạn cuối thực hiện nhiệm vụ đánh giá, xác định các nhân tố ảnh hưởng chính thức tới quyết định lựa chọn phương thức vận tải của người thực hiện chuyến đi.
Kết quả phân tích nhân tố khám phá và kết quả ước lượng mô hình hồi quy tuyến tính bội cho thấy các nhân tố ảnh hưởng tới quyết định lựa chọn phương thức vận tải của người thực hiện chuyến đi thành phố Hồ Chí Minh đúng như giả thiết dự kiến ban đầu trong nghiên cứu. Các biến quan sát được tách thành 12 nhân tố riêng biệt và mỗi nhân tố có ảnh hưởng khác nhau tới quyết định lựa chọn phương thức vận tải của người thực hiện chuyến đi thành phố Hồ Chí Minh.
Bên cạnh đó, chương 3 cũng làm rò phương pháp thu thập và xử lý số liệu phục vụ cho quá trình nghiên cứu. Bảng hỏi được xây dựng theo mục đích nghiên cứu nhân tố ảnh hưởng đã được định hướng trong luận án. Dựa vào số lượng các câu hỏi trong bảng hỏi và cơ sở lý thuyết thống kê, tác giả đưa ra quy mô mẫu và cấu trúc mẫu cho quá trình khảo sát số liệu. Phương pháp khảo sát số liệu được thực hiện là phỏng vấn hộ gia đình và phỏng vấn tại nơi làm việc. Các số liệu sau khi thu thập sẽ được xử lý bằng các phần mềm thống kê thông dụng như SPSS hay STATA.
Trên cơ sở đánh giá về nhân tố ảnh hưởng, tác giả lựa chọn mô hình dự báo là mô hình logit đa thức (3.26) có dạng:
∑
Đồng thời tác giả tiếp tục xây dựng khung lý thuyết cho mô hình logit đa thức xác định xác suất phân bổ nhu cầu đi lại.