tích vận tải có thể quan tâm đến việc dự báo tỉ lệ người thực hiện chuyến đi thường xuyên sử dụng một trong các loại hình vận chuyển người thực hiện chuyến đi dưới các điều kiện đa dạng về dịch vụ, hoặc các nhà nghiên cứu thị trường có thể quan tâm đến việc kiểm tra tỉ lệ người mua xe hơi lựa chọn các hãng sản xuất và kiểu dáng với giá cả và thuộc tính khác nhau. Hơn nữa, họ có thể quan tâm đến việc dự đoán tỉ lệ này cho các nhóm người thực hiện chuyến đi và việc định vị các người thực hiện chuyến đi hầu như chỉ quan tâm đến một lựa chọn duy nhất. Tương tự, họ cũng quan tâm đến việc tìm hiểu xem các nhóm người thực hiện chuyến đi đánh giá các thuộc tính phân biệt của một sự lựa chọn khác nhau như thế nào; ví dụ như các doanh nhân khá nhạy cảm với thời gian chuyến đi do đó họ sẵn sàng lựa chọn phương thức có thời gian chuyến đi ngắn hơn cho dù chi phí bỏ ra có thể cao hơn.
Khi xây dựng mô hình dự báo lựa chọn phương thức vận tải của người thực hiện chuyến đi, vấn đề quan trọng là mô hình phải thể hiện được khả năng dự báo hành vi ra quyết định lựa chọn phương thức đi lại của một nhóm người thực hiện chuyến đi. Như đã trình bày trong mục 2.2.2, có hai phương pháp cơ bản để mô hình hóa các hành vi tổng thể (hoặc nhóm) này. Một phương pháp trực tiếp mô hình hóa các hành vi tổng thể của tất cả hoặc một nhóm người thực hiện chuyến đi khi lựa chọn một phương thức vận tải nào đó như là một hàm của các nhân tố có ảnh hưởng tới sự lựa chọn. Cách tiếp cận này thường được biết đến như là cách tiếp cận tổng thể. Phương pháp thứ hai nhằm nhận dạng hành vi tổng thể như là kết quả của rất nhiều các quyết định của từng người thực hiện chuyến đi đơn lẻ và mô hình hóa các lựa chọn riêng lẻ bằng một hàm của các nhân tố ảnh hưởng tới quyết định lựa chọn của người thực hiện chuyến đi đó. Cách tiếp cận thứ hai được biết đến như là cách tiếp cận cục bộ hay rời rạc [54].
Ngày nay, đa số các nghiên cứu đều đi theo hướng tiếp cận rời rạc vì theo hướng này có nhiều thuận lợi hơn so với cách tiếp cận tổng thể trong việc mô hình hóa các hành vi ra quyết định của một nhóm những người thực hiện chuyến đi.
Trước hết, phương pháp tiếp cận tổng thể chủ yếu dựa vào mối quan hệ thống kê giữa các biến liên quan thể hiện đặc tính chung của cả nhóm những người thực hiện chuyến đi với giá trị mà biến nhận được ở mức bình quân của nhóm. Giá trị này khác biệt hẳn với giá trị của biến gắn với từng người thực hiện chuyến đi đơn lẻ, do đó, nó không thể cung cấp các ước lượng chính xác và đáng tin cậy của sự thay đổi trong hành vi lựa chọn phương thức vận tải của người thực hiện chuyến đi. Trong khi đó, cách tiếp cận rời rạc giải thích tại sao một người thực hiện chuyến đi cụ thể lại đưa ra một sự lựa chọn trong hoàn cảnh của họ và vì thế có thể giải thích tốt hơn những thay đổi trong hành vi lựa chọn cụ thể theo sự thay đổi của các đặc trưng riêng lẻ có liên quan tới người thực hiện chuyến đi đó.
Thứ hai, với cách tiếp cận rời rạc, mô hình hoàn toàn có thể được áp dụng, chuyển đổi từ vùng đô thị này tới một vùng đô thị khác.
Thứ ba, trong trường hợp người phân tích chủ động xây dựng các phương án hay kịch bản trong đó thay đổi các thuộc tính của các lựa chọn thay thế nhằm phân tích và đánh giá sự thay đổi trong hành vi lựa chọn phương thức vận tải của người thực hiện chuyến đi thì mô hình rời rạc là phù hợp vì các số liệu thu thập được trực tiếp sử dụng để ước lượng mô hình mà ít phải sử dụng các số liệu ước tính từ nguồn khác. Các dữ liệu thu thập được gắn liền với đối tượng nghiên cứu trong mô hình và hầu như chứa tất cả các biến ảnh hưởng cần phân tích.
Thứ tư, phương pháp rời rạc hiệu quả hơn phương pháp tổng thể xét theo khía cạnh độ tin cậy mô hình trên một đơn vị chi phí bỏ ra để thu thập dữ liệu. Dữ liệu rời rạc cung cấp sự biến đổi trọng yếu của hành vi được xem xét và sự xác định của hành vi đó, cho phép ước lượng hiệu quả các tham số của mô hình. Với cách tiếp cận tổng thể, các biến ảnh hưởng được sử dụng mang tính chất chung đại diện cho cả nhóm dẫn đến sự mất mát đáng kể của các biến số đặc trưng cho các cá thể riêng lẻ, do đó nó đòi hỏi càng nhiều dữ liệu để đạt được cùng một mức độ chính xác của mô hình.
Có thể bạn quan tâm!
- Cơ Cấu Đối Tượng Điều Tra Theo Phương Tiện Đi Lại Hàng Ngày
- Xây Dựng Mô Hình Hồi Quy Đánh Giá Ảnh Hưởng Của Các Nhân Tố Tới Quyết Định Lựa Chọn Phương Thức Vận Tải Của Người Thực Hiện Chuyến Đi
- Số Liệu Phục Vụ Dự Báo Phân Bổ Nhu Cầu Đi Lại
- Phương Pháp Ước Lượng Mô Hình Logit Đa Thức
- Một Số Kiểm Định Đối Với Mô Hình Logit Đa Thức
- Kết Quả Nghiên Cứu Dự Báo Phân Bổ Nhu Cầu Đi Lại Cho Các Phương Thức Vận Tải Ứng Dụng Tại Thành Phố Hồ Chí Minh
Xem toàn bộ 203 trang tài liệu này.
Cuối cùng, các mô hình rời rạc, nếu được xác định đúng, sẽ làm cho việc ước lượng các tham số không bị chệch, trong khi đó các ước lượng của mô hình với cách tiếp cận tổng thể cho ta các ước lượng chệch (tức là không chính xác).
Trên cơ sở những đánh giá này và phân tích ưu nhược điểm của các mô hình dự báo lựa chọn phương thức vận tải của người thực hiện chuyến đi trong quá khứ và hiện tại ở chương 1, mô hình logit đa thức có thể được coi là mô hình phù hợp cho việc dự báo lựa chọn phương thức vận tải của người thực hiện chuyến đi. Mô hình logit đa thức tiếp tục được trình bày kỹ hơn ở mục tiếp theo.
3.3.2 Mô hình logit đa thức trong dự báo phân bổ nhu cầu đi lại cho các phương thức vận tải (dự báo lựa chọn phương thức vận tải)
3.3.2.1 Tổng quan về mô hình logit đa thức
a. Khái niệm hồi quy logit đa thức
Phân tích hồi quy thiết lập mối quan hệ giữa một đối tượng đang được quan tâm (biến đáp ứng hay biến phụ thuộc) với các đối tượng khác (các biến dự báo hay biến độc lập) để đưa ra những kết luận có ý nghĩa thống kê. Khi biến phụ thuộc là biến rời rạc thì mô hình hồi quy tuyến tính không thể áp dụng được. Trong trường hợp này mô hình hồi quy logit (logistic) được xây dựng để giải quyết vấn đề nêu trên. Mô hình hồi quy logit được phát triển bởi David R. Cox từ những năm 1970 và ngày càng được ứng dụng rộng khắp.
Hồi quy logit đa thức (hay đa lựa chọn) là một phương pháp mở rộng hồi quy logit (ở đó biến phụ thuộc là biến nhị phân) thành các bài toán phân lớp. Trong đó, biến phụ thuộc là biến phân loại và có nhiều hơn hai kết quả rời rạc có thể (có nhiều hơn hai danh mục), các biến độc lập có giá trị thực, giá trị nhị phân hoặc có giá trị phân loại.
Có hai cách tiếp cận mô hình logit đa thức:
- Mô hình logit đa thức xem như là một tập hợp các hồi quy nhị phân độc lập.
- Mô hình logit đa thức dạng log – tuyến tính
(1) Mô hình xem như một tập hợp các hồi quy nhị phân độc lập
Giả sử biến phụ thuộc Y có k kết quả: Yi = 1, Yi = 2, …, Yi = k, vì các
giá trị này là rời rạc nên mô hình hồi quy tuyến tính không phù hợp. Để đổi ra biến liên tục người ta tính xác suất khi biến phụ thuộc nhận các giá trị này, tức là tính P(Yi = 1), P(Yi = 2), …, P(Yi = k) và tiến hành chia lần lượt các xác suất này cho một xác suất nào đó - gọi là xác suất trục. Khi đó ta được k – 1 mô hình hồi quy logit nhị phân độc lập được hồi quy riêng rẽ theo xác suất trục. Nếu P(Yi
= k) được chọn là xác suất trục, ta có:
(3. 5)
(3. 6)
….
(3. 7)
Lấy lũy thừa cả hai vế và giải để tìm xác suất, ta có:
(3. 8)
(3. 9)
….
(3. 10)
Để tính được các xác suất trên ta phải xác định được . Vì tổng tất cả các xác suất bằng 1 nên ta có:
∑
∑
Vậy:
∑
∑
(3. 11)
Lần lượt thay (3.11) vào (3.8), (3.9), (3.10) để tìm các xác suất khác.
∑
∑
..…
∑
(2) Mô hình dạng log – tuyến tính
(3. 12)
(3. 13)
(3. 14)
Công thức của hồi quy nhị phân dưới dạng một mô hình log – tuyến tính có thể được mở rộng trực tiếp thành hồi quy đa thức bằng cách mô hình hóa logarit của xác suất xảy ra một kết quả nào đó có sử dụng hàm dự báo tuyến tính với cùng một nhân tử chuẩn hóa thêm vào, logarit hàm phân vùng có dạng:
(3. 15)
(3. 16)
..…
(3. 17) Tiếp tục biến đổi ta có:
…..
Và:
.…
Lấy lũy thừa 2 vế và biến đổi ta có:
(3. 18)
(3. 19)
..…
(3. 20)
Đại lượng Z được gọi là hàm phân vùng đối với phân phối. Chúng ta có thể tính giá trị của hàm phân vùng bằng cách áp dụng ràng buộc: tổng tất cả các xác suất bằng 1
∑
∑ ∑
Suy ra:
∑
Thay (3.21) vào các biểu thức (3.18). (3.19), (3.20) ta có:
(3. 21)
∑
(3. 22)
∑
….
(3. 23)
∑
(3. 24)
Viết một cách tổng quát ta có:
Hay:
∑
(3. 25)
∑
(3. 26)
Trong đó:là hàm thỏa dụng của kết quả j
b. Cấu trúc hàm thỏa dụng
Trong hàm thỏa dụng, mức độ thỏa dụng của mỗi phương án lựa chọn theo nhận thức của người thực hiện chuyến đi được tách thành 2 thành phần. Một thành phần của hàm thỏa dụng biểu diễn phần thỏa dụng có thể quan sát và ước lượng được bởi nhà phân tích, thường gọi là phần thỏa dụng có thể quan sát hay phần thỏa dụng tất định (hoặc thỏa dụng hệ thống). Thành phần còn lại là sai lệch giữa giá trị thỏa dụng theo đánh giá của người thực hiện chuyến đi mà chúng ta chưa biết với giá trị thỏa dụng được ước lượng bởi nhà phân tích. Phần sai lệch này được biểu diễn bằng một sai số ngẫu nhiên. Về hình thức, chúng ta có thể biểu diễn:
Trong đó:
(3. 27)
Uit : là thỏa dụng thực của phương án lựa chọn i đối với người thực hiện chuyến đi t.
, : là phần thỏa dụng có thể quan sát (thỏa dụng hệ thống hay thỏa dụng tất định), phần này có thể quan sát và được ước lượng bởi nhà phân tích.có thể được biểu diễn là một hàm số của Xi và St hay:
(3. 28)
: là sai số hay phần thỏa dụng chưa biết đối với nhà phân tích. Do đó, mô hình thỏa dụng có thể biểu diễn:
(3. 29)
* Phần thỏa dụng có thể quan sát
Phần thỏa dụng có thể quan sát của một phương án lựa chọn là một hàm toán học của các thuộc tính của phương án lựa chọn và các đặc điểm của người thực hiện chuyến đi. Phần thỏa dụng có thể quan sát có dạng biểu diễn toán học bất kì nhưng hàm này thường được thiết lập như là hàm tổng để đơn giản hóa quá trình ước lượng. Hàm thỏa dụng có thể quan sát chứa các tham số chưa biết, sẽ được ước lượng trong quá trình mô hình hóa. Phần thỏa dụng có thể quan sát của mô hình thỏa dụng có thể được phân chia thành các thành phần bao gồm:
- Phần thỏa dụng có liên quan tới các thuộc tính của lựa chọn ()
- Phần thỏa dụng có liên quan tới các đặc điểm của người thực hiện chuyến đi ()
- Phần thỏa dụng có liên quan tới sự tương tác qua lại giữa các thuộc tính của lựa chọn và các đặc điểm của người thực hiện chuyến đi ().
Do đó, phần thỏa dụng có thể quan sát có thể được biểu diễn như sau:
(3. 30) Hoặc có thể biểu diễn dưới dạng:
(3. 31)
ở đó : là phần thỏa dụng có thể quan sát (hay phần hệ thống của hàm thỏa dụng) đối với lựa chọn i và cá thể t.
: Phần thỏa dụng có liên quan tới các thuộc tính của lựa
chọn i.
: Phần thỏa dụng có liên quan tới các đặc điểm của người
thực hiện chuyến đi t.
: Phần thỏa dụng có liên quan tới sự tương tác qua lại giữa các thuộc tính của lựa chọn i và các đặc điểm của người thực hiện chuyến đi t.
(1) Phần thỏa dụng có liên quan tới các thuộc tính của lựa chọn
Phần thỏa dụng có liên quan tới các thuộc tính của lựa chọn là một hàm số của các biến mô tả các thuộc tính của lựa chọn. Những thuộc tính này ảnh hưởng đến thỏa dụng của mỗi lựa chọn, áp dụng cho tất cả mọi người trong cộng đồng được xét. Trong dự báo lựa chọn phương thức vận tải, các thuộc tính này chính là các đặc điểm kinh tế - kỹ thuật của phương thức vận tải, chúng có thể đo được và sẽ có ảnh hưởng đến sở thích/xu hướng lựa chọn của người thực hiện chuyến đi. Các thuộc tính này tương đối đa dạng như: tổng thời gian di chuyển, thời gian di chuyển trên phương tiện, thời gian di chuyển bên ngoài phương tiện, chi phí đi lại …
Giá trị của các thuộc tính này thay đổi theo các phương thức vận tải đối với cùng một người thực hiện chuyến đi và giữa các người thực hiện chuyến đi khác nhau, do sự khác nhau của địa điểm xuất phát và đích đến của