Dữ Liệu Tính Toán Ước Lượng Hàm Đặc Trưng Câu Hỏi

Một biểu đồ đồ họa thô của tỷ lệ các câu trả lời đúng ở mọi năng lực, số điểm được vẽ lên đối với số điểm đúng được thu được bằng phương pháp thử và sai số trong đường cong phù hợp. Biểu diễn thô được đưa ra trong đồ thị. Có thể thấy rằng điểm của đường cong của đáp ứng được nhìn thấy ở một số điểm số bên phải là 15 tương ứng với một thô ước tính 15 số đúng số và tương ứng +1.5 trên thang điểm về khả năng như đã nêu trong đồ thị. Giả sử ước tính đầu tiên của độ khó b, của câu hỏi này

1.5. Cho một một tham số b = 1.5, ICC hoặc IRF thu được bằng cách sử dụng phần mềm BIRT như hình dưới đây:


Hình 1 13 Tham số ước lượng của câu hỏi Hình 1 14 Đồ thị hàm đặc trưng 1


Hình 1.13 Tham số ước lượng của câu hỏi


Hình 1 14 Đồ thị hàm đặc trưng của câu hỏi Đường cong BIRT của Pi θ ở 2

Hình 1.14 Đồ thị hàm đặc trưng của câu hỏi

Đường cong BIRT của Pi (θ) ở tất cả các giá trị từ -3 đến +3 có thể được so sánh với đạt được tỷ lệ các câu trả lời đúng ở mức điểm số ngay ở mức tương ứng giả định mức độ khả năng như thể hiện trong bảng dưới đây:

Bảng 1.5 Dữ liệu tính toán ước lượng hàm đặc trưng câu hỏi



Nhóm năng lực

Xác xuất trả lời đúng quan sát được

pi (θj)


Dải năng lực

Xác xuất đáp ứng câu hỏi của nhóm năng lực

Pi (θj)

18

1.0

+3

0.894

17

1.0

+2.5

0.805

16

0.4

+2

0.67

15

0.41

+1.5

0.5

14

0.14

+1

0.33

13

0.6

+0.5

0.195

12

0.25

+0

0.106

11

0.09

-0.5

0.055

10

0.2

-1

0.028

9

0

-1.5

0.014

8

0.5

-2

0.007

7

1

-2.5

0.003

6

0

-3

0

Có thể bạn quan tâm!

Xem toàn bộ 137 trang tài liệu này.



Ta có hàm một tham số

b

e

P()

1 eb


với b =1.5 thì

1.5

e

P()

1 e1.5


J [p() P()]2

Chi bình phương được tính từ công thức

2 mj j


j 0

j P(

j )(1P(j ))


Bảng 1.6. Dữ liệu tính toán ước lượng hàm đặc trưng câu hỏi



Nhóm năng lực


Số người trong nhóm


mj

Xác xuất trả lời đúng quan sát được


pi (θj)

Xác xuất đáp ứng câu hỏi của nhóm năng lực


Pi (θj)


Q(θj)=1-

P(θj)


[p() P()]2

j j


2

18

4

1.0

0,894

0,106

0,011236

0,474273

17

4

1.0

0,805

0,195

0,038025

0,968944

16

5

0.4

0,67

0,33

0,0729

1,648575

15

12

0.41

0,5

0,5

0,0081

0,3888

14

7

0.14

0,33

0,67

0,0361

1,142922

13

10

0.6

0,195

0,805

0,164025

10,44912

12

8

0.25

0,106

0,894

0,020736

1,750538

11

11

0.09

0,055

0,945

0,001225

0,259259

10

5

0.2

0,028

0,972

0,029584

5,435038

9

6

0

0,014

0,986

0,000196

0,085193

8

2

0.5

0,007

0,993

0,243049

69,9321

7

1

1

0,003

0,997

0,994009

332,3333

6

1

0

0

1

0

0







424,8681

Như vậy chỉ số 2 là quá lớn ta phải thay đổi tham số b (theo hai chiều hướng:

tăng lên và giảm đi) ví dụ b=1.51.451.4…1, giảm (tăng) đến khi chỉ số 2

nhỏ trong ngưỡng cho phép. Quá trình kết thúc khi các ứng đáp câu hỏi quan sát được và ước lượng tham của câu hỏi có đồ thị “tiệm cận” với nhau như hình vẽ.


Hình 1 15 Đồ thị của hàm đặc trưng câu hỏi Nếu quá trình trên không thu 3

Hình 1.15. Đồ thị của hàm đặc trưng câu hỏi


Nếu quá trình trên không thu được 2

ta sửa lại câu hỏi.

hợp lý thì hoặc là ta bỏ câu hỏi thi, hai là


Lưu ý quá trình ước lượng trên không phụ thuộc vào mẫu (nếu mẫu có năng lực thấp, hay năng lực cao đều không ảnh hưởng tới quá trình ước lượng tham số). Đây là một ưu điểm nổi bất của IRT. Nó giúp ta có thể ước lượng đề thi với các mẫu không phổ quát mà vẫn không lo ảnh hưởng tới chất lượng đề thi.

Dưới đây là hình ảnh ước lượng tham số câu hỏi với tập mẫu khác nhau

Hình 1 16 Hình ảnh ước lượng tham số câu hỏi với tập mẫu có năng lực 4


Hình 1.16.. Hình ảnh ước lượng tham số câu hỏi với tập mẫu có năng lực thấp


Hình 1 17 Hình ảnh ước lượng tham số câu hỏi với tập mẫu có năng lực cao 5


Hình 1.17. Hình ảnh ước lượng tham số câu hỏi với tập mẫu có năng lực cao


Hình 1 18 Hình ảnh ước lượng tham số câu hỏi với tập mẫu có năng lực phổ 6


Hình 1.18. Hình ảnh ước lượng tham số câu hỏi với tập mẫu có năng lực phổ quát

Khi tất cả các câu hỏi trong đề thi được ước lượng tham số, tức là với mỗi câu

eaibi

hỏi i nào đó ta có hàm đặc trưng của nó:

Pi () . Trong một đề có N câu

a b i i

1 e

hỏi thi, ta sẽ có tương ứng n hàm đặc trưng cho từng câu hỏi thi.


Mặc dù giả định rằng thang đo số liệu được biết đến, các giá trị số của các tham số câu hỏi thi và các thông số về khả năng của người kiểm tra có thể được thể hiện bằng số liệu này. Các nhà soạn đề thi cần biết những đặc tính nào họ cần đo lường về thí sinh để thiết kế các hỏi thi phù hợp cho những thí sinh có khả năng thấp, trung bình hoặc cao. Nhưng không thể xác định các giá trị của các tham số của độ phân biệt a giữa các nhóm thí sinh cần đo. Ngoài ra, khi một bài kiểm tra được thực hiện cho một nhóm thí sinh, không biết trước bao nhiêu của các đặc điểm tiềm ẩn của mỗi người thí sinh sở hữu. Do đó, một nhiệm vụ chính là xác định các giá trị của tham số câu hỏi và khả năng của thí sinh trong một câu hỏi cho các đặc điểm ẩn tiềm ẩn. Trong IRT, nhiệm vụ này là được gọi là hiệu chuẩn kiểm tra, và nó cung cấp một khung tham khảo để giải thích các kết quả kiểm tra. Kiểm tra hiệu chuẩn được thực hiện bằng cách thực hiện một bài kiểm tra cho một nhóm thí sinh M và câu trả lời nhị phân của thí sinh đối với N câu hỏi trong đề thi. Sau đó các công thức, thủ tục toán học được áp dụng cho dữ liệu ứng đáp câu hỏi để tạo ra mô hình năng lực, mô phỏng bám sát năng lực tiềm ẩn của thí sinh. Sau đó, các giá trị của ước lượng tham số câu hỏi và năng lực của thí sinh được thể hiện bằng số liệu này.


2.1. Đặt vấn đề

CHƯƠNG 2

TỔ CHỨC VÀ THỰC HIỆN XÂY DỰNG ĐỀ THI


Cho đến nay các loại lý thuyết đo lường và các mô hình đo lường khác nhau đã được giới thiệu rộng rãi ở Việt Nam trong. Với mong muốn tiếp cận lý thuyết khảo thí hiện đại, luận văn này dự định tập trung vào nghiên cứu trong lĩnh vực kiểm tra môn toán học lớp 12 bằng lý thuyết IRT. Lý thuyết IRT đã được biết đến từ những năm 50 của thế kỷ trước và được giới thiệu về Việt Nam từ những năm 2000, nhưng hiện nay việc xây dựng một đề thi trên cơ sở lý thuyết IRT vẫn chưa được phổ biến. Cách xây dựng đề thi vẫn chủ yếu theo lý thuyết đánh giá cổ điển (các kì thi THPT QG là ví dụ), IRT mới chủ yếu được ứng dụng trong các phân tích kết quả thi. Có nhiều lý do cho vấn đề này. Thực ra các lý thuyết kiểm tra cổ điển và lý thuyết IRT không loại trừ, đối lập nhau mà thường bổ xung các ưu điểm cho nhau. Mặt khác việc thực thi, ứng dụng lý thuyết IRT vào việc xây dựng đề thi ở Việt Nam gặp nhiều khó khăn. Thứ nhất là đội ngũ nghiên cứu chuyên sâu ở trong nước là chưa nhiều, chưa có cộng đồng. Thứ hai các mô hình toán học phức tạp trong IRT cần có những công cụ, phần mềm chuyên dụng để tính toán. Thứ ba lý thuyết đánh giá cổ điển vẫn đáp ứng tương đối tốt các yêu cầu từ các kỳ thi của bộ giáo dục.

Tuy vậy, thực tế đo lường trong giáo dục là vấn đề ngày càng được quan tâm sát sao trước yêu cầu đổi mới kiểm tra đánh giá trong giáo dục. Các nền tảng của đo lường đánh giá được biết đến hiện nay hoặc là dựa trên lý thuyết kiểm tra cổ điển hoặc dựa trên IRT hoặc là sự kết hợp của cả hai. Dựa trên các hiểu biết hạn hẹp của cá nhân, luận văn cố gắng xây dựng một đề đánh giá môn toán lớp 12 trên cở sở của lý thuyết khảo thí hiện đại.

2.2. Quy trình xây dựng một đề thi, đề kiểm tra


Một đề kiểm tra tiêu chuẩn hóa thường được thiết kế bởi các câu hỏi (CH) chọn từ một ngân hàng câu hỏi (NHCH). NHCH là tập hợp một số lượng tương đối lớn các câu hỏi, trong đó mỗi CH được mô tả gắn với các phần nội dung xác định và các tham số của nó. Trong trường hợp CH trắc nghiệm thì đó là độ khó, độ phân biệt theo lý

thuyết trắc nghiệm cổ điển, là các tham số a, b, c theo IRT. Ngoài ra NHCH phải được thiết kế sao cho trên đó có thể thực hiện các thao tác loại trừ hoặc thay đổi các CH “xấu”, bổ xung các CH tốt để số lượng và chất lượng câu hỏi ngày càng tăng lên. [A4]. Thiết kế một đề kiểm tra tiêu chuẩn hóa và một NHCH là khá phức tạp và tốn nhiều công sức, trí lực và thời gian. Trong luận văn này, sẽ xem xét việc thiết kế đề kiểm tra tổng kết môn Toán lớp 12. Có thể tóm tắt các bước đó như sau:

1) Tên đề thi


2) Mục đích đề thi, đề kiểm tra.


3) Khối lượng kiến thức, kĩ năng cần đo lường


4) Đối tượng đo lường


5) Những loại hình kiểm tra/ thi thực hiện


6) Mục đích sử dụng kết quả thi


7) Thời gian thi


8) Bảng ma trận trọng số


9) Biên soạn đề


10) Đề thi và đáp án.


Để thực hiện các bước của quy trình trên, chúng ta cần xác định các nội dung chi tiết của môn học, các mức độ nhận thức mong muốn TS đạt được rồi từ đó xây dựng ma trân kiến thức của môn học. Dựa vào các đặc điểm của kì thi, phân bố thời lượng nội dung kiểm tra mà ta phân bố tỉ lệ các CH hợp lí. Việc phân công, chế tác các CH thi cũng rất quan trọng. Mọi người được phân công biên soạn CH phải có năng lực chuyên môn vững vàng, nắm chắc các ô ma trận kiến thức để biên soạn các CH một cách chính xác và tốt nhất. Ngoài ra việc phản biện chuyên gia, lập các đề thi thử với các CH đã được soạn cũng phải làm hết sức nghiêm túc, khoa học. Những người quan tâm đến việc xây dựng một bài kiểm tra phải đối mặt với những khó khăn thử thách liên quan như: Đánh giá cái gì, đánh giá như thế nào, và liệu các test có tin cậy hay không, có cơ sở vững chắc không. Đó là những thử thách cơ bản đối với người giáo viên xây dựng test cho chính mình.

Xem tất cả 137 trang.

Ngày đăng: 22/09/2023
Trang chủ Tài liệu miễn phí