Các Phương Pháp Tính Độ Tin Cậy Của Bài Trắc Nghiệm

2.5.2.3 Kết luận từ độ phân cách

Độ phân cách D

Kết luận

D Ў 0.40

Câu trắc nghiệm có độ phân cách rất tốt

0.30 Ў D Ў 0.39

Câu trắc nghiệm có độ phân cách khá tốt,

nhưng có thể làm cho tốt hơn

0.20 Ў D Ў 0.29

Câu trắc nghiệm có độ phân cách tạm

được, cần phải điều chỉnh

D Ў 0.19

Câu trắc nghiệm có độ phân cách kém, cần phải loại bỏ hay phải gia công sửa chữa

nhiều

Có thể bạn quan tâm!

Xem toàn bộ 249 trang tài liệu này.

Bảng 9. Kết luận từ độ phân cách[3]

2.6 Độ tin cậy của bài trắc nghiệm

2.6.1 Định nghĩa độ tin cậy

Độ tin cậy của bài trắc nghiệm là hệ số tương quan của tỉ lệ trả lời đúng/sai giữa các lần trắc nghiệm bằng các đề trắc nghiệm tương đương[3].

Độ tin cậy của các điểm số đối với bài trắc nghiệm giúp ta biết được trắc nghiệm đã đo lường cái mà nó định đo tốt đến mức nào. Điều này có nghĩa là nếu cùng những học sinh đó, ta cho làm cùng một bài trắc nghiệm lần thứ hai, thì kết quả thu được sẽ gần giống nhau đến mức nào.

Độ tin cậy không phải là một thuộc tính của tự thân bài trắc nghiệm mà là thuộc tính của bài trắc nghiệm khi nó được đem ra áp dụng với nhóm thí sinh nào đó. Bài trắc nghiệm càng thích hợp với mức độ khả năng của nhóm bao nhiêu thì độ tin cậy của các điểm số lại càng cao. Khả năng của các phần tử trong nhóm càng phân tán rộng thì độ tin cậy của các điểm số trên bài trắc nghiệm lại càng cao.

Hệ số tương quan được sử dụng như là một số đo lường độ tin cậy. Một trong các đặc tính của hệ số tương quan là nó cung cấp cho ta một thứ đo lường

tương đối thay vì tuyệt đối về sự tương đồng giữa hai tập hợp điểm số của cùng một số người. Nếu sự khác biệt của các điểm số của cùng một người tương đối nhỏ so với sự khác biệt giữa các điểm số của những người khác nhau thì độ tin cậy của các điểm số về bài trắc nghiệm ấy sẽ cao. Nhưng ngược lại, nếu sự khác biệt giữa các điểm số của cùng một người tương đối lớn so với sự khác biệt giữa những người khác nhau thì độ tin cậy sẽ thấp.

Ta cần phải có hai số đo lường độc lập cho mỗi phần tử trong nhóm và các số đo lường này được lấy từ những bài trắc nghiệm tương đương về cùng một đặc điểm (khả năng) nào đó.

2.6.2 Các phương pháp tính độ tin cậy của bài trắc nghiệm

Có nhiều phương pháp nhằm có được những số đo lường độc lập cần thiết để phỏng định hệ số tin cậy của trắc nghiệm. Thông dụng nhất hiện nay là phương pháp phân đôi bài trắc nghiệm và phương pháp Kuder Richardson. Ngoài ra cũng còn một số phương pháp khác nữa như: phương pháp trắc nghiệm hai lần, phương pháp sử dụng các dạng trắc nghiệm tương đương…

2.6.2.1 Trắc nghiệm hai lần (test - retest)

Phương pháp đơn giản nhất để có các số đo lường độc lập là ra một bài trắc nghiệm hai lần[1] với cùng một nhóm thí sinh, rồi tính hệ số tương quan giữa hai tập hợp điểm số của lần thứ nhất và lần thứ hai.

Phương pháp này gặp phải một số chỉ trích:

 Như ta đã biết, một tập hợp các câu hỏi trong bài trắc nghiệm chỉ là một mẫu trong một “dân số” rất lớn các câu trắc nghiệm có thể có được về khả năng ta muốn khảo sát. Nếu sử dụng một tập hợp các câu trắc nghiệm hai lần cho một nhóm thí sinh thì ta không thể nào biết được rằng các điểm số có thay đổi hay không và thay đổi bao nhiêu, nếu người ta sử dụng một tập hợp các câu hỏi khác với cùng nhóm thí sinh ấy.

 Các giải đáp của thí sinh trong lần khảo sát thứ nhất không độc lập với các giải đáp của họ trong lần thứ hai. Các giải đáp ở lần thứ hai có thể bị ảnh hưởng do thí sinh còn nhớ lại lối giải đáp của mình trong lần thứ nhất, hay do những kinh nghiệm đã thu thập được sau lần khảo sát thứ nhất.

 Nếu có khoảng thời gian giữa lần khảo sát thứ nhất và thứ hai thì các sai số đo lường có thể bị lẫn lộn với những thay đổi thật sự của học sinh về khả năng do quá trình học tập.

2.6.2.2 Các dạng trắc nghiệm tương đương (equivalent forms)

Nếu ta có hai hay nhiều bài trắc nghiệm được soạn thảo làm sao cho các điểm số trên hai bài trắc nghiệm ấy tương đương[1] với nhau, và nếu mỗi học sinh trong nhóm đều làm cả hai bài trắc nghiệm, thì hệ số tương quan giữa hai tập hợp điểm số về hai bài ấy sẽ là số phỏng định hệ số tin cậy của chúng. Nhưng việc soạn thảo những bài trắc nghiệm tương đương như vậy rất công phu và phức tạp, cho nên việc tính hệ số tin cậy theo cách này rất ít khi sử dụng.

2.6.2.3 Phương pháp phân đôi bài trắc nghiệm (split halves method) Một bài trắc nghiệm duy nhất được phân ra thành hai nửa tương đương. Hai nửa này được xem như là hai bài trắc nghiệm phụ và các điểm số của

chúng là những điểm số độc lập cần thiết để tính độ tin cậy. Thông thường,

người ta phân bài trắc nghiệm ra hai nửa theo các câu mang số chẵn và các câu mang số lẻ. Sau đó, người ta tính hệ số tương quan giữa điểm số các câu lẻ (X) với điểm số các câu chẵn (Y) theo công thức[3]:

rxy

=N  XY - X Y

[N  X 2- ( X) 2][N  Y 2- ( Y) 2]

Nhưng đó chỉ là hệ số tương quan giữa hai bài trắc nghiệm được rút ngắn lại chỉ còn một nửa. Để có một số phỏng định độ tin cậy của toàn bài trắc nghiệm, người ta còn phải điều chỉnh hệ số tương quan giữa hai bài trắc nghiệm ngắn ra thành hệ số tương quan của một bài trắc nghiệm dài gấp đôi. Điều này có thể thực hiện được bằng công thức Spearman – Brown.

Công thức tổng quát của Spearman – Brown[3] được sử dụng để tiên

đoán sự gia tăng độ tin cậy bằng cách tăng chiều dài của bài trắc nghiệm:

r =

nrs

(n – 1)rs + 1

Trong đó: n là hệ số độ dài của bài trắc nghiệm. rs là hệ số tương quan

Khi ta cần tiên đoán độ tin cậy của một bài trắc nghiệm dài gấp đôi như

trong trường hợp phỏng định độ tin cậy theo phương pháp phân đôi bài trắc nghiệm thì công thức tính sẽ như sau:

r =

2rxy rxy + 1

Trong đó:

 rxy là hệ số tương quan giữa các điểm số chẵn (X) và các điểm số lẻ

(Y) đã tính ở trên (hay độ tin cậy của một nửa bài trắc nghiệm).

 r là độ tin cậy của toàn bài trắc nghiệm.

Thí dụ: Một bài trắc nghiệm sẽ được phân đôi thành 2 bài trắc nghiệm ngắn mang những câu hỏi số chẵn và những câu hỏi số lẻ. Có 11 thí sinh làm 2 bài trắc nghiệm ngắn trên, gọi:

 X: tổng số điểm của một thí sinh làm bài trắc nghiệm câu hỏi lẻ

 Y: tổng số điểm của một thí sinh làm bài trắc nghiệm câu hỏi chẵn Các số điểm của mỗi thí sinh như sau:

Thí sinh

X	Y	X2	Y2	XY
1	11	8	121	64	88

8	0	64	0	0
3	9	8	81	64	72
4	14	11	196	121	154
5	12	14	144	196	168
6	7	6	49	36	42
7	18	11	324	121	198
8	6	8	36	64	48
9	6	9	36	81	54
10	6	3	36	9	18
11	5	10	25	100	50
Tổng	102	88	1112	856	892

Bảng 10. Điểm số của mỗi thí sinh

rxy =N  XY - X Y

[N  X 2 - ( X) 2 ][N  Y 2 - ( Y) 2 ]

11 x 892 – 102 x 88

[11 x 1112 -1022 ][11 x 856 - 882 ]

Độ tin cậy toàn bài trắc nghiệm:

209

= 437

2 x 209

r = 2rxy rxy + 1

= 437

209 + 1

437

= 0.647

2.6.2.4 Công thức Kuder – Richardson

2

2

Phương pháp tính độ tin cậy thông dụng nhất hiện nay là áp dụng công thức Kuder – Richardson[1]:

r =

k k – 1

(1-i )

Trong đó:

 k : Số câu hỏi trong bài trắc nghiệm.



2 : Biến lượng (độ lệch tiêu chuẩn bình phương) của mỗi câu trắc

nghiệm.

 σ2

: Biến lượng của bài trắc nghiệm, tức biến lượng điểm của các cá

nhân trong nhóm về toàn thể bài trắc nghiệm.

2

Kuder – Richardson cũng đưa ra công thức khác suy ra từ công thức trên khi câu trắc nghiệm làm đúng được tính là 1 và câu làm sai tính là 0. Công thức này được gọi là công thức Kuder – Richardson 20[1].

r =

k – 1

(1 -  pq )

Trong đó:

 k : Số câu hỏi trong bài trắc nghiệm.

 p : Tỉ lệ số trả lời đúng cho một câu trắc nghiệm (Độ khó câu trắc nghiệm).

 q : Tỉ lệ số trả lời sai cho một câu trắc nghiệm.

 σ2

: biến lượng của bài trắc nghiệm, tức biến lượng điểm của các cá

nhân trong nhóm về toàn thể bài trắc nghiệm.

σ2

N Y 2- ( Y )2

N(N - 1)

Trong đó:

 N : Số thí sinh tham gia làm bài trắc nghiệm.

 Y : Tổng điểm bài làm của mỗi thí sinh

Thí dụ: Bài trắc nghiệm gồm 10 câu, có 10 thí sinh dự thi

 Tổng điểm bài làm của các thí sinh như sau:

Thí sinh

Tổng điểm (Y)	Y2
1	9	81
2	10	100
3	8	64

6	36
5	4	16
6	6	36
7	3	9
8	3	9
9	4	16
10	5	25
Tổng	58	392

Bảng 11. Điểm bài làm của thí sinh

 Độ khó của các câu trắc nghiệm:

Câu

Độ khó (p)	q = 1 - p	pq
1	0.7	0.3	0.21
2	0.8	0.2	0.16
3	0.7	0.3	0.21
4	0.6	0.4	0.24
5	0.6	0.4	0.24
6	0.5	0.5	0.24
7	0.3	0.7	0.21
8	0.4	0.6	0.24
9	0.5	0.5	0.25
10	0.7	0.3	0.21
Tổng			2.22

σ2

N Y 2- ( Y )2

N(N - 1)

r =

k – 1

(1 -  pq )

2

Bảng 12. Tính pq

10 x 392- 582

10 x 9

= 6.18

10 (1 - 2.22)

9 6.18

= 0.71

2.6.3 Kết luận từ độ tin cậy

Độ tin cậy r

Kết luận
Trên 0.80	Bài trắc nghiệm đáng tin cậy
Trên 0.70	Bài trắc nghiệm có độ tin cậy tạm chấp nhận
Từ 0.50 đến 0.70	Bài trắc nghiệm có độ tin cậy không cao, chắc chắn có nhiều câu hỏi cần phải chỉnh sửa

Bảng 13. Kết luận từ độ tin cậy[3]

Gửi bình luận