So Sánh Ưu Nhược Điểm Của Đề Thi Tnkq Và Tự Luận

CHƯƠNG 1

CƠ SỞ LÝ LUẬN VÀ TỔNG QUAN VẤN ĐỀ NGHIÊN CỨU

1.1. Tổng quan về đo lường trong giáo dục

Cùng với xu hướng chung là đổi mới nội dung và phương pháp giảng dạy trong nhà trường. Đo lường, đánh giá trong giáo dục là một quá trình quan trọng, quyết định sự thành bại của quá trình đổi mới đó. Đo lường trong giáo dục là công cụ để xác định năng lực nhận thức người học, điều chỉnh quá trình dạy học, điều chỉnh nội dung, phương tiện hỗ trợ quá trình dạy học nhằm đạt được được các mục tiêu, mục đích giáo dục đề ra. Đổi mới phương pháp, nội dung dạy học được chú trọng để đáp ứng những yêu cầu mới của mục tiêu giáo dục. Do vậy việc kiểm tra, đánh giá phải phải theo sát quá trình giảng dạy và mục tiêu giáo dục đề ra.

Hầu hết các đại lượng tâm lý là các thuộc tính của tư duy, mà tư duy thì không thể quan sát trực tiếp (đại lượng ẩn), nhưng vẫn có thể đo một cách gián tiếp thông qua các hành vi có thể quan sát được của con người. Ví dụ: để biết một học sinh có nắm được nội dung của môn học hay không sau khi học xong môn học đó, một bài kiểm tra có thể cho chúng ta biết một cách chính xác: học sinh đó hiểu đến mức nào (chỉ nhận biết khái niệm một cách máy móc hay còn có khả năng đánh giá, chuyển giao nhận thức của mình). Các công cụ đo lường, quan sát (ví dụ bài kiểm tra) cần được thiết kế cẩn thận, có độ tin cậy cao để ghi nhận chính xác các hành vi, làm cơ sở để xác định đại lượng ẩn. Đo lường nói chung đòi hỏi độ chính xác và chính xác, vì kết quả được hỗ trợ để có ý nghĩa đủ để cung cấp thông tin đáng tin cậy cho các hình thức ra quyết định khác nhau.

1.1.1. Các khái niệm cơ bản về đo lường đánh giá

Đo lường là quá trình mô tả mức độ cá nhân đạt được (hay đã có) một đặc điểm nào đó (như khả năng, thái độ,…) được ước lượng bằng những con số cụ thể. Ví dụ: Học sinh X làm bài kiểm tra đạt điểm 8. Học sinh Y làm được 3/4 số điểm tối đa của bài thi trắc nghiệm Toán. Bài của học sinh M được xếp hạng k trong lớp. Các điểm số 8, 3/4 hay thứ hạng k là những ký hiệu gián tiếp chỉ ra khả năng của học sinh về mặt định tính hay định hạng [4, tr. 352 - 353]. Đo lường thành quả học tậplà lượng giá

mức độ đạt được các mục tiêu cuối cùng (terminal) hay tiêu chí (criterion) trong một khóa học, một giai đoạn học.

Trắc nghiệm là một dụng cụ hay một phương thức hệ thống nhằm đo lường thành tích của một cá nhân so với các cá nhân khác hay so với những yêu cầu, nhiệm vụ học tập đã được dự kiến. Trong lĩnh vực giáo dục, thường dùng chữ “trắc nghiệm thành quả học tập” hay “trắc nghiệm thành tích”. Trong trường học, từ “trắc nghiệm” được dùng như là một hình thức kiểm tra, đánh giá học sinh. “Trắc nghiệm khách quan”, không phải hiểu theo nghĩa đối lập với một đo lường chủ quan nào, mà nên hiểu là hình thức kiểm tra này có tính khách quan cao hơn cách kiểm tra, đánh giá bằng luận đề (hình thức kiểm tra tự luận) chẳng hạn. Các điểm số thu thập được từ một bài trắc nghiệm thành tích có thể cung cấp hai loại thông tin: (1) loại thứ nhất là mức độ người học thực hiện được tiêu chí đã được ấn định, chẳng hạn như giải được đúng một bài Toán thông kê mô tả, giải thích đúng các kết xuất (output) của một chương trình thống kê v.v., không cần biết người ấy làm giỏi hơn hay kém hơn những người khác, (2) loại thứ hai là sự xếp hạng tương đối của các cá nhân liên quan đến mức độ thực hiện của họ về bài trắc nghiệm đã ra, chẳng hạn học viên A có thể giải các bài toán nhanh hơn, hoặc giỏi hơn học viên B. – [4, tr. 364 - 366].

Kiểm tra là một hoạt động nhằm cung cấp những số liệu, những thông tin làm cơ sở cho việc giám sát, đánh giá. Kiểm tra là một phần của quá trình dạy học và có ảnh hưởng đến cuộc đời của tất cả học sinh. Vì vậy giáo viên cần quan tâm đến những yếu tố ảnh hưởng đến việc kiểm tra như: đề thi phải rõ ràng, phù hợp với mục đích kiểm tra, phải đọc và kiểm tra nhiều lần để không có những sai sót; phía học sinh không bị mất tập trung chú ý trong suốt thời gian làm bài.

Lượng giá là đưa ra những thông tin ước lượng về trình độ, năng lực, phẩm chất của một cá nhân, một sản phẩm, v.v, dựa trên các số đo cụ thể hoặc quan sát được. Trong dạy học, dựa vào các điểm số một học sinh đạt được, người thầy giáo (hay nhà quản lý giáo dục) có thể ước lượng trình độ kiến thức, kỹ năng kỹ xảo của học sinh đó. Ví dụ: học sinh A hoàn thành xong 2/3 bài thi toán đại số được lượng giá là thuộc loại trung bình.

Đánh giá là quá trình thu thập, điều tra, phân tích và giải thích thông tin một cách có chủ đích, hệ thống nhằm xác định mức độ đạt đến các mục tiêu đã đề ra. Như vậy, số đo cung cấp cho ta số liệu dùng để đánh giá, còn việc suy đoán, diễn giải những con số này biến chúng thành sự đánh giá. Ta có thể nói thêm về đánh giá như sau: Đánh giá là một quá trình trong đó ta đưa ra những giá trị hoặc ấn định những giá trị cho một cái gì dó. Đặc điểm quan trọng của sự đánh giá đó là khả năng xét đoán. Đánh giá thường mang tính định lượng. Nó dựa trên những con số hoặc các tỉ lệ phần trăm. Sự xét đoán khi đánh giá gắn với một giá trị (định lượng) hay sự mô tả định tính căn cứ vào số đo trên một bài kiểm tra. Đánh giá là một quá trình gồm hai bước. Bước thứ nhất đó là kiểm tra, trong đó số liệu thu thập từ việc sử dụng một hoặc một chuỗi các bài kiểm tra. Khi việc kiểm tra được thực hiện thì sự xét đoán cũng được thực hiện về trình độ, thường là trong bối cảnh các mục đích có hướng dẫn.

Tin cậy: Độ tin cậy của một dụng cụ đo là khái niệm cho biết mức độ ổn định, vững chãi của các kết quả đo được khi tiến hành đo vật thể đó nhiều lần. Thí dụ có một gói mứt khi đặt lên cân, lần đầu báo 750 gam sang lần thứ hai báo 735 gam, lần thứ ba báo 765 gam, v.v… Ta nói cái cân này tin cậy. Tương tự một bài trắc nghiệm được gọi là tin cậy khi một học sinh làm nhiều lần bài trắc nghiệm này vào những thời điểm cách xa nhau thì các kết quả điểm số thu được đều khá ổn định (các điểm số của các lần đo không chênh lệch qua nhiều). Độ tin cậy thường được biểu hiện bằng một con số trong khoảng từ 0 đến 1. Độ lớn càng gần với 1 thì dụng cụ càng tin cậy. Ví dụ: nếu từ 0.80 trở lên thì độ tin cậy được gọi là cao từ 0.40 đến 0.79 thì tương đối tin cậy, dưới 0.40 là tin cậy thấp.

Giá trị: Độ giá trị của một dụng cụ đo là một khái niệm chỉ ra rằng dụng cụ này có khả năng đo đúng được cái cần đo. Thí dụ: Một vật có trọng lượng thực là 800 gam. Nếu khi bỏ lên cân thấy báo trị số 800 gam, ta nói cái cân này giá trị. Còn thấy báo là 700 gam, cân sẽ không giá trị vì không đo đúng được trọng lượng cần đo. Đặt vật lên, xuống đế cân nhiều lần, lần nào kết quả cũng không xê dịch khỏi 700 gam, ta nói cân đó tin cậy nhưng không giá trị.

1.1.2. Các phương pháp đo lường trong giáo dục

Hiện nay ở Việt Nam đã biết đến một hệ thống phương pháp và kỹ thuật đánh giá khá phong phú. Về phương pháp đánh giá có thể kể ra: quan sát, vấn đáp, viết. Trong viết còn bao gồm nhiều hình thức như: trắc nghiệm tự luận (tự luận), trắc nghiệm khách quan hay còn gọi là trắc nghiệm.

Theo [3] và ý kiến của các chuyên gia về đo lường đánh giá, ta nên sử hình thức kiểm tra tự luận để khảo sát thành quả học tập trong những trường hợp dưới đây:

(1) Khi nhóm học sinh dự thi hay kiểm tra không quá đông và đề thi chỉ được sử dụng một lần, không dùng lại nữa.

(2) Khi thầy cô giáo cố gắng tìm mọi cách có thể được để khuyến khích và khen thưởng sự phát triển kỹ năng diễn tả bằng văn viết.

(3) Khi thầy giáo muốn thăm dò thái độ hay tìm hiểu tư tưởng của học sinh về một vấn đề nào đó hơn là khảo sát thành quả học tập của chúng.

(4) Khi giáo viên tin tưởng vào tài năng phê phán và chấm bài luận đề một cách vô tư và chính xác hơn là khả năng soạn thảo những câu trắc nghiệm thật tốt.

(5) Khi thời gian soạn thảo bài khảo sát không nhiều .

Mặt khác, ta nên sử dụng trắc nghiệm khách quan trong những trường hợp sau:

(1) Khi ta cần khảo sát kết quả học tập của một số lượng lớn học sinh, hay muốn rằng bài khảo sát ấy có thể sử dụng lại vào một lúc khác.

(2) Khi ta những điểm số chính xác khách quan, công bằng và nhanh chóng.

(3) Khi ta cần kiểm tra toàn diện kiến thức, ngăn ngừa gian lận thi cử.

Cả trắc nghiệm lẫn tự luận đều có thể sử dụng để:

(1) Đo lường mọi thành quả học tập mà học sinh thu nhận được ở các mức độ nhận thức.

(2) Khảo sát được các khả năng hiểu, suy nghĩ có phê phán, giải quyết các vấn đề mới, phân tích, tổng hợp.

(3) Khuyến khích, gợi động cơ học tập để nắm vững kiến thức.

1.1.3. Đánh giá kết quả học tập của học sinh

Với từng môn học thì các mục tiêu trên được cụ thể hóa thành các mục tiêu về kiến thức, kỹ năng và thái độ. Mục đích của giáo dục là sự tiến bộ của học sinh. Đây chính là kết quả cuối cùng của quá trình học tập nhằm thay đổi hành vi của học sinh. Khi nhìn nhận mục tiêu giáo dục theo hướng kết quả học tập, cần phải lưu tâm rằng chúng ta đang đề cập đến những sản phẩm của quá trình học tập chứ không phải bản thân quá trình đó. Mối liên hệ giữa mục tiêu giáo dục (sản phẩm) và kinh nghiệm học tập (quá trình) được thiết kế nhằm hướng tới những thay đổi hành vi theo như mong muốn. Vậy đánh giá kết quả học tập là quá trình phản hồi thông tin, chất lượng giảng dạy tới người quản lý, người dạy và người học.

Khoa học đánh giá ngày càng phát triển, các loại hình đánh giá kết quả học tập của học sinh được phân loại theo các quan điểm tiếp cận mà có các loại hình đánh giá sau: đánh giá trên diện rộng và đánh giá trên lớp học, đánh giá chẩn đoán, đánh giá ban đầu, đánh giá trong tiến trình và đánh giá tổng kết. Ngoài ra xét theo mục tiêu học tập sẽ có hai loại đánh giá là Assessment for Learning (Đánh giá để cải tiến việc học tập) và Assessment of Learning (Đánh giá kết thúc giai đoạn học tập). Mỗi loại đánh giá sẽ có mục đích đánh giá, phương pháp đánh giá, công cụ đánh giá và các khuyến nghị khác nhau.

1.1.4. Công cụ đo lường kết quả học tập

Hoạt động đánh giá đào tạo được ra đời và phát triển song song cùng với hoạt động đào tạo. Việc lượng hóa giá trị kết quả học tập nhờ sử dụng hình thức thi trắc nghiệm (test) là một công đoạn quan trọng trong quá trình dạy học. Trắc nghiệm theo nghĩa rộng là một hoạt động được thực hiện để đo lường năng lực của các đối tượng nào đó nhằm những mục đích xác định, chẳng hạn, phân loại thí sinh, tìm ra thí sinh nổi trội, sàng lọc ra những thí sinh chưa đạt chuẩn. Trong giáo dục trắc nghiệm được tiến hành thường xuyên ở các kỳ thi, kiểm tra hay sát hạch nhằm đánh giá kết quả học tập và giảng dạy đối với một phần của môn học hoặc toàn bộ môn học hay đối với cả một cấp học. Ngoài ra trắc nghiệm cũng có thể được sử dụng nhằm lọc chọn một số người có năng lực cao nhất vào học một khoá học nào đó. Hiện nay trong giáo dục phổ thông có hai hình thức chủ yếu đo lường kết quả học tập của học sinh là câu hỏi trắc nghiệm tự luận gọi tắt là câu hỏi tự luận và câu hỏi trắc khách quan (TNKQ). Ta xem xét hai hình thức thi dưới bảng so sánh sau:

Bảng 1.1 So sánh ưu nhược điểm của đề thi TNKQ và tự luận

Chỉ mục

Ưu điểm
TNKQ	Tự luận
Ít tốn công ra đề thi		x
Đánh giá được khả năng diễn đạt, đặc biệt là diễn đạt tư duy hình tượng		x
Đề thi phủ kín nội dung môn học	x
Ít may rủi do “học tủ”	x
Ít tốn công chấm thi	x
Khách quan trong chấm thi	x
Áp dụng được công nghệ mới trong việc nâng cao chất lượng kỳ thi, giữ bí mật đề thi, hạn chế quay cóp khi thi, hạn chế tiêu cực trong chấm thi và giúp phân tích kết quả thi.	x

Có thể bạn quan tâm!

Xem toàn bộ 137 trang tài liệu này.

Nắm vững bản chất từng phương pháp cùng điều kiện cơ sở vật chất và công nghệ triển khai cụ thể, để sử dụng hợp lí, tối ưu mỗi phương pháp. Theo [3, tr. 29 – 36] ta có bảng so sánh ưu nhược điểm của các hình thức thi TL và TN như sau.

Bảng 1.2 Hình thức thi TNKQ và tự luận

Vấn đề

Đề thi TNKQ	Đề thi tự luận
Hình thức câu hỏi / đề thi	Một bộ câu hỏi trong đó mỗi câu hỏi đều kèm theo các phương án trả lời cho sẵn để học sinh lựa chọn phương án trả lời.	Một bộ câu hỏi trong đó mỗi câu hỏi không kèm theo các phương án trả lời mà học sinh phải tự luận để đưa ra câu trả lời.
Mức độ phức tạp khi viết câu hỏi và tổ hợp đề	Khó soạn câu hỏi.	Dễ soạn câu hỏi
	Dễ sai về diễn đạt, nội dung câu hỏi thiếu chính xác (vì có nhiều câu hỏi nên khó rà soát).	Ít bị sai sót về diễn đạt, nội dung rõ ràng.
	Dễ chuẩn bị đáp án, hướng dẫn chấm.	Khó xây dựng đáp án, hướng dẫn chấm, xây dựng đáp án phức tạp.

Có nhiều câu hỏi nên khó nhớ, dễ bảo mật.	Khó bảo mật đề thi do có ít câu hỏi.
Mức độ phức tạp khi tổ chức thikiểm tra	Tốn ít thời gian làm bài, đề kiểm tra có thể phủ toàn bộ chương trình.	Phải dành nhiều thời gian cho học sinh làm bài, khó kiểm tra toàn bộ chương trình.
	Tốn nhiều thời gian cho việc in ấn, nhân đề.	Không tốn nhiều công sức in ấn đề.
	Học sinh khó sử dụng tài liệu, loại trừ tiêu cực trong thi cử.	Học sinh dễ quay cóp sử dụng tài liệu, tiêu cực trong thi cử.
Vấn đề đoán mò phương án trả lời đúng	Học sinh có thể đoán mò.	Học sinh không đoán được câu trả lời đúng.
Độ tin cậy của đề thi	Độ tin cậy cao.	Độ tin cậy thấp.
Tính giá trị của đề thi	Có thể đánh giá đầy đủ các mức nhận thức nếu các câu hỏi được soạn kỹ.	Dễ đánh giá được các mức nhận thức cao (phân tích, tổng hợp, đánh giá).
Tính giá trị của đề thi	Bao quát toàn bộ chương trình nên đánh giá chính xác hơn, có thể có độ giá trị cao hơn.	Không bao quát toàn bộ chương trình nên độ giá trị có thể không cao.
Sự phức tạp của việc chấm điểm	Chấm điểm khách quan, công bằng	Chấm điểm phụ thuộc vào ý chủ quan của người chấm.
Mức độ phức tạp khi phân tích, đánh giá câu hỏi thi	Có nhiều phần mềm để phân tích, đánh giá câu hỏi, lựa chọn những câu hỏi có chất lượng.	Khó phân tích, đánh giá câu hỏi.

1.1.5. Sơ lược về khoa học đo lường đánh giá trên thế giới và Việt Nam.

1.1.5.1. Sơ lược về khoa học đo lường đánh giá trên thế giới

Lý thuyết trắc nghiệm đã được xây dựng và đưa vào ứng dụng trong các trường đại học ở Mỹ và một số nước khác từ khá sớm (bắt đầu từ những năm 1920). Lý thuyết trắc nghiệm là cơ sở khoa học giúp đánh giá chất lượng của bài thi trắc nghiệm (thông qua đánh giá các câu hỏi) và ước lượng năng lực thí sinh (thông qua việc thí sinh trả lời các câu hỏi). Lĩnh vực khoa học đo lường phát triển mạnh ở Mĩ vào thời kỳ từ trước và sau thế chiến thứ hai với những dấu mốc quan trọng như trắc nghiệm trí tuệ Stanford-Binet xuất bản năm 1916, bộ trắc nghiệm thành quả học tập tổng hợp đầu tiên Stanford Achievement Test ra đời vào năm 1923. Cho đến nay có hai hệ lý luận chính dùng trong lý thuyết đo lường giáo dục, đó là: lý thuyết trắc nghiệm cổ điển (Classical Test Theory - CTT); lý thuyết ứng đáp câu hỏi (Item Response Theory - IRT). IRT ra đời sau CTT và hiện nay trên thế giới IRT được áp dụng rộng rãi trong các hệ thống đánh giá giáo dục, đặc biệt là ở Mỹ, Australia và một số nước phát triển khác.

Hai cách tiếp cận thống kê về lý thuyết đo lường, thường được gắn nhãn như là "cổ điển" và "hiện đại" (lý thuyết ứng đáp câu hỏi) (Gustaffson 1977, Crocker và Algina 1986). Mặc dù chúng tương đối khác nhau, nhưng không nên xem chúng như các đối thủ bởi chúng bổ sung các ưu nhược điểm cho nhau. Có lẽ vấn đề khác biệt có thể được hiểu là sự phụ thuộc vào mẫu và so bằng của bài kiểm tra cổ điển. Điểm số được tính trên cơ sở các thủ tục phân tích cổ điển cung cấp thông tin về khả năng của thí sinh chỉ ở một mức độ hạn chế. Ngoài ra, vì kiểm tra các đặc tính của thí sinh được xác định trên cơ sở hồi đáp của một tập hợp học sinh, chỉ có thể được tái sử dụng với cùng một tập học sinh đó hoặc với một tập học sinh mới có những đặc điểm tương đồng với tập học sinh đã cho - một trở ngại lớn trong cách hiệu quả xây dựng ngân hàng câu hỏi.

Bên cạnh về sự nghiên cứu và phát triển của lý thuyết khảo thí cổ điển (CTT) những năm đầu thế kỉ 20 ở châu Âu và Mỹ, từ thập niên 50 những công trình đầu tiên về lý thuyết khảo thí hiện đại (IRT) đã được công bố. Allen Birnbaum đã viết một loạt các báo cáo kỹ thuật về các mô hình và mô hình kiểm tra đánh giá tham số vào năm

Gửi bình luận