Áp dụng lý thuyết ứng đáp câu hỏi đa chiều vào đo lường và đánh giá đề thi anh văn cuối kỳ
Email tác giả liên hệ:
hadt@hcmute.edu.vnTừ khóa:
Lý thuyết ứng đáp câu hỏi đa chiều, mô hình Rasch Testlet, phân tích nhân tố, phần mềm RTóm tắt
Bài báo nghiên cứu ứng dụng của lý thuyết ứng đáp câu hỏi đa chiều (MIRT) vào đo lường và đánh giá đề thi trắc nghiệm môn Tiếng Anh. Dữ liệu trong bài báo được thu thập từ bài thi cuối kỳ môn Anh Văn 2 dành cho sinh viên không chuyên tại trường Đại học Sư phạm Kỹ thuật Tp. HCM. Trước tiên, mô hình Rasch Testlet được dùng để kiểm tra tính đa chiều của đề thi. Tiếp theo, phân tích nhân tố (FA) được sử dụng để xác định số chiều cần đo. Độ khó và độ phân biệt của mỗi câu hỏi trong đề thi được ước lượng bằng mô hình MIRT 2 tham số. Việc xử lý dữ liệu được thực hiện bằng gói lệnh “mirt” của phần mềm R. Kết quả của bài báo cung cấp thông tin hữu ích cho giáo viên trong việc điều chỉnh phương pháp đánh giá.
Tải xuống: 0
Tài liệu tham khảo
Alderson, J. C., & Banerjee, E. (2002). Language testing and assessment. Language Testing, 35, 79-113.
Baker, F. (2001). The basic of item response theory. USA: ERIC Clearinghouse on Assessment and Evaluation.
Bechger, T.M., Maris, G., Verstralen, H.H.F.M., & Beguin, A.A. (2003). Using classical test theory in combination with item response theory. Applied Psychological Measurement, 27(5), 319-334.
Camilli, G., & Shepard, L.A. (1994). Methods for identifying biased test items (Vol. 4). Thousand Oaks, CA: Sage.
Embretson, S. E., &Reise, S. P. (2000). Item response theory for psychologists. Mahwah, NJ: Lawrence Erlbaum.
Guttman, L. (1954). Some necessary conditions for common-factor analysis. Psychometrika, 19, 149–161.
Hambleton, R. K., &Swaminathan, H. (1985). Item Response Theory: Principles and Applications. USA: Kluwer-Nijhoff Publishing.
Hasmy, A. (2014). Compare unidimensional & multidimensional Rasch model for test with multidimensional construct and items local dependence. Journal of Education and Learning, 8(3), 187-194.
Henning, G. (1987). A guide to language testing. Cambridge, Mass.: Newbury House.
Heydari, P., Bagheri, M. S., Zamanian, M., Sadighi, F., & Yarmohammadi, L. (2014). Investigating the construct validity of "Structure and Written Expression" section of TOLIMO through IRT. International Journal of Language Learning and Applied Linguistics World, 5(2), 105-123.
Kaiser, H. F. (1958). The Varimax criterion for analytic rotation in factor analysis. Psychometrika, 23(3), 187-200.
Kaiser, H. F. (1960). The application of electronic computers to factor analysis. Educational and Psychology Measurement, 34, 111–117.
Li, Y., Jiao, H., &Lissitz, R. W. (2012). Applying multidimensional item response theory models in validating test dimensionality: An example of K-12 large-scale science assessment. Journal of Applied Testing Technology, 13(2), 1-27.
McNamara, T. F. (1991). Test dimensionality: IRT analysis of an ESP listening test. Language Testing, 8(2), 139-159.
Reckase, M. D. (2009). Multidimensional item response theory. New York: Springer.
Schedl, M., Gordon, A., Carey, P. A., & Tang, K. L. (1996). An analysis of the dimensionality of TOEFL reading comprehension items (TOEFL Research Report No. 53). Princeton, NJ: ETS.
Wainer, H., Bradlow, E. T., & Wang, X. (2007). Testlet response theory and its applications. Cambridge: Cambridge University Press.
Wainer, H., & Wang, X. (2000). Using a new statistical model for testlets to score TOEFL. Journal of Educational Measurement, 37, 203–220.
Walt, J., &Steyn, F. (2008). The validation of language tests. Linguistics, 38, 191-204.
Wang, W. C., & Wilson, M. R. (2005). The RaschTestlet model. Applied Psychological Measurement, 29, 126–149.
Wilson, K. M. (2000). An exploratory dimensionality assessment of the TOEIC test (Research Report No. 14). Princeton, NJ: ETS.
Tải xuống
Đã Xuất bản
Cách trích dẫn
Giấy phép
Tác phẩm này được cấp phép theo Giấy phép quốc tế Creative Commons Attribution-NonCommercial 4.0 .
Bản quyền thuộc về JTE.


