Reliability of Modified Essay Question Test for Measuring Critical Thinking Skills in Mathematics under Different Testing Conditions: An Application of Generalizability


  • Pakjira Jongsooksai Chulalongkorn University
  • Kamonwan Tangdhanakanond Chulalongkorn University


Modified Essay Question test (MEQ), mathematical critical thinking skills, generalizability theory, double layer scoring rubric, reliability


This thesis was aimed at 1) developing a Modified Essay Question test (MEQ) for measuring mathematical critical thinking skills and a double-layer scoring rubric for ninth grade students 2) checking the quality of the double -layer scoring rubric for ninth grade students and 3) comparing the reliability of the modified essay question for measuring mathematical critical thinking skills with different scoring methods through an application of generalizability theory. The sample was comprised of 90 ninth grade students. Research instruments included the essay question test for mathematical critical thinking skills and three types of scoring rubrics. Cronbach’s alpha, Pearson’s Product Moment Correlation and G–Coefficient were used to analyze the data. Results were as follows: 1) Each question of the modified essay questions test was in accordance with the process of mathematical critical thinking. The 1st step of the double -layer scoring rubric concentrated on a detailed assessment of validity, an understanding of what was being measured, and communication in mathematics. Scores obtained from the 1st step were converted into those of the 2nd step according to the assigned criteria. 2) The double layer scoring rubric yielded content validity, which conformed to the answering guideline and reliability of scoring of an individual assessor as well as between assessors was at a high level. 3) The double layer scoring rubric was of higher precision than the small scaled analytical method and the Knox scoring method with value 0.1, respectively.

Author Biographies

Pakjira Jongsooksai, Chulalongkorn University

Graduate Student in Division of Methodology for Innovation Development in Education, Faculty of Education, Chulalongkorn University

Kamonwan Tangdhanakanond, Chulalongkorn University

Lecturer in Division of Department of Educational Research and Psychology, Faculty of Education, Chulalongkorn University



กมลวรรณ ตังธนกานนท์. (2563). การวัดและประเมินทักษะการปฏิบัติ (พิมพ์ครั้งที่ 3). สำนักพิมพ์จุฬาลงกรณ์มหาวิทยาลัย.

ณัฏฐณี ศิริโชติ และ กมลวรรณ ตังธนกานนท์. (2559). ปฏิสัมพันธ์ระหว่างวิธีการประเมินตนเองและความสามารถทางวิทยาศาสตร์ที่มีต่อพัฒนาการทักษะปฏิบัติการทดลองของนักเรียน [วิทยานิพนธ์ปริญญามหาบัณฑิต จุฬาลงกรณ์มหาวิทยาลัย]. Chulalongkorn University Intellectual Repository (CUIR).

มาฆพันธุ์ อ่ำนาคิล และ กมลวรรณ ตังธนกานนท์. (2557). การเปรียบเทียบความเที่ยงของแบบสอบอัตนัยประยุกต์วัดความสามารถในการแก้ปัญหาทางวิทยาศาสตร์ ที่ใช้วิธีการตรวจให้คะแนนที่แตกต่างภายใต้จำนวนเหตุการณ์ที่ต่างกัน : การประยุกต์ใช้ทฤษฎีการสรุปอ้างอิงความน่าเชื่อถือของผลการวัด [วิทยานิพนธ์ปริญญามหาบัณฑิต จุฬาลงกรณ์มหาวิทยาลัย]. Chulalongkorn University Intellectual Repository (CUIR).

ศิริชัย กาญจนวาสี. (2563). ทฤษฎีการทดสอบแนวใหม่ Modern test theories (พิมพ์ครั้งที่ 5). สำนักพิมพ์จุฬาลงกรณ์มหาวิทยาลัย.

สำนักงานเขตพื้นที่การศึกษามัธยมศึกษาสุพรรณบุรี. (ม.ป.ป.). ข้อมูลจำนวนนักเรียน. https://bigdata.mathayomspb.

สำนักงานเลขาธิการสภาการศึกษา กระทรวงศึกษาธิการ. (2563). การจัดการเรียนรู้ฐานสมรรถนะเชิงรุก. กลุ่มมาตรฐานการศึกษา สำนักมาตรฐานการศึกษาและพัฒนาการเรียนรู้.

สุไรยา หมันหมัด. (2549). การพัฒนาแบบทดสอบอัตนัยประยุกต์วัดความสามารถในการแก้ปัญหาทางวิทยาศาสตร์ของนักเรียนชั้นมัธยมศึกษาปีที่ 5 [วิทยานิพนธ์ปริญญามหาบัณฑิต มหาวิทยาลัยทักษิณ]. TSU Knowledge bank (TSUKB).


Abdullah, N., Idris, N., Hamzah, M. S. G. B., & Sembak, S. (2015). Planning and implementation of School-Based Assessment (SBA) among teachers. Social and Behavior Sciences, 211, 247-254.

Dressel, P. L., & Mayhew, L. B. (1957). General education explorations in evaluation (2nd ed.). American Council on Education.

Hamzah, M. S. G. B., Idris, N., Abdullah, S. K., Abdullah, N., & Muhammad, M. M. (2014). Development of the double layer rubric for the study on the implementation of school-based assessment among teachers. US-China Education Review, 5(4), 245-256.

Nunnally, J. C. (1978). Psychometric theory (2nd ed.). McGraw-Hill Inc.

So, J. Y., Sang, Y. L., Sun, J. I., Bee, S. K., & Sun, Y. B. (2018). Holistic rubric vs analytic rubric for measuring clinical performance levels in medical student. BMC Medical Education, 18(124), 1-6.




How to Cite

Jongsooksai, P., & Tangdhanakanond, K. (2022). Reliability of Modified Essay Question Test for Measuring Critical Thinking Skills in Mathematics under Different Testing Conditions: An Application of Generalizability. Journal of Education Studies, 50(4), EDUCU5004001 (13 pages) doi: 10.14456/educu.2022.30. Retrieved from