การศึกษาผลการตรวจให้คะแนนแบบสอบอัตนัย ประยุกต์ใช้โมเดลหลายองค์ประกอบ ของราส์ซ และทฤษฎีการสรุปอ้างอิงความน่าเชื่อถือของผลการวัด

ดรุณี  อภัยกาวี; ประกฤติยา  ทักษิโณ

PDF

เผยแพร่แล้ว: มิ.ย. 24, 2020

คำสำคัญ:

โมเดลหลายองค์ประกอบของราส์ซ , ทฤษฎีการสรุปอ้างอิง , คุณลักษณะการตรวจให้คะแนน

ดรุณี อภัยกาวี

สาขาวิชาการวัดและประเมินผลการศึกษา คณะศึกษาศาสตร์ มหาวิทยาลัยขอนแก่น

ประกฤติยา ทักษิโณ

ภาควิชาการวัดและประเมินผลการศึกษา คณะศึกษาศาสตร์ มหาวิทยาลัยขอนแก่น

บทคัดย่อ

งานวิจัยเรื่องนี้มีความมุ่งหมายเพื่อ 1) ศึกษาความตรงตามสภาพ และ 2) ศึกษาค่าสัมประสิทธิ์การสรุปอ้างอิงของผลการตรวจให้คะแนนแบบสอบอัตนัย กลุ่มตัวอย่าง ได้แก่ ผู้ตอบข้อสอบ เป็นนักเรียนชั้นมัธยมศึกษาปีที่ 3 จำนวน 32 คน และ ผู้ตรวจให้คะแนนเป็นนักศึกษาสาขาวิชาคณิตศาสตร์ จำนวน 37 คน เครื่องมือที่ใช้ในการวิจัย คือ แบบสอบอัตนัยการคิดทางคณิตศาสตร์ จำนวน 3 ข้อ ประยุกต์ใช้โมเดลหลายองค์ประกอบของราส์ช (Many Facet Rasch Model) และ ทฤษฎีการสรุปอ้างอิงความน่าเชื่อถือของผลการวัด (generalizability theory) ผลการวิจัยพบว่า

1) ค่าความตรงตามสภาพของผลการตรวจให้คะแนนแบบสอบอัตนัย 3 ข้อ ของผู้ตรวจให้คะแนนที่ต่างกัน เทียบกับคะแนนเกณฑ์กลางซึ่งมาจากคะแนนฉันทามติการตรวจของผู้เชี่ยวชาญ พบว่า ค่าสัมประสิทธิ์สหสัมพันธ์ของคะแนนที่ได้จากการตรวจของผู้ตรวจให้คะแนนเป็นกลางและเข้มงวดสูงกว่าผู้ตรวจให้คะแนนใจดี

2) ค่าสัมประสิทธิ์การสรุปอ้างอิง ในทุกคุณลักษณะของผู้ตรวจให้คะแนนที่ต่างกัน ภายใต้เงื่อนไขของรูปแบบการตรวจข้อสอบบางข้อของผู้สอบทุกคน [p x (i : r)] สูงกว่ารูปแบบการตรวจข้อสอบทุกข้อของผู้สอบทุกคน [p x i x r]

ฉบับ

ปีที่ 26 ฉบับที่ 1: มกราคม - มิถุนายน 2563

บท

บทความวิจัย

เนื้อหาและข้อมูลในบทความที่ลงตีพิมพ์ในวารสารการวัดผลการศึกษา มหาวิทยาลัยมหาสารคาม ถือเป็นข้อคิดเห็นและความรับผิดชอบของผู้เขียนบทความโดยตรง ซึ่งกองบรรณาธิการวารสาร ไม่จำเป็นต้องเห็นด้วย หรือร่วมรับผิดชอบใดๆ

บทความ ข้อมูล เนื้อหา รูปภาพ ฯลฯ ที่ได้รับการตีพิมพ์ในวารสารการวัดผลการศึกษา มหาวิทยาลัยมหาสารคาม ถือเป็นลิขสิทธิ์ของวารสารการวัดผลการศึกษา มหาวิทยาลัยมหาสารคาม หากบุคคลหรือหน่วยงานใดต้องการนำทั้งหมดหรือส่วนใดส่วนหนึ่งไปเผยแพร่ต่อหรือกระทำการใดๆ จะต้องได้รับอนุญาตเป็นลายลักษณ์อักษรจากวารสารการวัดผลการศึกษา มหาวิทยาลัยมหาสารคาม ก่อนเท่านั้น

References

กมลวรรณ ตังธนกานนท์. (2557). การวัดและประเมินทักษะการปฏิบัติ. พิมพ์ครั้ง 1.กรุงเทพฯ : สำนักพิมพ์ แห่งจุฬาลงกรณ์มหาวิทยาลัย.

จิรายุ เถาว์โท อนุ เจริญวงศ์ระยับ และปัณณวิชญ์ ใบกุหลาบ. (2559). การศึกษาค่าความเชื่อมั่นของคะแนนแบบทดสอบอัตนัยวิชาคณิตศาสตร์ของนักเรียนชั้นมัธยมศึกษาปีที่ 2 ที่มีจำนวนผู้ตรวจและรูปแบบการตรวจให้คะแนนต่างกัน โดยใช้ทฤษฎีการสรุปอ้างอิง.วารสารหาดใหญ่วิชาการ, 14(1),1-14.

ชนิสรา สงวนไว้. (2558). การเปรียบเทียบความเที่ยงของแบบสอบวัดความสามารถในการแก้ปัญหาอย่าง สร้างสรรค์ทางคณิตศาสตร์ : การประยุกต์ใช้ทฤษฎีการสรุปอ้างอิงความน่าเชื่อถือของผลการวัด. ปริญญานิพนธ์ ค.ม. (การวัดและประเมินผลการศึกษา). กรุงเทพฯ: บัณฑิตวิทยาลัย จุฬาลงกรณ์มหาวิทยาลัย.

นภัสนันท์ ขวัญจ่า. (2556). การเปรียบเทียบสัมประสิทธิ์การสรุปอ้างอิงของแบบวัดทักษะกระบวนการทาง วิทยาศาสตร์ ชั้นมัธยมศึกษาปีที่ 4 ที่มีรูปแบบการตรวจให้คะแนนต่างกัน. วิทยานิพนธ์ กศ.ม. (การวัดผลการศึกษา). มหาสารคาม: บัณฑิตวิทยาลัย มหาวิทยาลัยมหาสารคาม.

น้ำผึ้ง อินทะเนตร. (2554). การศึกษาคุณลักษณะของคะแนนแบบทดสอบปลายเปิดวิชาคณิตศาสตร์ เมื่อ จำนวนผู้ตรวจและรูปแบบการตรวจให้คะแนนต่างกัน โดยใช้โมเดลการสรุปอ้างอิงและโมเดลหลาย องค์ประกอบของราส์ช.วิทยานิพนธ์ กศ.ด.(การทดสอบและวัดผลการศึกษา). กรุงเทพฯ: บัณฑิตวิทยาลัย มหาวิทยาลัยศรีนครินทรวิโรฒ.

บุษวรรษ์ แสนปลื้ม. (2556). การใช้วิธีการตรวจคุณลักษณะและสัดส่วนจำนวนผู้ตรวจให้คะแนนที่มีต่อความเที่ยงตรงของการวัดความสามารถในการเขียนของนักเรียนชั้นประถมศึกษาปีที่ 3. วิทยานิพนธ์ กศ.ด. (การทดสอบและวัดผลการศึกษา). กรุงเทพฯ: บัณฑิตวิทยาลัย มหาวิทยาลัยศรีนครินทรวิโรฒ.

ปรีชา เนาว์เย็นผล. (2544). กิจกรรมการเรียนการสอนคณิตศาสตร์โดยใช้การแก้ปัญหาปลายเปิดสำหรับนักเรียนชั้นมัธยมศึกษาปีที่ 1. วิทยานิพนธ์ กศ.ด.(คณิตศาสตร์ศึกษา). กรุงเทพฯ : บัณฑิตวิทยาลัย มหาวิทยาลัยศรีนครินทรวิโรฒ.

ผจงจิต อินทสุวรรณ. (2525). Latent Trait Theory. วารสารการวัดผลการศึกษา, 3(3): 51-69.

พวงรัตน์ ทวีรัตน์. (2530). การสร้างและพัฒนาแบบทดสอบวัดผลสัมฤทธิ์. สำนักทดสอบทางการศึกษาและจิตวิทยา,มหาวิทยาลัยศรีนครินทรวิโรฒ.

พรรณี เจียมสุบุตร. (2543). การเปรียบเทียบความเชื่อมั่นของแบบทดสอบวัดความสามารถในการแก้โจทย์ปัญหาทางคณิตศาสตร์ ที่มีจำนวนผู้ตรวจและวิธีการตรวจต่างกัน. วิทยานิพนธ์ กศ.ด. (การทดสอบและวัดผลการศึกษา). กรุงเทพฯ: บัณฑิตวิทยาลัย มหาวิทยาลัยศรีนครินทรวิโรฒ. ถ่ายเอกสาร.

ศิริชัย กาญจนวาสี. (2555). ทฤษฎีการทดสอบแนวใหม่.พิมพ์ครั้ง 4. กรุงเทพฯ : สำนักพิมพ์แห่งจุฬาลงกรณ์มหาวิทยาลัย.

ศิริชัย กาญจนวาสี. (2556). ทฤษฎีการทดสอบแบบดั้งเดิม.พิมพ์ครั้ง 7.กรุงเทพฯ: สำนักพิมพ์แห่งจุฬาลงกรณ์มหาวิทยาลัย.

ศุกลรัตน์ อิงชาติเจริญ. (2557). การพัฒนาโมเดลคุณภาพการให้คะแนนระหว่างกลุ่มผู้ประเมินในวิชาที่มีการเรียนรู้โดยใช้ปัญหาเป็นฐาน: การประยุกต์ใช้โมเดลหลายองค์ประกอบของราสซ์. กรุงเทพฯ: บัณฑิตวิทยาลัย จุฬาลงกรณ์มหาวิทยาลัย.

อุษณี บัวศิริพันธ์. (2543). การเปรียบเทียบค่าสัมประสิทธิ์การสรุปอ้างอิงของแบบทดสอบวิชาคณิตศาสตร์ที่มี วิธีการตรวจ จำนวนผู้ตรวจและประสบการณ์ของผู้ประเมิน. วิทยานิพนธ์ กศ.ด. (การทดสอบและวัดผลการศึกษา). กรุงเทพฯ: บัณฑิตวิทยาลัย มหาวิทยาลัยศรีนครินทรวิโรฒ. ถ่ายเอกสาร.

อังคณา กุลนภาดล. (2557). การเปรียบเทียบค่าสัมประสิทธิ์การสรุปอ้างอิงของคะแนนผังมโนทัศน์วิชาการวิจัยทางการศึกษา เมื่อรูปแบบการตรวจและจำนวนผู้ตรวจต่างกัน.วารสารศึกษาศาสตร์ มหาวิทยาลัยบูรพา, 25(2).

Anderson, L. W., & Krathwohl, D. R. (2001). A taxonomy for learning, teaching, and assessing A revision of Bloom's taxonomy of educational objectives. New York: Addison Wesley Longman.

Brennan, R.L. (2001). Generalizability theory. New York: Springer.

Hopkins, C.D. & Antes, R.L. (1990). Classroom Measurement and Evaluation. 3rd Ed. Itasca, IL.

Iramaneerat, C., Yudkowsky, R., Myford, C. M., & Downing, S. M. (2008). Quality control of an OSCE using generalizability theory and many-faceted Rasch measurement. Advances in Health Sciences Education, 13(4), 479.

Linacre, J. M. (1994). Many-Facet Rasch Measurement. Chicago: MESA Press.

Linacre, J. M. (2014). FACETS (Version 3.71. 4) [Computer software]. Beaverton, Oregon: Winsteps.com

Wolfe, E. W, &. Myford, C. M. (2003). Detecting and measuring rater effects using many-facet Rasch measurement: Part I. Journal of applied measurement, 4(4), 386-422.

Mehrens, William A. & Lehmann, Irvin J.(1972). Measurement and Evaluation in Education and Psychology. New York : Holt, Rinehart and Winston.

Rui, Y. (2010). A Many-facet Rasch Analysis of Rater Effects on an Oral English Proficiency Test. Doctor of Philosophy. Purdue University West Lafayette, Indiana.

Saal, F. E., Downey, R. G., & Lahey, M. A. (1980). Rating the ratings: Assessing the psychometric quality of rating data. Psychological bulletin, 88(2), 413.

Smith, P. L. (1978). Sampling errors of variance components in small sample multifaceted generalizability studies. Journal of Educational Statistics, 3(4), 319-346.

Sudweeks, R. R., Reeve, S., & Bradshaw, W. S. (2004). A comparison of generalizability theory and many-facet Rasch measurement in an analysis of college sophomore writing. Assessing Writing, 9(3), 239-261.

Article Sidebar

Main Article Content

บทคัดย่อ

Article Details

References