การเปรียบเทียบการทำหน้าที่ต่างกันของข้อสอบ ด้วยวิธี IRT-likelihood ratio วิธี Bayesian และ วิธี Multiple group CFA

ผู้แต่ง

  • เพ็ญศรี เทียมสุข สาขาวิจัย วัดผล และสถิติการศึกษา มหาวิทยาลัยบูรพา
  • เชษฐ์ ศิริสวัสดิ์ สาขาวิจัย วัดผล และสถิติการศึกษา มหาวิทยาลัยบูรพา
  • ไพรัตน์ วงษ์นาม สาขาวิจัย วัดผล และสถิติการศึกษา มหาวิทยาลัยบูรพา

คำสำคัญ:

การทำหน้าที่ต่างกันของข้อสอบ, วิธีอัตราส่วนความควรจะเป็น, วิธีเบส์เซียน, วิธีองค์ประกอบเชิง, ยืนยันกลุ่มพหุ

บทคัดย่อ

การวิจัยครั้งนี้มีวัตถุประสงค์1) เพื่อศึกษาความสัมพันธ์ระหว่างผลการประมาณค่าพารามิเตอร์อำนาจ จำแนกของข้อสอบ (a) ค่าพารามิเตอร์ความยากของข้อสอบ (b) ค่าพารามิเตอร์ความสามารถของผู้สอบ (q) ด้วยวิธีMaximum likelihood วิธีBayesian และวิธีConfirmatory factor analysis 2) เพื่อเปรียบเทียบ การทำหน้าที่ต่างกันของข้อสอบใช้กับนักเรียนจำแนกตามเพศและสถานที่ตั้งทางภูมิศาสตร์ของโรงเรียน ด้วยวิธี IRT-likelihood ratioวิธีBayesian และวิธีMultiple group CFA กลุ่มตัวอย่างเป็นนักเรียนชั้นมัธยมศึกษา ปีที่ 6 ที่เข้าทดสอบวัดผลสัมฤทธิ์ทางการเรียนเพื่อประเมินคุณภาพการศึกษาระดับชาติปีการศึกษา 2558 โดยการสุ่มแบบหลายขั้นตอน (Multi-StageSampling)จำนวน 2,400คน จำแนกเป็นเพศชายและเพศหญิง ที่อยู่ในเขตกรุงเทพมหานคร และปริมณฑล และนอกเขตกรุงเทพมหานคร และปริมณฑล ผลการวิจัย พบว่า 1)ผลการประมาณค่าพารามิเตอร์อำนาจจำแนกของข้อสอบวิชาคณิตศาสตร์และภาษาไทยทั้งสามวิธีมีความ สัมพันธ์ทางบวกในระดับสูงมากอย่างมีนัยสำคัญทางสถิติที่ระดับ 0.05 ผลการประมาณค่าพารามิเตอร์ความ ยากของข้อสอบวิชาคณิตศาสตร์พบว่า วิธีMaximum likelihood และวิธีConfirmatory factor analysis มีความสัมพันธ์ทางบวกในระดับสูงมากอย่างมีนัยสำคัญทางสถิติที่ระดับ 0.05วิธีBayesian มีความสัมพันธ์ทาง บวกในระดับปานกลางค่อนข้างน้อยกับวิธีMaximum likelihood และวิธีConfirmatory factor analysis อย่างมีนัยสำคัญทางสถิติที่ระดับ 0.05 ผลการประมาณค่าพารามิเตอร์ความยากของข้อสอบวิชาภาษาไทย พบว่า ทั้งสามวิธีมีความสัมพันธ์ทางบวกในระดับสูงมากอย่างมีนัยสำคัญทางสถิติที่ระดับ 0.05ผลการประมาณ ค่าพารามิเตอร์ความสามารถของผู้สอบวิชาคณิตศาสตร์และวิชาภาษาไทย พบว่า ทั้งสามวิธีมีความสัมพันธ์ ทางบวกในระดับสูงมาก และมีนัยสำคัญทางสถิติที่ระดับ 0.05 2) วิธีการตรวจสอบการทำหน้าที่ต่างกันของ ข้อสอบวิชาคณิตศาสตร์เมื่อจำแนกตามเพศ พบว่าวิธีBayesianตรวจพบการทำหน้าที่ต่างกันของข้อสอบมาก ที่สุด และวิธีIRT-likelihood ratio ตรวจพบการทำหน้าที่ต่างกันของข้อสอบน้อยที่สุด เมื่อจำแนกตามเขต
ที่ตั้งทางภูมิศาสตร์ของโรงเรียน พบว่าวิธีMultiplegroup CFA ตรวจพบการทำหน้าที่ต่างกันของข้อสอบมากที่สุด และวิธีIRT-likelihood ratio ตรวจพบการทำหน้าที่ต่างกันของข้อสอบน้อยที่สุด ส่วนการทำหน้าที่ต่างกันของข้อสอบวิชาภาษาไทยเมื่อจำแนกตามเพศและที่ตั้งทางภูมิศาสตร์ของโรงเรียน พบว่าวิธีBayesian ตรวจพบการทำหน้าที่ต่างกันของข้อสอบมากที่สุด และวิธีMultiple group CFA ไม่พบการทำหน้าที่ต่างกันของข้อสอบเลย

References

เกียรติเทพ ตั้งสันติถาวร. (2548). การเปรียบเทียบการประมาณค่าพารามิเตอร์ด้วยวิธีเบส์กับวิธีวิเคราะห์
ความถดถอยแบบสองชั้นกำลังสองน้อยสุด. วิทยานิพนธ์สถิติศาสตรมหาบัณฑิต สาขาวิชาสถิติ
บัณฑิตวิทยาลัย จุฬาลงกรณ์มหาวิทยาลัย.

ชัยวิชิต เชียรชนะ. (2552). การวิเคราะห์พหุมิติ(Multidimensional Analysis). วารสารศึกษาศาสตร์
มหาวิทยาลัยขอนแก่น. 32(4), หน้า 13-22.

ชินภัทร ภูมิรัตน์. (2554). สพฐ. ตีปี๊บใช้ O-NET รับ นร.ปีหน้าโยนข้อสอบมีจุดอ่อนทำเด็กมึน. ค้นเมื่อ 10
มกราคม 2560, จาก http://www.manager.co.th/QOL/ViewNews.aspx? NewsID =
9540000045848

ณัฎฐปิญชาน์ พิชญาชมชื่น (2558). ผลการจัดกิจกรรมการเรียนรู้แบบอุปนัยที่มีต่อมโนทัศน์ทางคณิตศาสตร์
และความสามารถในการให้เหตุผลทางคณิตศาสตร์ของนักเรียนชั้นมัธยมศึกษาปีที่ 4. วารสาร
มหาวิทยาลัยศิลปากร ฉบับภาษาไทย สาขามนุษยศาสตร์สังคมศาสตร์ และศิลปะ. 8(2),
หน้า 76-91.

นงลักษณ์ วิรัชชัย. (2542). โมเดลลิสเรล : สถิติวิเคราะห์สำหรับการวิจัย. กรุงเทพมหานคร : โรงพิมพ์แห่ง
จุฬาลงกรณ์มหาวิทยาลัย.

นวลแสง สูคีรี. (2560). โมเดลความสัมพันธ์เชิงสาเหตุของปัจจัยที่ส่งผลต่อประสิทธิภาพทางวิชาการของโรงเรียน
มัธยมศึกษาในจังหวัดภาคใต้. วารสารมหาวิทยาลัยราชภัฏธนบุรี. 11(1), หน้า 75-90.

ปรางค์ทิพย์ รัชตะปิติ. (2550). การเปรียบเทียบการประมาณค่าพารามิเตอร์ด้วยวิธีเบส์กับวิธีวิเคราะห์
ความถดถอยพหุคูณแบบกำลังสองน้อยสุดสองชั้น. วิทยานิพนธ์สถิติศาสตรมหาบัณฑิต
สาขาวิชาสถิติบัณฑิตวิทยาลัย จุฬาลงกรณ์มหาวิทยาลัย.

ศาสตริยา ฉ่ำสมัย (2548). การศึกษาเปรียบเทียบการอนุมานค่าเฉลี่ยของประชากรระหว่างวิธีการแบบ
ภาวะน่าจะเป็นและวิธีการแบบเบส์เซียน. วิทยานิพนธ์วิทยาศาสตรมหาบัณฑิต สาขาสถิติ
บัณฑิตวิทยาลัย มหาวิทยาลัยเกษตรศาสตร์.

สุพัฒนา หอมบุปผา. (2556).การเปรียบเทียบการท�ำหน้าที่ต่างกันของข้อสอบ ด้วยวิธี HGLM วิธี MIMIC
และวิธี BAYESIAN. วิทยานิพนธ์ปรัชญาดุษฎีบัณฑิต สาขาวิจัย วัดผลและสถิติการศึกษา
คณะศึกษาศาสตร์มหาวิทยาลัยบูรพา.

สุภมาศ อังศุโชติ,สมถวิลวิ จิตรวรรณา และรัชนีกูล ภิญโญภานุวัฒน์. (2554). สถิติวิเคราะห์สำหรับการวิจัย
ทางสังคมศาสตร์และพฤติกรรมศาสตร์ : เทคนิคการใช้โปรแกรม LISREL. พิมพ์ครั้งที่ 3.
กรุงเทพมหานคร : เจริญดีมั่นคงการพิมพ์.
สุวภัทร์ทัพซ้าย. (2557). ผลของการใช้เทคนิคการสอน PMI ต่อความสามารถในการคิดอย่างมีวิจารณญาณ
วิชาภาษาไทยของนักเรียนชั้นมัธยมศึกษาปีที่ 3 โรงเรียนบ้านเหล่าจั่น หนองทุ่ม จังหวัดร้อยเอ็ด.
วารสารมหาวิทยาลัยราชภัฏธนบุรี. 8(2), หน้า 56-68.
สุวิมล ติรกานันท์. (2553). การวิเคราะห์ตัวแปรพหุในงานวิจัยทางสังคมศาสตร์. กรุงเทพมหานคร :
โรงพิมพ์แห่งจุฬาลงกรณ์มหาวิทยาลัย.
อริสฬาเตหลิ่ม. (2559).การเปรียบเทียบประสิทธิผลการประมาณค่าพารามิเตอร์และการทาหน้าที่ต่างกัน ํ
ของข้อสอบด้วยวิธีแมกซิมัมไลค์ลิฮูด วิธีของเบส์และวิธีของเบส์แบบมีอิทธิพลเทสต์เลท.
วิทยานิพนธ์ปรัชญาดุษฎีบัณฑิต สาขาวิจัย วัดผลและสถิติการศึกษา คณะศึกษาศาสตร์
มหาวิทยาลัยบูรพา.

Morizot, J., Ainsworth, A.T., & Reise, S. (2007). Toward modern psychometrics : Applicationof
item response theory models. In Robins, R.W., Fraley, R.C., & Krueger, R.F. (eds.).
Handbook of Research Methods in Personality Psychology. (pp. 407-423).
New York : Guilford Press.

Muthen, B., (1988). Some uses of structural equation modeling in validity studies :
Extending IRT to external variables.Retrieved January11,2017, fromhttp://psycnet.
apa.org/record/1988-97024-013.

Muthén, B., & Lehman, J. (1985). Multiple group IRT modeling : Applications to item bias
analysis. Journal of Educational Statistics. 10(2), pp. 133-142.

Muthén, B. O., Kao, C. F., & Burstein, L. (1991). Instructionally sensitive psychometrics :
Application of a new IRT-based detection technique to mathematics achievement
test items. Journal of Educational Measurement. 28(1), pp. 1-22.

Downloads