การพัฒนาเครื่องมือประเมินทักษะกระบวนการวิทยาศาสตร์ด้วยวิธีสร้างโมเดลภาวะสันนิษฐาน
Main Article Content
บทคัดย่อ
การวิจัยนี้มีวัตถุประสงค์หลักเพื่อพัฒนาเครื่องมือประเมินทักษะกระบวนการวิทยาศาสตร์แบบพหุมิติ สำหรับเนื้อหาปริมาณสัมพันธ์ ระดับมัธยมศึกษาปีที่ 5 มีวัตถุประสงค์ย่อย คือ 1) เพื่อพัฒนาแผนที่ภาวะสันนิษฐานทักษะกระบวนทางวิทยาศาสตร์ และ 2) เพื่อสร้างและตรวจสอบคุณภาพของเครื่องมือประเมินทักษะดังกล่าว กลุ่มตัวอย่าง คือ นักเรียนระดับชั้นมัธยมศึกษาปีที่ 5 ปีการศึกษา 2561 จำนวน 1,200 คน สังกัดสำนักงานเขตพื้นที่การศึกษามัธยมศึกษา ภาคตะวันออกเฉียงเหนือ เครื่องมือประเมินพัฒนาด้วยวิธีการสร้างโมเดลภาวะสันนิษฐาน มี 4 ขั้นตอน คือ 1) การพัฒนาแผนที่ภาวะสันนิษฐานทักษะกระบวนการทางวิทยาศาสตร์แบบพหุมิติ 2) การออกแบบข้อคำถาม 3) การให้คะแนนคำตอบ และ 4) การวิเคราะห์ข้อมูลตามโมเดลสัมประสิทธิ์สุ่มสำหรับข้อมูลหลายค่าที่มาจากการวัดหลายมิติ ด้วยโปรแกรม conquest ผลการวิจัยปรากฏดังนี้
1) แผนที่ภาวะสันนิษฐานทักษะกระบวนการทางวิทยาศาสตร์ มี 2 ด้าน คือ ด้านทักษะการพยากรณ์ มี 4 ระดับ ตั้งแต่ระดับต่ำสุด คือ นักเรียนรู้การเกิดปฏิกิริยาแต่ไม่สามารถตอบหรืออธิบายการเกิดปฏิกิริยาได้ถูกต้อง ไปยังระดับสูงสุด คือ ให้เหตุผลและบอกความแตกต่างของปฏิกิริยา และนำความรู้เรื่องอัตราการเกิดปฏิกิริยาไปใช้กับได้สอดคล้องกับบริบทจริง และด้านทักษะการจัดกระทำและสื่อความหมายของข้อมูล มี 4 ระดับ ตั้งแต่ระดับต่ำสุด คือ นักเรียนมีความรู้บอกได้ว่า อัตราการเกิดปฏิกิริยาเปลี่ยนตามพื้นที่ผิว แต่บอกไม่ได้ว่าสารตั้งต้นที่ทำปฏิกิริยากับหินปูนคือสารใด ไปจนถึงระดับสูงสุด คือ นักเรียนสามารถนำความรู้พื้นฐานทางวิทยาศาสตร์กระบวนการคิดมาประยุกต์ใช้เพื่อแสดงวิธีคำนวณหาปริมาณไฮโดรเจนไอออนที่ทำปฏิกิริยากับหินปูนได้และบอกอุณหภูมิที่มีผลต่อปฏิกิริยาได้
2) เครื่องมือประเมินทักษะกระบวนการทางวิทยาศาสตร์ มีทั้งหมด 15 ข้อ เป็นข้อคำถามปลายเปิด และตรวจให้คะแนนคำตอบหลายค่า ตั้งแต่ 0 ถึง 3 คะแนน ตามระดับทักษะในแผนที่ภาวะสันนิษฐานที่พัฒนาขึ้น มีข้อคำถามด้านการพยากรณ์ จำนวน 8 ข้อ และด้านการจัดกระทำและสื่อความหมายของข้อมูล จำนวน 7 ข้อ
3) ผลการตรวจสอบความตรงของผลการประเมินทักษะกระบวนการทางวิทยาศาสตร์ ด้านหลักฐานความตรงของเนื้อหาของข้อคำถาม พบว่า ข้อคำถามมีค่าความยากครอบคลุมช่วงความสามารถของนักเรียน นั่นคือ เนื้อหาของข้อคำถามเป็นนิยามของทักษะกระบวนทางวิทยาศาสตร์ของนักเรียน ด้านหลักฐานความตรงเกี่ยวกับกระบวนการตอบสนอง พบว่า นักเรียนเข้าใจเนื้อหาของข้อคำถาม ตรงกับความตั้งใจของผู้สร้าง ข้อคำถาม และด้านหลักฐานเกี่ยวกับโครงสร้างภายใน พบว่า ข้อคำถามสามารถนำไปใช้วัดทักษะกระบวนการรายด้านได้ (Infit MNSQ ระหว่าง 0.81 ถึง 1.11) โดยโมเดลพหุมิติสอดคล้องกลมกลืนกับข้อมูลคำตอบอย่างมีนัยสำคัญทางสถิติ (=332.48, df =2, p < .01) และมีค่า AIC และ BIC ต่ำกว่าโมเดลเอกมิติ เครื่องมือประเมินด้านการพยากรณ์และด้านการจัดกระทำและสื่อความหมายของข้อมูล มีค่าความเที่ยงแบบ EAP/PV เท่ากับ 0.78 และ 0.70 ตามลำดับ ซึ่งอยู่ในเกณฑ์ที่ยอมรับได้ และมีความคลาดเคลื่อนมาตรฐานในการวัดต่ำ
Article Details
เนื้อหาและข้อมูลในบทความที่ลงตีพิมพ์ในวารสารการวัดผลการศึกษา มหาวิทยาลัยมหาสารคาม ถือเป็นข้อคิดเห็นและความรับผิดชอบของผู้เขียนบทความโดยตรง ซึ่งกองบรรณาธิการวารสาร ไม่จำเป็นต้องเห็นด้วย หรือร่วมรับผิดชอบใดๆ
บทความ ข้อมูล เนื้อหา รูปภาพ ฯลฯ ที่ได้รับการตีพิมพ์ในวารสารการวัดผลการศึกษา มหาวิทยาลัยมหาสารคาม ถือเป็นลิขสิทธิ์ของวารสารการวัดผลการศึกษา มหาวิทยาลัยมหาสารคาม หากบุคคลหรือหน่วยงานใดต้องการนำทั้งหมดหรือส่วนใดส่วนหนึ่งไปเผยแพร่ต่อหรือกระทำการใดๆ จะต้องได้รับอนุญาตเป็นลายลักษณ์อักษรจากวารสารการวัดผลการศึกษา มหาวิทยาลัยมหาสารคาม ก่อนเท่านั้น
เอกสารอ้างอิง
กระทรวงศึกษาธิการ. (2551). หลักสูตรแกนกลางการศึกษาขั้นพื้นฐาน พุทธศักราช 2551. กรุงเทพมหานคร: โรงพิมพ์คุรุสภาลาดพร้าว.
พนิดา กระทุ่มนอก และ พัชรี จันทร์เพ็ง. (2560). ความก้าวหน้าในการเรียนรู้มโนมติทางวิทยาศาสตร์ของ นักเรียน ระดับชั้นมัธยมศึกษาปีที่ 4 เรื่อง รูปร่างโมเลกุลโควาเลนต์. ขอนแก่น: มหาวิทยาลัยขอนแก่น.
พัชรี จันทร์เพ็ง. (2561). การประยุกต์ทฤษฎีการตอบสนองข้อสอบแบบพหุมิติเพื่อการวิจัย. ขอนแก่น: โรงพิมพ์มหาวิทยาลัยขอนแก่น.
วีรภัทร์ สุขศิริ และ ชนม์ชกรณ์ วรอินทร์. (2559). การตรวจคะแนนจุดตัดขั้นต้นสำหรับกลุ่มสาระการเรียนรู้ วิทยาศาสตร์จากคะแนนสอบระดับชาติขั้นพื้นฐานด้วยวิธีทำแผนที่ความสามารถแฝงเชิงประจักษ์: การวิเคราะห์เพื่อการตัดสิน. กรุงเทพมหานคร: สถาบันทดสอบทางการศึกษาแห่งชาติ.
สำนักวิชาการและมาตรฐานการศึกษา. (2551). ตัวชี้วัดและสาระการเรียนรู้แกนกลาง กลุ่มสาระการเรียนรู้ วิทยาศาสตร์ ตามหลักสูตรแกนกลางการศึกษาขั้นพื้นฐาน พุทธศักราช 2551. กรุงเทพมหานคร: โรง พิมพ์ชุมนุมสหกรณ์การเกษตรแห่งประเทศไทย
Adams, R. J. (2005). Reliability as a measurement design effect. Studies in Educational Evaluation, 31, 162-172.
Adams, R. J., & Khoo, S. T. (1996). Quest. Melbourne, Australia: Australian Council for Educational Research.
Adams, R. J., Wilson, M., & Wang, W. C. (1997). The multidimensional random coefficients multinomial logit model. Applied Psychological Measurement, 21(1), 1-23
Akaike, H. (1974). A new look at the statistical model identification. IEEE Transaction on Automatic Control, 19(6), 716-723.
American Educational Research Association, American Psychological Association, & Nation Council on Measurement in Education. (2014). Standards for education and psychological testing. Washington, DC: American Educational Research Association.
American Association for the Advancement of Science. (1993). American Association for the Advancement of Science Project 2061: Science for all Americans. Washington, DC: American Association for the Advancement of Science
Arantika, J., Saputro, S., & Mulyani, S. (2019). Effectiveness of guided inquiry-based module to improve science process skills. Journal of Physics: Conference Series, 1157(4).
Azizah, N., Ibrahim, M., & Widodo, W. (2017). Process skill assessment instrument: Innovation to measure student’s learning result holistically. Journal of Physics Conference, 947(1).
Chiappetta, E. L., & Koballa, T. R. (2002). Science instruction in the middle and secondary schools. Upper Saddle River, NJ: Merrill/Prentice Hall.
Cizek, G. J. (2012). Defining and distinguishing validity: Interpretations of score meaning and justifications of test use. Psychological Methods, 17(1), 31.
DeMars, C. (2010). Item response theory: Understanding statistics measurement. Oxford: Oxford University Press.
Junpeng, P., Inprasitha, M., & Wilson, M. (2018). Modelling of the open-ended items for assessing multiple proficiencies in mathematical problem solving. The Turkish Online Journal of Educational Technology (TOJET), 17.
Linacre, J. M. (1994). Sample size and item calibration [or person measure] stability. Rasch Measurement Transactions, 7(4), 328.
Linacre, J. M. (1998). Many-facet Rasch measurement. Chicago: MESA Press.
Ongowo, R. O., & Indoshi, F. C. (2013). Science process skills in the Kenya certificate of secondary education biology practical examinations. Creative Education, 11(4), 713-717.
Ozgelen, S. (2012). Scientists’ science process skills within a cognitive domain framework. Eurasia Journal of Mathematics, Science & Technology Education, 8, 283-292.
Padilla, M. J. (1990). The science process skills: Research matters to the science teacher. Reston, VA: National Association for Research in Science Teaching. http://www.narst. org/publications/research/skill.cfm
Rambuda, A. M., & Fraser, W. J. (2004). Perceptions of teachers of the application of science process skills in teaching geography in secondary schools in the free state province in South African. Journal of Education, 24, 10-17.
Rasch, G. (1980). Probabilistic models for some intelligence and attainment tests. Chicago: University of Chicago Press. (Original work published 1960).
Sass D. A., Schmitt T. A., & Walker C. M. (2008). Estimating non-normal latent trait distributions with item response theory using true and estimated item parameters. Applied Measurement in Education, 21, 65-88.
Schwarz, G. (1978). Estimating the Dimension of a Model. The Annals of Statistics, 6(2), 461-464.
Webb, N. (1997). Criteria for alignment of expectations and assessments on mathematics and science education. Washington, DC: CCSSO
Wilson, M. (2005). Constructing measures: An item response modeling approach. Mahwah, NJ: Routledge.
Wilson, M., & Draney, K. (2002). A technique for setting standards and maintaining them over the time. In S. Nishisato, Y. Baba, H. Bozdogan, & K. Kanefugi (Eds.), Measurement and multivariate analysis (pp. 325-332). New York, NY: SpringVerlag
Wu, M. L., Adams, R. J., Wilson, M. R., & Haldane, S. A. (2007). ACER ConQuest: Generalised Item Response Modelling Software [Computer software]. Version 2. Camberwell, Victoria: Australian Council for Educational Research.
Wright, B. D., & Stone, M. H. (1979). Best test design. Chicago, IL: Mesa Press.