طراحی و کاربرد روش سنجش انطباقی کامپیوتری برای اجرای آزمون تولیمو در سازمان سنجش آموزش کشور
نویسنده
چکیده مقاله:
سنجش مهارت زبان انگلیسی در ارزیابیهای خطیر به تعداد زیادی پرسش برای آزمونهایی بهشیوه مداد-کاغذی (P&P) نیاز دارد؛ زیرا هر سال افراد بسیاری در این نوع آزمونهای سرنوشتساز شرکت میکنند. هدف از اجرای این پژوهش، طراحی و کاربرد سنجش انطباقی کامپیوتری (CAT) بهعنوان گزینهای برای سنجش مهارت زبان انگلیسی در سازمان سنجش آموزش کشور بود. CAT برخلاف آزمونهای سنتی P&P که توالی گزینش پرسشها در آن ثابت و یکنواخت است، از یک شیوه گزینش سؤال بهینه و انطباقی استفاده میکند. CAT، برآورد توانایی موقت را بهطور بهینه مورد هدف قرار میدهد و به یک ملاک همگرایی مناسب برای برآورد توانایی میرسد و در نتیجه، به یک فرایند سنجش کوتاهتر، قابل اطمینانتر و کارآمدتر میرسد. مورد مطالعه مهارت زبان انگلیسی در مطالعه حاضر، آزمون تولیمو است. این پژوهش در دو مرحله اجرا شده است: در مرحله اول، نمونهای از اجراهای مداد-کاغذی آزمون تولیمو (دوره 114 تا 123)، انتخاب و سپس، سؤالها و توانایی آزمودنیها مدرجسازی شد. در مرحله دوم، CATهای بهینه شبیهسازی شده بهعنوان مبنایی برای ارزیابی صحت و کارایی CAT عملیاتی طراحی شدند. نتایج پژوهش نشان داد که برآورد پارامتر توانایی به روش بیشینه درستنمایی و ملاک توقف طول ثابت، بیشترین دقت در برآورد پارامتر توانایی آزمودنیها را ایجاد میکنند. همچنین، آزمون CAT تولیمو که بر اساس خزانه سؤال بهینه شبیهسازیشدند، نسبت به CAT عملیاتی که بر اساس خزانه سؤال موجود طراحی شده است، به سؤالهای کمتری نیاز دارد، درحالیکه به نتایج دقیقتری نسبت به CAT عملیاتی در برآورد پارامتر توانایی منجر میشود. بنابراین، باوجود مناسب بودن سؤالهای موجود در خزانه سؤال مدرجسازی شده آزمون تولیمو، طراحی سؤالهایی برای هدف اجرای آزمون به شیوه CAT، هم بهصرفهتر است و هم دقیقتر پارامتر توانایی را برآورد میکند. همچنین، نتایج این مطالعه نشان داد که آزمون تولیمو هم به شیوه CAT شبیهسازی شده و CAT عملیاتی طراحی شده به شکلی کارآتر و دقیقتر نسبت به تولیمو مداد-کاغذی عمل میکند. یافتههای این پژوهش، نشان میدهد که آزمون CAT تولیمو دارای پتانسیل بالایی در کارایی و دقت اندازهگیری توانایی زبان انگلیسی است.
منابع مشابه
طراحی خزانههای سؤال بهینه برای سنجش انطباقی کامپیوتری با در نظر گرفتن امنیت آزمون
سنجش انطباقی کامپیوتری به خزانه سؤالی نیاز دارد که به خوبی طراحی شده و برای ساخت آزمونهای مجزا، تعداد مناسبی سؤال داشته باشد. همچنین شامل سؤالهایی باشد که از لحاظ محتوایی متعادل باشد و هزینه ساخت آزمون را کاهش دهد. یکی از روشهای طراحی خزانه سؤال، روش رِکیس است، که در آن از روش مونتکارلو برای تعیین ویژگیهای یک خزانه سؤال بهینه استفاده میشود. در این پژوهش، از این روش برای طراحی خزانه...
متن کاملروش بهینه هموارسازی دادهها در همترازسازی: مورد مطالعه آزمون تولیمو و آزمونهای جامع کنکورهای آزمایشی سازمان سنجش آموزش کشور
این پژوهش با هدف یافتن بهترین روش هموارسازی داده ها در روشهای مختلف همترازسازی انجام شد. به این منظور از دادههای آزمون تولیمو و آزمونهای جامع کنکورهای آزمایشی شرکت تعاونی سازمان سنجش آموزش کشوردر سال 92-91 استفاده شد. برای تحلیل دادههای آزمونهای جامع کنکورهای آزمایشی شرکت تعاونی سازمان سنجش آموزش کشور صرفاً از سؤالات مشترک دروس عمومی رشتههای ریاضی- فیزیک، علوم تجربی و علوم انسانی استفاده شد. ...
متن کاملتعیین روش بهینه شناسایی کارکرد افتراقی در سنجش انطباقی کامپیوتری
زمینه: یکی از چالشهای اساسی گذر از آزمونهای مداد – کاغذی به انطباقی کامپیوتری عادلانه بودن است که ارزیابی آن در چارچوب کارکرد افتراقی ضرورتی اجتنابناپذیر میباشد. هدف: هدف مطالعه حاضر بررسی کارکرد افتراقی، ارزیابی عوامل مداخلهگر در میزان آشکارسازی و معرفی روش بهینه مطالعه کارکرد افتراقی در سنجش انطباقی کامپیوتری بود. روش: با توجه به مسئله پژوهش از روش تجربی استفاده شد. گردآوری دادهها و دست...
متن کاملتلفیق رویکرد ریکیسی و رویکرد برنامهنویسی ریاضی در طراحی خزانههای سؤال بهینه برای سنجش انطباقی کامپیوتری
سنجش انطباقی کامپیوتری (CAT) شیوهای از سنجش توانایی است که دقت برآورد توانایی را افزایش میدهد و بدون از دست دادن دقت اندازهگیری آزمون، طول آن را کاهش میدهد. با این وجود، سنجش انطباقی در صورتی خوب عمل میکند که، دارای خزانه سؤالی باشد که در آن تعداد کافی سؤال با کیفیت مناسب وجود داشته باشد. بسیاری از محققان خاطر نشان کردند که، برای ساخت خزانه سؤالی برای (CAT)، نه تنها اندازه خزانه سؤال مهم ...
متن کاملروش بهینه همترازسازی با توجه به ویژگی های بومی آزمونهای ملی ایران: مورد مطالعه آزمون تولیمو و آزمون های جامع کنکورهای آزمایشی سازمان سنجش آموزش کشور
هدف از انجام پژوهش حاضر ارزیابی روشهای همترازسازی نمره مشاهده شده کلاسیک و روش کرنل ke بر حسب خطاها و سوگیری و همچنین بررسی عواملی بود که می تواند بر صحت روشهای همترازسازی متفاوت تأثیر داشته باشد. این پژوهش به طور دقیق تر با هدف بررسی و کاوش سودمندی و مناسب بودن روش ke (با شیوه های مختلف هموارسازیchain و poststratification) و همچنین مزایا و معایب این روش در مقایسه با تکنیک های همترازسازی کلاسیک...
15 صفحه اولتعیین مقایسهپذیری برآورد پارامتر توانایی در سنجش انطباقی کامپیوتری و مداد-کاغذی
هدف مطالعه حاضر تعیین مقایسهپذیری برآورد پارامتر توانایی در سنجش انطباقی کامپیوتری و مداد – کاغذی و تعیین الگوریتم بهینه آزمون انطباقی کامپیوتری بر اساس روشهای مختلف برآورد توانایی (بیشینه درستنمایی و پسین مورد انتظار) و ملاک خاتمه آزمون (خطای استاندارد ثابت و طول ثابت آزمون) در آزمونهای خطیر بود. جامعه پژوهش شامل تمامی شرکتکنندگان آزمون سراسری گروه آزمایشی علوم ریاضی و فنی سال 1392 بود که...
متن کاملمنابع من
با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید
ذخیره در منابع من قبلا به منابع من ذحیره شده{@ msg_add @}
عنوان ژورنال
دوره 10 شماره 29
صفحات 61- 144
تاریخ انتشار 2020-05-21
با دنبال کردن یک ژورنال هنگامی که شماره جدید این ژورنال منتشر می شود به شما از طریق ایمیل اطلاع داده می شود.
میزبانی شده توسط پلتفرم ابری doprax.com
copyright © 2015-2023