خانه بانک اطلاعات پایان‌نامه‌ها

پایان‌نامه‌ها - سنجش علمی

-
تاریخ درج : 1397/11/23    تاریخ بروز رسانی :1397/11/27    تعداد بازدید:125

1

علامه طباطبائی

تدوین الگوی بهینه وزن‌دهی و نمره‌گذاری سوابق تحصیلی داوطلبان ورود به دانشگاه‌ها و مراکز آموزش عالی کشور

دکتری تخصصی

میثم صادقی جوجیلی

محمدرضا فلسفی نژاد، علی دلاور

نورعلی فرخی، احسان جمالی

1396

 • چکیده
  • هدف پژوهش حاضر شناسایی وزن هر یک از دروس سوابق تحصیلی و نمره کل‌سازی بر اساس رویکردهای روان‌سنجی تحلیل عاملی و مدل پیوسته IRT و رویکردهای مبتنی بر نظر متخصصان تاپسیس و AHP، و همچنین بررسی کارایی و اعتبار روش‌های وزن دهی و نمره کل سازی سوابق تحصیلی به منظور تدوین الگوی بهینه وزن‌دهی و نمره کل‌سازی سوابق تحصیلی بود. برای اجرای پژوهش در فاز اول 11 درس سوابق تحصیلی با در نظر گرفتن دو ملاک مرتبط بودن و پیش نیاز بودن از گروه مرجع مورد نظر خواهی قرار گرفت و با استفاده از تکنیک‌های تاپسیس و AHP وزن‌دهی و اولویت‌بندی شد. در فاز دوم ابتدا نمرات دروس نهایی سال سوم متوسطه داوطلبان و پذیرفته‌شدگان رشته‌های روان‌شناسی و مشاوره در دانشگاه‌های سراسر کشور در گروه علوم انسانی از سازمان سنجش آموزش کشور دریافت شد و جهت برآورد وزن‌های استاندارد در قالب روش تحلیل عاملی و نیز محاسبه نمرات تتا در قالب مدل پیوسته پرسش پاسخ استفاده شد. در فاز سوم و به منظور مقایسه مدل‌های مختلف وزن‌دهی و نمره کل‌سازی، ابتدا گروه نمونه براساس نمرات حاصل از هر چهار رویکرد رتبه‌بندی شده، و از لحاظ شاخص‌های پراکندگی و میزان تفاوت رتبه‌ها مقایسه شد. همچنین براساس روش مؤنت کارلو، سوابق داوطلبان به همراه معدل دانشگاه براساس میزان همبستگی گزارش شده در پژوهش‌های قبلی و در دانشگاه علامه طباطبایی، شبیه‌سازی شده و به همراه نمره روان‌شناسی کنکور داوطلبان، بررسی شد که رتبه‌های بدست آمده از وزن‌های اعمال شده کدام رویکرد وزن‌دهی، در پیش بینی معدل دانشگاه بیشترین روایی را دارد. نتایج مقایسه نتایج حاصل از چهار رویکرد نشان داد از بین چهار روش بیشترین واریانس مربوط به روش نمره کل‌سازی با مدل پیوسته IRT و کمترین پراکندگی مربوط به نمره کل‌سازی براساس وزن‌های بدست آمده از روش تحلیل عاملی است. نتایج تحلیل آماری مبنی بر آزمون ویل کاکسون جهت مقایسه متوسط رتبه‌ها نشان داد در حجم نمونه کم روش وزن‌دهی به هر چهار روش نسبت به روش وزن‌های یکسان تفاوت معنادار در رتبه‌ها ایجاد می‌کند و بنابراین مدل وزن‌دهی در رتبه‌بندی داوطلبان در حجم نمونه کم تأثیر می‌گذارد. اما بین چهار مدل وزن‌دهی تفاوت معناداری در رتبه‌بندی داوطلبان مشاهده نمی‌شود. همچنین نتایج نشان داد در حجم نمونه بالا (2000 نفر) روش وزن‌دهی به هر چهار روش نسبت به روش وزن‌های یکسان تفاوت معنادار در رتبه‌ها ایجاد می‌کند و مدل وزن‌دهی در رتبه بندی داوطلبان ورود به دانشگاه تأثیر می‌گذارد. به علاوه نتایج نشان داد از بین سه مدل استفاده شده، مدل پیوسته IRT نسبت به سه روش دیگر در رتبه‌بندی داوطلبان تأثیر متفاوتی می‌گذارد ولی سه روش دیگر تفاوت معناداری در رتبه‌بندی داوطلبان ندارند. همچنین نتایج تحلیل داده‌ها نشان داد نمرات بدست آمده از مدل پیوسته IRT بیشترین همبستگی را با معدل دانشگاه و نمره روان‌شناسی کنکور دارند و بنابراین نسبت به سه مدل دیگر وزن‌دهی و نمره کل‌سازی بالاترین کارایی را در پیش‌بینی معدل دانشگاه و نمره روان‌شناسی کنکور دارد.

2

خوارزمی

کاربرد و مقایسه مدل طبقه پنهان چند بعدی مبتنی بر نظریه پاسخ سؤال (LCMIRT) درمطالعه بُعدیت و خوشه‌بندی سؤال‌های آزمون‌های سرنوشت‌ساز: مطالعه موردی درس ریاضی کنکور سراسری ریاضی فیزیک

کارشناسی ارشد

ریحانه رضازاده

مسعود گرامی‌پور

مریم مقدسین

1396

 • چکیده
  • این پژوهش بر آن است تا در راستای مطالعه ابعاد آزمون و مقایسه مدل‌های روان‌سنجی که از مهمترین موضوعات در حوزه اندازه‌گیری است. مهارت ریاضی که شامل چندین دامنه محتوا و فرایند مختلف است را با استفاده از مدل چند بعدی طبقه پنهان پاسخ سؤال مورد بررسی و واکاوی قرار دهد. بدین منظور از داده‌های آزمون ریاضی کنکور سراسری که در سال‌های 87، 90 و 94 اجرا شدند، استفاده شد. ابتدا از داده‌های هر آزمون یک نمونه تصادفی ساده 5000 نفری انتخاب شد و مطالعه بر روی تعداد ابعاد بر اساس روش تحلیل موازی، مدل چند بعدی طبقه پنهان پاسخ سؤال و مدل چند بعدی پاسخ سؤال برای هر یک از خرده آزمون‌های هندسه و جبر انجام شد و با بررسی و مقایسه نتایج تحلیل‌ها برای هر یک از مدل‌ها، ابعاد هر یک از خرده آزمون‌ها نیز مشخص شد و تحلیل داده  نشان داد که: 1) آزمون استاندارد کنکور به‌ عنوان مهم‌ترین شاخص ارزیابی دوره متوسطه و از تعیین‌کننده‌ترین عوامل برای ورود به دانشگاه‌ها مجموعه‌ای از ویژگی‌های پنهان در ساختار، نهفته است که ذاتاً چند بعدی هستند و چندین سازه یا بعد را اندازه‌گیری می‌کند. 2) خرده آزمون‌های مورد پژوهش با استفاده از تحلیل‌های مختلف، با مدل تک بعدی برازش ندارند و در حضور ابعاد بیشتر برازش آنها به صورت معناداری تأمین می‌شود. 3) پژوهش حاضر حوزه‌های شناختی درک ، حل مسئله ، استدلال را سه سازه اصلی درگیر در توانایی ریاضی شناسایی کرده‌اند. 4) درکنار بعد شناختی، بعد محتوایی سؤالات نیز اهمیت به سزایی دارد این موضوع که برخی از محتواهای آموزشی برای طرح سؤالات در تشخیص ابعاد شناختی مختلف مناسب هستند نیز باید مورد توجه قرار گیرد .5) به طور کلی مدل چند بعدی طبقه پنهان پاسخ سؤال در خوشه‌بندی و تحلیل سؤالات اطلاعات دقیق‌تری از کیفیت سؤال‌ها در اختیار پژوهشگر قرار می‌دهد و همین عامل باعث افزایش تعداد زیر خوشه‌های آن نسبت به مدل چند بعدی پاسخ سؤال است و این در حالی است که شاخص‌های برازش در همه خرده آزمون‌های پژوهش به صورت معناداری با مدل چند بعدی برازش بهتری دارند.

3

تربیت دبیر شهید رجایی

ارزیابی سؤالات شیمی آزمون سراسری (کنکور) سال 1395 با استفاده از نظریه سؤال پاسخ

کارشناسی ارشد

ناهید درویش

علیرضا کرمی گزافی

---

1396

 • چکیده
  • هدف پژوهش حاضر، ارزشیابی سؤالات شیمی آزمون سراسری (کنکور) سال 1395 با استفاده از نظریه سؤال پاسخ می‌باشد. از مجموع داوطلبان شرکت‌کننده در کنکور ریاضی فیزیک، یک گروه نمونه 3000 نفری به طور تصادفی انتخاب گردید. سؤالات براساس نظریه کلاسیک مورد بررسی قرار گرفت و نتایج حاصل بیانگر ضریب دشواری، ضریب تمیز و ضریب پایایی بود. بر طبق نظریه سؤال پاسخ، ابتدا مفروضه‌های اولیه این نظریه (تک بعدی بودن و استقلال موضعی) با استفاده از نرم افزار NOHARM بررسی گردید که هر دو مفروضه برای این درس برقرار بود. سپس برای برآورد پارامترهای سؤال (دشواری، تشخیص و حدس) و توانایی بر حسب مدل‌های جدید اندازه‌گیری از نرم افزار رایانه‌ای BILOG-MG استفاده شد و سؤالاتی که به نحوی با آزمون هماهنگی نداشتند، به منظور حذف از مجموعه سؤالات معرفی شدند. سپس منحنی ویژگی سؤال، تابع آگاهی سؤال، تابع آگاهی آزمون و منحنی خطای استاندارد آزمون از طریق این نرم افزار ترسیم گردید. نتایج به دست آمده با استفاده از نظریه کلاسیک نشان داد که 34 سؤال از 35 سؤال بخش شیمی در این آزمون، دشوار می‌باشند. همچنین از نظر جداسازی آزمودنی‌های قوی و ضعیف از یکدیگر (ضریب تمیز) 9 سؤال ناکارآمد محسوب شد. بر طبق نظریه سؤال پاسخ، داده‌ها با مدل دو پارامتری برازش مناسبی داشته‌اند که نشان دهنده ضعیف بودن عامل حدس در این آزمون است. اکثر سؤالات دشوار است و از نظر ضریب تشخیص تمامی سؤالات مناسب هستند. همچنین بیشترین میزان آگاهی سؤالات در فاصله توانایی 0/8 تا 3 قرار گرفته است و بهترین کارکرد آزمون با کمترین میزان خظا برای افراد با این میزان توانایی است.

4

تربیت مدرس

آسیب‌شناسی سؤال‌های درس بلاغت در آزمون‌های ورودی مقطع کارشناسی ارشد در گروه زبان و ادبیات عربی در دانشگاه‌های دولتی ایران

کارشناسی ارشد

زمان عیدی

کبری روشنفکر

روح الله رحمتیان

1396

 • چکیده
  • بلاغت به دلیل مباحث زیباشناختی به عنوان یکی از دروس مهم در رشته زبان و ادبیات عربی همواره مورد توجه بوده است و در آزمون کارشناسی ارشد یکی از دروس تأثیرگذار در پذیرش دانشجو در رشته مذکور می‌باشد. تحلیل و بررسی و نیز آسیب‌شناسی نحوه طراحی این سؤالات به طراحان سؤال این کمک را می‌نماید تا با دیدگاه بهتری نسبت به شیوه طراحی سؤال، و با در نظر گرفتن داوطلب و شرایط رقابت اقدام نمایند. وجود برخی آسیب‌ها در میان سؤالات این آزمون‌ها، ضرورت این ارزیابی را دو چندان می‌کند. هدف این پژوهش علاوه بر بررسی سؤالات بلاغت آزمون‌های کارشناسی ارشد دانشگاه‌های دولتی رشته زبان و ادبیات عربی طی سال های 1371تا 1390 و تطبیق آن‌ها با معیارهای شکلی و محتوایی، ارائه نمونه‌هایی از انواع آسیب‌های شکلی و محتوایی بوده است. روش پژوهش از نوع توصیفی بوده است. بدین معنی که کلیه سؤالات درس بلاغت طی بیست سال مورد تحلیل و بررسی قرار گرفته و سپس بر اساس معیارهای ویژه طرح سؤالات چهارگزینه‌ای که در کتاب‌های روان‌سنجی و ارزشیابی آموزشی مطرح شده است، آسیب‌شناسی شده‌اند. نتایج به دست آمده از این پژوهش نمایانگر این است که به طور تقریبی از هر 8 سؤال 1 سؤال دارای یک نوع آسیب است واز نظر آسیب‌های محتوایی: کمترین فراوانی مربوط به حوزه ناهمخوانی سؤالات با منابع آزمون تعیین‌شده و بیشترین فراوانی در حوزه سؤالات کلیشه‌ای و از نظر آسیب‌های شکلی: دشوار و نامفهومی تنه سؤال‌ها از کمترین فراوانی و تضاد یا تناقض میان گزینه‌ها، از بیشترین فراوانی برخوردار بوده است. و تعداد محدودی از سؤالات در حیطه سؤالات چند آسیبی گنجانده ‌شده‌اند که ضروری است توجه و اهتمام بیشتری نسبت بدان‌ها صورت پذیرد.

5

خوارزمی

مقایسه ویژگی‌های روان‌سنجی مدل‌های چهار و سه پارامتری نظریه سؤال-پاسخ براساس نتایج آزمون‌های سراسری ورود به دانشگاه

کارشناسی ارشد

جواد محمدلو

بلال ایزانلو

مسعود گرامی‌پور

1396

 • چکیده
  • هدف اصلی پژوهش حاضر مقایسه ویژگی‌های روان‌سنجی مدل‌های 3PL و 4PL است. برای مقایسه بیشتر و بهتر نتایج علاوه بر این دو مدل، مدل‌های 1PL، 2PL و 3Plu (2 پارامتری با مجانب بالا) نیز استفاده و نتایج هر پنج مدل مقایسه شد. به طور خلاصه، مدل 4PL با افزودن مجانب بالا به مدل 3PL و با حذف مجانب پایین از معادله مدل 4PL، مدل 3PLU (2 پارامتری با مجانب بالا) به دست می‌آید. برای این منظور از داده‌های شرکت‌کنندگان آزمون سراسری سال 1394 در سه گروه علوم ریاضی (آزمون فیزیک و معارف)، تجربی (آزمون شیمی و معارف) و انسانی (آزمون ادبیات تخصصی و معارف) استفاده شد. در آزمون‌های تخصصی و عمومی انتخاب شده از هر گروه یک نمونه تقریبا 6000 نفری به صورت تصادفی ساده انتخاب شد. ابتدا مفروضه تک‌بعدی بودن با نرم افزار NOHARM بررسی شد که برقرار بود. سپس برای پاسخ‌گویی به سؤال‌ها از بسته mirt در نرم افزار R استفاده شد. نتایج برازش هر یک از مدل‌ها در سطح سؤال نشان داد در دروس عمومی سوال‌ها بیشتر با مدل‌های 3PL و 4PL و در دروس اختصاصی سوؤل‌ها بیشتر به ترتیب با مدل 2PL و 3PLU برازش داشتند. برازش در سطح مدل بر اساس شاخص DIC نشان داد که بجز شیمی در سایر درس‌ها مدل 3PL نسبت به مدل 4PL مناسبت‌تر است (البته در مقام مقایسه مدل 2PL نسبت به همه مدل‌های استفاده شده بهتر است). همچنین نتایج شاخص بیز که برای برازش در سطح مدل استفاده می‌شود در کل با نتایج شاخص DIC همخوانی داشت. همبستگی بین نمره‌های خام هر درس و نمره توانایی برآورد شده آن بر اساس هر پنج مدل بالا است، که حاکی از رابطه خطی قوی بین متغیرها است. توانایی برآورد شده مدل‌ها تفاوت معناداری با هم نداشت. از نظر آگاهی در سطوح توانایی بالا، مدل 3 پارامتری نسبت به مدل 4 پارامتری آگاهی‌دهنده‌تر است. بطور کلی برای مدل 4 پارامتری نسبت به مدل 3 پارامتری مزیت خاصی پیدا نشد. مگر در سؤال‌های خاصی که برازش این مدل با آنها بهتر بود. البته تأثیر حجم نمونه بر نتایج مشخص نیست و لازم است در پژوهش‌های آتی نتایج مدل‌ها بر اساس حجم نمونه نیز مقایسه شوند.

6

علامه طباطبائی

مدل‌پردازی تشخیصی شناختی سؤال‌های درک مطلب زبان انگلیسی بر اساس داده‌های کنکور کارشناسی ارشد رشته زبان انگلیسی

کارشناسی ارشد

ریحانه رحیمی

علی دلاور

جلیل یونسی

1395

 • چکیده
  • هدف پژوهش حاضر تعیین نقاط ضعف و قوت آزمودنی‌ها در مهارت‌های پایه آزمون خواندن و درک مطلب از طریق مدل‌های سنجش تشخیصی شناختی با تحلیل باز برازش بود. داده‌های مورد بررسی در این پژوهش شامل پاسخ‌نامه 3000 نفر از شرکت‌کنندگان در آزمون سراسری کارشناسی ارشد رشته زبان انگلیسی بود که از بین 16044 نفر شرکت‌کننده به تصادف انتخاب شده بود. در ابتدا با کمک نظر متخصصین یک ماتریس Q که شامل روابط بین 20 سؤال آزمون خواندن با 7 مهارت پایه بود تشکیل گردید و سپس با توجه به شاخص‌های برازش 3 مدل DINA ،DINO و G-DINA با یکدیگر مقایسه و مدل G-DINA برای تجزیه و تحلیل نهایی انتخاب شد. در نهایت با استفاده از روش برآورد پسینی مورد انتظار در چهارچوب مدل G-DINA احتمال تسلط هر فرد بر هریک از مهارت‌ها با کمک بسته CDM در محیط نرم افزار R محاسبه شد و با تعیین نقطه برش 0/6 برای حد تسلط، افراد مورد بررسی در هریک از مهارت‌ها به دو گروه مسلط و غیر مسلط تقسیم شدند. یافته‌های حاصل از پژوهش نشان داد که در هر یک از مهارت‌ها بیشتر افراد به حد تسلط نرسیده‌اند، البته وضعیت افراد در مهارت SUM (تجزیه و تحلیل و ارزیابی اهمیت نسبی اطلاعات موجود در متن با کمک تفاوت قائل شدن بین ایده اصلی و جزئیات) نسبت به سایر مهارت‌ها بهتر بود و حدود نیمی از افراد در این مهارت به حد تسلط رسیده بودند. نتیجه‌‌ نهایی گویای این مطلب بود که به‌طور کلی وضعیت آزمودنی‌ها در کاربرد راهبردهای شناختی برای رسیدن به پاسخ صحیح نامطلوب می‌باشد و  باید این راهبردها در سرفصل‌های درسی مهارت خواندن و درک مطلب گنجانده شود.

7

علامه طباطبائی

عملکرد افتراقی جنسی سؤالات آزمون کنکور سراسری کارشناسی ارشد رشته آموزش زبان انگلیسی در ایران: رویکرد آماری متعدد جهت تجزیه و تحلیل داده ها

کارشناسی ارشد

نگار بابانژاد

معصومه استاجی

فهیمه معرفت

1395

 • چکیده
  • عدالت آزمون، به عنوان یکی از جنبه‌های مهم اعتبار آزمون، مسئله بسیار قابل توجهی در آزمون‌سازی زبان است. عدالت آزمون به عدم وجود جهت‌داری آزمون در هر یک از مراحل طرح و اجرای آزمون است. انتظار می‌رود آزمون‌های فارغ از جهت داری دقیقا همان مفاهیم و یا توانمندی‌هایی را مورد ارزیابی قرار دهند که برایشان طراحی شده بودند. این مطالعه قصد داشت تا در آزمون بزرگی چون کنکور کارشناسی ارشد آموزش زبان انگلیسی در ایران، سؤالاتی که حاوی عمکرد افتراقی می‌باشند را با استفاده از دو نمونه از کاربردی‌ترین و مفیدترین روش‌ها (رگرسیون لجیستیک و مانتل-هانسزل) پیدا کند. مطالعه حاضر جنسیت را به عنوان یک عامل نامربوط مورد بررسی قرار داده و به بررسی این موضوع پرداخته است که آیا سؤالات این آزمون به طور مساوی با مردان و زنان رفتار می‌کند یا خیر. به علاوه، یک تحلیل محتوایی از سؤالات پیدا شده حاوی عملکرد افتراقی انجام شد تا منابع زبانی چنین جهت‌داری‌هایی مشخص شوند. داده‌ها از پایگاه داده‌های سازمان سنجش ایران بدست آمد. پاسخنامه‌های 2217 زن و 735 مرد در کنکور سال 2015 برای یافتن سؤالاتی که حاوی رفتارهای انحرافی بودند بررسی شدند. نتایج حاصل از روش رگرسیون لجستیک نشان داد که هشت سؤال شامل عملکرد افتراقی بودند. چهار سوال از این سؤالات به نفع آقایان جهت داشتند و چهار سؤال هم به نفع خانم ها. یازده سؤال توسط روش مانتل هانسزل به عنوان سؤالات حاوی عملکرد افتراقی شناخته شدند که شش مورد از آن ها به نفع آقایان جهت داشتند و پنچ مورد به نفع خانم‌ها. نتایج این دو روش با یکدیگر مقایسه شد. اندازه اثر این سؤالات نیز محاسبه گشت. به جز برای دو سؤال، برای بقیه سؤالات اندازه اثر، کوچک نشان داده شد. تحلیل محتوایی سؤالات حاوی عملکرد افتراقی، هیچ دلیل زبانی خاصی را برای رفتار افتراقی سؤالات نشان نداد. نتایج این مطالعه نشان داد که حتی امتحان‌های استاندارد مانند کنکور ورودی کارشناسی ارشد هم، مستعد جهت‌داری‌ها هستند، که باید این جهت‌داری‌ها در چنین آزمون‌های بزرگی تشخیص داده شوند و از آنها حذف شوند. این مطالعه درحالیکه تلاش کرد یک قدم به سوی کنکور کارشناسی ارشد پاک از جهت‌داری گام بردارد، برای طراحان این آزمون و همچنین استفاده‌کنندگان این آزمون کاربردهایی داشت.

8

علامه طباطبائی

مقایسه‌پذیری برآورد پارامتر توانایی و شناسایی سوگیری سؤال‌ها در آزمون‌های مداد- کاغذی و انطباقی کامپیوتری به منظور امکان‌سنجی اجرای انطباقی آزمون‌های سرنوشت‌ساز

دکتری تخصصی

نگار شریفی یگانه

محمدرضا فلسفی نژاد، علی دلاور

نورعلی فرخی، احسان جمالی، ولی اله فرزاد، فریبرز درتاج

1395

 • چکیده
  • اجرای انطباقی کامپیوتری آزمون‌ها توان بالقوه‌ای در بهینه‌سازی فرایند سنجش دارد، اما تغییر روش اجرای آزمون‌ها چالش‌های نظری و عملی فراوانی به همراه دارد. مقایسه‌پذیری نتایج نسخه انطباقی کامپیوتری و مداد - کاغذی و عادلانه بودن اجرای انطباقی کامپیوتری از مهم‌ترین دغدغه‌های تغییر فرمت آزمون‌ها محسوب می‌شوند. هدف مطالعه حاضر بررسی مقایسه پذیری برآورد پارامتر توانایی در سنجش انطباقی کامپیوتری و مداد - کاغذی و تعیین الگوریتم بهینه آزمون انطباقی کامپیوتری بر اساس روش‌های مختلف برآورد توانایی (بیشینه درستنمایی و پسین مورد انتظار) و ملاک خاتمه آزمون (خطای استاندارد ثابت و طول ثابت آزمون) در آزمون سراسری به عنوان آزمون خطیر بود. هم‌چنین ارزیابی عادلانه بودن اجرای انطباقی کامپیوتری آزمون‌ها در چارچوب کارکرد افتراقی از دیگر اهداف مطالعه حاضر بود. در مرحله اول پژوهش، جامعه مورد مطالعه شامل کلیه شرکت‌کنندگان آزمون سراسری گروه آزمایشی علوم ریاضی و فنی سال 1392 بود که از میان آنها 1000 آزمودنی به روش نمونه‌گیری تصادفی انتخاب شدند. تحلیل سؤال‌ها با استفاده از مدل لجستیک سه‌پارامتری صورت گرفت. 40 مجموعه داده با حجمی برابر با داده‌های واقعی شبیه‌سازی شد و شبیه‌سازی پس‌تجربی آزمون انطباقی کامپیوتری انجام شد. نتایج نشان داد که آزمون انطباقی کامپیوتری قادر به بازیابی توانایی در خرده آزمون ریاضی می‌باشد. به علاوه روش برآورد پسین مورد انتظار و ملاک خاتمه خطای استاندارد ثابت 0/3 الگوریتم بهینه دستیابی به اهداف پایایی مناسب، طول منطقی آزمون و بازیابی برآورد توانایی در اجرای انطباقی کامپیوتری خرده آزمون ریاضی است. در مرحله دوم مطالعه پاسخ‌های‌ گروه نمونه 1000 نفری (گروه مرجع و کانونی 500 نفری) به بانک 55 سؤالی دو ارزشی براساس مدل لجستیک سه‌ پارامتری در 20 تکرار شبیه‌سازی شد. 15 سؤال‌ بانک از نظر نوع و اندازه کارکرد افتراقی دستکاری شدند و اثر آزمون براساس تفاوت میانگین توانایی گروه‌های مقایسه تعریف شد. پس از اجرای آزمون انطباقی کامپیوتری، تحلیل کارکرد افتراقی با روش رگرسیون لجستیک و آزمون نسبت درستنمایی سؤال - پاسخ انجام گرفت و روش‌ها براساس توان و خطای نوع اول مقایسه شدند. نتایج بیانگر کم‌تر بودن میزان خطای نوع اول روش آزمون نسبت درستنمایی در مقایسه با روش رگرسیون لجستیک بود. روش آزمون نسبت درستنمایی در شناسایی کارکرد افتراقی یکنواخت در هر دو موقعیت اثر و بدون اثر نسبت به روش رگرسیون لجستیک توان بیشتری داشت و با افزایش شدت کارکرد افتراقی توان نیز افزایش یافته است، درحالی که در ارزیابی کارکرد افتراقی غیریکنواخت هر دو روش عملکرد ضعیفی داشتند.
  • واژگان کلیدی: آزمون انطباقی کامپیوتری، کارکرد افتراقی سؤال، آزمون نسبت درستنمایی سؤال – پاسخ، رگرسیون لجستیک، ملاک خاتمه آزمون، شبیه‌سازی پس‌تجربی

9

خوارزمی

بررسی و مقایسه ویژگی‌های روان‌سنجی بخش فیزیک آزمون سراسری ورود به دانشگاه با توجه به مدل‌های دو ارزشی IRT: مطالعه موردی رشته ریاضی فیزیک

کارشناسی ارشد

محمد میری

مسعود گرامی‌پور

بلال ایزانلو

1394

 • چکیده
  • این پژوهش با هدف بررسی و مقایسه ویژگی‌های روان‌سنجی سؤالات آزمون فیزیک کنکور سراسری سال های 1388،1389،1390 براساس مدل‌های دو ارزشی IRT (تک، دو و سه پارامتری) انجام شده است. روش پژوهش توصیفی کمی از نوع تحقیقات روان‌سنجی است. جامعه آماری پژوهش را همه داوطلبان شرکت‌کننده در کنکور سراسری سال‌های 1389،1390، 1388 تشکیل می‌دهند. روش نمونه‌گیری، تصادفی ساده است که به طور تصادفی با استفاده از نرم افزار SPSS برای سال 1388 تعداد 2108 نفر، برای سال 1389 تعداد 2042 نفر و برای سال 1390 تعداد 1972 نفر انتخاب شد. ابزار جمع‌آوری اطلاعات، آزمون‌های درس فیزیک گروه ریاضی فیزیک، در کنکور سال‌های 1388، 1389 و 1390 است. جهت تجزیه و تحلیل اطلاعات جمع آوری شده از نرم افزارهای کامپیوتری SPSS، NOHARM، BILOG-MG براساس نظریه پاسخِ سؤال استفاده شد. نتایج نشان داد که کلیه آزمون‌های درس فیزیک در کنکور سراسری سال‌های 1388، 1389 و 1390 تک بعدی بوده و همچنین استقلال موضعی این آزمون‌ها برقرار است. در پارامتر دشواری، آزمون سال 1388 آسان‌تر از آزمون سال‌های 1389 و 1390 است. آزمون سال 1389 براساس مدل‌های تک، دو و سه پارامتری دشوارتر از آزمون سال‌های 1388 و 1390 است. ضریب حدس آزمون سال 1388 بیشتر از آزمون سال‌های 1389 و 1390 است. تمامی آزمون‌ها با مدل دو پارامتری نسبت به مدل‌های تک و سه پارامتری برازش بهتری داشتند. همچنین مشخص شد که تابع آگاهی در مدل سه پارامتری نسبت به مدل‌های تک و دو پارامتری بیشترین میزان آگاهی را داشت. در کل می‌توان نتیجه گرفت که سیر تحول ویژگی‌های روان‌سنجی آزمون فیزیک بین سال‌های 1388 تا 1390 با استفاده از نظریه پاسخِ سؤال روند رو به جلو و مثبتی داشته است.
  • واژگان کلیدی: روان‌سنجی، آزمون فیزیک، مدل‌های دو ارزشی، نظریه پاسخِ سؤال(IRT)، کنکور سراسری

10

رازی

بررسی طبقه‌بندی بلوم در بخش درک مطلب زبان انگلیسی کنکور سراسری دانشگاه‌های ایران در سه سال اخیر

کارشناسی ارشد

فائزه میرزایی‌تبار

نوالدین یوسفی

-

1394

 • چکیده
  • آزمون به طور عام و آزمون ورودی دانشگاه‌ها به طور خاص توجه بسیاری از پژوهشگران را به خود جلب کرده است. در این خصوص چستین (1988) می‌گویند: سنجش و ارزیابی یکی از جنبه یادگیری است که به فراگیران در فهم مسائلی که نیاموخته‌اند و به معلم در درک اقداماتی در راستای افزایش یادگیری توانایی می‌بخشد. طبق نظر رزم جو (2004) هدف اصلی آزمون ورودی دانشگاه انتخاب کردن و قرار دادن دانش آموزانی با شایستگی علمی بالاتر در مراکز دانشگاهی است. محمدپور و عبدالغفار (2009) معتقدند: آزمون ورودی دانشگاه‌ها در ایران تأثیر بسیاری بر احساسات و آینده دانش آموزان و خانواده‌های آن‌ها دارد. درک مطلب مؤلفه اصلی در اندازه‌گیری توانایی خواندن دانش آموزان است به طور کلی بخش درک مطلب شامل چند متن است که هر متن چند سؤال به دنبال دارد. علی رغم مطالعات زیادی که در سال‌های اخیر به بررسی آزمون ورودی دانشگاه در ایران پرداخته است. به نظر می‌رسد بررسی سؤالات کنکور براساس طبقه‌بندی بلوم ضرروی است. طبقه‌بندی بلوم مدل چند طبقه‌ای است که تفکر را بر اساس شش سطح درک و فهم دسته‌بندی می‌کند . سه سطح بالا به ترتیب دانش درک و به کارگیری است و سه سطح پایین تجزیه و تحلیل، ترکیب و ارزیابی است. همواره تلاش معلمان بر این است که دانش آموزان را به سمت سه سطح بالای تفکر هدایت و تشویق کنند. از آنجایی که مهارت خواندن و درک مطلب انگلیسی نقش مهمی در آزمون ورودی دانشگاه‌ها در ایران ایفا می‌کند من در پژوهش جاری به بررسی بخش خواندن (درک مطلب) و سؤالات آن در کنکور سراسری سه سال هنر از سال 1391 تا 1393 بر اساس طبقه‌بندی بلوم پرداختم و به این نتیجه رسیدم که سؤالات هر سه سال بر سطوح پایین تفکر در طبقه‌بندی بلوم تمرکز بیشتری دارد.

11

ولی عصر رفسنجان

بررسی ثبات ساختار عاملی سؤالات عمومی کنکور دکتری زبان انگلیسی در دو سطح مختلف دانش زبان عمومی: با استفاده از مدل‌سازی معادله ساختاری

کارشناسی ارشد

فاطمه فاریابی

حمدالله راوند

غلامرضا روحانی

1394

 • چکیده
  • دو هدف اصلی این مطالعه عبارت بودند از (1) اعتبارسنجی ساختار درونی بخش عمومی آزمون ورودی کنکور دکتری آموزش زبان انگلیسی در ایران (2) بررسی ثبات ساختار عاملی کنکور دکتری آموزش زبان انگلیسی در دو سطح متفاوت. برای تجزیه و تحلیل پاسخ‌های شرکت‌کنندگانی (تعداد: 100) که به صورت تصادفی انتخاب شده بودند و در کنکور 1392 شرکت کرده بودند تا اجازه ورود به دانشگاه‌های دولتی ایران در رشته آموزش زبان انگیسی را کسب کنند، از روش مدل‌سازی معادله ساختاری استفاده شد. ابتدا به منظور دستیابی به مدلی که بهترین برازش به داده‌ها را داشته باشد، چهار مدل (تک عاملی، مدل همبسته، مدل ناهمبسته و مدل مرتبه بالا) برآورد و مقایسه شدند. مدل مرتبه بالا و مدل همبسته سه عاملی بهترین برازش به داده‌ها را نشان دادند. نتایج نشان دادند که ساختار تست در هر دو سطح دانش زبانی ثابت باقی ماند. این نتایج دیدگاه چند عاملی بودن دانش زبانی را تأیید کردند. همچنین مشخص شد که رابطه‌ای بین سطح دانش زبانی و ساختار تست وجود ندارد. در حالی که این نتایج بدست آمده روش اعلام نمره کنکور دکتری را زیر سؤال بردند و منجر به این نتیجه‌گیری شد که گزارش فقط یک نمره کلی نشان‌دهنده خوبی از ساختار تست نیست.

12

علامه طباطبائی

کاربرد مدل‌های تشخیصی شناختی به منظور تعیین مهارت‌های زیربنایی عملکرد داوطلبان در آزمون ورودی زبان انگلیسی عمومی دوره دکترا

دکتری تخصصی

اعظم مقدم

محمدرضا فلسفی نژاد

نورعلی فرخی

1394

 • چکیده
  • شیوه‌های مرسوم اندازه‌گیری آموزشی به دلیل عدم توجه به فرایندهای شناختی‌ای که آزمودنی‌ها در حین ارائه پاسخ به سوالات یک آزمون استفاده می‌کنند و عدم استخراج اطلاعات تشخیصی در مورد نقاط قوت و ضعف دانش‌آموزان مورد انتقاد قرار گرفته‌اند. در این راستا رویکرد سنجش تشخیصی شناختی برای فائق آمدن بر مشکلات مربوط به این روش‌ها مطرح شده‌اند. این پژوهش با هدف کاربرد مدل‌های تشخیصی شناختی به منظور تعیین مهارت‌های زیربنایی عملکرد داوطلبان در آزمون ورودی زبان انگلیسی عمومی دوره دکترا انجام شد. علاوه بر این بررسی کفایت مدل، تعیین نقاط قوت و ضعف آزمون‌شوندگان، بررسی دقت و اعتبار طبقه‌بندی و مقایسه داوطلبان مرد و زن در مهارت‌های شناسایی شده نیز از اهداف دیگر این مطالعه بود. بدین منظور از روش‌ تحقیق کیفی-کمی با رویکرد ریتروفیت آزمون‌های موجود برای تحقق اهداف این مطالعه استفاده شد. جامعه تحقیق شامل کلیه داوطلبان کنکور دکترا در رشته‌های مربوط به زبان انگلیسی در سال 1391 بود. نمونه نیز 3699 آزمودنی در آزمون دستور زبان و 2754 آزمودنی در آزمون درک مطلب بود. ابزار مورد استفاده، آزمون زبان انگلیسی عمومی با 100 سوال در سه بخش مجزا بود. با استفاده از روش‌های کیفی سه مهارت‌های احتمالی آزمون دستور زبان شامل قواعد مربوط به ریخت و صرف و نحو، قواعد مربوط به انسجام و قواعد مربوط به واژگان و شش مهارت احتمالی آزمون درک مطلب شامل استفاده از دانش واژگان، استفاده از دانش نحوی، استخراج اطلاعات صریح، استنتاج، اتصال و ادغام و استفاده از دانش عملی شناسایی شد. سپس در بخش کمی مدل غیرجبرانی فیوژن با رویکرد بیز و مبتنی بر زنجیره‌های مارکف مونته کارلو (هارتز، 2002) برای تحلیل داده‌ها به کار گرفته شد. کفایت مدل با همگرا شدن زنجیره‌های مارکف، برازش مناسب مدل با داده‌ها و پارامترهای مناسب سوالات تایید شد. هم‌چنین بررسی میزان تسلط آزمودنی‌ها نشان داد از بین سه مهارت دستور زبان، قواعد مربوط به انسجام، قواعد مربوط به ریخت و صرف و نحو و قواعد مربوط به واژگان به ترتیب دشوارترین تا آسان‌ترین مهارت‌ها بودند. از بین مهارت‌های درک مطلب نیز اتصال و ادغام، استفاده از دانش عملی، استخراج اطلاعات صریح، استنتاج، استفاده از دانش نحوی و استفاده از دانش واژگان به ترتیب آسان‌ترین تا دشوارترین مهارت‌ها بود. دقت و اعتبار طبقه‌بندی آزمون‌شوندگان در هر یک از مهارت‌های دستور زبان و درک مطلب نیز مناسب ارزیابی شد. اگر چه داوطلبان مرد در مهارت‌های مورد نیاز آزمون دستور زبان و در مهارت‌های استفاده از دانش واژگان، استفاده از دانش نحوی و استنتاج در آزمون درک مطلب بهتر از داوطلبان زن بودند، ولی با توجه به حجم نمونه بالا و اندازه اثر کم این تفاوت‌های آماری معنادار قابل اغماض به نظر می‌رسد. نتایج این مطالعه برتری استفاده از مدل‌های تشخیصی شناختی نسبت به روش‌های مرسوم در تحلیل داده‌های مربوط به آزمون زبان را تایید کرد.
  • واژگان کلیدی: مدل‌های تشخیصی شناختی، مهارت‌های زبان انگلیسی، آزمون ورودی زبان انگلیسی عمومی، و داوطلبان دکترا

13

خوارزمی

بررسی ویژگی‌های روان‌سنجی آزمون سراسری درس زیست‌شناسی بر اساس مدل چند گزینه ای IRT

کارشناسی ارشد

علی ترکاشوند

مسعود گرامی‌پور

بلال ایزانلو

1394

 • چکیده
  • مدل‌های چند ارزشی نظریه پاسخ سوال، بر خلاف مدل کلاسیک اندازه‌گیری و مدل‌های دو ارزشی، از این قابلیت برخوردارند که در برآورد پارامترهای سوال و آزمودنی‌ها در آزمون‌های توانایی متشکل از سوال‌های چندگزینه‌ای، برای گزینه‌های پاسخ، بیش از دو ارزش در نظر بگیرند و لذا مدعی هستند که با مورد توجه قرار دادن اطلاعات موجود در گزینه‌های پاسخ نادرست می‌توانند ارزش‌های متفاوتی برای آن‌ها در نظر بگیرند و بدین وسیله موجب افزایش دقت برآورد توانایی آزمودنی‌ها می‌شوند. هدف اصلی پژوهش حاضر در واقع معرفی و بکارگیری یکی ازکامل‌ترین مدل های چند ارزشی IRT (مدل چند گزینه‌ای) به عنوان یک مدل مناسب برای برآورد دقیق‌تر پارامترهای سوال و توانایی در سوال‌های چند گزینه‌ای در مقایسه با مدل‌های دو ارزشیIRT است. برای این منظور، از بین کلیه شرکت‌کنندگان در آزمون سراسری گروه آزمایشی علوم تجربی در سال 1391، یک نمونه 5000 نفری از آزمودنی‌ها به کمک نرم افزار SPSS به صورت تصادفی انتخاب شد. ابزار مورد استفاده برای جمع آوری داده‌های پژوهش، پاسخنامه‌های داوطلبان گروه آزمایشی علوم تجربی در سال 1391 در آزمون اختصاصی درس زیست‌شناسی با 50 سوال چهار گزینه‌ای بود. به منظور تجزیه و تحلیل آزمون و سوال‌های آن بر طبق مدل چند گزینه ای نظریه پاسخ سوال، ابتدا مفروضه های تک بعدی بودن و استقلال موضعی توسط نرم افزار NOHARM مورد برسی قرارگرفت. پس از اطمینان یافتن از برقراری مفروضات IRT، سوالات آزمون توسط برنامه MULTILOG مورد تحلیل قرار گرفت. مدل سه پارامتری که از نظر ساختار پارامتری در میان مدل‌های دو ارزشی، نزدیکترین مدل به مدل چند گزینه‌ای است، به عنوان مدل دو ارزشی مناسب جهت مقایسه میزان آگاهی‌دهندگی با مدل چند گزینه‌ای انتخاب شد. نتایج این بررسی‌ها حاکی از برتری دقت برآورد توانایی پاسخ‌دهندگان در مدل چند گزینه‌ای نسبت به مدل سه پارامتری در اکثر سطوح توانایی است و این برتری دقت برآورد مدل چند گزینه‌ای در مورد آزمودنی‌ها با توانایی پایین‌تر از حد متوسط بیشتر مشهود است. هم‌چنین نتایج تحلیل گزینه‌های انحرافی نشان داد که اکثر سوالات دارای گزینه‌های انحرافی معادل هستند و نیاز به اصلاح یا جایگزینی با گزینه انحرافی مناسب‌تری داشتند .هم‌چنین مدل سه پارامتری نسبت به مدل چند گزینه‌ای برازش بهتری با مجموعه سوال‌ها دارد.
  • واژگان کلیدی: روان سنجی، نظریه پاسخ سوال، مدل چند گزینه‌ای

14

علامه طباطبائی

ویژگی‌های روان‌سنجی سؤالات کنکور کارشناسی ارشد رشته آمار و کاربردها در سال 1393 با استفاده از نظریه کلاسیک آزمون و نظریه سوال پاسخ

کارشناسی ارشد

مهدی مولایی یساولی

نورعلی فرخی

یحیی مهاجر

1394

 • چکیده
  • هدف پژوهش حاضر بررسی ویژگی‌های روان‌سنجی سؤالات کنکور کارشناسی ارشد سال 1393 در گروه آمار و کاربردها بر اساس نظریه کلاسیک آزمون و نظریه پرسش-پاسخ بوده است. به‌منظور تجزیه‌ و تحلیل آزمون و سؤالاتش بر طبق نظریه کلاسیک اندازه‌گیری، ضریب دشواری، ضریب تمیز، واریانس سؤالات، ضرایب پایایی آزمون، پایایی در صورت حذف سوال و همچنین فراوانی گزینه‌های انحرافی با نرم‌افزار SPSS محاسبه شد. جهت تجزیه‌ و تحلیل سؤالات با نظریه IRT ابتدا مفروضه‌های تک‌بعدی بودن و استقلال موضعی بررسی گردید. پس از بررسی پیش‌فرض‌ها با کمک نرم‌افزار FACTOR شاخص‌های این نظریه به همراه نمودارهای مختلف با کمک نرم‌افزار BILOG-MG محاسبه گردید. نتایج نشان داد در هر سه ماده امتحانی زبان انگلیسی، دروس پایه و دروس تخصصی، مدل سه پارامتری نسبت به مدل‌های یک و دو پارامتری برازش بهتری با مجموع داده‌ها دارد. شاخص‌های هر دو نظریه نشان می‌دهد در سؤالات آزمون سؤالات نامطلوب زیادی وجود دارد لذا این دروس احتیاج به بازنگری دارد. از تحلیل گزینه‌های انحرافی مشاهده می‌شود بعضی از گزینه‌های انحرافی عملکرد مناسبی نداشته‌اند و باید مورد بازنگری قرار گیرند. بررسی هیستوگرام توانایی در هر سه ماده امتحانی نشان می‌دهد که پراکندگی سطوح توانایی در بین داوطلبین زیاد است.
  • واژگان کلیدی: ویژگی‌های روانسنجی، نظریه کلاسیک، نظریه سوال - پاسخ، آزمون کارشناسی ارشد

15

علامه طباطبائی

بررسی ویژگی‌های روان‌سنجی سوالات کارشناسی رشته هنر کنکور سراسری سال 1393 با استفاده از نظریه کلاسیک

کارشناسی ارشد

پرویز فداکار گبلو

علی دلاور

نورعلی فرخی

1394

 • چکیده
  • هدف پژوهش حاضر، بررسی ویژگی‌های روان‌سنجی سوالات کنکور کارشناسی گروه هنر در سال 1393 بود. جامعه آماری این تحقیق 7 درس کنکور هنر بودند که از این دروس نمونه‌گیری به عمل نیامده و تمام آنها مورد بررسی قرار گرفته‌اند. از مجموع داوطلبان شرکت کننده در کنکور هنر، یک گروه نمونه 1516 نفری به صورت تصادفی انتخاب گردید. براساس نظریه کلاسیک و سوال پاسخ به محاسبه پارامترهایی تک تک سوالات مانند دشواری و تمیز پرداخته شد و سوالاتی را که به نحوی با آزمون هماهنگی نداشتند، به منظور حذف از مجموعه سوالات معرفی شدند. برای تحلیل داده‌ها از برنامه SPSS و برآورد پارامترهای سوال و توانایی بر حسب مدل‌های جدید اندازه‌گیری از نرم افزار رایانه‌ای BILOG-MG استفاده شد. مقایسه مدل‌های مختلف اندازه‌گیری از نظر برآوردهای متفاوت یا مشابه پارامترهای سوال و همچنین یافتن بهترین مدل که با داده‌ها برازش دارد، نیز به وسیله تابع آگاهی و آزمون خی‌دو ارزیابی شدند. نتایج نشان داد آزمون ترسیم فنی کمترین و آزمون درک عمومی ریاضی و فیزیک بیشترین پایایی را داشتند. گزینه‌های انحرافی بعضی از سوالات آزمون، هم احتمال نبودند. بررسی پارامتر دشواری سوالات نشان دادند که اکثر سوالات در نظریه کلاسیک دشواری کمتر از 0/3 و در نظریه سوال پاسخ دشواری بالای 0/8 دارند. دشواری سوالات این آزمون با توجه به هدف کنکور، مطلوب می‌باشند. همچنین کمترین مقدار دشواری مطابق با نظریه کلاسیک و بیشترین مقدار دشواری مطابق با نظریه سوال پاسخ، مربوط به سوالات ابتدایی (درس درک عمومی هنر) و سوالات انتهایی (درس‌های خلاقیت موسیقی و خواص مواد) می‌باشند. در همه دروس مفروضه‌های تک بعدی بودن و استقلال موضعی برقرار بودند و همچنین براساس نظریه سوال پاسخ، آزمون‌های پنچ درس (درک عمومی هنر، درک عمومی ریاضی فیزیک، ترسیم فنی، خلاقیت نمایشی، خلاقیت موسیقی) با مدل سه پارامتری و آزمون‌ دو درس (خلاقیت تصویری و خواص مواد) با مدل دو پارامتری برازش بهتری داشتند. تحلیل پارامتر سوالات نشان دادند که ضریب تمیز در همه سوالات بیشتر از 0/3 و عامل حدس کمتر از 0/1 می‌باشند. بررسی تابع آگاهی سوالات و آزمون‌ها نشان دادند که همه سوالات آزمونها برای سطوح بالای توانایی (دامنه 1/5 تا 2/5) بیشترین آگاهی و کمترین خطای را دارند. برآورد پارامتر سوالات براساس دو نظریه بیانگر این بود که نتایج دو نظریه همسو بوده و یکدیگر را تکمیل و تایید می‌کنند.
  • واژگان کلیدی : روان‌سنجی، کنکور هنر، نظریه کلاسیک، نظریه سوال پاسخ

16

علامه طباطبائی

طراحی و کاربرد الگوهای تهیه‌ خزانه‌ سؤال در بهینه‌سازی کارکرد سنجش انطباقی کامپیوتری در آزمون‌های سرنوشت‌ساز

دکتری تخصصی

مریم مقدسین

محمدرضا فلسفی نژاد، علی دلاور

نورعلی فرخی، احسان جمالی

1393

 • چکیده
  • سنجش انطباقی کامپیوتری (CAT) شیوه‌ای از سنجش توانایی است که دقت برآورد توانایی را افزایش می‌دهد، و بدون از دست رفتن دقت اندازه‌گیری آزمون، طول آن را کاهش می‌دهد. با این وجود، سنجش انطباقی در صورتی خوب کار می‌کند که، دارای خزانه‌ی سؤالی باشد که در آن تعداد کافی سؤال با کیفیت مناسب وجود داشته باشد. بسیاری از محققان خاطر نشان می‌کنند که، برای ساخت یک خزانه‌ سؤال برای (CAT)، نه ‌تنها اندازه‌ خزانه‌ سؤال مهم است، بلکه توزیع پارامترهای سؤالات خزانه نیز از اهمیت به‌سزایی برخوردار است. با این وجود، تحقیقات اندکی در زمینه‌ این که چگونه این ویژگی‌های مطلوب تعیین می‌شود، وجود دارد. هدف اصلی این پژوهش، کاربرد و گسترش ایده‌ اصلی “bin-and-union” رویکرد ریکیسی (2003)، که یک روش شبیه‌سازی مؤنت کارلو برای تعیین ویژگی‌های خزانه‌ سؤال است و تلفیق آن با رویکرد برنامه‌نویسی ریاضی یا مدل انحرافات وزن‌دار (WDM) بود. در این پژوهش این روش برای ساخت یک خزانه‌ سؤال بهینه برای آزمون سنجش انطباقی عملیاتی ریاضی به‌کار برده شد. این طرح شامل برآوردهایی از اندازه‌ مطلوب خزانه‌ سؤال و توزیع مطلوب پارامترهای سؤالات و ویژگی‌های غیر آماری آن بود. فرآیند طراحی این خزانه شامل تعیین مجموعه‌ای از ویژگی‌های مورد نظر خزانه‌ سؤال، با درنظر گرفتن چندین عامل مهمی که ممکن است بر نتایج مطلوب طراحی یک خزانه‌ سؤال اثر گذارد، بود. در این پژوهش خزانه‌های سؤال بهینه‌ شبیه‌سازی شده بر اساس مدل راش، و مدل دو و سه پارامتری مدرج شدند. همچنین از روش سیمپسون-هتر نیز برای کنترل مواجه‌ سؤال استفاده شد. عملکرد خزانه‌های سؤال بهینه‌ شبیه‌سازی‌شده از طریق یک خزانه‌ سؤال عملیاتی ارزیابی شد. نتایج ارزیابی نشان داد که، مکانیزم به کار رفته برای تعیین ویژگی‌های مطلوب خزانه‌ سؤال به‌خوبی کار می‌کند و برای تعیین ویژگی های مطلوب خزانه‌ عملیاتی مناسب است.
  • واژگان کلیدی: طراحی، خزانه سوال، سنجش انطباقی کامپیوتری- آزمون‌های سرنوشت‌ساز

17

دانشکده مدیریت و اقتصاد

بررسی روش‌های علمی تعیین ضرایب دروس امتحانی در آزمون‌های سراسری با استفاده از نظریه سوال پاسخ

کارشناسی ارشد

مریم پارساییان

وحید رضایی‌تبار

سیما نقی‌زاده

1393

 • چکیده
  • آزمون وسیله‌ای برای سنجش افراد و گزینش آنها می‌باشد لذا نمره‌گذاری دقیق آزمون‌ها از اهمیت ویژه‌ای برخوردار است. این حساسیت مخصوصا در آزمون‌های سراسری مانند آزمون‌های سازمان سنجش آموزش کشور بیشتر به چشم می‌خورد. چرا که رقابت داوطلبان در این آزمون‌ها بسیار تنگاتنگ بوده و با کوچکترین تغییری در معیار سنجش آنها یعنی نمره کل، جایگاه افراد تغییر کرده و وضعیت پذیرش آنها عوض می‌شود. لذا استفاده از یک روش معتبر باعث می‌شود که هر داوطلب در جایگاهی که استحقاق آن را دارد قرار گیرد به عبارتی دیگر در رشته‌ و دانشگاهی که متناسب با توانایی وی می‌باشد پذیرفته شود. در این پژوهش تحلیل توانایی‌های هر یک از آزمودنی‌ها با استفاده از ویژگی‌های مربوط به هر سوال از جمله ضریب دشواری، قدرت تمیز و حدس پرداخته شده است که این کار از طریق نظریه سوال پاسخ که یک نظریه مدرن اندازه‌گیری است انجام گرفته است. به منظور اندازه‌گیری دقیق توانایی‌های آزمودنی‌ها لازم است برای هر خرده‌آزمون (درس) وزنی متناسب با سوال‌های آزمون مربوطه اتخاذ شود. از این رو در تحقیق حاضر ضریب هر درس که همان وزن خرده‌آزمون است با استفاده از نظریه سوال پاسخ محاسبه شده است. در نهایت نتایج حاصل از نظریه سوال پاسخ با نظریه آزمون کلاسیک از طریق خطای استاندارد اندازه‌گیری مقایسه شده است. نتیجه تحقیق حاضر بدین صورت شد که چون تحلیل نظریه سوال پاسخ براساس تک تک سوال‌ها می‌باشد لذا دقیق‌تر است و خطای استاندارد آن کمتر می‌باشد.

18

دانشگاه آزاد اسلامی واحد تهران مرکز

امکان‌سنجی طراحی، اجرا و تحلیل آزمون‌های سراسری بر اساس نظریه سوال - پاسخ

کارشناسی ارشد

مزتضی حسینی

علی مقدم‌زاده

---

1393

 • چکیده
  • هدف این پژوهش، بررسی امکان سنجی طراحی، اجرا و تحلیل آزمون‌های سراسری بر اساس IRT می‌باشد. این تحقیق از نظر هدف، جزء تحقیقات کاربردی و از نظر روش، توصیفی بوده و از دو قسمت تشکیل شده است. قسمت اول، بررسی امکان‌سنجی از طریق تحلیل نتایج پرسشنامه محقق ساخته و قسمت دوم، مربوط به بررسی ویژگی‌های روا‌‌ن‌سنجی آزمون ریاضی کنکور 91 گروه ریاضی فیزیک بود. جامعه تحقیق شامل کارکنان بخش آزمون سازی سازمان سنجش و متخصصین، برای بخش اول و کلیه داوطلبان رشته ریاضی کنکور 91 برای بخش دوم بودند. نمونه بخش اول شامل 34 نفر و بخش دوم نیز از بین داوطلبان گروه ریاضی 91، با حجم نمونه 1000 نفری به صورت تصادفی انتخاب گردید. تجزیه و تحلیل داده‌ها با نرم افزارهای SPSS، Bilog و statistica انجام گردید. برخی نقاط ضعف و قوت آزمون‌های برگزار شده با تحلیل‌های روان‌سنجی آزمون ریاضی 91، مشخص گردید. در نهایت، در قالب پاسخ به سوال اصلی پژوهشی نتیجه گرفتیم که در حال حاضر، امکان طراحی، اجرا و تحلیل آزمون‌های سراسری بر اساس IRT تحت شرایط خاصی از قبیل جذب و استخدام نیروهای متخصص و بازآموزی نیروهای موجود، اعزام نیرو جهت کسب تخصص‌های لازم به مراکز معتبر جهانی در عرصه آزمون‌سازی، دعوت از متخصصین ETS به سازمان و ایجاد پل ارتباطی بین متخصصین و کارکنان سازمان وجود دارد. بین میانگین عامل اجتماعی در دو گروه کارکنان سازمان سنجش و متخصصین تفاوت معناداری وجود داشت. میانگین میزان نگرش کل دو گروه به اجرای طرح نیز دارای تفاوت معنادار نبود. جهت عملی نمودن اجرای این طرح نیاز به جذب و پرورش نیروهای متخصص، انتقال و باز آموزی کارکنان موجود سازمان با برگزاری کارگاه‌های آشنایی نظری و عملی با IRT، تشکیل کارگروه آزمون‌سازی بر اساس IRT، اجرای سالانه چند آزمون آزمایشی و تهیه گزارش آن از اقداماتی است که می‌تواند در پیشبرد اهداف این طرح موثر باشد. از مهمترین اقدامات لازم می‌توان به جذب نیروی متخصص بیشتر در زمینه آزمون‌سازی اشاره کرد زیرا برای مثال در ETS بیش از 2500 نفر مشغول کار هستند و سالانه بیش از 20 میلیون آزمون در بیش از 180 کشور برگزار می‌نماید.
  • واژگان کلیدی: امکان‌سنجی، آزمون‌های سرنوشت‌ساز، CTT، IRT، ETS 

19

یزد

بررسی روایی آزمون دکتری آموزش زبان انگلیسی ایران ، بر اساس مدل استدلال کاربرد آزمون

کارشناسی ارشد

مژده ده بزرگی

محمدجواد رضایی

علی محمد فضیلت‌فر

1393

 • چکیده
  • تهیه و تدوین آزمون استاندارد همواره یکی از اهداف مربیان و برنامه ریزان آموزش در سطوح مختلف بوده است. علاوه بر پایایی نمره آزمون، یکی از مهمترین ارکانی که در روند طراحی و استفاده از آزمون باید در نظر گرفته شود روایی تفسیر و تعبیر عملکرد آزمون دهنده و استفاده از نمره آزمون است. آزمون سراسری کنکور دکتری آموزش زبان انگلیسی در ایران سه سال است که به صورت همگانی برگزار می شود. پیش از آن هر دانشگاهی آزمون مخصوص خود را داشته است. از آنجایی که این آزمون یک نمونه از آزمون های سرنوشت ساز به شمار می رود و نتایج حاصل از آن در روند زندگی افراد تاثیر خاصی بر جای می‌گذارد، روایی این آزمون ویژگی بسیار مهمی است که باید به آن پرداخته شود . هدف از این تحقیق سنجش میزان روایی آزمون سراسری کنکور دکتری آموزش زبان انگلیسی ایران بر اساس مدل استدلال کاربرد آزمون می باشد‌. در این روند، هر چهار مرحله اعم از ثبت نتایج آزمون، تعبیر، تصمیم گیری و پیامدهای آزمون با اتکا به ادعاها، پشتوانه ها و فرآیند تکذیب های ارائه شده از طریق پرسشنامه و مصاحبه از دیدگاه ذی‌‌ نفعان بررسی می شود. ذی‌ نفعان آزمون دکتری زبان انگلیسی شامل آزمون دهنده ها، طراحان سوال و جوامع دانشگاهی می شود. نتایج بدست آمده از این تحقیق کیفی حاکی از روایی نسبی آزمون دکتری آموزش زبان انگلیسی می‌‌باشد. هر چند ، جهت بهبود و ارتقا توجیه پذیری استفاده از آزمون و نتایج حاصل از آن ، نیازمند اصلاحاتی در پشتوانه‌های مطرح شده ، علی الخصوص در مرحله تعبیر نتایج آزمون ، می‌باشد. نتایج حاصل از این تحقیق می تواند در انتخاب صحیح تر دانشجویان مقطع دکتری موثر واقع شود که این امر به نوبه ی خود در بهبود کیفیت آموزش و بالا بردن سطح دانش دانشجویان و استادان تأثیر به سزایی خواهد داشت.
۵۸۱۰۱۷
تعداد بازدید کل :
۳۲
تعداد افراد آنلاین :
۱۳۹۷/۱۱/۲۷ - ۱۷:۲۷:۲۴
تاریخ :
تلفن: 88923790
نمابر: 88923778
پست الكترونيكي: arzesh@sanjesh.org
نشاني: تهران- خيابان كريم خان زند-بين خيابان استاد نجات اللهي
و خيابان سپهبد قرني- پلاك 204- سازمان سنجش آموزش كشور
طبقه 5- مركز تحقيقات، ارزشيابي، اعتبارسنجي و تضمين كيفيت آموزش عالي