RE

قابلیت اعتماد (پایایی) ابزار اندازه گیری

قابلیت اعتماد که واژه هایی مانند پایایی، ثبات و اعتبار برای آن به کار برده می‌شود و معادل انگلیسی آنReliability است، یکی از ویژگی های ابزار اندازه گیری (پرسشنامه یا مصاحبه یا سایر آزمون ها) است. مفهوم یاد شده با این امر سروکار دارد که ابزار اندازه گیری در شرایط یکسان تا چه اندازه نتایج یکسانی به دست می دهد. از جمله تعریف هایی که برای قابلیت اعتماد ارائه شده است می توان به تعریف ارائه شده توسط ایبل و فریسبی (1989) اشاره کرد: «همبستگی میان یک مجموعه از نمرات و مجموعه دیگری از نمرات در یک آزمون معادل که به صورت مستقل بر یک گروه آزمودنی به دست آمده است.»

با توجه به این امر معمولا دامنه ضریب قابلیت از صفر (عدم ارتباط) تا 1+ (ارتباط کامل) است. ضریب قابلیت اعتماد نشانگر آن است که تا چه اندازه ابزار اندازه گیری ویژگی های با ثبات آزمودنی و یا ویژگی های متغیر و موقتی وی را می سنجد.

لازم به ذکر است که قابلیت اعتماد در یک آزمون می‌تواند از موقعیتی به موقعیت دیگر و از گروهی به گروه دیگر متفاوت باشد. برای محاسبه ضریب قابلیت اعتماد ابزار اندازه گیری شیوه های مختلفی به کار برده می‌شود. از آن جمله می‌توان به الف) اجرای دوباره (روش بازآزمایی) ، ب) روش موازی (همتا) ، ج) روش تصنیف (دو نیمه کردن)  ، د) روش کودر- ریچاردسون و سایر اشاره کرد.

الف) اجرای دوباره آزمون یا روش بازآزمایی: این روش عبارت است از ارائه یک آزمون بیش از یک بار در یک گروه آزمودنی تحت شرایط یکسان. برای محاسبه ضریب قابلیت اعتماد با این روش، ابتدا ابزار اندازه گیری بر روی یک گروه آزمودنی اجرا شده و سپس در فاصله زمانی کوتاهی دوباره در همان شرایط، آزمون بر روی همان گروه اجرا می‌شود. نمرات بدست آمده از دو آزمون مورد نظر قرار گرفته و ضریب همبستگی آنها محاسبه می‌شود. این ضریب نمایانگر قابلیت اعتماد (پایایی) ابزار است. روش بازآزمایی برای ارزیابی ثبات مولفه های یک ابزار اندازه گیری به کار می‌رود ولی با این اشکال نیز روبه رو است که نتایج حاصله از آزمون مجدد می‌تواند تحت تاثیر تمرین (تجربه) و حافظه آزمودنی قرار گرفته و بنابراین منجر به تغییر در قابلیت اعتماد ابزار اندازه گیری گردد.

ب) روش موازی یا استفاده از آزمون های همتا: یکی از روشهای متداول ارزیابی قابلیت اعتماد در اندازه گیری های روانی- تربیتی استفاده از آزمون های همتا است که شباهت زیادی با یکدیگر دارند ولی کاملا یکسان نیستند. ضریب قابلیت اعتماد بر اساس همبستگی نمرات دو آزمون همتا به دست می‌آید.  خطاهای اندازه گیری و کمبود یا عدم وجود همسانی میان دو فرم همتای آزمون (تفاوت در سوالات یا محتوای آن‌ها) قابلیت اعتماد را کاهش می‌دهد.

ممکن است فرم های همتا به طور همزمان ارائه نگردد. در این صورت قابلیت اعتماد هم شامل ثبات و همسانی می‌شود. اگر فاصله اجرای فرم های همتا زیاد باشد و تغییراتی در ضریب قابلیت اعتماد مشاهده گردد، ممکن است که این تغییر مربوط به عوامل فردی (آزمودنی ها)، همتا نبودن آزمون ها و یا ترکیبی از هر دو باشد.

ج) روش تنصیف (دو نیمه کردن): این روش برای تعیین هماهنگی درونی یک آزمون به کار می‌رود. برای محاسبه ضریب قابلیت اعتماد با این روش، سوال های (اقلام) یک آزمون را به دو نیمه تقسیم نموده و سپس نمره سوال های نیمه اول و نمره سوال های نیمه دوم را محاسبه می‌کنیم. پس از آن همبستگی بین نمرات این دو نیمه را بدست می‌آوریم. ضریب همبستگی به دست آمده برای ارزیابی قابلیت اعتماد کل آزمون مورد استفاده قرار می‌گیرد. برای محاسبه ضریب قابلیت اعتماد کل آزمون از فرمول -اسپیرمن- براون- برای این مورد استفاده می‌شود:

(1+همبستگی بین دو نیمه)    /    2 * همبستگی بین دو نیمه  = ضریب قابلیت اعتماد کل آزمون

د) روش کودر- ریچاردسون: کودر و ریچاردسون دو فرمول را برای محاسبه هماهنگی درونی آزمون ها ارائه نموده اند. فرمول اول برآوردی از میانگین ضرایب قابلیت اعتماد برای تمام طرق ممکن تنصیف (دو نیمه کردن) را به دست می‌دهد. استفاده از فرمول دوم باید سطح دشواری سوال های آزمون یکسان باشد.

برای محاسبه ضریب قابلیت اعتماد با این روش، نیازی به داشتن نسبت پاسخ های صحیح و غلط نیست، بلکه در دست داشتن واریانس نمره های کل و میانگین نمرات کفایت می‌کند.

ه‍) روش آلفای کرونباخ: یکی دیگر از روشهای محاسبه قابلیت اعتماد استفاده از فرمول کرونباخ است. این روش برای محاسبه هماهنگی درونی ابزار اندازه گیری از جمله پرسشنامه ها یا آزمونهایی که خصیصه های مختلف را اندازه گیری می کند بکار می رود. در این گونه ابزارها، پاسخ هر سوال می تواند مقادیر عددی مختلف را اختیار کند.

برای محاسبه ضریب آلفای کرونباخ ابتدا باید واریانس نمره های هر زیر مجموعه سوال های پرسشنامه (یا زیر آزمون) و واریانس کل را محاسبه کرد. سپس با استفاده از فرمول آلفای کرونباخ مقدار ضریب آلفا را محاسبه کرد.

و) عوامل موثر بر ضریب قابلیت اعتماد: ضریب قابلیت اعتماد یک آزمون تحت تاثیر عوامل مختلفی قرار دارد که عبارتست از :

1- طول آزمون: علی الاصول آزمون های طولانی تر از قابلیت اعتماد بالاتری در مقایسه با آزمون های کوتاه برخوردارند. برای مثال ضریب قابلیت اعتماد یک آزمون 60  سوالی می‌تواند بیشتر از یک آزمون 40  سوالی باشد.

2- سوال های مشابه از نظر محتوا و با سطح دشواری متوسط، قابلیت اعتماد آزمون را افزایش می‌دهد.

3- ماهیت متغیر اندازه گیری شده نیز ضریب قابلیت اعتماد را تحت تاثیر قرار می‌دهد.

لازم به ذکر است که ضریب قابلیت اعتماد در تفسیر نتایج مهم بوده و شرط اساسی در انتخاب یک ابزار اندازه گیری است.

 

منبع: کتاب روش های تحقیق در علوم رفتاری، تالیف دکتر زهره سرمد، عباس بازرگان و الهه حجازی. 1376، موسسه نشر آگه، تهران.

porseshnameonlie

مقیاسهای اندازه گیری نگرشها

برای اندازه گیری نگرشها می توان از مقیاسهایی استفاده نمود که مهمترین آنها عبارتند از:
الف) مقیاس لیکرت (Likert style): یکی از رایج ترین مقیاسهای اندازه گیری است. این مقیاس از مجموعه ای منظم از گویه ها (عبارات) که به ترتیب خاصی تدوین شده، ساخته می شود. این گویه ها حالات خاصی از پدیده مورد انداره گیری را به صورت گویه هایی که از لحاظ اندازه گیری دارای وزن های مساوی است، عرضه می کند. پاسخ دهنده میزان موافقت خود را با هر یک از این عبارات در مقیاس درجه بندی شده که معمولا از یک تا پنج (یا هفت) درجه است، نشان می دهد. سپس پاسخ آزمودنی به هر یک از گویه ها از نظر عددی (رتبه) ارزش گذاری می شود. حاصل جمع عددی این ارزشها نمره آزمودنی را در این مقیاس به دست می دهد. امروزه اکثر پرسشنامه ها دارای مقیاس لیکرت هستند.
ب) مقیاس افتراق معنایی (Semantic Differential Scale): در این مقیاس از پاسخ دهنده خواسته می شود تا مفهومی را روی یک مقیاس دوقطبی هفت درجه ای علامت گذاری کند. در دو قطب مقیاس دو صفت متضاد با هم قرار دارند.
ج) مقیاس ثرستون (Thurston scale): در این مقیاس از پاسخ دهنده خواسته می شود تا تمام مواردی را که با آنها موافق است، علامت بزند. امتیاز هر فرد در این مقیاس بوسیله تعداد گویه هایی که با آنها موافق است تعیین می شود.
د) مقیاس گاتمن (Gatman): در این مقیاس گویه ها بر حسب دشواری، پیچیدگی یا ارزش وزنی مرتب می شوند و موافقت یا تایید یک گویه، موافقت با سایر گویه های کم وزن تر را به دنبال دارد. این ویژگی “تراکمی بودن” مقیاس گاتمن، امکان می دهد تا با داشتن امتیاز کلی فرد نمره وی را در هر گویه پیش بینی نماییم.

ه) مقیاس فاصله اجتماعی بوگاردوس (Bogardos): در این مقیاس گویه ها به صورت موقعیت های فرضی به ترتیب که معرف فاصله اجتماعی باشد، ارائه می شود. مقیاس بوگاردوس نوعی مقیاس سنجش نگرش است که در بررسی نگرش نسبت به گروههای قومی – نژادی، طبقات اجتماعی، گروههای مذهبی و حرفه ای مورد استفاده قرار می گیرد. پیش فرض این مقیاس آن است که هر چه فرد پیشداوری بیشتری در مورد یک گروه ویژه داشته باشد، فاصله اجتماعی بین او و اعضای گروه بیشتر خواهد بود.

منبع: سازمان و مدیریت: رویکردی پژوهشی نوشته سیدمحمد مقیمی