اعتبار اندازه گيري (روايي) ابزار اندازه گيري

  • زمان مطالعه: ۷دقیقه

مفهوم اعتبار يا روايي (Validity) به اين سوال پاسخ مي‌دهد كه ابزار اندازه گيري تا چه حد خصيصه مورد نظر را مي سنجد. بدون آگاهي از اعتبار ابزار اندازه گيري نمي‌توان به دقت داده هاي حاصل از آن اطمينان داشت. ابزار اندازه گيري ممكن است براي اندازه گيري يك خصيصه ويژه داراي اعتبار باشد، در حالي كه براي سنجش همان خصيصه بر روي جامعه ديگر از هيچ گونه اعتباري برخوردار نباشد.

براي مثال يك آزمون رياضي ممكن است براي سنجش توانايي رياضي دانش آموزان پايه پنجم ابتدايي از اعتبار لازم برخوردار باشد اما براي سنجش توانايي رياضي دانش آموزان پايه سوم راهنمايي فاقد اعتبار باشد. روش هاي متعددي براي تعيين اعتبار ابزار اندازه گيري وجود دارد كه در اين جا به اختصار در مورد هر يك توضيح داده خواهد شد؛

الف) اعتبار محتوا: 

اعتبار محتوا نوعي اعتبار است كه معمولا براي بررسي اجزاي تشكيل دهنده يك ابزار اندازه گيري به كار برده مي‌شود. به عنوان مثال براي يك آزمون پيشرفت تحصيلي بايد اعتبار محتواي آن را مورد نظر قرار داد. اعتبار محتواي يك ابزار اندازه گيري به سوال هاي تشكيل دهنده آن بستگي دارد. اگر سوال هاي ابزار معرف وپژگي ها و مهارت هاي ويژه اي باشد كه محقق قصد اندازه گيري آن‌ها را داشته باشد، آزمون داراي اعتبار محتوا است. براي اطمينان از اعتبار محتوا، بايد در موقع ساختن ابزار (مانند طراحي پرسشنامه) چنان عمل كرد كه سوال هاي تشكيل دهنده ابزار معرف قسمت هاي محتواي انتخاب شده باشد. بنابراين اعتبار محتوا ويژگي ساختاري ابزار است كه همزمان با تدوين آزمون در آن تنيده مي‌شود. اعتبار محتواي يك آزمون معمولا توسط افرادي متخصص در موضوع مورد مطالعه تعيين مي‌شود. از اين رو اعتبار محتوا به قضاوت داوران بستگي دارد.

ب) اعتبار ملاكي:

اعتبار ملاكي عبارتست از كارآمدي يك ابزار اندازه گيري در پيش بيني رفتار يك فرد در موقعيت هاي خاص. براي اين منظور عملكرد هر فرد در آزمون با يك ملاك مقايسه مي‌شود. به عبارت ديگر اعتبار ملاكي يك ابزار اندازه گيري عبارتست از همبستگي بين نمرات آزمون و نمره ملاك. اعتبار ملاكي بر دو نوع است:

1- اعتبار پيش بين    ،    2- اعتبار همزمان

1-اعتبار پيش بين: در اندازه گيري هاي رواني- تربيتي، اعتبار پيش بين عبارتست از بررسي رابطه نمره هاي آزموني كه برخي ويژگي ها را مي سنجد و آن چه ادعاي پيش بيني آن را دارد. اعتبار پيش بين مي‌تواند به وسيله رابطه عملكرد در يك آزمون با آزمون ملاك رفتاري به دست آيد. به عبارت ديگر ضريب همبستگي نمره هاي حاصل از اجراي آزمون با نمره هاي متغير ملاك، نمايانگر اعتبار پيش بين است.

2- اعتبار همزمان: اعتبار همزمان در مواردي به كار مي‌رود كه داده هاي حاصله از دو اندازه گيري در يك زمان در دسترس باشد. در اين گونه موارد عملكرد در يك آزمون به عملكرد در آزمون ديگر مرتبط مي‌گردد. اين فرايند اعتبار همزمان ناميده مي‌شود. اعتبار همزمان در مواردي محاسبه مي‌شود كه هدف جانشين كردن يك ابزار اندازه گيري به جاي ابزار ديگري باشد. اين امر بيشتر به علت ملاحظات مربوط به سهولت اجراي آزمون يا جانشين كردن يك آزمون كوتاهتر به جاي يك آزمون طويل تر است. در اين مورد نيز ضريب همبستگي بين نمره هاي حاصل از اجراي آزمون با نمره هاي بدست آمده از اجراي آزمون ديگر يا اندازه هاي حاصل از اندازه گيري ديگري كه همزمان به عمل آمده است به عنوان ميزان اعتبار اندازه گيري به كار مي‌رود.

ج) اعتبار سازه:

اعتبار سازه  يك ابزار اندازه گيري نمايانگر آن است كه ابزار اندازه گيري تا چه اندازه يك سازه يا خصيصه اي را كه مبناي  نظري دارد مي سنجد. در بررسي اعتبار سازه بايد به تدوين فرضيه هايي درباره مفاهيم اندازه گيري شده، آزمودن اين فرضيه ها و محاسبه همبستگي نتايج با اندازه گيري اوليه پرداخت. اگر ضريب همبستگي حاصله بالا باشد اعتبار سازه افزايش مي‌يابد ولي اگر همبستگي معني دار نباشد علت را مي‌توان به عوامل زير نسبت داد:

1- جمع آوري داده ها با اشكال همراه بوده است.

2- پيش بيني و فرضيه ها غلط بوده است.

3- ابزار، خصيصه مورد نظر را اندازه گيري نمي‌كند.

اگر چه فرايند برقراري اعتبار سازه امر بي انتهايي است ولي محقق يا سازنده آزمون مي‌تواند اعتبار سازه يك آزمون را در موقعيت هاي خاص نشان دهد.

از جمله شيوه هايي كه براي تعيين اعتبار سازه به كار مي‌رود موارد زير است:

1- تفاوت هاي گروهي: اگر نظريه اي تفاوتي را بين گروهها (يا هيچ تفاوتي را) در نمرات آزمون پيش بيني كند، آزموني كه اين تفاوت را نشان دهد (يا ندهد) داراي اعتبار سازه است. براي مثال پيش بيني مي‌شود كه كودكان و بزرگسالان در بلوغ اجتماعي با هم تفاوت دارند. بنابراين اگر آزموني كه براي اندازه گيري خصيصه بلوغ اجتماعي ساخته شده باشد، تفاوت معني داري را بين كودكان و بزرگسالان نشان دهد داراي اعتبار سازه است.

2- تغييرات: چنانچه  نظريه اي پيش بيني كند كه خصيصه مورد اندازه گيري تحت تاثير زمان يا مداخله آزمايشي قرار مي گيرد، اگر نمرات آزمون اين تاثير را نشان دهد داراري اعتبار سازه است.  براي مثال اگر آزموني مهارت هاي كلامي را مي سنجد بايد با افزايش سن آزمودني ها نمرات افزايش يابد، يا اگر مداخله اجتماعي براي پرورش اين مهارت ها صورت گرفته باشد نمرات پيش آزمون و پس آزمون بايد تغييرات معني داري را نشان دهد.

3- اعتبار همگرا و واگرا (تشخيصي): هر گاه يك يا چند خصيصه از طريق دو يا چند روش اندازه گيري شوند همبستگي بين اين اندازه گيري ها دو شاخص مهم اعتبار را فراهم مي آورد. اگر همبستگي بين نمرات آزمون هايي كه خصيصه واحدي را اندازه گيري مي‌كند بالا باشد، آزمون ها داراي اعتبار همگرا مي‌باشد. چنانچه همبستگي بين آزمون هايي كه خصيصه هاي متفاوتي را اندازه گيري مي‌كند پايين باشد، آزمون ها داراي اعبتار تشخيصي يا واگرا است.

د) اعتبار عاملي:

 اعتبار عاملي صورتي از اعتبار سازه است كه از طريق تحليل عاملي به دست مي‌آيد. يك عامل، يك متغير فرضي (سازه) است كه نمرات مشاهده شده را در يك يا چند متغير تحت تاثير قرار مي‌دهد. هر گاه تحليل عاملي روي يك ماتريس همبستگي صورت گيرد آزمون هايي كه تحت تاثير عوامل خاصي قرار گرفته داراي بار عاملي بالا در آن عامل است.

برای آشنایی با قابلیت اعتماد مطلب قابليت اعتماد (پايايي) ابزار اندازه گيري را مطالعه نمایید.

منبع: كتاب روش هاي تحقيق در علوم رفتاري، تاليف دكتر زهره سرمد، عباس بازرگان و الهه حجازي. 1376، موسسه نشر آگه، تهران.