مفهوم اعتبار يا روايي (Validity) به اين سوال پاسخ ميدهد كه ابزار اندازه گيري تا چه حد خصيصه مورد نظر را مي سنجد. بدون آگاهي از اعتبار ابزار اندازه گيري نميتوان به دقت داده هاي حاصل از آن اطمينان داشت. ابزار اندازه گيري ممكن است براي اندازه گيري يك خصيصه ويژه داراي اعتبار باشد، در حالي كه براي سنجش همان خصيصه بر روي جامعه ديگر از هيچ گونه اعتباري برخوردار نباشد.
براي مثال يك آزمون رياضي ممكن است براي سنجش توانايي رياضي دانش آموزان پايه پنجم ابتدايي از اعتبار لازم برخوردار باشد اما براي سنجش توانايي رياضي دانش آموزان پايه سوم راهنمايي فاقد اعتبار باشد. روش هاي متعددي براي تعيين اعتبار ابزار اندازه گيري وجود دارد كه در اين جا به اختصار در مورد هر يك توضيح داده خواهد شد؛
اعتبار محتوا نوعي اعتبار است كه معمولا براي بررسي اجزاي تشكيل دهنده يك ابزار اندازه گيري به كار برده ميشود. به عنوان مثال براي يك آزمون پيشرفت تحصيلي بايد اعتبار محتواي آن را مورد نظر قرار داد. اعتبار محتواي يك ابزار اندازه گيري به سوال هاي تشكيل دهنده آن بستگي دارد. اگر سوال هاي ابزار معرف وپژگي ها و مهارت هاي ويژه اي باشد كه محقق قصد اندازه گيري آنها را داشته باشد، آزمون داراي اعتبار محتوا است. براي اطمينان از اعتبار محتوا، بايد در موقع ساختن ابزار (مانند طراحي پرسشنامه) چنان عمل كرد كه سوال هاي تشكيل دهنده ابزار معرف قسمت هاي محتواي انتخاب شده باشد. بنابراين اعتبار محتوا ويژگي ساختاري ابزار است كه همزمان با تدوين آزمون در آن تنيده ميشود. اعتبار محتواي يك آزمون معمولا توسط افرادي متخصص در موضوع مورد مطالعه تعيين ميشود. از اين رو اعتبار محتوا به قضاوت داوران بستگي دارد.
اعتبار ملاكي عبارتست از كارآمدي يك ابزار اندازه گيري در پيش بيني رفتار يك فرد در موقعيت هاي خاص. براي اين منظور عملكرد هر فرد در آزمون با يك ملاك مقايسه ميشود. به عبارت ديگر اعتبار ملاكي يك ابزار اندازه گيري عبارتست از همبستگي بين نمرات آزمون و نمره ملاك. اعتبار ملاكي بر دو نوع است:
1- اعتبار پيش بين ، 2- اعتبار همزمان
1-اعتبار پيش بين: در اندازه گيري هاي رواني- تربيتي، اعتبار پيش بين عبارتست از بررسي رابطه نمره هاي آزموني كه برخي ويژگي ها را مي سنجد و آن چه ادعاي پيش بيني آن را دارد. اعتبار پيش بين ميتواند به وسيله رابطه عملكرد در يك آزمون با آزمون ملاك رفتاري به دست آيد. به عبارت ديگر ضريب همبستگي نمره هاي حاصل از اجراي آزمون با نمره هاي متغير ملاك، نمايانگر اعتبار پيش بين است.
2- اعتبار همزمان: اعتبار همزمان در مواردي به كار ميرود كه داده هاي حاصله از دو اندازه گيري در يك زمان در دسترس باشد. در اين گونه موارد عملكرد در يك آزمون به عملكرد در آزمون ديگر مرتبط ميگردد. اين فرايند اعتبار همزمان ناميده ميشود. اعتبار همزمان در مواردي محاسبه ميشود كه هدف جانشين كردن يك ابزار اندازه گيري به جاي ابزار ديگري باشد. اين امر بيشتر به علت ملاحظات مربوط به سهولت اجراي آزمون يا جانشين كردن يك آزمون كوتاهتر به جاي يك آزمون طويل تر است. در اين مورد نيز ضريب همبستگي بين نمره هاي حاصل از اجراي آزمون با نمره هاي بدست آمده از اجراي آزمون ديگر يا اندازه هاي حاصل از اندازه گيري ديگري كه همزمان به عمل آمده است به عنوان ميزان اعتبار اندازه گيري به كار ميرود.
اعتبار سازه يك ابزار اندازه گيري نمايانگر آن است كه ابزار اندازه گيري تا چه اندازه يك سازه يا خصيصه اي را كه مبناي نظري دارد مي سنجد. در بررسي اعتبار سازه بايد به تدوين فرضيه هايي درباره مفاهيم اندازه گيري شده، آزمودن اين فرضيه ها و محاسبه همبستگي نتايج با اندازه گيري اوليه پرداخت. اگر ضريب همبستگي حاصله بالا باشد اعتبار سازه افزايش مييابد ولي اگر همبستگي معني دار نباشد علت را ميتوان به عوامل زير نسبت داد:
1- جمع آوري داده ها با اشكال همراه بوده است.
2- پيش بيني و فرضيه ها غلط بوده است.
3- ابزار، خصيصه مورد نظر را اندازه گيري نميكند.
اگر چه فرايند برقراري اعتبار سازه امر بي انتهايي است ولي محقق يا سازنده آزمون ميتواند اعتبار سازه يك آزمون را در موقعيت هاي خاص نشان دهد.
از جمله شيوه هايي كه براي تعيين اعتبار سازه به كار ميرود موارد زير است:
1- تفاوت هاي گروهي: اگر نظريه اي تفاوتي را بين گروهها (يا هيچ تفاوتي را) در نمرات آزمون پيش بيني كند، آزموني كه اين تفاوت را نشان دهد (يا ندهد) داراي اعتبار سازه است. براي مثال پيش بيني ميشود كه كودكان و بزرگسالان در بلوغ اجتماعي با هم تفاوت دارند. بنابراين اگر آزموني كه براي اندازه گيري خصيصه بلوغ اجتماعي ساخته شده باشد، تفاوت معني داري را بين كودكان و بزرگسالان نشان دهد داراي اعتبار سازه است.
2- تغييرات: چنانچه نظريه اي پيش بيني كند كه خصيصه مورد اندازه گيري تحت تاثير زمان يا مداخله آزمايشي قرار مي گيرد، اگر نمرات آزمون اين تاثير را نشان دهد داراري اعتبار سازه است. براي مثال اگر آزموني مهارت هاي كلامي را مي سنجد بايد با افزايش سن آزمودني ها نمرات افزايش يابد، يا اگر مداخله اجتماعي براي پرورش اين مهارت ها صورت گرفته باشد نمرات پيش آزمون و پس آزمون بايد تغييرات معني داري را نشان دهد.
3- اعتبار همگرا و واگرا (تشخيصي): هر گاه يك يا چند خصيصه از طريق دو يا چند روش اندازه گيري شوند همبستگي بين اين اندازه گيري ها دو شاخص مهم اعتبار را فراهم مي آورد. اگر همبستگي بين نمرات آزمون هايي كه خصيصه واحدي را اندازه گيري ميكند بالا باشد، آزمون ها داراي اعتبار همگرا ميباشد. چنانچه همبستگي بين آزمون هايي كه خصيصه هاي متفاوتي را اندازه گيري ميكند پايين باشد، آزمون ها داراي اعبتار تشخيصي يا واگرا است.
اعتبار عاملي صورتي از اعتبار سازه است كه از طريق تحليل عاملي به دست ميآيد. يك عامل، يك متغير فرضي (سازه) است كه نمرات مشاهده شده را در يك يا چند متغير تحت تاثير قرار ميدهد. هر گاه تحليل عاملي روي يك ماتريس همبستگي صورت گيرد آزمون هايي كه تحت تاثير عوامل خاصي قرار گرفته داراي بار عاملي بالا در آن عامل است.
برای آشنایی با قابلیت اعتماد مطلب قابليت اعتماد (پايايي) ابزار اندازه گيري را مطالعه نمایید.
منبع: كتاب روش هاي تحقيق در علوم رفتاري، تاليف دكتر زهره سرمد، عباس بازرگان و الهه حجازي. 1376، موسسه نشر آگه، تهران.