نرمال بودن داده ها: اهمیت نرمال بودن و روش‎‌های بررسی

  • زمان مطالعه: ۹دقیقه

در اغلب آزمون های پارامتری، مفروضات مقدماتی بسیاری وجود دارد که تا این مفروضات تامین نشوند؛ نتایج به دست آمده از آزمون، نامعتبر خواهد بود. در میان این مفروضات مهمترین و شایعترین فرض، فرض نرمال بودن داده هاست. منظور از نرمال بودن توزیع داده ها این است که هیستوگرام فراوانی داده ها تقریبا به صورت منحنی نرمال باشد. در این نوشته به معرفی راه های بررسی نرمال بودن داده ها می پردازیم. لازم است به این نکته مهم توجه شود در اکثر موارد لازم است که توزیع خطاها نرمال باشند یعنی بجای بررسی نرمال بودن داده ها بایستی توزیع خطاها از لحاظ نرمال بودن و یا نبودن بررسی شوند.

راه های بررسی تست نرمال بودن:

الف) تحلیل توصیفی

در این گونه موارد از پارامترهای کشیدگی و چولگی استفاده می گردد و زمانیکه هر دو پارامتر به توزیع نرمال نزدیک بود نشان دهنده این است که توزیع داده ها نرمال است.  چولگی معیاری از تقارن یا عدم تقارن تابع توزیع می‌باشد. برای یک توزیع کاملاً متقارن چولگی صفر و برای یک توزیع نامتقارن با کشیدگی به سمت مقادیر بالاتر چولگی مثبت و برای توزیع نامتقارن با کشیدگی به سمت مقادیر کوچکتر مقدار چولگی منفی است. کشیدگی یا kurtosis  نشان دهنده ارتفاع یک توزیع است. به عبارت دیگر کشیدگی معیاری از بلندی منحنی در نقطه ماکزیمم است و مقدار کشیدگی برای توزیع نرمال برابر ۳ می باشد. کشیدگی مثبت یعنی قله توزیع مورد نظر از توزیع نرمال بالاتر و کشیدگی منفی نشانه پایین تر بودن قله از توزیع نرمال است. برای مثال در توزیع t که پراکندگی داده ها بیشتر از توزیع نرمال است، ارتفاع منحنی کوتاه تر از منحنی نرمال است. در حالت کلی چنانچه چولگی و کشیدگی در بازه (2 ، 2-) نباشند داده‌ها از توزیع نرمال برخوردار نیستند. برای بررسی این پارامترها می توان از نرم افزارهای گوناگون از جمله SPSS استفاده کرد.

ب) تحلیل استنباطی 

در تحلیل استنباطی می توان از آزمون های مختلف برای بررسی توزیع داده ها ( نرمال بودن یا نرمال نبودن) استفاده کرد. از آزمون های مهمی که برای این امر استفاده می گردد و در بیشتر نرم افزارها نیز تعبیه شده است می توان به شاپیرو ویلک، کولوموگروف اسمرینوف و اندرسون دارلینگ اشاره کرد. آزمون کولوموکروف اسمرینوف يک آزمون تطابق توزيع برای داده های کمی است. فرض کنيد محققی نمونه ای از اندازه های کمی در اختيار دارد و می خواهد تعيين کند که آيا اين نمونه از جامعه ای با توزيع نرمال بدست آمده است يا خير؟ آزمون نرمال بودن يک توزيع يکی از شايع ترين آزمون ها برای نمونه های کوچک است که محقق به نرمال بودن آن شک دارد. برای اين هدف آزمون K-S، آزمون مناسبی است. آزمون شاپیرو-ویلک، اصل فرض صفر را به‌کار می‌گیرد تا بررسی کند که آیا یک نمونه x1, ... , xn از یک جامعه دارای توزیع طبیعی ناشی می‌شود یا نه. آزمون اندرسون دارلینگ هم مانند دو آزمون قبلی هنگامی که P-value بیشتر از ۰.۰۵ (با آلفا یا سطح اطمینان) باشد نرمال بودن داده را نشان می‌دهد. اندرسون دارلینگ هم همانند K-s قابلیت استفاده برای توزیع‌هایی غیر از توزیع نرمال را دارد.

در این آزمون ها چنانچه فرض صفر رد گردد توزیع داده ها نرمال نبوده و برعکس در صورت قبول فرض صفر می توان عنوان نمود که توزیع داده نرمال می باشد.