کوپر دو رهیافت اصلی به نمونهگیری در پیمایشهای مبتنی بر وب بیان کرده است:
در نوع احتمالی، پژوهشگر جامعه را شناسایی میکند و یک چهارچوب را برای نمونهگیری تهیه کرده و سپس اقدام به نمونهگیری تصادفی میکند. با این روش احتمال اینکه هر واحد از جامعه تحقیق در نمونه بگنجد مشخص است و از این رو میزان خطای نمونهگیری نیز قابل محاسبه است. این رهیافت میتواند برای تعمیم درباره جامعهای که پژوهش بر آن مبتنی است مورد استفاده قرار گیرد. نوع دیگر، نمونهگیری غیراحتمالی است که احتمالا رایج ترین نوع مورد استفاده در پیمایشهای اینترنتی است. در این نوع پیمایشها هیچ تلاشی برای شناسایی چهارچوب نمونهگیری با انتخاب تصادفی نمونه صورت نمیگیرد. این شیوه عموما در مواردی که شناسایی جامعه پژوهش ویا تماس با یک نمونه احتمالی از جامعه مشکل است مورد استفاده قرار میگیرد. هر نوع نتیجهگیری در مورد پارامترهای جامعه در پیمایشهای غیراحتمالی به صورت بالقوه دارای مشکل است. ناتان (Nathan) نیز اذعان داشته که اکثر پیمایشهای اینترنتی مبتنی بر نمونهگیری غیراحتمالی و خودگزینشی هستند.
اهمیت احتمالی بودن نمونهگیری در این نکته نهفته است که امکان محاسبه خطای نمونهگیری تنها در مورد نمونههای احتمالی وجود دارد و تعدادی از مفاهیم اصلی نظیر انحراف استاندارد و بازه اطمینان نیز مبتنی بر خطای نمونهگیری هستند. به عنوان مثال تصور کنید که پیمایش یک جامعه نمونه نشان داده است که میانگین میزان مطالعه افراد جامعه پژوهش 90 دقیقه در هفته است. سوال این است که آیا پیمایش دیگری بر روی همین جامعه نیز به همین نتیجه یا نتیجهای نزدیک به این خواهد رسید؟ تصور کنید که انحراف استاندارد توزیع نمونهگیری ما دو دقیقه است، بنابراین میتوانیم بگوییم که ما 95 درصد اطمینان داریم که متوسط میزان مطالعه افراد جامعه ما بین 91 تا 99 دقیقه (بعلاوه یا منهای دوبرابر انحراف استاندارد) در هفته است و یا بگوییم که تقریبا 99 درصد اطمینان داریم که مابین 90 و 100 دقیقه (بعلاوه یا منهای دو و نیم برابر انحراف استاندارد) در هفته است. به فواصل میان این اعداد بازههای اطمینان، و به احتمالات مختلف سطوح اطمینان گفته میشود. در صورتیکه نمونهگیری پیمایش از نوع احتمالی و غیرسویافته باشد، اگر ما به دفعات دست به نمونهگیری تازه بزنیم و همین روش را تکرار کرده و یک توزیع نمونهگیری ایجاد کنیم، میانگین توزیع ما با میانگین حقیقی کل جامعه پژوهش مطابق خواهد بود. به عبارت دیگر نتایج به دست آمده از نمونه، بازتابی از کل جامعه پژوهش و در نتیجه قابل تعمیم خواهد بود. اما در یک نمونه غیراحتمالی (که در پیمایشهای الکترونیکی بسیار شایع است)، نمونهگیری میتواند به سادگی منجر به سویافتگی نتایج شود. به عنوان مثال ممکن است که بیشتر افرادی مورد پیمایش قرار گیرند که زمان بیشتری را صرف مطالعه میکنند در نتیجه میانگین حاصله بیشتر از میانگین واقعی جامعه خواهد بود. در این نوع نمونهگیریها امکان محاسبه خطای نمونهگیری وجود ندارد لذا از میزان نادرستی نتایج نیز نمیتوان تخمینی ارائه کرد.
لازار و پریس در بحث خود درباره روشهای نمونهگیری در پیمایشهای الکترونیکی، دو نوع جامعه پژوهش قائل شدهاند: جامعه پژوهش تعریف شده و مشخص، و جامعه پژوهش نامشخص. آنها شیوههایی را برای دستیابی به یک جامعه پژوهش قابل قبول زمانی که جامعه پژوهش نامشخص است ذکر کردهاند:
شیوههای دیگری نیز وجود دارد از جمله میتوان با استفاده از پاپ آپ ها ترتیبی داد که به صورت تصادفی به عنوان مثال از میان هر پنج بازدید کننده از یک وب سایت، پنجمین نفر از وجود پیمایش مطلع و از وی دعوت به پاسخگویی شود. با توجه به مشخص بودن تعداد بازدیدکنندگان یک وب سایت، این روش میتواند نمونهگیری نسبتا خوبی به دست دهد.
منبع: ISI web of knowledge