در آنالیز واریانس یک عامله در صورت رد فرض صفر (یعنی تفاوت معناداراست )ما می توانیم برای تشخیص تفاوت درون گروهها از آزمونهای تعقیبی (Post Hoc ) استفاده کنیم.در واقع ببینیم این تفاوت در بین کدام یک از گروها وجود دارد.
انواع آزمونهای مقایسههای چندگانه تعقیبی (Post hoc) بعد از معنیدار بودن تفاوت میانگینها
تحلیل واریانس نشان میدهد که آیا نمونهها متعلق به جامعه هستند یا خیر. در صورتی که فرض صفر رد شود، معلوم نیست که کدام یک از نمونهها در کدام جامعه قرار دارند. به عبارت دیگر، معنیدار شدن نسبت F به ما نمیگوید که اختلاف بین کدام جفت از میانگینها معنیدار است. بلکه با آماره F ، تنها میتوانیم پی ببریم که اختلاف بین میانگین گروهها معنیدار است.
در هنگام تحلیل واریانس و به عبارتی آزمون تفاوت میانگینها در بین سه گروه و بیشتر، علاوه بر آزمون معنیداری این تفاوت میانگینها، لازم است که به کیفیت این تفاوت نیز پی ببریم. چرا که آشنایی با کیفیت این تفاوت، نقش مهمی در آزمون فرضیه و تفسیر نتایج آن و همچنین در جمعبندی و ارائه راهکارها برای گزارش دارد. در نرمافزار SPSS ، نوع آزمون مقایسه چندگانه تعریفشده که به کمک آنها میتوانیم چگونگی تفاوت میانگین نمره گروهها از همدیگر را تشخیص دهیم. هدف این آزمونها، بررسی تفاوت دو به دو میانگینها یا ترکیب خطی از آنهاست.
در خصوص برتری استفاده از این آزمونها، باید گفت که آزمونهایی بیش تر از همه مورد استفاده قرار میگیرند که نرخ خطای نوع اول را تعدیل کرده و به عبارتی از میزان تورم آن بکاهد. همچنین، انتخاب نوع آزمون مقایسه چندگانه بر اساس دو معیار، برابری حجم نمونه و برابری واریانس انجام میگیرد.
در نرمافزار spss ، تمامی آزمونهای مقایسهای چندگانه به آزمونهای مقایسه اثرات اصلی(Main Effect) معروفاند که در صفحه خروجی با عبارت «مقایسه های جفتی یا دوتایی» نشان داده میشوند. چون میانگینهای گروهها را 2×2 با هم مقایسه میکنند تا مشخص شود کدام گروهها با هم فرق دارند.
در یک تقسیمبندی کلی، این 18 آزمون مقایسه چندگانه با توجه به معیار برابری یا عدم برابری واریانس ها، به دو گروه اصلی تقسیم میشوند:
آزمون مقایسه چندگانه با فرض برابری واریانس ها
حداقل تفاوت معنیدار فیشر (LSD):
این آزمون یکی از قدیمیترین و قویترین آزمونها برای مقایسه پس از تجربه است. در صورتی که تعداد میانگینها از سه تا بیشتر نباشد، بهتر است از این آزمون استفاده شود. اما اگر میانگینهای مورد مقایسه بیش از سه مورد باشد، بهتر است سایر آزمونها مورد استفاده قرار گیرد.
بونفرونی (Bonferroni):
این آزمون، بر اساس آماره t و با کنترل نرخ خطای کل، سطح معناداری مشاهده شده را بر اساس واقعیتی که مقایسههای چندگانه انجام دادهاند، تعدیل میکند. پیشنهاد میشود که برای آزمون تعداد جفتهای کم تر، از آزمون بونفرونی استفاده شود تا آزمون توکی.
سیداک (Sidak):
این آزمون بر اساس آماره t، سطح معناداری را تعدیل کرده و مرزهای نزدیک تری در مقایسه با آزمون بونفرونی فراهم میکند.
شفه (Scheffe):
اگر قصد مقایسه میانگین گروههای با حجم نابرابر را داریم، روش شفه مناسبترین آزمون است. اما اشکال عمده این روش، محتاطانه یا محافظهکارانه بودن آن است. بدین معنی که چون آزمون شفه تمامی ترکیبهای خطی احتمالی میانگین گروهها را آزمون میکند، بنابراین، در این آزمون، صرفاً ترکیبهای جفتی آزمون نمیشوند. در نتیجه آزمون شفه نسبت به سایر آزمونها محافظهکارتر است. به همین خاطر، برای این که تفاوت بین میانگینها معنیدار باشد، نیازمند میزان بالایی از این تفاوت هستیم.
همچنین، آزمون شفه، در مقایسه با آزمون توکی، برای آزمون یک دسته اطلاعات یکسان، فرض صفر را کمتر رد میکند. مهمترین مزیتهای آزمون شفه نسبت به آزمون توکی، امکان کاربرد آن در مورد گروههای با حجمهای نابرابر و عدم حساسیت آن نسبت به انحراف از پیش فرضهای نرمال بودن توزیع دادهها و همگونی واریانس ها میباشد. این روش به α بزرگ تری نیاز دارد. به همین دلیل، برخی از پژوهش گران هنگام استفاده از این آزمون، از سطح 1/0 به جای 05/0 استفاده میکنند.
آزمون F رادیان – اینوت – گابریل – ولش (R-E-G-W-F)
این آزمون بر اساس مقدار آماره F، به مقایسه چندگانه گروهها با همدیگر میپردازد.
آزمون Q رادیان – اینوت – گابریل – ولش (R-E-G-W-Q)
این آزمون که معمولاً برای نمونههای برابر به کار میرود، توان خوبی در تمایز گروهها از همدیگر دارد. علاوه بر این، کنترل شدیدی هم بر میزان خطای نوع اول دارد.
نیومن-کلز استودنت شده (S-N-K)
آزمون سادهای است که به جای آزمون دانکن بکار میرود. در آزمون نیومن-کلز، ابتدا میانگینها از بالاترین تا پایینترین مقدار مرتب میشوند و سپس تفاوت بین هر جفت میانگین محاسبه میشود. در نهایت نیز، ارزش مقایسهای که برای هر جفت از میانگینها به طور جداگانه محاسبه میشود، با هم مقایسه میگردند.
توکی (Tukey)
این آزمون که به آزمونهای کمترین تفاوتهای راستین توکی و ای. توکی نیز معروف است، از آماره طیف استودنت شده برای تمامی مقایسههای جفتی بین گروهها استفاده کرده و نرخ خطای تجربی را با نرخ خطای حاصل از جمعآوری برای تمامی مقایسههای جفتی هماهنگ میکند. پیشنهاد میشود زمانی که قصد دارید تعداد زیادی جفت میانگین را آزمون کنید، از آزمون توکی استفاده کنید زیرا این آزمون از آزمون بونفرونی قوی تر است.
استفاده از آزمون توکی مستلزم تعیین یک اندازه بحرانی HSD برای دادههای مورد مطالعه است. هرگاه تفاوت میانگین هر جفت از گروههای مورد مطالعه برابر یا بیشتر از اندازه بحرانی HSD باشد، فرض صفر درباره معنیدار بودن تفاوت بین آنها رد میشود. به عبارت دیگر تفاوت بین آنها معنادار است. در شرایطی که حجم نمونهها مساوی باشد استفاده از روش توکی مناسب است.
بی. توکی (Tukey’s b)
این آزمون برای انجام مقایسههای جفتی بین گروهها، از میانگین مقدار بحرانی آزمون توی و نیومن-کولز استودنت شده استفاده میکند.
دانکن (Duncan)
در این آزمون، که به آزمون چند دامنه دانکن نیز معروف است، چنانچه قدر مطلق اختلاف میانگینهای مورد مقایسه بزرگ تر یا مساوی r_α (s_x ̅ ) باشد، اختلاف بین میانگینهای مورد مقایسه معنیدار است. در این آزمون برای مقایسه هر جفت میانگین، مقدار r_α (s_x ̅ ) خاص آن مقایسه محاسبه می شود.
آزمون جی. تی. دو هوشبرگ (Hochberg’s GT2)
این آزمون همانند آزمون توکی است، منتهی تفاوتی که با آن دارد، این است که از حداکثر قدر مطلق استودنت شده استفاده میکند. ضمن آنکه معمولاً آزمون توکی قوی تر از این آزمون است.
گابریل (Gabriel)
این آزمون نیز از حداکثر قدر مطلق استودنت شده استفاده کرده و زمانی که حجم نمونه با هم نابرابر باشند، عموماً قوی تر از آزمون جی. تی. دو هوشبرگ میباشد. اما زمانی که حجم نمونهها تفاوت زیادی با هم داشته باشند، مقدار آزمون گابریل لیبرال بوده و مقدار بالاتری را نشان خواهد داد.
والر-دانکن (Waller-Duncan)
این آزمون که به آزمونتی. والر-دانکن نیز معروف است، از رویکرد بیزی(Bayesian) استفاده میکند. زمانی که اندازههای نمونه با هم برابر نباشند، این آزمون از میانگین هارمونیک اندازه نمونه استفاده میکند.
دانت (Dunnett)
این آزمون که یک آزمون t جهت مقایسه چندگانه جفتی است، مجموعهای از طبقات را در برابر تنها یک میانگین کنترل مقایسه میکند. در اجرای این آزمون، طبقه آخر، به صورت پیش گزیده به عنوان طبقه کنترل در نظر گرفته میشود.
آزمونهای مقایسه چندگانه با فرض عدم برابری واریانس ها
آزمون مقایسه چندگانه که فرض عدم برابری واریانس ها را میپذیرند، شامل 4 آزمون میباشند که در زیر به شرح هر یک پرداخته میشود:
تی. دو تمهنه (Tamhane’s T2)
آزمون محافظهکاری است که بر اساس مقدار آماره t ، به مقایسه جفتی گروهها با همدیگر میپردازد.
تی. سه دانت (Dunntt’s T3)
این آزمون بر اساس حداکثر قدر مطلق استودنت شده، به مقایسه جفتی گروهها با همدیگر میپردازد.
جیمز – هوئل (Games-Howell)
این آزمون اغلب لیبرال عمل میکند و تفاوت گروهها با همدیگر را بسیار زیاد نشان میدهد.
سی دانت (Dunnett’s C)
این آزمون بر اساس طیف استودنت شده، به مقایسه جفتی گروهها با همدیگر میپردازد.
آموزش تصویری تحلیل واریانس ANOVA و آزمون های تعقیبی
برای یادگیری تحلیل واریانس ANOVA می توانید آموزش تصویری زیر را تهیه کنید. برای دیدن سرفصل این آموزش به صفحه خرید محصول مراجعه کنید: