توضیحات
داده های پرت (Outlier)
تأثیر داده های پرت بر روی نتایج آماری
تأثیر داده های پرت بر انتخاب روش آماری
تأثیر داده های پرت بر نرمال بودن دادهها
موضوع مهمی که در این آموزش به آن پرداخته میشود نرمال نشدن دادهها به علت وجود دادههای پرت است. ممکن است شما هیستوگرام توزیع فراوانی دادهها را رسم کنید و مشاهده کنید شکل توزیع دادهها تقریباً نرمال است اما آزمونهای استنباطی نرمال بودن دادهها را تأیید نمیکند علت این است که آزمونهای تست نرمال بودن به دادههای پرت حساس هستند و درصورتیکه فراوانی دادههای پرت کمی زیاد شود فرض نرمال بودن دادهها رد میشود. دادههای پرت میتوانند باعث افزایش شاخص چولگی (به سمت راست یا چپ) شود و یا در برخی نقاط کشیدگی دادهها را کمتر با بیشتر از کشیدگی شکل توزیع نرمال کند.
برای مثال هیستوگرام در شکل های (1) و (2) را مشاهده کنید توزیع فراوانی متغیر X2 و X3 تقریباً شبیه توزیع نرمال است اما برخی از داده های پرت باعث ایجاد چولگی در هیستوگرام شده است این موارد که در شکل مشخص شدهاند دادهها پرت هستند و با حذف آنها میتوان شکل توزیع دادهها را به توزیع نرمال نزدیک کرد.
حل یک مثال کاربردی در حذف داده های پرت
نمودار هیستوگرام این سه متغیر را در شکلهای شماره (1) و (2) و (3) مشاهده کردیم. ابتدا به کمک آزمون Jarque-Bera تست میکنیم که این سه متغیر نرمال هستند یا خیر. برای انجام این آزمون از نرم افزار Data Normalize Master در پکیج تحلیل آماری است استفاده میکنیم. دادههای این دو متغیر را کپی میکنیم و داخل نرم افزار Data Normalize Master قرار میدهیم.
نقد و بررسیها
هنوز بررسیای ثبت نشده است.