Section author: Danielle J. Navarro and David R. Foxcroft

ஒரு மாதிரியின் இயல்பான தன்மையை சரிபார்க்கிறது

இந்த அத்தியாயத்தில் இதுவரை நாம் விவாதித்த அனைத்து சோதனைகளும் தரவு பொதுவாக விநியோகிக்கப்படுகின்றன என்று கருதுகின்றன. இந்த அனுமானம் பெரும்பாலும் மிகவும் நியாயமானதாகும், ஏனெனில்: ref: மத்திய வரம்பு தேற்றம் <sentral_limit_theorem> பல உண்மையான உலக அளவுகள் பொதுவாக விநியோகிக்கப்படுவதை உறுதி செய்கிறது. உங்கள் மாறி *உண்மையில் *பல்வேறு விசயங்களின் சராசரியாக நீங்கள் சந்தேகிக்கும் எந்த நேரத்திலும், அது பொதுவாக விநியோகிக்கப்படும் என்பதற்கு ஒரு நல்ல வாய்ப்பு உள்ளது, அல்லது குறைந்தபட்சம் இயல்பு நிலைக்கு மூடுங்கள் *t *- சோதனைகள். இருப்பினும், வாழ்க்கை உத்தரவாதங்களுடன் வரவில்லை, தவிர பல வழிகள் உள்ளன, அதில் நீங்கள் மிகவும் இயல்பான மாறிகள் கொண்ட மாறிகள் முடிவடையும். எடுத்துக்காட்டாக, உங்கள் மாறி உண்மையில் பல்வேறு விசயங்களின் குறைந்தபட்சம் என்று நீங்கள் நினைக்கும் எந்த நேரத்திலும், அது மிகவும் வளைந்து போகும் ஒரு நல்ல வாய்ப்பு உள்ளது. உளவியலில், மறுமொழி நேரம் (ஆர்டி) தரவு இதற்கு ஒரு சிறந்த எடுத்துக்காட்டு. மனித பங்கேற்பாளரிடமிருந்து பதிலைத் தூண்டக்கூடிய நிறைய விசயங்கள் உள்ளன என்று நீங்கள் கருதினால், இந்த தூண்டுதல் நிகழ்வுகளில் ஒன்று நிகழும் முதல் முறையாக உண்மையான பதில் நிகழும். [#] _ இதன் பொருள் ஆர்டி தரவு முறையாக இயல்பானது அல்ல . சரி, எனவே எல்லா சோதனைகளாலும் இயல்புநிலை கருதப்பட்டால், உண்மையான உலக தரவுகளால் பெரும்பாலும் ஆனால் எப்போதும் நிறைவு அடையவில்லை (குறைந்தது தோராயமாக), ஒரு மாதிரியின் இயல்பான தன்மையை எவ்வாறு சரிபார்க்கலாம்? இந்த பிரிவில் நான் இரண்டு முறைகளைப் பற்றி விவாதிக்கிறேன்: QQ அடுக்கு மற்றும் சாபிரோ-வில்க் சோதனை.

QQ அடுக்கு

பொதுவாக விநியோகிக்கப்பட்ட தரவுகளுக்கான இச்டோகிராம் மற்றும் QQ சூழ்ச்சி

Fig. 101 Histogram (left panel) and QQ plot (right panel) for the column Normal in the distributions data set, a normally-distributed sample with 200 observations. The Shapiro-Wilk statistic associated with these data is W = 0.992, indicating that no significant departures from normality were detected (p = 0.361).

வளைந்த மற்றும் வால் தரவுகளுக்கான இச்டோகிராம் மற்றும் கியூக் சூழ்ச்சி

Fig. 102 மேல் வரிசையில், | விநியோகங்கள் | _ தரவு தொகுப்பு `` வளைந்த`` நெடுவரிசையில் 200 அவதானிப்புகளுக்கான ஒரு இச்டோகிராம் (மேல்-இடது குழு) மற்றும் QQ சூழ்ச்சி (மேல்-வலது குழு). இங்குள்ள தரவின் வளைவு 1.543 ஆகும், மேலும் இது ஒரு QQ சதித்திட்டத்தில் பிரதிபலிக்கிறது, இது மேல்நோக்கி வளைகிறது மற்றும் `` தரப்படுத்தப்பட்ட எச்சங்கள்`` க்குள் குறைந்த மதிப்புகள் இல்லை. இதன் விளைவாக, சாபிரோ-வில்க் புள்ளிவிவரம்* w* = 0.732 ஆகும், இது இயல்புநிலையிலிருந்து குறிப்பிடத்தக்க விலகலை பிரதிபலிக்கிறது (* ப* <0.001). | விநியோகங்கள் | _ தரவு தொகுப்பு `` கனமான வால் `` நெடுவரிசையில் உள்ள 200 அவதானிப்புகளுக்கான அதே அடுக்குகளை கீழ் வரிசை காட்டுகிறது. இந்த வழக்கில், தரவுகளில் உள்ள கனமான வால்கள் அதிக கர்டோசிசை (8.225) உருவாக்குகின்றன, மேலும் QQ சூழ்ச்சி நடுவில் தட்டையானது, மேலும் இருபுறமும் கூர்மையாக வளைக்கப்படுகிறது. இதன் விளைவாக வரும் சாபிரோ-வில்க் புள்ளிவிவரம்* W* = 0.765 ஆகும், இது மீண்டும் இயல்புநிலையிலிருந்து ஒரு குறிப்பிடத்தக்க விலகலை பிரதிபலிக்கிறது (* p* <0.001).

ஒரு மாதிரி இயல்பான அனுமானத்தை மீறுகிறதா என்பதை சரிபார்க்க ஒரு வழி ** “QQ சதி” ** (அளவு-அளவு சதி) வரைய வேண்டும். ஏதேனும் முறையான மீறல்களை நீங்கள் காண்கிறீர்களா என்பதை பார்வைக்கு சரிபார்க்க இது உங்களை அனுமதிக்கிறது. ஒரு QQ சதித்திட்டத்தில், ஒவ்வொரு அவதானிப்பும் ஒற்றை புள்ளியாக திட்டமிடப்பட்டுள்ளது. ஃச் ஒருங்கிணைப்பு என்பது தரவு பொதுவாக விநியோகிக்கப்பட்டால் (மாதிரியிலிருந்து சராசரி மற்றும் மாறுபாட்டுடன்) அவதானிப்பு வீழ்ச்சியடைய வேண்டும் என்ற தத்துவார்த்த அளவு, மற்றும் ஒய் ஒருங்கிணைப்பில் மாதிரியில் உள்ள தரவின் உண்மையான அளவு. தரவு இயல்பாக இருந்தால், புள்ளிகள் ஒரு நேர் கோட்டை உருவாக்க வேண்டும். உதாரணமாக, ஒரு சாதாரண விநியோகத்திலிருந்து மாதிரி மூலம் தரவை உருவாக்கினால் என்ன நடக்கும் என்பதைப் பார்ப்போம், பின்னர் ஒரு QQ சதித்திட்டத்தை வரைகிறோம். முடிவுகள் இதில் காட்டப்பட்டுள்ளன: NumRef: Fig-QQ1. நீங்கள் பார்க்க முடியும் என, இந்த தரவு அழகான நேர் கோட்டை உருவாக்குகிறது; ஒரு சாதாரண விநியோகத்திலிருந்து அவற்றை நாங்கள் மாதிரி செய்ததில் ஆச்சரியமில்லை! இதற்கு நேர்மாறாக, காட்டப்பட்டுள்ள இரண்டு தரவுத் தொகுப்புகளைப் பாருங்கள்: NumRef: Fig-QQ2. மேல் பேனல்கள் மிகவும் வளைந்த தரவுத் தொகுப்பிற்கான இச்டோகிராம் மற்றும் ஒரு QQ சூழ்ச்சி ஆகியவற்றைக் காட்டுகின்றன: QQ சூழ்ச்சி மேல்நோக்கி வளைகிறது. கீழ் பேனல்கள் ஒரு கனமான வால் (அதாவது, உயர் கர்டோசிச்) தரவு தொகுப்புக்கு அதே அடுக்குகளைக் காட்டுகின்றன: இந்த விசயத்தில் QQ சூழ்ச்சி நடுத்தரத்தில் தட்டையானது மற்றும் இரு முனைகளிலும் கூர்மையாக வளைவுகள்.

சாபிரோ-வில்க் சோதனைகள்

உங்கள் தரவின் இயல்பான தன்மையை முறைசாரா முறையில் சரிபார்க்க QQ அடுக்கு ஒரு நல்ல வழியை வழங்குகிறது, ஆனால் சில நேரங்களில் நீங்கள் இன்னும் கொஞ்சம் முறையான ஒன்றைச் செய்ய விரும்புவீர்கள், மேலும் ** சாபிரோ-வில்க் சோதனை ** (: குறிப்பு: `சாபிரோ & வில்க், 1965 <சாபிரோ_1965 > `) நீங்கள் தேடுவது இருக்கலாம். [#] _ நீங்கள் எதிர்பார்ப்பது போல, சோதிக்கப்படும் சுழிய கருதுகோள் என்னவென்றால், * n * அவதானிப்புகளின் தொகுப்பு பொதுவாக விநியோகிக்கப்படுகிறது.

இது கணக்கிடும் சோதனை புள்ளிவிவரம் வழக்கமாக *w *எனக் குறிக்கப்படுகிறது, மேலும் இது பின்வருமாறு கணக்கிடப்படுகிறது. முதலாவதாக, அளவு அதிகரிக்கும் வரிசையில் அவதானிப்புகளை வரிசைப்படுத்துகிறோம், மேலும் *x *: துணை: 1 மாதிரியில் மிகச்சிறிய மதிப்பாக இருக்கட்டும், *x *: துணை:` 2` இரண்டாவது மிகச்சிறிய மற்றும் பலவற்றாக இருக்க வேண்டும். * W * இன் மதிப்பு வழங்கப்படுகிறது

\[W = \frac{ \left( \sum_{i = 1}^N a_i X_i \right)^2 }{ \sum_{i = 1}^N (X_i - \bar{X})^2}\]

எங்கே **என்பது அவதானிப்புகளின் சராசரி, மற்றும் *A *: துணை: I மதிப்புகள் ஒரு அறிமுக உரை.

Because it’s a little hard to explain the maths behind the W statistic, a better idea is to give a broad brush description of how it behaves. Unlike most … mumble, mumble … something complicated that is a bit beyond the scope of of the test statistics that we’ll encounter in this book, it’s actually small values of W that indicate departure from normality. The W statistic has a maximum value of 1, which occurs when the data look “perfectly normal”. The smaller the value of W the less normal the data are. However, the sampling distribution for W, which is not one of the standard ones that I discussed in chapter நிகழ்தகவு அறிமுகம் and is in fact a complete pain in the arse to work with, does depend on the sample size N. To give you a feel for what these sampling distributions look like, I’ve plotted three of them in Fig. 103. Notice that, as the sample size starts to get large, the sampling distribution becomes very tightly clumped up near W = 1, and as a consequence, for larger samples W doesn’t have to be very much smaller than 1 in order for the test to be significant.

சாபிரோ-வில்க் டபிள்யூ புள்ளிவிவரத்தின் மாதிரி வழங்கல்

Fig. 103 10, 20 மற்றும் 50 அளவு மாதிரிகளுக்கு, தரவு பொதுவாக விநியோகிக்கப்படுகிறது என்ற சுழிய கருதுகோளின் கீழ், சாபிரோ-வில்க் டபிள்யூ புள்ளிவிவரத்தின் மாதிரி வழங்கல். W இன் சிறிய மதிப்புகள் இயல்பான தன்மையிலிருந்து புறப்படுவதைக் குறிக்கின்றன என்பதை நினைவில் கொள்க.

சாமோவியில் சாபிரோ-வில்க் புள்ளிவிவரத்தைப் பெற, `` அனுமானங்கள்`` இன் கீழ் பட்டியலிடப்பட்ட `` இயல்பான தன்மை`` க்கான விருப்பத்தை சரிபார்க்கவும். QQ சதித்திட்டத்திற்கு நாங்கள் பயன்படுத்திய தோராயமாக மாதிரி தரவுகளில் (n*= 100), சாபிரோ-வில்க் இயல்பான சோதனை புள்ளிவிவரத்திற்கான மதிப்பு 0.69 இன்*p-value உடன் w = 0.99 ஆகும். எனவே, ஆச்சரியப்படுவதற்கில்லை, இந்த தரவு இயல்புநிலையிலிருந்து விலகுவதற்கான எந்த ஆதாரமும் எங்களிடம் இல்லை. ஒரு சாபிரோ-வில்க் சோதனைக்கான முடிவுகளைப் புகாரளிக்கும்போது, நீங்கள் (வழக்கம் போல்) சோதனை புள்ளிவிவரம் *W *மற்றும் *p *-மதிப்பு ஆகியவற்றைச் சேர்க்க வேண்டும் என்பதை உறுதிப்படுத்த வேண்டும், இருப்பினும் மாதிரி வழங்கல் *n *ஐப் பொறுத்தது என்று கொடுக்கப்பட்டுள்ளது * n * ஐச் சேர்க்க ஒரு மரியாதையாக இருக்கலாம்.

எடுத்துக்காட்டு

இதற்கிடையில், தரவு இயல்பானதாக மாறும் போது QQ சூழ்ச்சி மற்றும் சாபிரோ-வில்க் சோதனைக்கு என்ன நடக்கிறது என்பதற்கு ஒரு எடுத்துக்காட்டு உங்களுக்குக் காண்பிப்பது மதிப்பு. அதற்காக, | CH04_Descrictives` அவை ஒரு சாதாரண விநியோகத்திலிருந்து வந்ததாகத் தெரியவில்லை. QQ சதிக்கு என்ன நடக்கும் என்பது இங்கே:

`` Afl.margins`` மாறியில் தரவு (வளைந்த) தரவுகளுக்கான QQ சூழ்ச்சி  of | aflsmall_margins | தரவுத்தொகுப்பு

Fig. 104 `` Afl.margins`` மாறுபட்ட (வளைந்த) தரவுகளுக்கான QQ சூழ்ச்சி | aflsmall_margins | _ தரவு தொகுப்பு

நாங்கள் சாபிரோ-வில்க் சோதனையை `` afl.margins`` உடன் இயக்கும்போது, w = 0.94 இன் சாபிரோ-வில்க் இயல்பான சோதனை புள்ளிவிவரத்திற்கான மதிப்பைப் பெறுகிறோம், மற்றும் *p *-value = 9.481E-07. தெளிவாக ஒரு குறிப்பிடத்தக்க விளைவு!