Section author: Danielle J. Navarro and David R. Foxcroft
நம்பிக்கை இடைவெளியை மதிப்பிடுதல்
புள்ளிவிவரங்கள் என்பது நீங்கள் உறுதியாக இல்லை என்று சொல்ல வேண்டியதில்லை—தெரியாத தோற்றம் [#] _
இந்த அத்தியாயத்தின் இந்த கட்டத்தில், தரவுகளின் மாதிரியின் அடிப்படையில் மக்கள்தொகை அளவுருக்களைப் பற்றி யூகங்களை உருவாக்க புள்ளிவிவர வல்லுநர்கள் நம்பியிருக்கும் மாதிரிக் கோட்பாட்டின் அடிப்படைகளை நான் கோடிட்டுக் காட்டியுள்ளேன். இந்த விவாதம் விளக்குவது போல, இந்த மாதிரிக் கோட்பாடு நமக்குத் தேவையான ஒரு காரணம் என்னவென்றால், ஒவ்வொரு தரவுத் தொகுப்பும் சில நிச்சயமற்ற தன்மையை நம்மை விட்டுச்செல்கிறது, எனவே எங்கள் மதிப்பீடுகள் ஒருபோதும் துல்லியமாக இருக்காது. இந்த விவாதத்திலிருந்து காணாமல் போன சேதி, எங்கள் மதிப்பீட்டோடு இணைக்கும் நிச்சயமற்ற அளவை * அளவிடுவதற்கான முயற்சியாகும். இளங்கலை உளவியல் மாணவர்களின் சராசரி ஐ.க்யூ 115 என்று யூகிக்க முடிந்தது போதாது (ஆம், நான் அந்த எண்ணை உருவாக்கினேன்). எங்கள் யூகத்தில் நம்மிடம் உள்ள உறுதியின் அளவை வெளிப்படுத்தும் ஒன்றைச் சொல்லவும் விரும்புகிறோம். எடுத்துக்காட்டாக, உண்மையான சராசரி 109 மற்றும் 121 க்கு இடையில் உள்ளது என்று 95 % வாய்ப்பு உள்ளது என்று சொல்வது நல்லது. இதற்கான பெயர் சராசரிக்கு ** நம்பிக்கை இடைவெளி ** ஆகும்.
மாதிரி விநியோகங்களைப் பற்றிய புரிதலுடன் கருவி, சராசரிக்கான நம்பிக்கை இடைவெளியை உருவாக்குவது உண்மையில் மிகவும் எளிதானது. இது எவ்வாறு செயல்படுகிறது என்பது இங்கே. உண்மையான மக்கள் தொகை சராசரி µ மற்றும் நிலையான விலகல் is. *N *பங்கேற்பாளர்களைக் கொண்ட எனது ஆய்வை நான் முடித்துவிட்டேன், அந்த பங்கேற்பாளர்களிடையே சராசரி IQ *x̄ *. எங்கள் கலந்துரையாடலில் இருந்து எங்களுக்குத் தெரியும்: குறிப்பு: மத்திய வரம்பு தேற்றம் <சென்ட்ரல்_ லிமிட்_தரேம்> சராசரியின் மாதிரி வழங்கல் தோராயமாக இயல்பானது என்பதை. எங்கள் விவாதத்திலிருந்து: டாக்: இயல்பான வழங்கல் <../ ch07/ch07_probability_5>, பொதுவாக விநியோகிக்கப்பட்ட அளவு உண்மையான சராசரியின் இரண்டு நிலையான விலகல்களுக்குள் விழும் 95 % வாய்ப்பு உள்ளது என்பதையும் நாங்கள் அறிவோம்.
இன்னும் துல்லியமாகச் சொல்வதானால், இன்னும் சரியான பதில் என்னவென்றால், பொதுவாக விநியோகிக்கப்பட்ட அளவு உண்மையான சராசரியின் 1.96 நிலையான விலகல்களுக்குள் விழும் 95 % வாய்ப்பு உள்ளது. அடுத்து, மாதிரி விநியோகத்தின் நிலையான விலகல் நிலையான பிழை என குறிப்பிடப்படுகிறது என்பதையும், சராசரியின் நிலையான பிழை SEM என எழுதப்பட்டுள்ளது என்பதையும் நினைவில் கொள்க. இந்த துண்டுகள் அனைத்தையும் நாங்கள் ஒன்றாக இணைக்கும்போது, 95 % நிகழ்தகவு உள்ளது என்பதை அறிகிறோம், மாதிரி சராசரி * x̄ * மக்கள்தொகையின் 1.96 நிலையான பிழைகளுக்குள் பொய்களை நாம் உண்மையில் கவனித்திருக்கிறோம்.
கணித ரீதியாக, இதை இவ்வாறு எழுதுகிறோம்:
SEM க்கு சமம்: கணிதம்: சிக்மா / sqrt {N} மேலும் இது உண்மை என்று 95 % நம்பிக்கையுடன் இருக்க முடியும். எவ்வாறாயினும், நாங்கள் உண்மையில் ஆர்வமாக உள்ள கேள்விக்கு இது பதிலளிக்கவில்லை. மேலே உள்ள சமன்பாடு மாதிரி பற்றி நாம் எதிர்பார்க்க வேண்டும் என்று கூறுகிறது, இது மக்கள்தொகை அளவுருக்கள் என்னவென்று எங்களுக்குத் தெரியும். நாம் * விரும்புவது * இந்த வேலையை வேறு வழியில் வைத்திருக்க வேண்டும். மக்கள்தொகை அளவுருக்களைப் பற்றி நாம் என்ன நம்ப வேண்டும் என்பதை அறிய விரும்புகிறோம், ஒரு குறிப்பிட்ட மாதிரியை நாங்கள் கவனித்திருக்கிறோம். இருப்பினும், இதைச் செய்வது மிகவும் கடினம் அல்ல. கொஞ்சம் உயர்நிலைப் பள்ளி இயற்கணிதத்தைப் பயன்படுத்தி, எங்கள் சமன்பாட்டை மீண்டும் எழுத ஒரு ச்னீக்கி வழி இது போன்றது:
இது சொல்வது என்னவென்றால், மதிப்புகளின் வரம்பில் மக்கள்தொகை சராசரியைக் கொண்டிருப்பதற்கான 95 % நிகழ்தகவு உள்ளது. இந்த வரம்பை ** 95 % நம்பிக்கை இடைவெளி ** எனக் குறிப்பிடுகிறோம்,*ci*: துணை: 95 . சுருக்கமாக, * n * போதுமானதாக இருக்கும் வரை (சராசரியின் மாதிரி வழங்கல் இயல்பானது என்று நம்புவதற்கு எங்களுக்கு போதுமானது), பின்னர் இதை 95 % நம்பிக்கை இடைவெளிக்கான எங்கள் சூத்திரமாக எழுதலாம்:
நிச்சயமாக, 1.96 என்ற எண்ணைப் பற்றி சிறப்பு எதுவும் இல்லை. நீங்கள் 95 % நம்பிக்கை இடைவெளியை விரும்பினால் நீங்கள் பயன்படுத்த வேண்டிய பெருக்கி இது. நான் 70 % நம்பிக்கை இடைவெளியை விரும்பினால், 1.96 ஐ விட மேசிக் எண்ணாக 1.04 ஐப் பயன்படுத்தியிருப்பேன்.
சூத்திரத்தில் ஒரு சிறிய தவறு
வழக்கம் போல், நான் பொய் சொன்னேன். 95 % நம்பிக்கை இடைவெளிக்கு நான் மேலே கொடுத்த தேற்றம் தோராயமாக சரியானது, ஆனால் விவாதத்தில் ஒரு முக்கியமான விவரத்தை நான் பளபளத்தேன். எனது சூத்திரத்தை நீங்கள் சராசரியின் நிலையான பிழையான *SEM *ஐப் பயன்படுத்த வேண்டும் என்பதைக் கவனியுங்கள், இதன் விளைவாக நீங்கள் உண்மையான மக்கள்தொகை தர விலகலைப் பயன்படுத்த வேண்டும் σ. ஆயினும்கூட, இல்: டாக்: CH08_ESTIMATION_4 உண்மையான மக்கள்தொகை அளவுருக்களை நாம் உண்மையில் * அறியவில்லை என்பதை நான் வலியுறுத்தினேன். Σ இன் உண்மையான மதிப்பு எங்களுக்குத் தெரியாது என்பதால், மக்கள்தொகை தர விலகலின் மதிப்பீட்டைப் பயன்படுத்த வேண்டும்: கணிதம்: தொப்பி {சிக்மா} அதற்கு பதிலாக. இது மிகவும் நேரடியானது, ஆனால் இது எங்கள் மேசிக் எண்ணைக் கணக்கிடுவதற்கான சாதாரண விநியோகத்தை விட *t *-விநியோகத்தின் சதவீதங்களைப் பயன்படுத்த வேண்டும், மேலும் பதில் மாதிரி அளவைப் பொறுத்தது. *N *மிகப் பெரியதாக இருக்கும்போது, *t *-distripution அல்லது சாதாரண விநியோகத்தைப் பயன்படுத்தி அதே மதிப்பைப் பெறுகிறோம்: 1.96. ஆனால் *n *சிறியதாக இருக்கும்போது *t *-distribution: 2.26 ஐப் பயன்படுத்தும்போது மிகப் பெரிய எண்ணைப் பெறுகிறோம்.
இங்கே என்ன நடக்கிறது என்பது பற்றி மர்மமான எதுவும் இல்லை. பெரிய மதிப்புகள் என்பது நம்பிக்கை இடைவெளி அகலமானது என்பதைக் குறிக்கிறது, இது µ இன் உண்மையான மதிப்பு உண்மையில் என்ன என்பது குறித்து நாம் மிகவும் நிச்சயமற்றவர்கள் என்பதைக் குறிக்கிறது. சாதாரண விநியோகத்திற்கு பதிலாக *t *-டிச்ட்ரிபியூசனைப் பயன்படுத்தும்போது, பெரிய எண்களைப் பெறுகிறோம், இது எங்களுக்கு அதிக நிச்சயமற்ற தன்மை இருப்பதைக் குறிக்கிறது. அந்த கூடுதல் நிச்சயமற்ற தன்மை நமக்கு ஏன் இருக்கிறது? சரி, ஏனென்றால் மக்கள்தொகை தரமான விலகல் பற்றிய எங்கள் மதிப்பீடு: கணிதம்: தொப்பி சிக்மா தவறாக இருக்கலாம்! அது தவறு என்றால், சராசரியின் எங்கள் மாதிரி வழங்கல் உண்மையில் எப்படி இருக்கும் என்பதைப் பற்றி நாம் கொஞ்சம் உறுதியாக இருப்பதை இது குறிக்கிறது, மேலும் இந்த நிச்சயமற்ற தன்மை ஒரு பரந்த நம்பிக்கை இடைவெளியில் பிரதிபலிக்கிறது.
நம்பிக்கை இடைவெளியை விளக்குகிறது
நம்பிக்கை இடைவெளிகளைப் பற்றிய கடினமான சேதி என்னவென்றால், அவை என்ன பொருள் என்பதை புரிந்துகொள்வது *. மக்கள் முதலில் நம்பிக்கை இடைவெளிகளை எதிர்கொள்ளும்போதெல்லாம், முதல் உள்ளுணர்வு எப்போதுமே "உண்மையான சராசரி நம்பிக்கை இடைவெளியில் இருக்கும் 95 % நிகழ்தகவு உள்ளது" என்று எப்போதும் சொல்வது. இது எளிதானது, நான் “95 % நம்பிக்கையுடன்” இருக்கிறேன் என்று சொல்வதன் பொருள் என்ன என்பதற்கான பொது அறிவு யோசனையைப் பிடிக்கத் தோன்றுகிறது. துரதிர்ச்டவசமாக, இது சரியாக இல்லை. உள்ளுணர்வு வரையறை உங்கள் சொந்த தனிப்பட்ட * நம்பிக்கைகளை * மக்கள்தொகையின் மதிப்பைப் பற்றி மிகவும் நம்பியுள்ளது. நான் 95 % நம்பிக்கையுடன் இருக்கிறேன் என்று சொல்கிறேன், ஏனென்றால் அவை என் நம்பிக்கைகள். அன்றாட வாழ்க்கையில் அது சரியாக இருக்கிறது, ஆனால் நீங்கள் மீண்டும் நினைவில் வைத்திருந்தால்: doc: ../ ch07/ch07_probability_2, தனிப்பட்ட நம்பிக்கை மற்றும் நம்பிக்கையைப் பற்றி பேசுவது ஒரு பேய்சியன் சிந்தனை என்பதை நீங்கள் கவனிப்பீர்கள். இருப்பினும், நம்பிக்கை இடைவெளிகள் * பேய்சியன் கருவிகள் அல்ல. இந்த அத்தியாயத்தில் உள்ள எல்லாவற்றையும் போலவே, நம்பிக்கை இடைவெளிகளும் * அடிக்கடி * கருவிகள், நீங்கள் அடிக்கடி முறைகளைப் பயன்படுத்தப் போகிறீர்கள் என்றால், அவற்றுடன் ஒரு பேய்சியன் விளக்கத்தை இணைப்பது பொருத்தமானதல்ல. நீங்கள் அடிக்கடி முறையான முறைகளைப் பயன்படுத்தினால், நீங்கள் அடிக்கடி விளக்கங்களை பின்பற்ற வேண்டும்!
சரி, அது சரியான பதில் இல்லையென்றால், என்ன? அடிக்கடி நிகழ்தகவு பற்றி நாங்கள் சொன்னதை நினைவில் கொள்ளுங்கள். "நிகழ்தகவு அறிக்கைகள்" செய்ய எங்களுக்கு அனுமதிக்கப்பட்ட ஒரே வழி, நிகழ்வுகளின் வரிசையைப் பற்றி பேசுவதும், பல்வேறு வகையான நிகழ்வுகளின் அதிர்வெண்களைக் கணக்கிடுவதும் ஆகும். அந்த கண்ணோட்டத்தில், 95 % நம்பிக்கை இடைவெளியின் விளக்கத்திற்கு நகலெடுப்புடன் ஏதாவது செய்ய வேண்டும். குறிப்பாக, நாங்கள் மீண்டும் மீண்டும் பரிசோதனையை பிரதிபலித்து, ஒவ்வொரு பிரதிக்கும் 95 % நம்பிக்கை இடைவெளியைக் கணக்கிட்டால், அந்த * இடைவெளிகளில் 95 % உண்மையான சராசரியைக் கொண்டிருக்கும். மிகவும் பொதுவாக, இந்த நடைமுறையைப் பயன்படுத்தி கட்டப்பட்ட அனைத்து நம்பிக்கை இடைவெளிகளிலும் 95 % உண்மையான மக்கள் தொகை சராசரியைக் கொண்டிருக்க வேண்டும். இந்த சிந்தனை இதில் விளக்கப்பட்டுள்ளது: NUMREF: Fig-confintsmp, இது“ அளவீட்டு 10 IQ மதிப்பெண்கள் ”சோதனை (மேல் குழு) மற்றும்“ அளவீட்டு 25 IQ மதிப்பெண்கள் ”பரிசோதனைக்கு (கீழே உள்ள குழு ஆகியவற்றுக்கு 50 நம்பிக்கை இடைவெளிகளைக் காட்டுகிறது ). ஒரு பிட் அதிர்ச்டவசமாக, நான் உருவகப்படுத்திய 100 பிரதிகளில், அவற்றில் சரியாக 95 உண்மையான சராசரியைக் கொண்டிருந்தன.
Fig. 66 95 % நம்பிக்கை இடைவெளிகள். ஒரு பரிசோதனையின் 50 உருவகப்படுத்தப்பட்ட பிரதிகளை மேல் குழு காட்டுகிறது, அதில் 10 பேரின் IQ களை அளவிடுகிறோம். புள்ளி மாதிரி சராசரியின் இருப்பிடத்தை குறிக்கிறது மற்றும் வரி 95 % நம்பிக்கை இடைவெளியைக் காட்டுகிறது. 50 நம்பிக்கை இடைவெளிகளில் மொத்தம் 47 இல் உண்மையான சராசரி (அதாவது, 100) உள்ளது, ஆனால் நட்சத்திரங்களால் குறிக்கப்பட்ட மூன்று இடைவெளிகள் இல்லை. கீழ் குழு இதேபோன்ற உருவகப்படுத்துதலைக் காட்டுகிறது, ஆனால் இந்த நேரத்தில், 25 பேரின் IQ களை அளவிடும் ஒரு பரிசோதனையின் பிரதிகளை நாங்கள் உருவகப்படுத்துகிறோம்.
இங்குள்ள முக்கியமான வேறுபாடு என்னவென்றால், பேய்சியன் உரிமைகோரல் மக்கள்தொகை சராசரியைப் பற்றி நிகழ்தகவு அறிக்கையை அளிக்கிறது (அதாவது, இது மக்கள்தொகை சராசரியைப் பற்றிய நமது நிச்சயமற்ற தன்மையைக் குறிக்கிறது), இது நிகழ்தகவு பற்றிய அடிக்கடி விளக்கத்தின் கீழ் அனுமதிக்கப்படாது, ஏனெனில் நீங்கள் ஒரு மக்கள் தொகை! அடிக்கடி வரும் கூற்றில், மக்கள் தொகை சராசரி நிர்ணயிக்கப்பட்டுள்ளது மற்றும் அதைப் பற்றி நிகழ்தகவு உரிமைகோரல்கள் எதுவும் செய்ய முடியாது. இருப்பினும், நம்பிக்கை இடைவெளிகள் மீண்டும் மீண்டும் செய்யக்கூடியவை, எனவே சோதனைகளை நாங்கள் பிரதிபலிக்க முடியும். ஆகவே, * நம்பிக்கை இடைவெளி * (ஒரு சீரற்ற மாறி) உண்மையான சராசரியைக் கொண்டிருக்கும் நிகழ்தகவைப் பற்றி பேச ஒரு அடிக்கடி வருபவர் அனுமதிக்கப்படுகிறார், ஆனால் * உண்மையான மக்கள் தொகை பொருள் * (மீண்டும் மீண்டும் நிகழ்வு அல்ல) வரும் நிகழ்தகவு பற்றி பேச அனுமதிக்கப்படவில்லை நம்பிக்கை இடைவெளி.
இது கொஞ்சம் பதட்டமாகத் தெரிகிறது என்று எனக்குத் தெரியும், ஆனால் அது ஒரு சேதி. இது முக்கியமானது, ஏனெனில் விளக்கத்தின் வேறுபாடு கணிதத்தில் வேறுபாட்டிற்கு வழிவகுக்கிறது. நம்பிக்கை இடைவெளிகளுக்கு ஒரு பேய்சியன் மாற்று உள்ளது, இது *நம்பகமான இடைவெளிகள் *என அழைக்கப்படுகிறது. பெரும்பாலான சூழ்நிலைகளில் நம்பகமான இடைவெளிகள் நம்பிக்கை இடைவெளிகளுக்கு மிகவும் ஒத்தவை, ஆனால் மற்ற சந்தர்ப்பங்களில் அவை மிகவும் வேறுபட்டவை. வாக்குறுதியளித்தபடி, நான் அத்தியாயத்தில் பேய்சியன் முன்னோக்கைப் பற்றி அதிகம் பேசுவேன்: டாக்: ../ ch16/ch16_bayes.
சமோவியில் நம்பிக்கை இடைவெளிகளைக் கணக்கிடுகிறது
`` விளக்கங்கள்`` இன் செயல்பாட்டின் ஒரு பகுதியாக சராசரிக்கு நம்பிக்கை இடைவெளிகளைக் கணக்கிட சமோவி ஒரு எளிய வழியை வழங்குகிறது. தேர்வுப்பெட்டியை `` மீதான நம்பிக்கை இடைவெளியை அமைக்கவும்``.
95 % நம்பிக்கை இடைவெளிகள் உளவியலில் உண்மையான தரமாகும். எனவே, எடுத்துக்காட்டாக, நான் | IQSIM | _ தரவு தொகுப்பை (N = 10,000 உடன் எங்கள் உருவகப்படுத்தப்பட்ட பெரிய மாதிரி தரவு) ஏற்றினால், `` விளக்கங்கள்`` இன் கீழ் சராசரி `` நம்பிக்கை இடைவெளியை சரிபார்க்கவும், நாங்கள் ஒரு சராசரி IQ மதிப்பெண்ணைப் பெறுகிறோம் 99.683 இன் 95 % தொஒ உடன் 99.391 முதல் 99.975 வரை.
சாமோவியில் உள்ள சராசரிக்கான நம்பிக்கை இடைவெளிகளைத் திட்டமிடும்போது, இது `` விளக்கங்கள்`` விருப்பங்களின் ஒரு பகுதியாக கிடைக்கவில்லை (இன்னும்). எவ்வாறாயினும், குறிப்பிட்ட புள்ளிவிவர சோதனைகளைப் பற்றி அறியும்போது, எடுத்துக்காட்டாக அத்தியாயம்: டாக்: ../ CH13/CH13_ANOVA, தரவு பகுப்பாய்வின் ஒரு பகுதியாக நம்பிக்கை இடைவெளிகளைத் திட்டமிட முடியும் என்பதைக் காண்போம். இது மிகவும் அருமையாக இருக்கிறது, எனவே அதை பின்னர் எப்படி செய்வது என்று நாங்கள் உங்களுக்குக் காண்பிப்போம்.