Section author: Danielle J. Navarro and David R. Foxcroft
ஒரு மாதிரி *z *-test
இந்த பிரிவில் எல்லா புள்ளிவிவரங்களிலும் மிகவும் பயனற்ற சோதனைகளில் ஒன்றை விவரிக்கிறேன்: ** Z- சோதனை **. தீவிரமாக - இந்த சோதனை நிச வாழ்க்கையில் ஒருபோதும் பயன்படுத்தப்படவில்லை. அதன் ஒரே உண்மையான நோக்கம் என்னவென்றால், புள்ளிவிவரங்களை கற்பிக்கும் போது, இது *t *-test ஐ நோக்கி செல்லும் வழியில் மிகவும் வசதியான படியாகும், இது அனைத்து புள்ளிவிவரங்களிலும் மிகவும் (ஓவர்) பயன்படுத்தப்பட்ட கருவியாகும்.
சோதனை உரையாற்றும் அனுமான சிக்கல்
*Z *-Test க்குப் பின்னால் உள்ள யோசனையை அறிமுகப்படுத்த, ஒரு எளிய உதாரணத்தைப் பயன்படுத்துவோம். எனது நண்பர், டாக்டர் செப்போ, தனது அறிமுக புள்ளிவிவர வகுப்பை ஒரு வளைவில் தரப்படுத்துகிறார். அவரது வகுப்பில் சராசரி தகுதி 67.5 என்றும், நிலையான விலகல் 9.5 என்றும் வைத்துக்கொள்வோம். அவரது பல நூற்றுக்கணக்கான மாணவர்களில், அவர்களில் 20 பேர் உளவியல் வகுப்புகளை எடுத்துக்கொள்கிறார்கள். ஆர்வத்தினால், உளவியல் மாணவர்கள் எல்லோரையும் போலவே அதே தரங்களைப் பெறுகிறார்களா என்று நான் ஆச்சரியப்படுகிறேன் (அதாவது, 67.5 இன் சராசரி) அல்லது அவர்கள் அதிகமாகவோ அல்லது குறைவாகவோ மதிப்பெண் பெற முனைகிறார்களா? சாமோவி விரிதாள் பார்வையில், அந்த மாணவர்களின் `` தரங்களை`` பார்க்க நான் பயன்படுத்தும் |
50 60 60 64 66 66 67 69 70 74 76 76 77 79 79 79 81 82 82 89
பின்னர் `` ஆய்வு` → `` விளக்கங்கள்`` இல் சராசரியைக் கணக்கிடுங்கள். சராசரி மதிப்பு 72.3.
அ்ம். உளவியல் மாணவர்கள் இயல்பை விட சற்று அதிகமாக மதிப்பெண் பெறுகிறார்கள் என்பது * இருக்கலாம். * X̄ * = 72.3 இன் அந்த மாதிரி சராசரி கருதுகோள் மக்கள்தொகை சராசரியை விட µ = 67.5 ஐ விட நியாயமான பிட் அதிகம், ஆனால், மறுபுறம், * n * = 20 இன் மாதிரி அளவு அவ்வளவு பெரியதல்ல. ஒருவேளை இது தூய்மையான வாய்ப்பு.
கேள்விக்கு பதிலளிக்க, எனக்குத் தெரியும் என்று நான் நினைக்கிறேன் என்பதை எழுத இது உதவுகிறது. முதலாவதாக, மாதிரி சராசரி * x̄ * = 72.3 என்று எனக்குத் தெரியும். உளவியல் மாணவர்கள் வகுப்பின் மற்ற பகுதிகளைப் போலவே நிலையான விலகலைக் கொண்டிருக்கிறார்கள் என்று நான் கருத விரும்பினால், மக்கள்தொகை தர விலகல் σ = 9.5 என்று நான் சொல்ல முடியும். டாக்டர் செப்போ ஒரு வளைவுக்கு தரப்படுத்துவதால், உளவியல் மாணவர் தரங்கள் பொதுவாக விநியோகிக்கப்படுகின்றன என்பதையும் நான் கருதுகிறேன்.
அடுத்து, தரவிலிருந்து நான் என்ன கற்றுக்கொள்ள விரும்புகிறேன் என்பது பற்றி தெளிவாக இருக்க இது உதவுகிறது. இந்த வழக்கில் எனது ஆராய்ச்சி கருதுகோள் உளவியல் மாணவர் தரங்களுக்கான * மக்கள் தொகை * சராசரி with உடன் தொடர்புடையது, இது தெரியவில்லை. குறிப்பாக, µ = 67.5 இல்லையா என்பதை அறிய விரும்புகிறேன். இதுதான் எனக்குத் தெரியும், எங்கள் பிரச்சினையை தீர்க்க ஒரு கருதுகோள் சோதனையை வகுக்க முடியுமா? தரவு, அவை எழுவதாக கருதப்படும் கருதுகோள் விநியோகத்துடன் இதில் காட்டப்பட்டுள்ளன: NUMREF: Fig-zeppo. சரியான பதில் என்ன என்பது முற்றிலும் தெளிவாகத் தெரியவில்லை, இல்லையா? இதற்காக, எங்களுக்கு சில புள்ளிவிவரங்கள் தேவைப்படும்.
Fig. 82 உளவியல் மாணவர் தரங்கள் (பார்கள்) உருவாக்கப்பட்டதாகக் கருதப்படும் தத்துவார்த்த வழங்கல் (திடமான வரி).
கருதுகோள் சோதனையை உருவாக்குதல்
ஒரு கருதுகோள் சோதனையை உருவாக்குவதற்கான முதல் படி சுழிய மற்றும் மாற்று கருதுகோள்கள் என்ன என்பது பற்றி தெளிவாக இருக்க வேண்டும். இதைச் செய்வது மிகவும் கடினம் அல்ல. எங்கள் சுழிய கருதுகோள், h : துணை: 0, உண்மையான மக்கள்தொகை என்பது உளவியல் மாணவர் தரங்களுக்கு 67.5 %ஆகும், மேலும் எங்கள் மாற்று கருதுகோள் என்னவென்றால், மக்கள் தொகை * என்பது * 67.5 %அல்ல. இதை நாம் கணித குறியீட்டில் எழுதினால், இந்த கருதுகோள்கள் ஆகின்றன:
நேர்மையாகச் சொல்வதானால், இந்த குறியீடு சிக்கலைப் பற்றிய நமது புரிதலுக்கு அதிகம் சேர்க்கவில்லை என்றாலும், தரவிலிருந்து நாம் கற்றுக்கொள்ள முயற்சிப்பதை எழுதுவதற்கான ஒரு சிறிய வழி இது. NULL கருதுகோள்கள் h : sub: 0 மற்றும் மாற்று கருதுகோள் h : எங்கள் சோதனைக்கு துணை:` 1` இரண்டும் விளக்கப்பட்டுள்ளன: எண்: அத்தி-ச்டெச்டிப். இந்த கருதுகோள்களை எங்களுக்கு வழங்குவதோடு மட்டுமல்லாமல், மேலே கோடிட்டுக் காட்டப்பட்டுள்ள காட்சி எங்களுக்கு பயனுள்ள பின்னணி அறிவை பயனுள்ளதாக இருக்கும். குறிப்பாக, நாம் சேர்க்கக்கூடிய இரண்டு சிறப்பு தகவல்கள் உள்ளன:
உளவியல் தரங்கள் பொதுவாக விநியோகிக்கப்படுகின்றன.
இந்த மதிப்பெண்களின் உண்மையான நிலையான விலகல் 9.5 என அறியப்படுகிறது.
இப்போதைக்கு, இவை முற்றிலும் நம்பகமான உண்மைகள் போல செயல்படுவோம். நிச வாழ்க்கையில், இந்த வகையான முற்றிலும் நம்பகமான பின்னணி அறிவு இல்லை, எனவே இந்த உண்மைகளை நாம் நம்ப விரும்பினால், இந்த விசயங்கள் உண்மை என்று * அனுமானத்தை நாம் செய்துள்ளோம். எவ்வாறாயினும், இந்த அனுமானங்கள் பொறுப்பு அளிக்கப்படலாம் அல்லது இல்லாமல் இருக்கலாம் என்பதால், அவற்றை நாம் சரிபார்க்க வேண்டியிருக்கலாம். இப்போதைக்கு, நாங்கள் விசயங்களை எளிமையாக வைத்திருப்போம்.
Fig. 83 *Z *-test (இரண்டு பக்க பதிப்பு, அதாவது) ஒரு மாதிரி மூலம் கருதப்படும் சுழிய மற்றும் மாற்று கருதுகோள்களின் வரைகலை விளக்கம். சுழிய மற்றும் மாற்று கருதுகோள்கள் இரண்டும் மக்கள்தொகை வழங்கல் இயல்பானவை என்று கருதுகின்றன, மேலும் கூடுதலாக மக்கள்தொகை நிலையான விலகல் அறியப்படுகிறது என்று கருதுகிறது (சில மதிப்பில் சரி செய்யப்பட்டது : துணை: 0 ). சுழிய கருதுகோள் (இடது) என்பது மக்கள்தொகை என்பது சில குறிப்பிட்ட மதிப்புக்கு சமம் μ : துணை: 0. மாற்று கருதுகோள் என்னவென்றால், மக்கள்தொகை என்பது இந்த மதிப்பிலிருந்து வேறுபடுகிறது, μ ≠ μ : துணை: 0.
அடுத்த கட்டம் என்னவென்றால், ஒரு கண்டறியும் சோதனை புள்ளிவிவரத்திற்கு நாங்கள் ஒரு நல்ல தேர்வாக இருப்பதைக் கண்டுபிடிப்பதே, இது H : துணை: 0 மற்றும் H : துணை:` 1` ஆகியவற்றுக்கு இடையில் பாகுபாடு காட்ட உதவும். கருதுகோள்கள் அனைத்தும் மக்கள்தொகையைக் குறிக்கின்றன µ, மாதிரி சராசரி * x̄ * தொடங்குவதற்கு மிகவும் பயனுள்ள இடமாக இருக்கும் என்று நீங்கள் நம்புகிறீர்கள். நாம் என்ன செய்ய முடியும் என்பது மாதிரி சராசரி * x̄ * மற்றும் மக்கள்தொகைக்கு சுழிய கருதுகோள் கணிக்கும் மதிப்புக்கு இடையிலான வேறுபாட்டைப் பார்ப்பதுதான். எங்கள் எடுத்துக்காட்டில் நாம் * x̄ * - 67.5 ஐக் கணக்கிடுகிறோம். மிகவும் பொதுவாக, சுழிய கருதுகோள் எங்கள் மக்கள் தொகை சராசரி என்று கூறும் மதிப்பைக் குறிக்க µ : துணை: 0 ஐ அனுமதித்தால், நாங்கள் கணக்கிட விரும்புகிறோம்
இந்த அளவு 0 க்கு சமமாக அல்லது மிக நெருக்கமாக இருந்தால், சுழிய கருதுகோளுக்கு விசயங்கள் நன்றாக இருக்கும். இந்த அளவு 0 இலிருந்து நீண்ட தூரம் இருந்தால், சுழிய கருதுகோளைத் தக்கவைத்துக்கொள்வதற்கான வாய்ப்புகள் குறைவு. ஆனால் பூச்சியத்திலிருந்து எவ்வளவு தொலைவில் இருக்க வேண்டும் H : துணை: 0?
அதைக் கண்டுபிடிக்க நாம் இன்னும் கொஞ்சம் ச்னீக்கி இருக்க வேண்டும், மேலும் நான் முன்பு எழுதிய பின்னணி அறிவின் இரண்டு பகுதிகளையும் நம்ப வேண்டும்; அதாவது மூல தரவு பொதுவாக விநியோகிக்கப்படுகிறது மற்றும் மக்கள்தொகை தர விலகலின் மதிப்பு எங்களுக்குத் தெரியும். சுழிய கருதுகோள் உண்மையில் உண்மையாக இருந்தால், உண்மையான சராசரி µ : துணை: 0 என்றால், இந்த உண்மைகள் ஒன்றாக தரவின் முழுமையான மக்கள்தொகை விநியோகத்தை அறிந்திருக்கிறோம்: சராசரி : துணை:` 0 உடன் ஒரு சாதாரண வழங்கல் மற்றும் நிலையான விலகல். பிரிவில் இருந்து குறியீட்டை ஏற்றுக்கொள்வது: DOC: `../ ch07/ch07_probability_5, ஒரு புள்ளிவிவர வல்லுநர் இதை இவ்வாறு எழுதலாம்:
சரி, அது உண்மை என்றால், *x̄ *இன் வழங்கல் பற்றி நாம் என்ன சொல்ல முடியும்? சரி, நாம் முன்னர் விவாதித்தபடி (பார்க்க: குறிப்பு: மத்திய வரம்பு தேற்றம் <சென்ட்ரல்_ லிமிட்_தரேம்>), சராசரி * x̄ * இன் மாதிரி விநியோகமும் இயல்பானது, மேலும் சராசரி with உள்ளது. ஆனால் இந்த மாதிரி விநியோகத்தின் நிலையான விலகல் *SE (x̄) *, இது சராசரி *நிலையான பிழை *என்று அழைக்கப்படுகிறது
வேறு வார்த்தைகளில் கூறுவதானால், சுழிய கருதுகோள் உண்மையாக இருந்தால், சராசரியின் மாதிரி விநியோகத்தை பின்வருமாறு எழுதலாம்:
இப்போது தந்திரம் வருகிறது. நாம் என்ன செய்ய முடியும் என்பது மாதிரி சராசரி * x̄ * ஐ ஒரு: doc: நிலையான மதிப்பெண் <../ ch04/ch04_descriptives_5>. இது வழக்கமாக *z *என எழுதப்பட்டுள்ளது, ஆனால் இப்போது நான் இதை *z *: sub: x̄ (இந்த விரிவாக்கப்பட்ட குறியீட்டைப் பயன்படுத்துவதற்கான காரணம், நாங்கள் கணக்கிடுகிறோம் என்பதை நினைவில் வைத்துக் கொள்ள உதவுவதாகும் ஒரு மாதிரி சராசரியின் தரப்படுத்தப்பட்ட பதிப்பு, *அல்ல *ஒற்றை அவதானிப்பின் தரப்படுத்தப்பட்ட பதிப்பு, இது ஒரு *z *-ச்கோர் பொதுவாகக் குறிக்கிறது). நாங்கள் அவ்வாறு செய்யும்போது எங்கள் மாதிரி சராசரிக்கு *z *-ச்கோர்:
அல்லது, சமமாக:
இந்த *z *-ச்கோர் எங்கள் சோதனை புள்ளிவிவரம். இதை எங்கள் சோதனை புள்ளிவிவரமாகப் பயன்படுத்துவது பற்றிய நல்ல சேதி என்னவென்றால், எல்லா *z *-ச்கோர்களையும் போலவே, இது ஒரு நிலையான இயல்பான விநியோகத்தைக் கொண்டுள்ளது:
. வேறு வார்த்தைகளில் கூறுவதானால், அசல் தரவு எந்த அளவில் உள்ளது என்பதைப் பொருட்படுத்தாமல், *z *-statististed எப்போதும் ஒரே விளக்கத்தைக் கொண்டுள்ளது: இது கவனிக்கப்பட்ட மாதிரி சராசரியை பிரிக்கும் நிலையான பிழைகளின் எண்ணிக்கைக்கு சமம் *x̄ *மக்கள்தொகையில் இருந்து சராசரி µ : துணை: 0 சுழிய கருதுகோளால் கணிக்கப்பட்டுள்ளது. இன்னும் சிறப்பாக, மூல மதிப்பெண்களுக்கான மக்கள்தொகை அளவுருக்கள் உண்மையில் என்ன என்பதைப் பொருட்படுத்தாமல், *z *-test க்கான 5 % முக்கியமான பகுதிகள் எப்போதும் ஒரே மாதிரியாக இருக்கும், இதில் விளக்கப்பட்டுள்ளபடி: எண்: Fig-ztest. இதன் பொருள் என்னவென்றால், மக்கள் தங்கள் புள்ளிவிவரங்கள் அனைத்தையும் கையால் செய்த நாட்களில், யாராவது இது போன்ற ஒரு அட்டவணையை வெளியிட முடியும்:
விரும்பிய α நிலை |
இரு பக்க சோதனை |
ஒருதலைப்பட்ச சோதனை |
|---|---|---|
0.1 |
1.644854 |
1.281552 |
0.05 |
1.959964 |
1.644854 |
0.01 |
2.575829 |
2.326348 |
0.001 |
3.290527 |
3.090232 |
இதையொட்டி, ஆராய்ச்சியாளர்கள் தங்கள் *z *-புள்ளிவிவரத்தை கையால் கணக்கிட்டு, பின்னர் ஒரு உரை புத்தகத்தில் முக்கியமான மதிப்பைப் பார்க்க முடியும்.
Fig. 84 இரு பக்க *z *-test (இடது குழு) மற்றும் ஒருதலைப்பட்ச *z *-test (வலது குழு) க்கான நிராகரிப்பு பகுதிகள்
ஒரு வேலை சான்று, கையால்
இப்போது, நான் முன்பு குறிப்பிட்டது போல, z *-test நடைமுறையில் ஒருபோதும் பயன்படுத்தப்படவில்லை. நிச வாழ்க்கையில் இது மிகவும் அரிதாகவே பயன்படுத்தப்படுகிறது, சாமோவியின் அடிப்படை நிறுவலுக்கு அதற்கான செயல்பாட்டில் கட்டமைக்கப்பட்டுள்ளது. இருப்பினும், சோதனை மிகவும் எளிமையானது, கைமுறையாக ஒன்றை செய்வது மிகவும் எளிதானது. | Zeppo | _ தரவு தொகுப்புக்குச் செல்வோம். நான் செய்ய வேண்டிய முதல் சேதி, நான் ஏற்கனவே செய்த (72.3) `` தரங்கள்` `மாறிக்கான மாதிரி சராசரியைக் கணக்கிடுவதாகும். எங்களிடம் ஏற்கனவே அறியப்பட்ட மக்கள் தொகை தர விலகல் (σ = 9.5) உள்ளது, மேலும் மக்கள்தொகையின் மதிப்பு சுழிய கருதுகோள் குறிப்பிடுகிறது (µ : துணை: `0` = 67.5), மற்றும் மாதிரி அளவு ( n* = 20).
அடுத்து, சராசரியின் (உண்மை) நிலையான பிழையை கணக்கிடுவோம் (ஒரு கால்குலேட்டருடன் எளிதாக செய்யப்படுகிறது):
sem.true = sd.true / sqrt(N)
= 9.5 / sqrt(20)
= 2.124265
இறுதியாக, எங்கள் *z *-ச்கோரைக் கணக்கிடுகிறோம்:
z.score = (sample.mean - mu.null) / sem.true
= (72.3 - 67.5) / 2.124265
= 2.259606
இந்த கட்டத்தில், எங்கள் முக்கியமான மதிப்புகளின் அட்டவணையில் 2.26 மதிப்பை பாரம்பரியமாக பார்ப்போம். எங்கள் அசல் கருதுகோள் இரு பக்கங்களாக இருந்தது (மற்ற மாணவர்களை விட சைக் மாணவர்கள் புள்ளிவிவரங்களில் சிறப்பாகவோ அல்லது மோசமாகவோ இருப்பார்களா என்பது பற்றி எங்களுக்கு உண்மையில் எந்த கோட்பாடும் இல்லை) எனவே எங்கள் கருதுகோள் சோதனை இரு பக்க (அல்லது இரண்டு வால்). நான் முன்பு காட்டிய சிறிய அட்டவணையைப் பார்க்கும்போது, 1.96 இன் முக்கியமான மதிப்பை விட 2.26 பெரியது என்பதைக் காணலாம், இது α = 0.05 இல் குறிப்பிடத்தக்கதாக இருக்க வேண்டும், ஆனால் 2.58 இன் மதிப்பை விட சிறியது, இது குறிப்பிடத்தக்கதாக இருக்க வேண்டும் α = 0.01 இன் நிலை. எனவே, நாம் ஒரு குறிப்பிடத்தக்க விளைவு என்று முடிவு செய்யலாம், இதுபோன்ற ஒன்றைச் சொல்வதன் மூலம் நாம் எழுதலாம்:
உளவியல் மாணவர்களின் மாதிரியில் 72.3 சராசரி தரத்துடன், மற்றும் 9.5 உண்மையான மக்கள்தொகை தரமான விலகலைக் கருதி, உளவியல் மாணவர்கள் வகுப்பு சராசரிக்கு கணிசமாக வேறுபட்ட புள்ளிவிவர மதிப்பெண்களைக் கொண்டுள்ளனர் என்று முடிவு செய்யலாம் (* z* = 2.26,* n* = 20, * ப * <0.05).
*Z *-Test இன் அனுமானங்கள்
நான் முன்பு கூறியது போல், அனைத்து புள்ளிவிவர சோதனைகளும் அனுமானங்களைச் செய்கின்றன. சில சோதனைகள் நியாயமான அனுமானங்களைச் செய்கின்றன, மற்ற சோதனைகள் இல்லை. நான் இப்போது விவரித்த சோதனை, ஒரு மாதிரி *z *-test, மூன்று அடிப்படை அனுமானங்களை உருவாக்குகிறது. அவை:
இயல்புநிலை. வழக்கமாக விவரிக்கப்பட்டுள்ளபடி, *z *-Test உண்மையான மக்கள்தொகை வழங்கல் இயல்பானது என்று கருதுகிறது. [#] _ இது பெரும்பாலும் ஒரு அழகான நியாயமான அனுமானமாகும், மேலும் இதைப் பற்றி நாங்கள் கவலைப்படுகிறதா என்பதை நாம் சரிபார்க்க முடியும் என்பதற்கான ஒரு அனுமானமாகும் (பகுதியைப் பார்க்கவும் : டாக்: CH11_TTEST_08).
சுதந்திரம். சோதனையின் இரண்டாவது அனுமானம் என்னவென்றால், உங்கள் தரவுத் தொகுப்பில் உள்ள அவதானிப்புகள் ஒருவருக்கொருவர் தொடர்புபடுத்தப்படவில்லை, அல்லது ஒருவருக்கொருவர் வேடிக்கையான வழியில் தொடர்புடையவை. இது புள்ளிவிவர ரீதியாக சரிபார்க்க எளிதானது அல்ல, இது நல்ல சோதனை வடிவமைப்பை கொஞ்சம் நம்பியுள்ளது. இந்த அனுமானத்தை மீறும் ஒன்றின் வெளிப்படையான (மற்றும் முட்டாள்தனமான) எடுத்துக்காட்டு, உங்கள் தரவுக் கோப்பில் அதே அவதானிப்பை மீண்டும் மீண்டும் "நகலெடுக்க" ஒரு தரவு தொகுப்பாகும், இதனால் நீங்கள் ஒரு பெரிய “மாதிரி அளவு” உடன் முடிவடையும், இது மட்டுமே அடங்கும் ஒரு உண்மையான அவதானிப்பு. மிகவும் யதார்த்தமாக, ஒவ்வொரு அவதானிப்பும் நீங்கள் ஆர்வமுள்ள மக்களிடமிருந்து முற்றிலும் சீரற்ற மாதிரி என்று கற்பனை செய்வது உண்மையிலேயே நம்பத்தகுந்ததா என்று நீங்களே கேட்டுக்கொள்ள வேண்டும். நடைமுறையில் இந்த அனுமானம் ஒருபோதும் நிறைவு செய்யப்படவில்லை, ஆனால் குறைக்கும் ஆய்வுகளை வடிவமைக்க நாங்கள் முயற்சி செய்கிறோம் தொடர்புடைய தரவின் சிக்கல்கள்.
அறியப்பட்ட நிலையான விலகல். *Z *-Test இன் மூன்றாவது அனுமானம் என்னவென்றால், மக்கள்தொகையின் உண்மையான நிலையான விலகல் ஆராய்ச்சியாளருக்குத் தெரியும். இது முட்டாள். உண்மையான உலக தரவு பகுப்பாய்வு சிக்கலில் சில மக்கள்தொகையின் நிலையான விலகல் உங்களுக்குத் தெரியாது, ஆனால் சராசரி பற்றி முற்றிலும் அறியாதவர்கள். வேறு வார்த்தைகளில் கூறுவதானால், இந்த அனுமானம் * எப்போதும் * தவறு.
Your அறியப்பட்டதாகக் கருதும் முட்டாள்தனத்தைப் பார்க்கும்போது, அது இல்லாமல் நாம் வாழ முடியுமா என்று பார்ப்போம். இது *z *-test இன் மந்தமான களத்திலிருந்து நம்மை வெளியேற்றுகிறது, மேலும் யூனிகார்ன்கள் மற்றும் தேவதைகள் மற்றும் தொழுநோய்களுடன் *t *-test இன் மந்திர இராச்சியத்திற்குள் செல்கிறது!