Section author: Danielle J. Navarro and David R. Foxcroft
சோதனை புள்ளிவிவரங்கள் மற்றும் மாதிரி விநியோகங்கள்
இந்த கட்டத்தில் ஒரு கருதுகோள் சோதனை எவ்வாறு கட்டமைக்கப்படுகிறது என்பதைப் பற்றி பேசத் தொடங்க வேண்டும். அதற்காக, ஈஎச்பி எடுத்துக்காட்டுக்கு திரும்புவோம். நாங்கள் பெற்ற உண்மையான தரவைப் புறக்கணிப்போம், இப்போதைக்கு, மற்றும் பரிசோதனையின் கட்டமைப்பைப் பற்றி சிந்தியுங்கள். உண்மையான எண்கள் என்ன என்பதைப் பொருட்படுத்தாமல், தரவின் * வடிவம் * * ஃச் * * n * இல் இருந்து மறைக்கப்பட்ட அட்டையின் நிறத்தை சரியாக அடையாளம் கண்டுள்ளது. மேலும், சுழிய கருதுகோள் உண்மையிலேயே உண்மை, எச்பி இல்லை என்பதையும், சரியான வண்ணத்தை எவரும் எடுக்கும் உண்மையான நிகழ்தகவுகளும் சரியாக * θ * = 0.5 என்று கருதலாம். தரவு எப்படி இருக்கும் என்று நாங்கள் எதிர்பார்க்கிறோம்? சரி, சரியான பதிலைச் செய்யும் நபர்களின் விகிதம் 50 %க்கு மிக அருகில் இருக்கும் என்று நாங்கள் எதிர்பார்க்கிறோம். அல்லது, இதை மேலும் கணித அடிப்படையில் சொற்றொடருக்கு, * ஃச் * / * n * தோராயமாக 0.5 என்று நாங்கள் கூறுவோம். நிச்சயமாக, இந்த பகுதியே * சரியாக * 0.5 இருக்கும் என்று நாங்கள் எதிர்பார்க்க மாட்டோம். எடுத்துக்காட்டாக, நாங்கள் * n * = 100 பேரை சோதித்தோம், அவர்களில் * ஃச் * = 53 கேள்வியை சரியாகப் பெற்றிருந்தால், தரவு சுழிய கருதுகோளுடன் மிகவும் ஒத்துப்போகிறது என்பதை ஒப்புக்கொள்ள வேண்டிய கட்டாயத்தில் இருக்கலாம். மறுபுறம், எங்கள் பங்கேற்பாளர்களில் * ஃச் * = 99 கேள்வியை சரியாகப் பெற்றால், சுழிய கருதுகோள் தவறு என்று நாங்கள் நம்புகிறோம். இதேபோல், * ஃச் * = 3 பேருக்கு மட்டுமே பதில் கிடைத்தால், சுழியம் தவறு என்று நாங்கள் நம்புகிறோம். இதைப் பற்றி இன்னும் கொஞ்சம் தொழில்நுட்பமாக இருக்கட்டும். எங்கள் தரவைப் பார்த்து கணக்கிடக்கூடிய ஒரு அளவு * ஃச் * உள்ளது. * ஃச் * இன் மதிப்பைப் பார்த்த பிறகு, சுழிய கருதுகோள் சரியானது என்று நம்பலாமா, அல்லது மாற்றீட்டிற்கு ஆதரவாக சுழிய கருதுகோளை நிராகரிப்பது பற்றி ஒரு முடிவை எடுக்கிறோம். எங்கள் தேர்வுகளை வழிநடத்த நாங்கள் கணக்கிடும் இந்த விசயத்தின் பெயர் ** சோதனை புள்ளிவிவரம் **.
ஒரு சோதனை புள்ளிவிவரத்தைத் தேர்ந்தெடுத்த பின்னர், அடுத்த கட்டம் சோதனை புள்ளிவிவரத்தின் எந்த மதிப்புகள் சுழிய கருதுகோளை நிராகரிக்க வழிவகுக்கும் என்பதையும், எந்த மதிப்புகள் அதை வைத்திருக்க வழிவகுக்கும் என்பதையும் துல்லியமாகக் குறிப்பிடுவது. அவ்வாறு செய்ய, சுழிய கருதுகோள் உண்மையில் உண்மையாக இருந்தால், சோதனை புள்ளிவிவரத்தின் ** மாதிரி வழங்கல் ** என்னவாக இருக்கும் என்பதை நாம் தீர்மானிக்க வேண்டும் (நாங்கள் முன்பு மாதிரி விநியோகங்களைப் பற்றி பேசினோம்: குறிப்பு: `சராசரியின் மாதிரி வழங்கல் <sampling_distribution_the_mean> `). நமக்கு இது ஏன் தேவை? ஏனெனில் இந்த வழங்கல் * ஃச் * இன் மதிப்புகள் என்ன என்பதை சரியாகச் சொல்கிறது, எங்கள் சுழிய கருதுகோள் நம்மை எதிர்பார்க்க வழிவகுக்கும். எனவே, எங்கள் தரவுகளுடன் சுழிய கருதுகோள் எவ்வளவு நெருக்கமாக உடன்படுகிறது என்பதை மதிப்பிடுவதற்கான ஒரு கருவியாக இந்த விநியோகத்தை நாம் பயன்படுத்தலாம்.
Fig. 67 சுழிய கருதுகோள் உண்மையாக இருக்கும்போது எங்கள் சோதனை புள்ளிவிவர ஃச் க்கான மாதிரி வழங்கல். எங்கள் ஈஎச்பி காட்சிக்கு இது ஒரு இருமுனை வழங்கல். சரியான பதிலின் நிகழ்தகவு θ = 0.5 என்று சுழிய கருதுகோள் கூறுவதால், மாதிரி வழங்கல் பெரும்பாலும் மதிப்பு 50 (100 இல்) சரியான பதில்கள் என்று கூறுகிறது. நிகழ்தகவு வெகுசனத்தின் பெரும்பாலானவை 40 முதல் 60 வரை உள்ளன.
சோதனை புள்ளிவிவரத்தின் மாதிரி விநியோகத்தை உண்மையில் எவ்வாறு தீர்மானிப்பது? நிறைய கருதுகோள் சோதனைகளுக்கு இந்த படி உண்மையில் மிகவும் சிக்கலானது, பின்னர் புத்தகத்தில் சில சோதனைகளுக்கு நான் அதைப் பற்றி சற்று தவிர்க்கப்படுவதை நீங்கள் காண்பீர்கள் (அவற்றில் சில எனக்கு என்னைப் புரிந்து கொள்ளவில்லை). இருப்பினும், சில நேரங்களில் இது மிகவும் எளிதானது. மேலும், அதிர்ச்டவசமாக, எங்கள் ஈஎச்பி சான்று எங்களுக்கு எளிதான நிகழ்வுகளில் ஒன்றை வழங்குகிறது. எங்கள் மக்கள்தொகை அளவுரு *θ *என்பது கேள்வியைக் கேட்டபோது மக்கள் சரியாக பதிலளிக்கும் ஒட்டுமொத்த நிகழ்தகவு மட்டுமே, மேலும் எங்கள் சோதனை புள்ளிவிவரம் *x *என்பது *n *இன் மாதிரி அளவிலிருந்து அவ்வாறு செய்தவர்களின் எண்ணிக்கையில் *எண்ணிக்கை *. இதுபோன்ற ஒரு விநியோகத்தை நாங்கள் முன்பு பார்த்திருக்கிறோம், பிரிவில்: doc: ../ ch07/ch07_probability_4, அதுதான் பைனோமியல் வழங்கல் விவரிக்கிறது! எனவே, அந்த பிரிவில் நான் அறிமுகப்படுத்திய குறியீடு மற்றும் சொற்களைப் பயன்படுத்த, * ஃச் * பைனோமிகல் விநியோகிக்கப்படுவதாக சுழிய கருதுகோள் கணிக்கிறது, இது எழுதப்பட்டுள்ளது:
X ~ Binomial(θ, N)
சுழிய கருதுகோள் * θ * = 0.5 மற்றும் எங்கள் பரிசோதனையில் * n * = 100 நபர்களைக் கொண்டிருப்பதால், நமக்குத் தேவையான மாதிரி வழங்கல் உள்ளது. இந்த மாதிரி வழங்கல் இதில் திட்டமிடப்பட்டுள்ளது: NumRef: Fig-samplingdist. உண்மையில் எந்த ஆச்சரியமும் இல்லை, சுழிய கருதுகோள் * ஃச் * = 50 என்பது பெரும்பாலும் விளைவு என்று கூறுகிறது, மேலும் 40 முதல் 60 வரை சரியான பதில்களுக்கு இடையில் எங்காவது பார்ப்பது உறுதி என்று அது கூறுகிறது.