Section author: Danielle J. Navarro and David R. Foxcroft

கருத்தில் கொள்ள வேண்டிய சில சிக்கல்கள்

இந்த அத்தியாயத்தில் நான் உங்களுக்கு விவரித்திருப்பது சுழிய கருதுகோள் முக்கியத்துவ சோதனைக்கான ஆர்த்தடாக்ச் கட்டமைப்பாகும் (என்.எச்.எச்.டி). என்எச்எச்டி எவ்வாறு செயல்படுகிறது என்பதைப் புரிந்துகொள்வது ஒரு முழுமையான தேவை, ஏனெனில் இது 20 ஆம் நூற்றாண்டின் முற்பகுதியில் முக்கியத்துவம் பெற்றதிலிருந்து அனுமான புள்ளிவிவரங்களுக்கான மேலாதிக்க அணுகுமுறையாகும். உழைக்கும் விஞ்ஞானிகளில் பெரும்பான்மையானவர்கள் தங்கள் தரவு பகுப்பாய்வை நம்பியிருக்கிறார்கள், எனவே நீங்கள் அதை வெறுக்கிறீர்கள் என்றாலும் அதை நீங்கள் அறிந்து கொள்ள வேண்டும். இருப்பினும், அணுகுமுறை சிக்கல்கள் இல்லாமல் இல்லை. கட்டமைப்பில் ஏராளமான நகைச்சுவைகள் உள்ளன, அது எப்படி வந்தது என்பதில் வரலாற்று விந்தைகள், கட்டமைப்பானது சரியானதா இல்லையா என்பது குறித்த தத்துவார்த்த மோதல்கள், மற்றும் தெரியாதவர்களுக்கு நிறைய நடைமுறை பொறிகள் உள்ளன. இந்த தலைப்பில் நான் நிறைய விவரங்களுக்குச் செல்லப் போவதில்லை, ஆனால் இந்த சிக்கல்களில் சிலவற்றை சுருக்கமாக விவாதிப்பது மதிப்பு என்று நான் நினைக்கிறேன்.

நெய்மன் மற்றும் ஃபிசர்

நீங்கள் அறிந்திருக்க வேண்டிய முதல் சேதி என்னவென்றால், ஆர்த்தடாக்ச் என்.எச்.எச்.டி உண்மையில் கருதுகோள் சோதனைக்கு இரண்டு மாறுபட்ட அணுகுமுறைகளின் மேச்-அப் ஆகும், ஒன்று சர் ரொனால்ட் ஃபிசர் முன்மொழியப்பட்டது, மற்றொன்று செர்சி நெய்மனால் முன்மொழியப்பட்டது (பார்க்க: குறிப்பு: `லெஅ்மன், 2011 < Lehmann_2011> `ஒரு வரலாற்று சுருக்கத்திற்கு). வரலாறு குழப்பமாக இருக்கிறது, ஏனென்றால் ஃபிசரும் நெய்மனும் உண்மையான மனிதர்களாக இருந்தனர், அதன் கருத்துக்கள் காலப்போக்கில் மாறியது, மேலும் எந்த நேரத்திலும் அவர்களில் ஒருவர் பல தசாப்தங்களுக்குப் பிறகு அவர்களின் வேலையை எவ்வாறு விளக்க வேண்டும் என்பதற்கான "உறுதியான அறிக்கையை" வழங்கவில்லை. இந்த இரண்டு அணுகுமுறைகளையும் நான் எடுத்துக்கொள்வதற்கான விரைவான சுருக்கம் இங்கே.

முதலில், ஃபிசரின் அணுகுமுறையைப் பற்றி பேசலாம். என்னால் சொல்ல முடிந்தவரை, ஃபிசர் உங்களிடம் ஒரு கருதுகோள் (பூச்யம்) மட்டுமே இருப்பதாகவும், நீங்கள் செய்ய விரும்புவது சுழிய கருதுகோள் தரவுகளுடன் முரணாக இருக்கிறதா என்பதைக் கண்டுபிடிப்பதையும் கருதினார். அவரது கண்ணோட்டத்தில், நீங்கள் என்ன செய்ய வேண்டியது என்பது பூச்யத்தின் படி தரவு “போதுமான சாத்தியமில்லை” என்பதை சரிபார்க்க வேண்டும். உண்மையில், எங்கள் முந்தைய விவாதத்தை நீங்கள் நினைவில் வைத்திருந்தால், ஃபிசர் *பி *-மதிப்பை வரையறுக்கிறார். ஃபிசரின் கூற்றுப்படி, சுழிய கருதுகோள் தரவின் மிக மோசமான கணக்கை வழங்கினால், நீங்கள் அதை பாதுகாப்பாக நிராகரிக்கலாம். ஆனால், அதை ஒப்பிடுவதற்கு உங்களிடம் வேறு எந்த கருதுகோள்களும் இல்லை என்பதால், “மாற்றீட்டை ஏற்றுக்கொள்வதற்கான” வழி இல்லை, ஏனெனில் உங்களிடம் வெளிப்படையாகக் கூறப்பட்ட மாற்று இல்லை. அதுதான் அதிகமாகவோ அல்லது குறைவாகவோ இருக்கிறது.

இதற்கு நேர்மாறாக, கருதுகோள் சோதனையின் புள்ளி செயலுக்கான வழிகாட்டியாக இருந்தது என்றும் அவரது அணுகுமுறை ஃபிசரை விட சற்றே முறையானது என்றும் நெய்மன் நினைத்தார். அவரது கருத்து என்னவென்றால், நீங்கள் செய்யக்கூடிய பல விசயங்கள் உள்ளன * (பூச்யத்தை ஏற்றுக்கொள்ளுங்கள் அல்லது மாற்றீட்டை ஏற்றுக்கொள்ளுங்கள்) மற்றும் சோதனையின் புள்ளி எந்த தரவு உதவி உங்களுக்குச் சொல்வதுதான். இந்த கண்ணோட்டத்தில், உங்கள் மாற்று கருதுகோளை சரியாகக் குறிப்பிடுவது மிக முதன்மை. மாற்று கருதுகோள் என்னவென்று உங்களுக்குத் தெரியாவிட்டால், சோதனை எவ்வளவு ஆற்றல் வாய்ந்தது என்பது உங்களுக்குத் தெரியாது, அல்லது எந்த நடவடிக்கை அர்த்தமுள்ளதாக இருக்கிறது. அவரது கட்டமைப்பிற்கு உண்மையிலேயே வெவ்வேறு கருதுகோள்களுக்கு இடையில் ஒரு போட்டி தேவைப்படுகிறது. நெய்மானைப் பொறுத்தவரை, *பி *-மதிப்பு பூச்யத்தின் கீழ் தரவின் நிகழ்தகவை (அல்லது தரவு மிகவும் தீவிரமானது) நேரடியாக அளவிடவில்லை, இது ஒரு சுருக்க விளக்கமாக இருந்தது, இது "சாத்தியமான சோதனைகள்" பூச்யத்தை ஏற்றுக்கொள்ளச் சொல்கிறது, எந்த “சாத்தியமான சோதனைகள்” மாற்றீட்டை ஏற்றுக்கொள்ளச் சொல்லும்.

நீங்கள் பார்க்க முடியும் என, இன்று நம்மிடம் இருப்பது இருவரின் ஒற்றைப்படை மிச்மாச் ஆகும். ஒரு சுழிய கருதுகோள் மற்றும் மாற்று (நெய்மன்) இரண்டையும் கொண்டிருப்பதைப் பற்றி நாங்கள் பேசுகிறோம், ஆனால் வழக்கமாக [#] _ தீவிர தரவு (ஃபிசர்) அடிப்படையில் *பி *-மதிப்பை வரையறுக்கவும், ஆனால் நம்மிடம் α மதிப்புகள் (நெய்மன்) உள்ளன. சில புள்ளிவிவர சோதனைகள் வெளிப்படையாகக் குறிப்பிடப்பட்ட மாற்று வழிகளைக் கொண்டுள்ளன (நெய்மன்) ஆனால் மற்றவை அதைப் பற்றி மிகவும் தெளிவற்றவை (ஃபிசர்). மேலும், சிலரின் கூற்றுப்படி, மாற்றீட்டை (ஃபிசர்) ஏற்றுக்கொள்வது பற்றி பேச எங்களுக்கு இசைவு இல்லை. இது ஒரு குழப்பம், ஆனால் இது ஏன் ஒரு குழப்பம் என்பதை இது விளக்குகிறது என்று நம்புகிறேன்.

பேய்சியன் வெர்சச் அடிக்கடி

இந்த அத்தியாயத்தில் முன்னதாக நான் *p *-value ஐ சுழிய கருதுகோள் உண்மையாக இருப்பதற்கான நிகழ்தகவாக விளக்க முடியாது என்ற உண்மையைப் பற்றி நான் மிகவும் உறுதியாக இருந்தேன். NHST என்பது அடிப்படையில் அடிக்கடி நிகழும் கருவியாகும் (அத்தியாயம்: DOC: ../ ch07/ch07_probability) மற்றும் கருதுகோள்களுக்கு நிகழ்தகவுகளை ஒதுக்க உங்களை அனுமதிக்காது. சுழிய கருதுகோள் உண்மை அல்லது அது இல்லை. புள்ளிவிவரங்களுக்கான பேய்சியன் அணுகுமுறை நிகழ்தகவை நம்பிக்கையின் அளவாக விளக்குகிறது, எனவே சுழிய கருதுகோள் உண்மையாக இருக்க 10 % வாய்ப்பு உள்ளது என்று சொல்வது முற்றிலும் சரி. இந்த கருதுகோளில் உங்களிடம் உள்ள நம்பிக்கையின் அளவின் பிரதிபலிப்பு இது. அடிக்கடி நிகழும் அணுகுமுறையில் இதைச் செய்ய உங்களுக்கு இசைவு இல்லை. நினைவில் கொள்ளுங்கள், நீங்கள் அடிக்கடி நிகழும் என்றால், அதிக எண்ணிக்கையிலான சுயாதீன பிரதிகளுக்குப் பிறகு (அதாவது நீண்ட கால அதிர்வெண்) என்ன நடக்கிறது என்பதன் அடிப்படையில் மட்டுமே நிகழ்தகவை வரையறுக்க முடியும். இது நிகழ்தகவு குறித்த உங்கள் விளக்கமாக இருந்தால், சுழிய கருதுகோள் உண்மை என்று “நிகழ்தகவு” பற்றி பேசுவது முழுமையான அபத்தமானது: ஒரு சுழிய கருதுகோள் உண்மை அல்லது அது தவறானது. இந்த அறிக்கைக்கு நீண்டகால அதிர்வெண் பற்றி நீங்கள் பேச வழி இல்லை. “பூச்ய கருதுகோளின் நிகழ்தகவு” பற்றி பேசுவது “சுதந்திரத்தின் நிறம்” போலவே அர்த்தமற்றது. அதற்கு ஒன்று இல்லை!

மிக முக்கியமாக, இது * முற்றிலும் கருத்தியல் சேதி அல்ல. நீங்கள் ஒரு பேய்சியன் என்றும், கருதுகோள்களைப் பற்றிய நிகழ்தகவு அறிக்கைகளை வெளியிடுவதில் நீங்கள் சரி என்றும் நீங்கள் முடிவு செய்தால், அந்த நிகழ்தகவுகளைக் கணக்கிடுவதற்கு நீங்கள் பேய்சியன் விதிகளைப் பின்பற்ற வேண்டும். அத்தியாயத்தில் இதைப் பற்றி நான் அதிகம் பேசுவேன்: டாக்: ../ சி.எச் .16/சி.எச். : துணை: `0 உண்மை. நீங்கள் தெரிந்து கொள்ள விரும்புவது பூச்யத்தின் நிகழ்தகவு என்றால், *p *-மதிப்பு நீங்கள் தேடுவது அல்ல!

பொறிகள்

நீங்கள் பார்க்க முடியும் என, கருதுகோள் சோதனையின் பின்னால் உள்ள கோட்பாடு ஒரு குழப்பம், இப்போது கூட அது எவ்வாறு செயல்பட வேண்டும் என்பது பற்றிய புள்ளிவிவரங்களில் வாதங்கள் உள்ளன. இருப்பினும், புள்ளிவிவர நிபுணர்களிடையே கருத்து வேறுபாடுகள் இங்கே எங்கள் உண்மையான அக்கறை அல்ல. எங்கள் உண்மையான கவலை நடைமுறை தரவு பகுப்பாய்வு ஆகும். சுழிய கருதுகோள் முக்கியத்துவ சோதனைக்கான “ஆர்த்தடாக்ச்” அணுகுமுறை பல குறைபாடுகளைக் கொண்டிருந்தாலும், என்னைப் போன்ற ஒரு மனந்திரும்பாத பேய்சியன் கூட பொறுப்புடன் பயன்படுத்தினால் அவை பயனுள்ளதாக இருக்கும் என்பதை ஒப்புக் கொள்ளும். பெரும்பாலான நேரங்களில் அவர்கள் விவேகமான பதில்களைக் கொடுக்கிறார்கள், மேலும் சுவையான விசயங்களைக் கற்றுக்கொள்ள நீங்கள் அவற்றைப் பயன்படுத்தலாம். நாம் விவாதித்த பல்வேறு சித்தாந்தங்கள் மற்றும் வரலாற்று குழப்பங்களை ஒதுக்கி வைத்துக் கொண்டால், எல்லா புள்ளிவிவரங்களிலும் மிகப்பெரிய இடர் *சிந்தனையற்ற தன்மை *என்பதே உண்மை. நான் முட்டாள்தனத்தை அர்த்தப்படுத்தவில்லை, நான் உண்மையில் சிந்தனையற்ற தன்மையைக் குறிக்கிறேன். ஒவ்வொரு சோதனையும் தரவைப் பற்றி உண்மையில் என்ன சொல்கிறது என்பதை சிந்திக்காமல் நேரத்தை செலவிடாமல் ஒரு முடிவை விளக்குவதற்கான விரைவு, அதை நீங்கள் எவ்வாறு விளக்கினீர்கள் என்பதற்கு இது ஒத்ததாக இருக்கிறதா என்று சோதித்துப் பாருங்கள். அதுதான் மிகப்பெரிய பொறி உள்ளது.

இதற்கு ஒரு எடுத்துக்காட்டு கொடுக்க, பின்வரும் உதாரணத்தைக் கவனியுங்கள் (: குறிப்பு: கெல்மேன் & ச்டெர்ன், 2006 <gelman_2006>). நான் எனது ஈஎச்பி ஆய்வை இயக்குகிறேன் என்று வைத்துக்கொள்வோம், ஆண் பங்கேற்பாளர்கள் மற்றும் பெண் பங்கேற்பாளர்களுக்கான தரவை தனித்தனியாக பகுப்பாய்வு செய்ய முடிவு செய்துள்ளேன். ஆண் பங்கேற்பாளர்களில், 50 பேரில் 33 பேர் அட்டையின் நிறத்தை சரியாக யூகித்தனர். இது ஒரு குறிப்பிடத்தக்க விளைவு (* ப* = 0.03). பெண் பங்கேற்பாளர்களில், 50 பேரில் 29 பேர் சரியாக யூகிக்கப்பட்டனர். இது ஒரு குறிப்பிடத்தக்க விளைவு அல்ல (ப = 0.32). இதைக் கவனித்தவுடன், ஆண்களுக்கும் பெண்களுக்கும் அவர்களின் மனநல திறன்களின் அடிப்படையில் ஏன் வேறுபாடு இருக்கிறது என்று மக்கள் யோசிக்கத் தொடங்குவது மிகவும் தூண்டுகிறது. இருப்பினும், இது தவறு. நீங்கள் இதைப் பற்றி சிந்தித்தால், ஆண்களை வெளிப்படையாக பெண்களுடன் ஒப்பிடும் ஒரு சோதனையை நாங்கள் உண்மையில் * இயக்கவில்லை. நாங்கள் செய்ததெல்லாம் ஆண்களை வாய்ப்புடன் ஒப்பிடுவது (பைனோமியல் சோதனை குறிப்பிடத்தக்கதாக இருந்தது) மற்றும் பெண்களை வாய்ப்புடன் ஒப்பிட்டுப் பார்த்தது (பைனோமியல் சோதனை குறிப்பிடத்தக்கதாக இல்லை). ஆண்களுக்கும் பெண்களுக்கும் இடையே உண்மையான வேறுபாடு இருப்பதாக நாம் வாதிட விரும்பினால், எந்த வித்தியாசமும் இல்லை என்ற சுழிய கருதுகோளின் சோதனையை நாம் இயக்க வேண்டும்! வேறுபட்ட கருதுகோள் சோதனையைப் பயன்படுத்தி நாம் அதைச் செய்யலாம், [#] _ ஆனால் நாம் அவ்வாறு செய்யும்போது ஆண்களும் பெண்களும் கணிசமாக வேறுபட்டவர்கள் என்பதற்கு எங்களுக்கு எந்த ஆதாரமும் இல்லை (* ப* = 0.54). * இப்போது* இரு குழுக்களிடையே அடிப்படையில் வேறுபட்ட எதுவும் இருப்பதாக நீங்கள் நினைக்கிறீர்களா? நிச்சயமாக இல்லை. இங்கே நடந்தது என்னவென்றால், இரு குழுக்களிடமிருந்தும் (ஆண் மற்றும் பெண்) தரவு அழகான எல்லைக்கோடு. தூய்மையான வாய்ப்பால், அவர்களில் ஒருவர் * பி * = 0.05 வரியின் மந்திர பக்கத்தில் முடிவடைந்தது, மற்றொன்று அவ்வாறு செய்யவில்லை. ஆண்களும் பெண்களும் வேறுபட்டவர்கள் என்பதை இது உண்மையில் குறிக்கவில்லை. இந்த தவறு மிகவும் பொதுவானது, நீங்கள் எப்போதும் எச்சரிக்கையாக இருக்க வேண்டும். குறிப்பிடத்தக்க மற்றும் குறிப்பிடத்தக்கதாக இல்லாத வேறுபாடு உண்மையான வேறுபாட்டின் சான்றுகள் * அல்ல. இரண்டு குழுக்களிடையே வேறுபாடு இருப்பதாக நீங்கள் சொல்ல விரும்பினால், அந்த வித்தியாசத்தை நீங்கள் சோதிக்க வேண்டும்!

மேலே உள்ள எடுத்துக்காட்டு அது, ஒரு எடுத்துக்காட்டு. இது மிகவும் பொதுவானது என்பதால் நான் அதைத் தனிமைப்படுத்தினேன், ஆனால் பெரிய படம் என்னவென்றால், தரவு பகுப்பாய்வு சரியாகப் பெற தந்திரமானதாக இருக்கும். நீங்கள் என்ன சோதிக்க விரும்புகிறீர்கள், அதை ஏன் சோதிக்க விரும்புகிறீர்கள், உங்கள் சோதனை அளிக்கும் பதில்கள் உண்மையான உலகில் எந்த அர்த்தத்தையும் ஏற்படுத்தக்கூடும் என்பதைப் பற்றி சிந்தியுங்கள்.