Section author: Danielle J. Navarro and David R. Foxcroft

ஏன் பேய்சியன் இருக்க வேண்டும்?

இந்த கட்டத்தில் நான் பேய்சியன் புள்ளிவிவரங்களை அடிப்படையாகக் கொண்ட தர்க்கத்தில் மட்டுமே கவனம் செலுத்தியுள்ளேன். "நிகழ்தகவு நம்பிக்கையின் அளவாக" என்ற யோசனையைப் பற்றியும், ஒரு பகுத்தறிவு முகவர் உலகைப் பற்றி எவ்வாறு நியாயப்படுத்த வேண்டும் என்பதையும் குறிக்கிறது. நீங்களே பதிலளிக்க வேண்டிய கேள்வி இதுதான்: உங்கள் புள்ளிவிவரங்களை நீங்கள் எவ்வாறு செய்ய விரும்புகிறீர்கள்? உங்கள் முடிவுகளை வழிநடத்த மாதிரி விநியோகங்கள் மற்றும் *பி *மதிப்புகளை நம்பி, நீங்கள் ஒரு ஆர்த்தடாக்ச் புள்ளிவிவர நிபுணராக இருக்க விரும்புகிறீர்களா? அல்லது முந்தைய நம்பிக்கைகள், பேயச் காரணிகள் மற்றும் பகுத்தறிவு நம்பிக்கை திருத்தத்திற்கான விதிகள் போன்ற விசயங்களை நம்பி நீங்கள் ஒரு பேய்சியனாக இருக்க விரும்புகிறீர்களா? நேர்மையாக இருக்க, உங்களுக்காக இந்த கேள்விக்கு என்னால் பதிலளிக்க முடியாது. இறுதியில் அது சரியானது என்று நீங்கள் நினைப்பதைப் பொறுத்தது. இது உங்கள் அழைப்பு மற்றும் உங்கள் அழைப்பு மட்டுமே. சொல்லப்பட்டால், பேய்சியன் அணுகுமுறையை * நான் ஏன் விரும்புகிறேன் என்பதைப் பற்றி கொஞ்சம் பேச முடியும்.

அவை பொருள் என்று நீங்கள் நினைப்பதைக் குறிக்கும் புள்ளிவிவரங்கள்

நீங்கள் அந்த வார்த்தையைப் பயன்படுத்துகிறீர்கள். இதன் பொருள் இதன் பொருள் என்று நான் நினைக்கவில்லை

இனிகோ மோன்டோயா, இளவரசி மணமகள் <https://www.imdb.com/title/tt0093779/quotes> __ [#] _ _

என்னைப் பொறுத்தவரை, பேய்சியன் அணுகுமுறையின் மிகப்பெரிய நன்மைகளில் ஒன்று, அது சரியான கேள்விகளுக்கு பதிலளிக்கிறது. பேய்சியன் கட்டமைப்பிற்குள், "ஒரு கருதுகோள் உண்மை என்ற நிகழ்தகவு" என்பதைக் குறிப்பிடுவது முற்றிலும் விவேகமான மற்றும் அனுமதிக்கக்கூடியது. இந்த நிகழ்தகவைக் கணக்கிட கூட முயற்சி செய்யலாம். இறுதியில், உங்கள் புள்ளிவிவர சோதனைகள் உங்களுக்குச் சொல்ல நீங்கள் * விரும்புவது * இல்லையா? ஒரு உண்மையான மனிதனுக்கு, இது புள்ளிவிவரங்களைச் செய்வதற்கான முழு * புள்ளி * ஆகத் தோன்றும், அதாவது, எது உண்மை, எது இல்லை என்பதை தீர்மானிக்க. உண்மை என்னவென்று உங்களுக்குத் தெரியாத எந்த நேரத்திலும், நீங்கள் நிகழ்தகவு கோட்பாட்டின் மொழியைப் பயன்படுத்த வேண்டும், “கோட்பாடு A உண்மை என்று 80 % வாய்ப்பு உள்ளது, ஆனால் கோட்பாடு B என்ற 20 % வாய்ப்பு அதற்கு பதிலாக உண்மை ”.

இது ஒரு மனிதனுக்கு மிகவும் தெளிவாகத் தெரிகிறது, ஆனால் இது ஆர்த்தடாக்ச் கட்டமைப்பிற்குள் வெளிப்படையாக தடைசெய்யப்பட்டுள்ளது. அடிக்கடி நிகழும், இதுபோன்ற அறிக்கைகள் ஒரு முட்டாள்தனமாக இருக்கின்றன, ஏனெனில் “கோட்பாடு உண்மை” என்பது மீண்டும் மீண்டும் நிகழக்கூடிய நிகழ்வு அல்ல. ஒரு கோட்பாடு உண்மை அல்லது அது இல்லை, நீங்கள் எவ்வளவு செய்ய விரும்பினாலும், நிகழ்தகவு அறிக்கைகள் எதுவும் அனுமதிக்கப்படவில்லை. பிரிவில், மீண்டும் ஒரு காரணம் இருக்கிறது: DOC: ../ ch09/ch09_hypothesistesting_05, சுழிய கருதுகோள் உண்மையாக இருக்கும் நிகழ்தகவாக *p *-value ஐ விளக்குவதற்கு நான் உங்களுக்கு மீண்டும் மீண்டும் எச்சரித்தேன். ச்டேட்டிக்சில் உள்ள ஒவ்வொரு பாடப்புத்தகமும் அந்த எச்சரிக்கையை மீண்டும் செய்ய வேண்டிய கட்டாயத்தில் இருப்பதற்கு ஒரு காரணம் இருக்கிறது. ஏனென்றால், மக்கள் தீவிரமாக * விரும்புகிறார்கள் * இது சரியான விளக்கமாக இருக்க வேண்டும். அடிக்கடி நிகழும் பிடிவாதமாக, இளங்கலை பட்டதாரிகளை கற்பித்தல் மற்றும் நாள்தோறும் அடிப்படையில் தரவு பகுப்பாய்வைச் செய்வதன் மூலம் வாழ்நாள் முழுவதும் "கருதுகோள் உண்மை என்று நிகழ்தகவு" என்பது அர்த்தமுள்ளதாக இல்லை என்று பெரும்பாலான உண்மையான மனிதர்கள் நினைக்கிறார்கள், இது நாம் மிகவும் கவனித்துக்கொள்கிறோம் * * பற்றி. பயிற்சி பெற்ற புள்ளிவிவர வல்லுநர்கள் கூட ஒரு *p *-மதிப்பை இந்த வழியில் விளக்க முயற்சிக்கும் தவறுக்கு இரையாகிவிடுகிறார்கள் என்பது மிகவும் ஈர்க்கக்கூடிய யோசனையாகும். எடுத்துக்காட்டாக, 2013 இல் அதிகாரப்பூர்வ செய்தித்தாள் அறிக்கையின் மேற்கோள் இங்கே <https://about.abc.net.au/reports-publications/appreciation-survey--sumary-port-2013> __, அவற்றின் விளக்கமளிப்பது எப்படி என்பதை விளக்குகிறது (அடிக்கடி) தரவு பகுப்பாய்வு:

அறிக்கை முழுவதும், பொருத்தமான, புள்ளிவிவர ரீதியாக குறிப்பிடத்தக்க மாற்றங்கள் குறிப்பிடப்பட்டுள்ளன. அனைத்து முக்கியத்துவ சோதனைகளும் 95 சதவீத நம்பிக்கையை அடிப்படையாகக் கொண்டவை. ! (வலியுறுத்தல் சேர்க்கப்பட்டது)

இல்லை! அது * அல்ல * பி * <0.05 பொருள். 95 % நம்பிக்கை என்பது அடிக்கடி நிகழும் புள்ளிவிவர நிபுணருக்கு என்ன அல்ல. தைரியமான பிரிவு வெறும் தவறு. ஆர்த்தடாக்ச் முறைகள் “ஒரு உண்மையான மாற்றம் ஏற்பட்டதற்கு 95 % வாய்ப்பு உள்ளது” என்று உங்களுக்குச் சொல்ல முடியாது, ஏனென்றால் இது அடிக்கடி நிகழ்தகவுகள் ஒதுக்கப்படக்கூடிய நிகழ்வு அல்ல. ஒரு கருத்தியல் அடிக்கடி நிகழ்த்துவதற்கு, இந்த வாக்கியம் அர்த்தமற்றதாக இருக்க வேண்டும். நீங்கள் மிகவும் நடைமுறைக்குரியவர் என்றாலும், அது இன்னும் *p *-value இன் தவறான வரையறை. நீங்கள் மரபுவழி புள்ளிவிவர கருவிகளை நம்ப விரும்பினால் சொல்வது அனுமதிக்கப்பட்ட அல்லது சரியான சேதி அல்ல.

மறுபுறம், நீங்கள் ஒரு பேய்சியன் என்று வைத்துக்கொள்வோம். தைரியமான பத்தியில் *p *-value இன் தவறான வரையறை இருந்தாலும், மாற்று கருதுகோளின் பின்புற நிகழ்தகவு 95 %ஐ விட அதிகமாக உள்ளது என்று அவர்கள் கூறும்போது ஒரு பேய்சியன் பொருள். இங்கே சேதி. பேய்சியன் பின்புறம் உண்மையில் நீங்கள் புகாரளிக்க விரும்பும் சேதி என்றால், நீங்கள் ஏன் ஆர்த்தடாக்ச் முறைகளைப் பயன்படுத்த முயற்சிக்கிறீர்கள்? நீங்கள் பேய்சியன் உரிமைகோரல்களைச் செய்ய விரும்பினால், நீங்கள் செய்ய வேண்டியது எல்லாம் ஒரு பேய்சியன் மற்றும் பேய்சியன் கருவிகளைப் பயன்படுத்துங்கள்.

எனக்காக பேசும்போது, பேய்சியன் பார்வைக்கு மாறுவது குறித்து இது மிகவும் விடுதலையான சேதி என்று நான் கண்டேன். நீங்கள் குதித்தவுடன், *பி *-மதிப்புகளின் எதிர்-உள்ளுணர்வு வரையறைகளைச் சுற்றி இனி உங்கள் தலையை மூடிக்கொள்ள வேண்டியதில்லை. உண்மையான சராசரி சில இடைவெளியில் உள்ளது என்று நீங்கள் 95 % நம்புகிறீர்கள் என்று ஏன் சொல்ல முடியாது என்பதை நினைவில் கொள்வதை நீங்கள் கவலைப்பட வேண்டியதில்லை. நீங்கள் செய்ய வேண்டியது என்னவென்றால், நீங்கள் ஆய்வை நடத்துவதற்கு முன்பு நீங்கள் நம்பியதைப் பற்றி நேர்மையாக இருங்கள், பின்னர் அதைச் செய்வதிலிருந்து நீங்கள் கற்றுக்கொண்டதைப் புகாரளிக்கவும். நன்றாக இருக்கிறது, இல்லையா? என்னைப் பொறுத்தவரை, இது பேய்சியன் அணுகுமுறையின் பெரிய வாக்குறுதியாகும். நீங்கள் உண்மையிலேயே செய்ய விரும்பும் பகுப்பாய்வைச் செய்கிறீர்கள், மேலும் தரவு உங்களுக்குச் சொல்கிறது என்று நீங்கள் உண்மையில் நம்புவதை வெளிப்படுத்துங்கள்.

நீங்கள் நம்பக்கூடிய தெளிவான தரநிலைகள்

[P] 0.02 க்குக் கீழே இருந்தால், [பூச்ய] கருதுகோள் முழு உண்மைகளையும் கணக்கிடத் தவறிவிட்டது என்பதை வலுவாக சுட்டிக்காட்டுகிறது. 0.05 இல் ஒரு வழக்கமான கோட்டை வரைந்து, [ *p *இன் சிறிய மதிப்புகள்] ஒரு உண்மையான முரண்பாட்டைக் குறிக்கின்றன என்பதைக் கருத்தில் கொண்டால் நாம் பெரும்பாலும் வழிதவற மாட்டோம்.

—: குறிப்பு: சர் ரொனால்ட் ஃபிசர் (1925) <ஃபிசர்_1925>

புள்ளிவிவரங்களுக்கான மரபுவழி அணுகுமுறையாக மாறிய நிறுவனங்களில் ஒருவரான சர் ரொனால்ட் ஃபிசரின் மேற்கோளைக் கவனியுங்கள். *பி *-மதிப்புகளின் நோக்கம் குறித்து ஒரு கருத்தை வெளிப்படுத்த யாராவது எப்போதாவது உரிமை பெற்றிருந்தால், அது ஃபிசர். இந்த பத்தியில், அவரது உன்னதமான வழிகாட்டி *ஆராய்ச்சித் தொழிலாளர்களுக்கான புள்ளிவிவர முறைகளிலிருந்து எடுக்கப்பட்டது *, *p *<0.05 இல் சுழிய கருதுகோளை நிராகரிப்பது என்ன என்பது குறித்து அவர் தெளிவாக இருக்கிறார். அவருடைய கருத்தில், “ஒரு உண்மையான விளைவு” இருப்பதைக் குறிக்க நாம் * p * <0.05 ஐ எடுத்துக் கொண்டால், “நாம் பெரும்பாலும் வழிதவற மாட்டோம்”. இந்த பார்வை அசாதாரணமானது. எனது அனுபவத்தில், பெரும்பாலான பயிற்சியாளர்கள் ஃபிசருக்கு மிகவும் ஒத்த காட்சிகளை வெளிப்படுத்துகிறார்கள். சாராம்சத்தில், * பி * <0.05 மாநாடு மிகவும் கடுமையான தெளிவான தரத்தை குறிக்கும் என்று கருதப்படுகிறது.

சரி, அது எவ்வளவு உண்மை? இந்த கேள்வியை அணுகுவதற்கான ஒரு வழி, *பி *-மதிப்புகளை பேயச் காரணிகளாக மாற்ற முயற்சிப்பது, இரண்டுமே எவ்வாறு ஒப்பிடுகின்றன என்பதைப் பாருங்கள். இது எளிதான காரியமல்ல, ஏனென்றால் ஒரு *p *-மதிப்பு என்பது ஒரு பேயச் காரணிக்கு அடிப்படையில் வேறுபட்ட கணக்கீடு ஆகும், மேலும் அவை ஒரே விசயத்தை அளவிடாது. இருப்பினும், இருவருக்கும் இடையிலான உறவை வெளிப்படுத்த சில முயற்சிகள் நடந்துள்ளன, அது சற்று ஆச்சரியமாக இருக்கிறது. எடுத்துக்காட்டாக. மற்றும் 5: 1 மாற்றுக்கு ஆதரவாக. அது சரி என்றால், ஃபிசரின் கூற்று சற்று நீட்டிக்கப்படுகிறது. சுழிய கருதுகோள் பாதி நேரத்தைப் பற்றி உண்மை என்று வைத்துக்கொள்வோம் (அதாவது, h : துணை: 0 0.5) இன் முன் நிகழ்தகவு), மேலும் அந்த எண்களைப் பயன்படுத்துகிறோம், அது கொடுக்கப்பட்ட சுழிய கருதுகோளின் பின்புற நிகழ்தகவை உருவாக்குகிறது * p * <0.05 இல் நிராகரிக்கப்பட்டது. தரவைப் பயன்படுத்துதல்: ref: சான்சன் (2013) <சான்சன்_2013>, நீங்கள் பூச்யத்தை * p * <0.05 இல் நிராகரித்தால், 80 % நேரம் நீங்கள் சரியாக இருப்பீர்கள் என்பதை நாங்கள் காண்கிறோம். உங்களைப் பற்றி எனக்குத் தெரியாது, ஆனால் என் கருத்துப்படி, உங்கள் முடிவுகளில் 20 % இல் நீங்கள் தவறாக இருப்பதை உறுதி செய்யும் ஒரு தெளிவான தரநிலை போதுமானதாக இல்லை. உண்மை என்னவென்றால், ஃபிசரின் கூற்றுக்கு மாறாக, நீங்கள் * p * <0.05 இல் நிராகரித்தால் நீங்கள் அடிக்கடி வழிதவற வேண்டும். இது மிகவும் கடுமையான தெளிவான வாசல் அல்ல.

*பி *-மதிப்பு ஒரு பொய்.

கேக் ஒரு பொய்.
கேக் ஒரு பொய்.
கேக் ஒரு பொய்.
கேக் ஒரு பொய்.

`போர்டல் <https://knowyourmeme.com/memes/the-cake-is-a-lie> ____ __ __

சரி, இந்த கட்டத்தில் உண்மையான சிக்கல் ஆர்த்தடாக்ச் புள்ளிவிவரங்களுடன் இல்லை என்று நீங்கள் நினைத்துக் கொண்டிருக்கலாம், * ப * <0.05 தரநிலை. ஒரு வகையில், அது உண்மைதான். பரிந்துரை: குறிப்பு: சான்சன் (2013) <சான்சன்_2013> கொடுக்கிறது “எல்லோரும் இப்போது பேய்சியனாக இருக்க வேண்டும்” என்பதல்ல. அதற்கு பதிலாக, பரிந்துரை என்னவென்றால், வழக்கமான தரத்தை A * P * <0.01 நிலை போன்றவற்றுக்கு மாற்றுவது புத்திசாலித்தனமாக இருக்கும். இது ஒரு நியாயமற்ற பார்வை அல்ல, ஆனால் என் பார்வையில் சிக்கல் அதை விட சற்று கடுமையானது. என் கருத்துப்படி, ஆர்த்தடாக்ச் கருதுகோள் சோதனைகள் கட்டமைக்கப்பட்ட விதத்தில் ஒரு பெரிய சிக்கல் உள்ளது. மனிதர்கள் உண்மையில் எவ்வாறு ஆராய்ச்சி செய்கிறார்கள் என்பதில் அவர்கள் மிகவும் அப்பாவியாக இருக்கிறார்கள், மேலும் இந்த மிக *பி *-மதிப்புகள் தவறானவை.

அபத்தமான கூற்று போல் தெரிகிறது, இல்லையா? சரி, பின்வரும் காட்சியைக் கவனியுங்கள். நீங்கள் மிகவும் உற்சாகமான ஆராய்ச்சி கருதுகோளைக் கொண்டு வந்துள்ளீர்கள், அதைச் சோதிக்க ஒரு ஆய்வை வடிவமைக்கிறீர்கள். நீங்கள் மிகவும் விடாமுயற்சியுடன் இருக்கிறீர்கள், எனவே உங்கள் மாதிரி அளவு என்னவாக இருக்க வேண்டும் என்பதைச் செய்ய நீங்கள் ஒரு ஆற்றல் பகுப்பாய்வை இயக்குகிறீர்கள், மேலும் நீங்கள் ஆய்வை நடத்துகிறீர்கள். நீங்கள் உங்கள் கருதுகோள் சோதனையை இயக்குகிறீர்கள், மேலும் 0.072 இன் *பி *-மதிப்பு. உண்மையில் இரத்தக்களரி எரிச்சலூட்டும், இல்லையா?

நீங்கள் என்ன செய்ய வேண்டும்? சில சாத்தியங்கள் இங்கே:

  1. எந்த விளைவும் இல்லை என்று நீங்கள் முடிவு செய்து அதை ஒரு சுழிய முடிவாக வெளியிட முயற்சிக்கிறீர்கள்

  2. ஒரு விளைவு இருக்கலாம் என்று நீங்கள் யூகித்து, அதை "எல்லைக்கோடு குறிப்பிடத்தக்க" முடிவாக வெளியிட முயற்சிக்கிறீர்கள்

  3. நீங்கள் விட்டுவிட்டு ஒரு புதிய ஆய்வை முயற்சிக்கவும்

  4. *P *-மதிப்பு மேலே செல்கிறதா அல்லது (முன்னுரிமை!) *P *<0.05 இன் “மேசிக்” அளவுகோலுக்குக் கீழே குறைகிறதா என்பதைப் பார்க்க இன்னும் சில தரவுகளை சேகரிக்கிறீர்கள்

நீங்கள் * தேர்வு செய்வீர்கள்? மேலும் படிக்கும் முன், அதைப் பற்றி சிந்திக்க சிறிது நேரம் எடுக்கும்படி கேட்டுக்கொள்கிறேன். நீங்களே நேர்மையாக இருங்கள். ஆனால் அதைப் பற்றி அதிகம் வலியுறுத்த வேண்டாம், ஏனென்றால் நீங்கள் எதைத் தேர்வு செய்தாலும் திருகப்படுகிறீர்கள். ஒரு எழுத்தாளர், விமர்சகர் மற்றும் ஆசிரியர் என்ற எனது சொந்த அனுபவங்களையும், மற்றவர்களிடமிருந்து நான் கேள்விப்பட்ட கதைகளையும் அடிப்படையாகக் கொண்டு, ஒவ்வொரு விசயத்திலும் என்ன நடக்கும் என்பது இங்கே:

  • விருப்பம் 1 உடன் ஆரம்பிக்கலாம். நீங்கள் அதை ஒரு சுழிய முடிவாக வெளியிட முயற்சித்தால், காகிதம் வெளியிட போராடும். சில விமர்சகர்கள் * பி * = 0.072 உண்மையில் சுழிய முடிவு அல்ல என்று நினைப்பார்கள். இது எல்லைக்கோடு குறிப்பிடத்தக்கதாக இருக்கும் என்று அவர்கள் வாதிடுவார்கள். மற்ற விமர்சகர்கள் இது ஒரு சுழிய முடிவு என்பதை ஒப்புக்கொள்வார்கள், ஆனால் சில சுழிய முடிவுகள் * வெளியிடக்கூடியவை என்றாலும், உங்களுடையது இல்லை என்று கூறுவார்கள். ஒன்று அல்லது இரண்டு விமர்சகர்கள் உங்கள் பக்கத்தில் கூட இருக்கலாம், ஆனால் அதைப் பெறுவதற்கு நீங்கள் ஒரு மேல்நோக்கி போராடுவீர்கள்.

  • சரி, விருப்ப எண் 2 பற்றி சிந்திக்கலாம். அதை ஒரு எல்லைக்கோடு குறிப்பிடத்தக்க முடிவாக வெளியிட முயற்சிக்கிறீர்கள் என்று வைத்துக்கொள்வோம். சில விமர்சகர்கள் இது ஒரு சுழிய முடிவு என்றும் வெளியிடப்படக்கூடாது என்றும் கூறுவார்கள். மற்றவர்கள் சான்றுகள் தெளிவற்றவை என்றும், தெளிவான குறிப்பிடத்தக்க முடிவைப் பெறும் வரை நீங்கள் கூடுதல் தரவை சேகரிக்க வேண்டும் என்றும் கூறுவார்கள். மீண்டும், வெளியீட்டு செயல்முறை உங்களுக்கு சாதகமாக இல்லை.

  • Given the difficulties in publishing an “ambiguous” result like p = 0.072, option number 3 might seem tempting: give up and do something else. But that’s a recipe for career suicide. If you give up and try a new project every time you find yourself faced with ambiguity, your work will never be published. And if you’re in academia without a publication record you can lose your job. So that option is out.

  • நீங்கள் விருப்பம் 4 உடன் சிக்கிக்கொண்டது போல் தெரிகிறது. உங்களிடம் உறுதியான முடிவுகள் இல்லை, எனவே இன்னும் சில தரவுகளை சேகரித்து பகுப்பாய்வை மீண்டும் இயக்க முடிவு செய்கிறீர்கள். விவேகமானதாகத் தோன்றுகிறது, ஆனால் துரதிர்ச்டவசமாக, நீங்கள் இதைச் செய்தால் உங்கள் பி *-மதிப்புகள் அனைத்தும் இப்போது தவறானவை. * அவற்றில் அனைத்தும். *இந்த *ஆய்வுக்காக நீங்கள் கணக்கிட்ட *p *-மதிப்புகள் மட்டுமல்ல. அவர்கள் அனைவரும். கடந்த காலங்களில் நீங்கள் கணக்கிட்ட அனைத்து *பி *மதிப்புகளும், எதிர்காலத்தில் நீங்கள் கணக்கிடும் அனைத்து *பி *மதிப்புகளும். அதிர்ச்டவசமாக, யாரும் கவனிக்க மாட்டார்கள். நீங்கள் வெளியிடப்படுவீர்கள், நீங்கள் பொய் சொன்னீர்கள்.

காத்திருங்கள், என்ன? அந்த கடைசி பகுதி எவ்வாறு உண்மையாக இருக்க முடியும்? அதாவது, இது ஒரு நியாயமான நியாயமான உத்தி போல் தெரிகிறது அல்லவா? நீங்கள் சில தரவைச் சேகரித்தீர்கள், முடிவுகள் முடிவானவை அல்ல, எனவே இப்போது நீங்கள் செய்ய விரும்புவது முடிவுகள் * முடிவான வரை கூடுதல் தரவை சேகரிக்க வேண்டும். அதில் என்ன தவறு?

நேர்மையாக, அதில் தவறில்லை. இது ஒரு நியாயமான, விவேகமான மற்றும் பகுத்தறிவுள்ள சேதி. நிச வாழ்க்கையில், ஒவ்வொரு ஆராய்ச்சியாளரும் இதுதான். துரதிர்ச்டவசமாக. எல்லா தரவுகளும் உள்ளன. சோதனை முடிந்துவிட்டதாக அது கருதுவதால், அது * இரண்டு * சாத்தியமான முடிவுகளை மட்டுமே கருதுகிறது. நீங்கள் வழக்கமான * ப * <0.05 வாசலைப் பயன்படுத்துகிறீர்கள் என்றால், அந்த முடிவுகள்:

விளைவு

செயல்

p less than 0.05

பூச்யத்தை நிராகரிக்கவும்

p greater than 0.05

பூச்யத்தைத் தக்க வைத்துக் கொள்ளுங்கள்

முடிவெடுக்கும் பிரச்சினையில் மூன்றாவது சாத்தியமான செயலைச் சேர்ப்பது * நீங்கள் * செய்கிறீர்கள். குறிப்பாக, நீங்கள் என்ன செய்கிறீர்கள் என்பது சோதனையைத் தொடர்வதை நியாயப்படுத்த ஒரு காரணியாக *p *-மதிப்பைப் பயன்படுத்துவதாகும். இதன் விளைவாக, முடிவெடுக்கும் நடைமுறையை நீங்கள் இதைப் போலவே மாற்றியுள்ளீர்கள்:

விளைவு

செயல்

p less than 0.05

பரிசோதனையை நிறுத்தி பூச்யத்தை நிராகரிக்கவும்

p between 0.05 and 0.1

பரிசோதனையைத் தொடரவும்

p greater than 0.1

பரிசோதனையை நிறுத்தி பூச்யத்தைத் தக்க வைத்துக் கொள்ளுங்கள்

சுழிய கருதுகோள் சோதனையின் “அடிப்படை” கோட்பாடு இந்த வகையான விசயங்களைக் கையாள கட்டமைக்கப்படவில்லை, அத்தியாயத்தில் நான் விவரித்த படிவத்தில் அல்ல: டாக்: ../ ch09/ch09_hypothesistesting. நிச வாழ்க்கையில் “கூடுதல் தரவை சேகரிக்க” தேர்வுசெய்யும் நபராக நீங்கள் இருந்தால், சுழிய கருதுகோள் சோதனையின் விதிகளுக்கு ஏற்ப நீங்கள் * முடிவுகளை எடுக்கவில்லை என்பதை இது குறிக்கிறது. கருதுகோள் சோதனையின் அதே முடிவுக்கு நீங்கள் வந்தாலும், நீங்கள் முடிவைக் குறிக்கும் முடிவை நீங்கள் பின்பற்றவில்லை *, மேலும் சிக்கலை ஏற்படுத்தும் செயல்முறையைப் பின்பற்றுவது இந்த தோல்வி (ஒரு தொடர்புடைய சிக்கல்). உங்கள் *பி *-மதிப்புகள் ஒரு பொய்.

இன்னும் மோசமானது, அவை ஆபத்தான வழியில் பொய், ஏனென்றால் அவை அனைத்தும் மிகச் சிறியவை *. இது எவ்வளவு மோசமாக இருக்கும் என்பதைப் புரிந்துகொள்ள, பின்வரும் (மோசமான) காட்சியைக் கவனியுங்கள். இறுக்கமான பட்செட்டில் நீங்கள் மிகவும் ஆர்வமுள்ள ஆராய்ச்சியாளர் என்று கற்பனை செய்து பாருங்கள், அவர் மேலே உள்ள எனது எச்சரிக்கைகளுக்கு கவனம் செலுத்தவில்லை. இரண்டு குழுக்களை ஒப்பிடும் ஒரு ஆய்வை நீங்கள் வடிவமைக்கிறீர்கள். * பி * <0.05 மட்டத்தில் ஒரு குறிப்பிடத்தக்க முடிவைக் காண நீங்கள் தீவிரமாக விரும்புகிறீர்கள், ஆனால் நீங்கள் செய்ய வேண்டியதை விட அதிகமான தரவை சேகரிக்க நீங்கள் உண்மையில் விரும்பவில்லை (ஏனெனில் இது விலை உயர்ந்தது). செலவுகளைக் குறைக்க நீங்கள் தரவைச் சேகரிக்கத் தொடங்குகிறீர்கள், ஆனால் ஒவ்வொரு முறையும் ஒரு புதிய அவதானிப்பு வரும்போது உங்கள் தரவுகளில் *t *-test ஐ இயக்குகிறீர்கள். *T *-tests *p *<0.05 என்று சொன்னால், நீங்கள் பரிசோதனையை நிறுத்திவிட்டு ஒரு குறிப்பிடத்தக்க முடிவைப் புகாரளிக்கிறீர்கள். இல்லையென்றால், நீங்கள் தரவைச் சேகரிக்கிறீர்கள். இந்த பரிசோதனைக்கு உங்கள் முன் வரையறுக்கப்பட்ட செலவு வரம்பை அடையும் வரை இதைச் செய்கிறீர்கள். வரம்பு * N * = 1000 அவதானிப்புகளில் உதைக்கிறது என்று சொல்லலாம். இது மாறிவிட்டால், விசயத்தின் உண்மை என்னவென்றால், உண்மையான விளைவைக் காணவில்லை: சுழிய கருதுகோள் உண்மை. எனவே, நீங்கள் அதை பரிசோதனையின் முடிவில் கொண்டு வருவதற்கான வாய்ப்பு என்ன, (சரியாக) எந்த விளைவும் இல்லை என்று முடிவுசெய்கிறது? ஒரு சிறந்த உலகில், இங்கே பதில் 95 %ஆக இருக்க வேண்டும். எல்லாவற்றிற்கும் மேலாக, * பி * <0.05 அளவுகோலின் முழு * புள்ளி * வகை I பிழை விகிதத்தை 5 % ஆகக் கட்டுப்படுத்துவதாகும், எனவே சுழிய கருதுகோளை பொய்யாக நிராகரிக்க 5 % வாய்ப்பு மட்டுமே உள்ளது என்று நாங்கள் நம்புகிறோம் இந்த சூழ்நிலையில். இருப்பினும், உண்மையாக இருக்கும் என்பதற்கு எந்த உத்தரவாதமும் இல்லை. நீங்கள் விதிகளை மீறுகிறீர்கள். நீங்கள் மீண்டும் மீண்டும் சோதனைகளை இயக்குவதால், நீங்கள் ஒரு குறிப்பிடத்தக்க முடிவைப் பெற்றிருக்கிறீர்களா என்பதைப் பார்க்க உங்கள் தரவுகளில் “எட்டிப் பார்க்கிறது”, எல்லா சவால்களும் முடக்கப்பட்டுள்ளன.

புதிய தரவு வரும்போது உங்கள் சோதனைகளை மீண்டும் இயக்குவதன் விளைவு

Fig. 200 புதிய தரவு வரும்போது உங்கள் சோதனைகளை மீண்டும் இயக்கினால் விசயங்கள் எவ்வளவு மோசமாக இருக்கும்? நீங்கள் அடிக்கடி நிகழும் என்றால், பதில் “மிகவும் தவறு”.

அது எவ்வளவு மோசமானது? பதில் திடமான கருப்பு கோட்டாகக் காட்டப்பட்டுள்ளது: NumRef: Fig-adpapt, மேலும் இது * வியக்கத்தக்க வகையில் * மோசமானது. ஒவ்வொரு அவதானிப்பிற்கும் பிறகு உங்கள் தரவைப் பார்த்தால், நீங்கள் ஒரு வகை I பிழையை உருவாக்க 49 % வாய்ப்பு உள்ளது. இது, உம், அது இருக்க வேண்டிய 5 % ஐ விட சற்று பெரியது. ஒப்பிடுவதன் மூலம், நீங்கள் பின்வரும் மூலோபாயத்தைப் பயன்படுத்தினீர்கள் என்று கற்பனை செய்து பாருங்கள். தரவைச் சேகரிக்கத் தொடங்குங்கள். ஒவ்வொரு முறையும் ஒரு அவதானிப்பு வரும், ஒரு: டாக்: CH16_BAYES_5 ஐ இயக்கவும், பேயச் காரணியைப் பாருங்கள். நான் கருதுகிறேன்: குறிப்பு: சான்சன் (2013) <சான்சன்_2013> சரி, மற்றும் 3: 1 இன் பேயச் காரணி 0.05 இன் *பி *-மதிப்புக்கு சமமானதாக நான் கருதுவேன். [#] _ இந்த நேரத்தில், எங்கள் தூண்டுதல் மகிழ்ச்சியான ஆராய்ச்சியாளர் பின்வரும் நடைமுறையைப் பயன்படுத்துகிறார். பேயச் காரணி பூச்யத்திற்கு ஆதரவாக 3: 1 அல்லது அதற்கு மேற்பட்டதாக இருந்தால், பரிசோதனையை நிறுத்தி பூச்யத்தைத் தக்க வைத்துக் கொள்ளுங்கள். மாற்றுக்கு ஆதரவாக இது 3: 1 அல்லது அதற்கு மேற்பட்டதாக இருந்தால், பரிசோதனையை நிறுத்தி பூச்யத்தை நிராகரிக்கவும். இல்லையெனில் சோதனையைத் தொடரவும். இப்போது, கடைசி நேரத்தைப் போலவே, சுழிய கருதுகோள் உண்மை என்று வைத்துக் கொள்வோம். என்ன நடக்கிறது? அது நிகழும்போது, இந்த காட்சிக்கான உருவகப்படுத்துதல்களையும் நான் இயக்கினேன், மேலும் முடிவுகள் கோடு வரியாக காட்டப்பட்டுள்ளன: NumRef: Fig-adpapt. ஆர்த்தடாக்ச் *டி *-டெச்டைப் பயன்படுத்துவதன் மூலம் நாம் பெறும் 49 % வீதத்தை விட வகை I பிழை விகிதம் மிகக் குறைவு என்று அது மாறிவிடும்.

சில வழிகளில், இது குறிப்பிடத்தக்கதாகும். ஆர்த்தடாக்ச் சுழிய கருதுகோள் சோதனையின் முழு * புள்ளி * வகை I பிழை வீதத்தைக் கட்டுப்படுத்துவதாகும். பேய்சியன் முறைகள் உண்மையில் இதைச் செய்ய வடிவமைக்கப்படவில்லை. ஆயினும்கூட, தரவு வரும்போது கருதுகோள் சோதனைகளை இயக்கும் “மகிழ்ச்சியான மகிழ்ச்சியான” ஆராய்ச்சியாளரை எதிர்கொள்ளும்போது, பேய்சியன் அணுகுமுறை மிகவும் பயனுள்ளதாக இருக்கும். 3: 1 தரநிலை கூட, பெரும்பாலான பேய்சியர்கள் ஏற்றுக்கொள்ள முடியாத நிலையில் கருதும், * p * <0.05 விதியை விட மிகவும் பாதுகாப்பானது.

இது உண்மையில் மோசமானதா?

முந்தைய பிரிவில் நான் கொடுத்த எடுத்துக்காட்டு ஒரு அழகான தீவிர சூழ்நிலை. நிச வாழ்க்கையில், ஒரு புதிய அவதானிப்பு வரும்போது மக்கள் ஒவ்வொரு முறையும் கருதுகோள் சோதனைகளை நடத்துவதில்லை. எனவே * p * <0.05 வாசல் “உண்மையில்” 49 % வகை I பிழை வீதத்திற்கு (அதாவது * p * = 0.49) ஒத்திருக்கிறது என்று சொல்வது நியாயமில்லை. ஆனால் உங்கள் *பி *-மதிப்புகள் நேர்மையாக இருக்க வேண்டும் என்று நீங்கள் விரும்பினால், நீங்கள் கருதுகோள் சோதனைகளைச் செய்வதற்கான முற்றிலும் மாறுபட்ட வழிக்கு மாற வேண்டும் அல்லது *எட்டிக் இல்லை *என்ற கடுமையான விதியை அமல்படுத்த வேண்டும். பரிசோதனையை எப்போது நிறுத்த வேண்டும் என்பதை தீர்மானிக்க தரவைப் பயன்படுத்த நீங்கள் * அனுமதிக்கப்படவில்லை. நீங்கள் ஒரு “எல்லைக்கோடு” *p *-value ஐப் பார்க்கவும், மேலும் தரவுகளை சேகரிக்க முடிவு செய்யவும் அனுமதிக்கப்படவில்லை. தரவைப் பார்த்த பிறகு உங்கள் தரவு பகுப்பாய்வு மூலோபாயத்தை மாற்ற கூட உங்களுக்கு இசைவு இல்லை. இந்த விதிகளை நீங்கள் கண்டிப்பாக பின்பற்ற வேண்டும், இல்லையெனில் நீங்கள் கணக்கிடும் *பி *மதிப்பீடுகள் முட்டாள்தனமாக இருக்கும்.

ஆம், இந்த விதிகள் வியக்கத்தக்க வகையில் கண்டிப்பானவை. சில ஆண்டுகளுக்கு முன்பு ஒரு வர்க்கப் பயிற்சியாக, இந்த சூழ்நிலையைப் பற்றி சிந்திக்கும்படி மாணவர்களிடம் கேட்டேன். * N * = 80 பேரைச் சேகரிக்கும் நோக்கத்துடன் உங்கள் ஆய்வை இயக்கத் தொடங்கினீர்கள் என்று வைத்துக்கொள்வோம். ஆய்வு தொடங்கும் போது நீங்கள் விதிகளைப் பின்பற்றுகிறீர்கள், தரவைப் பார்க்க மறுக்கிறார் அல்லது எந்த சோதனைகளையும் இயக்கவும். ஆனால் நீங்கள் * n * = 50 ஐ அடையும்போது உங்கள் விருப்பம் கொடுக்கிறது… மேலும் நீங்கள் ஒரு பார்வை எடுத்துக் கொள்ளுங்கள். என்ன நினைக்கிறேன்? உங்களுக்கு ஒரு குறிப்பிடத்தக்க முடிவு கிடைத்துள்ளது! இப்போது, நிச்சயமாக, நீங்கள் * n * = 80 இன் மாதிரி அளவிற்கு ஆய்வை இயக்குகிறீர்கள் என்று நீங்கள் சொன்னீர்கள் * என்று நீங்கள் அறிவீர்கள், ஆனால் அது இப்போது அர்த்தமற்றதாகத் தெரிகிறது, இல்லையா? * N * = 50 மாதிரி அளவுடன் இதன் விளைவாக குறிப்பிடத்தக்கதாகும், எனவே தரவைச் சேகரிப்பது வீணாகவும் திறமையற்றதாகவும் இருக்காது? நீங்கள் நிறுத்த ஆசைப்படவில்லையா? கொஞ்சம்? நீங்கள் செய்தால், உங்கள் வகை I பிழை விகிதம் * p * <0.05 இல் 8 %வரை பலூன் செய்யப்பட்டது என்பதை நினைவில் கொள்ளுங்கள். உங்கள் காகிதத்தில் * p * <0.05 ஐப் புகாரளிக்கும்போது, நீங்கள் * உண்மையில் * சொல்வது * p * <0.08. “ஒரு பார்வை” இன் விளைவுகள் எவ்வளவு மோசமாக இருக்கும்.

இப்போது இதைக் கவனியுங்கள். விஞ்ஞான இலக்கியம் *டி *-டெச்ட்கள், அனோவாச், பின்னடைவுகள் மற்றும் χ²-சோதனைகளால் நிரப்பப்பட்டுள்ளது. நான் இந்த புத்தகத்தை எழுதியபோது இந்த சோதனைகளை தன்னிச்சையாக எடுக்கவில்லை. இந்த நான்கு கருவிகளும் பெரும்பாலான அறிமுக புள்ளிவிவர நூல்களில் தோன்றுவதற்கான காரணம் என்னவென்றால், இவை அறிவியலின் ரொட்டி மற்றும் வெண்ணெய் கருவிகள். இந்த கருவிகள் எதுவும் “தரவு எட்டுதலை” சமாளிக்க ஒரு திருத்தம்: அவர்கள் அனைவரும் நீங்கள் அதைச் செய்யவில்லை என்று கருதுகின்றனர். ஆனால் அந்த அனுமானம் எவ்வளவு யதார்த்தமானது? நிச வாழ்க்கையில், சோதனை முடிவடைவதற்கு முன்னர் எத்தனை பேர் தங்கள் தரவைப் பார்த்தார்கள் என்று நினைக்கிறீர்கள், மேலும் தரவு எப்படி இருக்கிறது என்பதைப் பார்த்த பிறகு அவர்களின் அடுத்தடுத்த நடத்தையைத் தழுவிக்கொண்டது? மாதிரி செயல்முறை வெளிப்புறக் கட்டுப்பாட்டால் நிர்ணயிக்கப்படும்போது தவிர, பதில் “பெரும்பாலான மக்கள் அதைச் செய்திருக்கிறார்கள்” என்று நான் நினைக்கிறேன். அது நடந்திருந்தால், அறிவிக்கப்பட்ட *பி *-மதிப்புகள் தவறு என்று நீங்கள் ஊகிக்கலாம். இன்னும் மோசமான சேதி என்னவென்றால், அவர்கள் உண்மையில் என்ன முடிவு செயல்முறை பின்பற்றினார்கள் என்பது எங்களுக்குத் தெரியாது என்பதால், *பி *-மதிப்புகள் *என்னவாக இருக்க வேண்டும் என்பதை அறிய எங்களுக்கு வழி இல்லை. ஆராய்ச்சியாளர் பயன்படுத்திய முடிவெடுக்கும் நடைமுறை உங்களுக்குத் தெரியாதபோது *p *-value ஐ கணக்கிட முடியாது. எனவே அறிவிக்கப்பட்ட *p *-மதிப்பு ஒரு பொய்யாகவே உள்ளது.

மேலே உள்ள அனைத்தும் கொடுக்கப்பட்டால், வீட்டு செய்தி என்ன? பேய்சியன் முறைகள் முட்டாள்தனமானவை அல்ல. ஒரு ஆராய்ச்சியாளர் ஏமாற்றுவதில் உறுதியாக இருந்தால், அவர்கள் எப்போதும் அவ்வாறு செய்யலாம். பேயசின் விதி மக்களை பொய் சொல்வதைத் தடுக்க முடியாது, அல்லது ஒரு பரிசோதனையை மோசமாக்குவதைத் தடுக்க முடியாது. அது இங்கே எனது கருத்து அல்ல. பிரிவில் புத்தகத்தின் ஆரம்பத்திலேயே நான் செய்ததைப் போலவே எனது கருத்து: doc: ../ ch01/ch01_whystats_1: புள்ளிவிவர சோதனைகளை நாங்கள் இயக்குவதற்கான காரணம் நம்மிடமிருந்து நம்மைப் பாதுகாப்பதே. “தரவு எட்டுதலில்” இருப்பதற்கான காரணம், இது மிகவும் கவர்ச்சியூட்டுகிறது, *நேர்மையான ஆராய்ச்சியாளர்களுக்கு கூட *. புள்ளிவிவர அனுமானத்திற்கான ஒரு கோட்பாடு இதை ஒப்புக் கொள்ள வேண்டும். ஆமாம், நீங்கள் *பி *-மதிப்புகளை பாதுகாக்க முயற்சி செய்யலாம், அவற்றை சரியாகப் பயன்படுத்தாதது ஆராய்ச்சியாளரின் தவறு என்று கூறி, ஆனால் என் மனதில் புள்ளியைத் தவறவிட்டார். மனிதர்களைப் பற்றி முற்றிலும் அப்பாவியாக இருக்கும் புள்ளிவிவர அனுமானத்தின் கோட்பாடு, ஆராய்ச்சியாளர் தங்கள் சொந்த தரவைப் பார்க்கக்கூடிய வாய்ப்பைக் கூட இது கருத்தில் கொள்ளவில்லை * என்பது ஒரு கோட்பாடு அல்ல. சாராம்சத்தில், என் கருத்து இதுதான்:

நல்ல சட்டங்கள் அவற்றின் தோற்றம் மோசமான ஒழுக்கங்களில் உள்ளன.

அம்ப்ரோசியச் மேக்ரோபியச் <https://www.quotes.net/quote/20857> __

புள்ளிவிவர சோதனைக்கான நல்ல விதிகள் மனித பலவீனத்தை ஒப்புக் கொள்ள வேண்டும். நாம் யாரும் ஊழ்கம் இல்லாமல் இல்லை. நம்மில் யாரும் சோதனைக்கு அப்பாற்பட்டவர்கள் அல்ல. புள்ளிவிவர அனுமானத்திற்கான ஒரு நல்ல அமைப்பு உண்மையான மனிதர்களால் பயன்படுத்தப்படும்போது கூட செயல்பட வேண்டும். ஆர்த்தடாக்ச் சுழிய கருதுகோள் சோதனை இல்லை. [#] _