Section author: Danielle J. Navarro and David R. Foxcroft

ஒரு சோதனையின் பி மதிப்பு

ஒரு வகையில், எங்கள் கருதுகோள் சோதனை முடிந்தது. நாங்கள் ஒரு சோதனை புள்ளிவிவரத்தை உருவாக்கியுள்ளோம், சுழிய கருதுகோள் உண்மையாக இருந்தால் அதன் மாதிரி விநியோகத்தைக் கண்டுபிடித்தோம், பின்னர் சோதனைக்கு முக்கியமான பகுதியை உருவாக்கினோம். ஆயினும்கூட, எல்லாவற்றிலும் மிக முக்கியமான எண்ணிக்கையை நான் உண்மையில் தவிர்த்துவிட்டேன், ** பி-மதிப்பு **. இந்த தலைப்புக்கு தான் இப்போது நாம் திரும்புவோம். A *p *-value ஐ விளக்குவதற்கு சற்றே வித்தியாசமான வழிகள் உள்ளன, ஒன்று சர் ரொனால்ட் ஃபிசர் மற்றும் மற்றொன்று செர்சி நெய்மனால் முன்மொழியப்பட்டது. இரண்டு பதிப்புகளும் முறையானவை, இருப்பினும் அவை கருதுகோள் சோதனைகளைப் பற்றி சிந்திக்க மிகவும் மாறுபட்ட வழிகளை பிரதிபலிக்கின்றன. பெரும்பாலான அறிமுக பாடப்புத்தகங்கள் ஃபிசரின் பதிப்பை மட்டுமே கொடுக்க முனைகின்றன, ஆனால் இது கொஞ்சம் அவமானம் என்று நினைக்கிறேன். என் மனதில், நெய்மனின் பதிப்பு தூய்மையானது மற்றும் உண்மையில் சுழிய கருதுகோள் சோதனையின் தர்க்கத்தை சிறப்பாக பிரதிபலிக்கிறது. நீங்கள் உடன்படவில்லை, எனவே நான் இரண்டையும் சேர்த்துள்ளேன். நான் நெய்மனின் பதிப்பிலிருந்து தொடங்குவேன்.

முடிவெடுப்பதில் மென்மையான பார்வை

நான் விவரித்த கருதுகோள் சோதனை நடைமுறையில் ஒரு சிக்கல் என்னவென்றால், இது "மிகவும் குறிப்பிடத்தக்க" மற்றும் "மிகவும் முக்கியத்துவம் வாய்ந்தவை" என்று ஒரு முடிவுக்கு இடையில் எந்த வேறுபாட்டையும் ஏற்படுத்தாது. உதாரணமாக, எனது ஈஎச்பி ஆய்வில் நான் பெற்ற தரவு முக்கியமான பிராந்தியத்திற்குள் மட்டுமே விழுந்தது, எனவே நான் ஒரு குறிப்பிடத்தக்க விளைவைப் பெற்றேன், ஆனால் அது ஒரு அழகான சேதி. இதற்கு நேர்மாறாக, நான் ஒரு ஆய்வை நடத்துவேன் என்று வைத்துக்கொள்வோம், அதில் எனது * n * = 100 பங்கேற்பாளர்களுக்கு * ஃச் * = 97 பதில் சரியானது. இது வெளிப்படையாக குறிப்பிடத்தக்கதாக இருக்கும், ஆனால் மிகப் பெரிய வித்தியாசத்தில், இதைப் பற்றி உண்மையில் தெளிவற்ற தன்மை இல்லை. நான் ஏற்கனவே விவரித்த செயல்முறை இரண்டிற்கும் இடையே எந்த வேறுபாட்டையும் ஏற்படுத்தாது. எனது ஏற்றுக்கொள்ளக்கூடிய வகை I பிழை வீதமாக α = 0.05 ஐ அனுமதிக்கும் நிலையான மாநாட்டை நான் ஏற்றுக்கொண்டால், இவை இரண்டும் குறிப்பிடத்தக்க முடிவுகள்.

இங்குதான் *பி *-மதிப்பு கைக்கு வருகிறது. இது எவ்வாறு செயல்படுகிறது என்பதைப் புரிந்து கொள்ள, ஒரே தரவுத் தொகுப்பில் நாங்கள் நிறைய கருதுகோள் சோதனைகளை நடத்தினோம் என்று வைத்துக்கொள்வோம், ஆனால் ஒவ்வொரு விசயத்திலும் of இன் வேறுபட்ட மதிப்புடன். எனது அசல் ஈஎச்பி தரவுகளுக்காக நாங்கள் அதைச் செய்யும்போது, நமக்கு கிடைக்கும் சேதி இதுபோன்றது:

Α இன் மதிப்பு	0.05	0.04	0.03	0.02	0.01
பூச்யத்தை நிராகரிக்கவா?	ஆம்	ஆம்	ஆம்	இல்லை	இல்லை

0.03 மற்றும் அதற்கு மேற்பட்ட α நிலைகளைப் பயன்படுத்தி, ESP தரவை (* X* = 62 வெற்றிகள்* n* = 100 அவதானிப்புகள்) சோதிக்கும்போது, பூச்ய கருதுகோளை நிராகரிப்பதை நாங்கள் எப்போதும் காணலாம். 0.02 மற்றும் அதற்குக் கீழே α நிலைகளுக்கு நாம் எப்போதும் சுழிய கருதுகோளைத் தக்கவைத்துக்கொள்வோம். ஆகையால், 0.02 மற்றும் 0.03 க்கு இடையில் எங்காவது α இன் மிகச்சிறிய மதிப்பு இருக்க வேண்டும், இது இந்த தரவுகளுக்கான சுழிய கருதுகோளை நிராகரிக்க அனுமதிக்கும். இது *பி *-மதிப்பு. ஈஎச்பி தரவு * பி * = 0.021 ஐக் கொண்டுள்ளது. சுருக்கமாக,

p is defined to be the smallest Type I error rate (α) that you have to be willing to tolerate if you want to reject the null hypothesis.

நீங்கள் சகிக்கமுடியாததாகக் காணும் பிழை விகிதத்தை * p * விவரிக்கிறது என்று மாறிவிட்டால், நீங்கள் பூச்யத்தைத் தக்க வைத்துக் கொள்ள வேண்டும். *P *க்கு சமமான பிழை விகிதத்துடன் நீங்கள் வசதியாக இருந்தால், நீங்கள் விரும்பும் மாற்றீட்டிற்கு ஆதரவாக சுழிய கருதுகோளை நிராகரிப்பது சரி.

இதன் விளைவாக, * பி * என்பது நீங்கள் இயக்கக்கூடிய அனைத்து கருதுகோள் சோதனைகளின் சுருக்கமாகும், இது சாத்தியமான அனைத்து α மதிப்புகளிலும் எடுக்கப்பட்டது. இதன் விளைவாக இது எங்கள் முடிவு செயல்முறையை "மென்மையாக்குவதன்" விளைவைக் கொண்டுள்ளது. * P * ≤ frand நீங்கள் சுழிய கருதுகோளை நிராகரித்திருக்கும் அந்த சோதனைகளுக்கு, அந்த சோதனைகளுக்கு * p *> α நீங்கள் பூச்யத்தைத் தக்க வைத்துக் கொண்டிருப்பீர்கள். எனது ஈஎச்பி ஆய்வில் நான் * ஃச் * = 62 ஐப் பெற்றேன், இதன் விளைவாக நான் * p * = 0.021 உடன் முடிந்தது. எனவே நான் பொறுத்துக்கொள்ள வேண்டிய பிழை விகிதம் 2.1 %ஆகும். இதற்கு நேர்மாறாக, எனது சோதனை *x *= 97 ஐக் கொடுத்தது என்று வைத்துக்கொள்வோம். இப்போது எனது *p *-value க்கு என்ன நடக்கும்? இந்த நேரத்தில் அது * p * = 1.36 · 10 : sup: 25, இது ஒரு சிறிய, சிறிய [#] _ வகை I பிழை வீதமாகும். இந்த இரண்டாவது வழக்கில் நான் சுழிய கருதுகோளை அதிக நம்பிக்கையுடன் நிராகரிக்க முடியும், ஏனென்றால் நிராகரிப்பதற்கான எனது முடிவை நியாயப்படுத்த 10 டிரில்லியன் டிரில்லியன் டாலர்களில் 1 வகை I பிழை விகிதத்தை பொறுத்துக்கொள்ள நான் "தயாராக இருக்க வேண்டும்" .

தீவிர தரவின் நிகழ்தகவு

*பி *-மதிப்பின் இரண்டாவது வரையறை சர் ரொனால்ட் ஃபிசரிடமிருந்து வந்தது, உண்மையில் இது பெரும்பாலான அறிமுக புள்ளிவிவர பாடப்புத்தகங்களில் நீங்கள் காண முனைகிறீர்கள். முக்கியமான பகுதியை நான் கட்டியெழுப்பியபோது, அது மாதிரி விநியோகத்தின் * வால்கள் * (அதாவது தீவிர மதிப்புகள்) உடன் எவ்வாறு ஒத்திருக்கிறது என்பதைக் கவனியுங்கள்? இது ஒரு தற்செயல் நிகழ்வு அல்ல, கிட்டத்தட்ட எல்லா “நல்ல” சோதனைகளும் இந்த பண்பைக் கொண்டுள்ளன (எங்கள் வகை II பிழை வீதத்தைக் குறைக்கும் பொருளில் நல்லது, β). அதற்கான காரணம் என்னவென்றால், ஒரு நல்ல முக்கியமான பகுதி எப்போதுமே சோதனை புள்ளிவிவரத்தின் மதிப்புகளுடன் ஒத்திருக்கிறது, இது சுழிய கருதுகோள் உண்மையாக இருந்தால் குறைந்தது கவனிக்கப்பட வாய்ப்புள்ளது. இந்த விதி உண்மையாக இருந்தால், *p *-value ஐ ஒரு சோதனை புள்ளிவிவரத்தை நாம் கவனித்திருக்கும் நிகழ்தகவாக வரையறுக்கலாம், இது நாம் உண்மையில் பெற்றதைப் போலவே தீவிரமானது. வேறு வார்த்தைகளில் கூறுவதானால், சுழிய கருதுகோளின் படி தரவு மிகவும் நம்பமுடியாததாக இருந்தால், சுழிய கருதுகோள் தவறாக இருக்கலாம்.

ஒரு பொதுவான தவறு

சரி, எனவே *p *-value ஐ விளக்குவதற்கு இரண்டு வித்தியாசமான ஆனால் நியாயமான வழிகள் இருப்பதை நீங்கள் காணலாம், ஒன்று நெய்மனின் கருதுகோள் சோதனைக்கு அணுகுமுறையை அடிப்படையாகக் கொண்டது, மற்றொன்று ஃபிசரின் அடிப்படையில். துரதிர்ச்டவசமாக, மக்கள் சில நேரங்களில் கொடுக்கும் மூன்றாவது விளக்கம் உள்ளது, குறிப்பாக அவர்கள் முதலில் புள்ளிவிவரங்களைக் கற்றுக் கொள்ளும்போது, அது *முற்றிலும் மற்றும் முற்றிலும் தவறானது *. இந்த தவறான அணுகுமுறை *p *-value ஐ “பூச்ய கருதுகோள் உண்மை என்ற நிகழ்தகவு” என்று குறிப்பிடுவதாகும். இது சிந்திக்க ஒரு உள்ளுணர்வாக ஈர்க்கும் வழியாகும், ஆனால் இது இரண்டு முக்கிய விசயங்களில் தவறு. முதலாவதாக, சுழிய கருதுகோள் சோதனை என்பது அடிக்கடி நிகழும் கருவியாகும், மேலும் நிகழ்தகவுக்கான அடிக்கடி அணுகுமுறை * சுழிய கருதுகோளுக்கு நிகழ்தகவுகளை ஒதுக்க உங்களை அனுமதிக்காது. நிகழ்தகவு பற்றிய இந்த பார்வையின்படி, சுழிய கருதுகோள் உண்மை அல்லது அது இல்லை, அதற்கு உண்மையாக இருப்பதற்கு “5 % வாய்ப்பு” இருக்க முடியாது. இரண்டாவதாக, பேய்சியன் அணுகுமுறைக்குள் கூட, இது கருதுகோள்களுக்கு நிகழ்தகவுகளை ஒதுக்க அனுமதிக்கிறது, *p *-மதிப்பு சுழியம் உண்மை என்ற நிகழ்தகவுடன் ஒத்துப்போகாது. இந்த விளக்கம் *பி *-மதிப்பு எவ்வாறு கணக்கிடப்படுகிறது என்பதற்கான கணிதத்துடன் முற்றிலும் முரணானது. அப்பட்டமாகச் சொல்லுங்கள், இந்த வழியில் சிந்திக்க உள்ளுணர்வு முறையீடு இருந்தபோதிலும், ஒரு *p *-value ஐ இந்த வழியில் விளக்குவதற்கு எந்த நியாயமும் இல்லை. அதை ஒருபோதும் செய்ய வேண்டாம்.

ஒரு சோதனையின் *பி *மதிப்பு

முடிவெடுப்பதில் மென்மையான பார்வை

தீவிர தரவின் நிகழ்தகவு

ஒரு பொதுவான தவறு

ஒரு சோதனையின் பி மதிப்பு