Section author: Danielle J. Navarro and David R. Foxcroft
பெட்டி அடுக்கு
இச்டோகிராம்களுக்கு மற்றொரு மாற்று ** பெட்டி சூழ்ச்சி **, சில நேரங்களில் “பெட்டி மற்றும் விச்கர்ச்” சூழ்ச்சி என்று அழைக்கப்படுகிறது. இச்டோகிராம்களைப் போலவே அவை இடைவெளி அல்லது விகித அளவிலான தரவுகளுக்கு மிகவும் பொருத்தமானவை. ஒரு பெட்டி சதித்திட்டத்தின் பின்னால் உள்ள சிந்தனை, சராசரி, இடைநிலை வரம்பு மற்றும் தரவின் வரம்பின் எளிய காட்சி சித்தரிப்பு. அவர்கள் அவ்வாறு செய்வதால், மிகவும் கச்சிதமான வழியில் பெட்டி அடுக்குகள் மிகவும் பிரபலமான புள்ளிவிவர கிராஃபிக் ஆகிவிட்டன, குறிப்பாக தரவு பகுப்பாய்வின் ஆய்வு கட்டத்தில் நீங்கள் தரவை நீங்களே புரிந்து கொள்ள முயற்சிக்கும்போது. | Aflsmall_margins | _ தரவு எங்கள் எடுத்துக்காட்டு என அமைக்கப்பட்ட `` afl.margins`` மாறியைப் பயன்படுத்தி, அவை எவ்வாறு செயல்படுகின்றன என்பதைப் பார்ப்போம்.
Fig. 23 Box plot of the afl.margins variable from the aflsmall_margins data
set plotted in jamovi
ஒரு பெட்டி சூழ்ச்சி எப்படி இருக்கும் என்பதை விவரிக்க எளிதான வழி ஒன்றை வரைய வேண்டும். `` பெட்டி சதி` செக் பாக்சைக் சொடுக்கு செய்து, கீழ் வலதுபுறத்தில் காட்டப்பட்டுள்ள சதித்திட்டத்தை நீங்கள் பெறுவீர்கள்: NumRef: FIG-BOXPLOT1`. சாமோவி சாத்தியமான மிக அடிப்படையான பெட்டி சதித்திட்டத்தை வரைந்துள்ளார். இந்த சதித்திட்டத்தைப் பார்க்கும்போது, இதை நீங்கள் எவ்வாறு விளக்க வேண்டும்: பெட்டியின் நடுவில் உள்ள தடிமனான கோடு சராசரி; பெட்டியே 25 வது சதவிகிதம் முதல் 75 வது சதவிகிதம் வரை வரம்பைக் கொண்டுள்ளது; “விச்கர்ச்” ஒரு குறிப்பிட்ட எல்லைக்கு மேல் இல்லாத மிக தீவிரமான தரவு புள்ளிக்கு வெளியே செல்கிறது. இயல்பாக, இந்த மதிப்பு 1.5 மடங்கு இடைநிலை வரம்பாகும் (IQR), குறைந்த எல்லைக்கு* 25 வது விழுக்காடு - (1.5 * IQR)*, மற்றும்* 75 வது விழுக்காடு + (1.5 * iqr)* மேல் எல்லைக்கு கணக்கிடப்படுகிறது . இந்த வரம்பிற்கு வெளியே வரும் எந்தவொரு அவதானிப்பும் விச்கர்களால் மூடப்பட்டதற்கு பதிலாக ஒரு வட்டம் அல்லது புள்ளியாக திட்டமிடப்பட்டுள்ளது, மேலும் இது பொதுவாக ** வெளிநாட்டவர் ** என குறிப்பிடப்படுகிறது. `` Afl.margins`` மாறுபாட்டிற்கு இந்த வரம்பிற்கு வெளியே இரண்டு அவதானிப்புகள் உள்ளன, மேலும் இந்த அவதானிப்புகள் புள்ளிகளாக திட்டமிடப்பட்டுள்ளன (மேல் எல்லை 107, மற்றும் விரிதாளில் தரவு நெடுவரிசையைப் பார்த்தால் மதிப்புகள் அதிகமாக உள்ளன இதை விட, 108 மற்றும் 116, எனவே இவை புள்ளிகள்).
வயலின் அடுக்கு
பாரம்பரிய பெட்டி சதித்திட்டத்தின் மாறுபாடு வயலின் சூழ்ச்சி. வயலின் அடுக்குகள் பெட்டி அடுக்குகளுக்கு ஒத்தவை, தவிர அவை தரவின் கர்னல் நிகழ்தகவு அடர்த்தியை வெவ்வேறு மதிப்புகளில் காட்டுகின்றன. பொதுவாக, வயலின் அடுக்குகளில் தரவின் சராசரி ஒரு மார்க்கர் மற்றும் நிலையான பெட்டி அடுக்குகளைப் போலவே இடைநிலை வரம்பைக் குறிக்கும் பெட்டியும் அடங்கும். சாமோவியில் `` வயலின்`` மற்றும் `` பெட்டி சதி`` செக் பாக்ச் இரண்டையும் சரிபார்த்து இந்த வகையான செயல்பாட்டை நீங்கள் அடையலாம். காண்க: NumRef: Fig-foxplot2, இது சதித்திட்டத்தில் உண்மையான தரவு புள்ளிகளைக் காண்பிப்பதற்காக` தரவு` செக் பாக்ச் இயக்கப்பட்டது. இது வரைபடத்தை சற்று பிசியாக மாற்றும், ஆனால் என் கருத்து. தெளிவு எளிமை, எனவே நடைமுறையில் ஒரு எளிய பெட்டி சதித்திட்டத்தைப் பயன்படுத்துவது நல்லது.
Fig. 24 Violin plot of the afl.margins variable from the aflsmall_margins
file plotted in jamovi, alsow showing a box plot and data points
பல பெட்டி அடுக்குகளை வரைதல்
கடைசி சேதி. ஒரே நேரத்தில் பல பெட்டி அடுக்குகளை வரைய விரும்பினால் என்ன செய்வது? உதாரணமாக, 2010 ஆம் ஆண்டிற்கு மட்டுமல்ல, 1987 மற்றும் 2010 க்கு இடையில் ஒவ்வொரு ஆண்டும் ஏ.எஃப்.எல் விளிம்புகளைக் காட்டும் தனி பெட்டி அடுக்குகளை நான் விரும்பினேன் என்று வைத்துக்கொள்வோம். அதைச் செய்ய நாம் செய்ய வேண்டிய முதல் சேதி தரவைக் கண்டுபிடிப்பதாகும். இவை | aflmarginbyyear | _ தரவு தொகுப்பில் சேமிக்கப்படுகின்றன. எனவே அதை சாமோவியில் ஏற்றுவோம், அதில் என்ன இருக்கிறது என்று பார்ப்போம். இது ஒரு பெரிய பெரிய தரவு தொகுப்பு என்பதை நீங்கள் காண்பீர்கள். இதில் 4296 விளையாட்டுகள் மற்றும் நாங்கள் ஆர்வமுள்ள மாறிகள் உள்ளன. நாம் செய்ய விரும்புவது `` விளிம்பு`` மாறிக்கு சாமோவி டிரா பாக்ச் அடுக்குகளை வைத்திருக்கிறது, ஆனால் ஒவ்வொரு `` ஆண்டு`` க்கும் தனித்தனியாக திட்டமிடப்பட்டுள்ளது. இதைச் செய்வதற்கான வழி என்னவென்றால், `` ஆண்டு`` மாறியை `` பெட்டியால் பிளவுக்குள் நகர்த்துவதாகும், இதுபோன்று: numref: figure-splitfile1.
Fig. 25 `` பிளவு மூலம் `` பெட்டியைக் காட்டும் சாமோவி திரை காட்சி
இதன் விளைவாக இதில் காட்டப்பட்டுள்ளது: NumRef: fighpoxplot3. பெட்டி சதித்திட்டத்தின் இந்த பதிப்பு, ஆண்டுக்கு பிரிந்தது, இச்டோகிராம்களுக்கு பதிலாக பெட்டி அடுக்குகளைத் தேர்ந்தெடுப்பது ஏன் சில நேரங்களில் பயனுள்ளதாக இருக்கும் என்பதற்கான உணர்வைத் தருகிறது. அதிக விவரங்களுடன் அதிகமாக இல்லாமல், ஆண்டுதோறும் தரவு எப்படி இருக்கும் என்பதைப் பற்றிய நல்ல உணர்வைப் பெற முடியும். இந்த இடத்திற்கு 24 இச்டோகிராம்களை நான் செய்ய முயற்சித்திருந்தால் என்ன நடந்திருக்கும் என்று இப்போது கற்பனை செய்து பாருங்கள்: வாசகர் பயனுள்ள எதையும் கற்றுக்கொள்ளப் போவதில்லை என்பதற்கு வாய்ப்பு இல்லை.
Fig. 26 சாமோவியில் உருவாக்கப்பட்ட பல பெட்டி அடுக்குகள், `` விளிம்பு`` `` ஆண்டு` என்ற மாறிகள் | aflmarginbyyear | _ தரவு தொகுப்பு
வெளியீட்டாளர்களைக் கண்டறிய பெட்டி அடுக்குகளைப் பயன்படுத்துதல்
பெட்டி சூழ்ச்சி தானாகவே ஒரு குறிப்பிட்ட வரம்பிற்கு வெளியே இருக்கும் அவதானிப்புகளை பிரிக்கிறது, அவற்றை சாமோவியில் ஒரு புள்ளியுடன் சித்தரிக்கிறது, மக்கள் பெரும்பாலும் ** வெளியீட்டாளர்களைக் கண்டறிவதற்கான முறைசாரா முறையாக பயன்படுத்துகிறார்கள் **: மீதமுள்ளவற்றிலிருந்து “சந்தேகத்திற்கு இடமின்றி” அவதானிப்புகள் தரவு. இங்கே ஒரு எடுத்துக்காட்டு. `` Afl.margins`` மாறிக்கான பெட்டி சதித்திட்டத்தை நான் வரைந்திருக்கிறேன் என்று வைத்துக்கொள்வோம், அது போல் வந்தது: NumRef: Fig-foxplot4.
Fig. 27 மிகவும் சந்தேகத்திற்கிடமான இரண்டு வெளியீட்டாளர்களைக் காட்டும் `` afl.margins`` மாறியின் பெட்டி சூழ்ச்சி
இரண்டு அவதானிப்புகளுடன் வேடிக்கையான ஒன்று நடக்கிறது என்பது தெளிவாகத் தெரிகிறது. வெளிப்படையாக, இரண்டு ஆட்டங்கள் இருந்தன, அதில் விளிம்பு 300 புள்ளிகளுக்கு மேல் இருந்தது! அது எனக்கு சரியாகத் தெரியவில்லை. இப்போது நான் சந்தேகத்திற்குரியவனாகிவிட்டேன், தரவுகளை இன்னும் கொஞ்சம் நெருக்கமாகப் பார்க்க வேண்டிய நேரம் இது. சாமோவியில் இந்த அவதானிப்புகள் எது சந்தேகத்திற்குரியவை என்பதை நீங்கள் விரைவாகக் கண்டறியலாம், பின்னர் தரவு உள்ளீட்டில் தவறு ஏற்பட்டுள்ளதா என்பதைப் பார்க்க மூல தரவுகளுக்குச் செல்லலாம். இதைச் செய்ய நீங்கள் ஒரு வடிப்பானை அமைக்க வேண்டும், இதனால் ஒரு குறிப்பிட்ட வாசலில் மதிப்புகளைக் கொண்ட அந்த அவதானிப்புகள் மட்டுமே சேர்க்கப்படுகின்றன. எங்கள் எடுத்துக்காட்டில், வாசல் 300 க்கு மேல் உள்ளது, எனவே நாம் உருவாக்கும் வடிகட்டி இதுதான். முதலில், சாமோவி சாளரத்தின் மேற்புறத்தில் உள்ள `` வடிப்பான்கள்`` பொத்தானைக் சொடுக்கு செய்து, பின்னர் `` விளிம்பு> 300`` ஐ வடிகட்டி புலத்தில் தட்டச்சு செய்க: எண்ரீஃப்: FIG-FILTER1.
Fig. 28 சாமோவி வடிகட்டி திரை
இந்த வடிகட்டி விரிதாள் பார்வையில் ஒரு புதிய நெடுவரிசையை உருவாக்குகிறது, அங்கு வடிப்பானை கடந்து செல்லும் அவதானிப்புகள் மட்டுமே சேர்க்கப்பட்டுள்ளன. `` ஆய்வு` `` விளக்கங்கள்` சாளரத்தில்) ஒரு ஆய்வு →` விளக்கங்கள்` சாளரத்தில்) உருவாக்க சமோவிக்கு எந்த அவதானிப்புகள் என்பதை விரைவாக அடையாளம் காண ஒரு தூய்மையான வழி (இது கட்டாயம் பெயரளவு மாறி | பெயரளவு | இல்: எண்ரெஃப்: `FIG-FILTER2 விளிம்பு 300 க்கு மேல் இருந்த அவதானிப்புகளுக்கான ஐடி மதிப்புகள் ** 14 ** மற்றும் ** 134 ** என்பதை நீங்கள் காணலாம். இவை சந்தேகத்திற்கிடமான வழக்குகள் அல்லது அவதானிப்புகள், என்ன நடக்கிறது என்பதைக் கண்டுபிடிக்க நீங்கள் அசல் தரவு மூலத்திற்குச் செல்ல வேண்டும்.
Fig. 29 சந்தேகத்திற்கிடமான இரண்டு வெளியீட்டாளர்களுக்கான ஐடி எண்களைக் காட்டும் ஐடியுக்கான அதிர்வெண் அட்டவணை: 14 மற்றும் 134
வழக்கமாக யாராவது தவறான எண்ணில் தட்டச்சு செய்திருப்பதை நீங்கள் காணலாம். இது ஒரு வேடிக்கையான சான்று போல் தோன்றினாலும், இந்த வகையான சேதி உண்மையில் நிறைய நடக்கிறது என்பதை நான் வலியுறுத்த வேண்டும். உண்மையான உலக தரவுத் தொகுப்புகள் பெரும்பாலும் முட்டாள்தனமான பிழைகள் நிறைந்தவை, குறிப்பாக யாராவது ஒரு கட்டத்தில் கணினியில் எதையாவது தட்டச்சு செய்ய வேண்டியிருக்கும் போது. உண்மையில், தரவு பகுப்பாய்வின் இந்த கட்டத்திற்கு உண்மையில் ஒரு பெயர் உள்ளது, நடைமுறையில் அது நம் காலத்தின் ஒரு பெரிய பகுதியை எடுத்துக் கொள்ளலாம்: ** தரவு தூய்மை **. தட்டச்சு தவறுகளை (“எழுத்துப்பிழைகள்”) தேடுவது, தரவு காணாமல் போனது மற்றும் மூல தரவுக் கோப்புகளில் உள்ள அனைத்து வகையான பிற அருவருப்பான பிழைகளையும் இது உள்ளடக்குகிறது.
குறைவான தீவிர மதிப்புகளுக்கு, அவர்கள் ஒரு பெட்டி சதித்திட்டத்தில் கொடியிடப்பட்டிருந்தாலும், வெளிநாட்டவர்களைச் சேர்க்கலாமா அல்லது எந்தவொரு பகுப்பாய்விலும் அவற்றை விலக்குவதா என்ற முடிவு * ஏன் * தரவு அவர்கள் செய்யும் வழி மற்றும் நீங்கள் விரும்புவது என்று நீங்கள் நினைக்கிறீர்கள் *க்கு *தரவைப் பயன்படுத்தவும். நீங்கள் உண்மையில் இங்கே நல்ல தீர்ப்பைப் பயன்படுத்த வேண்டும். வெளிநாட்டவர் உங்களுக்கு முறையானதாகத் தெரிந்தால், அதை வைத்திருங்கள். எப்படியிருந்தாலும், நான் மீண்டும் தலைப்புக்குத் திரும்புவேன்: DOC: ../ CH12/CH12_REGRESSION_11.