सूचना: आईडीआरई सांख्यिकी परामर्श समूह वेबसाइट को वर्डप्रेस सीएमएस में फरवरी में माइग्रेट कर देगा ताकि नई सामग्री के रख-रखाव और सृजन की सुविधा मिल सके। हमारे कुछ पुराने पृष्ठों को हटा दिया जाएगा या संग्रहीत किया जाएगा ताकि वे अब बनाए रखा नहीं जा सकें। हम रीडायरेक्ट बनाए रखने का प्रयास करेंगे ताकि पुरानी यूआरएल हम जितनी अच्छी तरह काम कर सकें उतना काम जारी रहेगा। डिजिटल रिसर्च और एजुकेशन फॉर डिजिटल रिसर्च एंड एजुकेशन में आपका स्वागत है एक उपहार देने के लिए स्टेट कंसल्टिंग ग्रुप द्वारा सहायता करें। स्टेटा एफएक्यू मैं कैसे एक आंकड़ा पर वर्णनात्मक आंकड़े और पाँच नंबर सारांश प्राप्त कर सकता हूं Stata संक्षेप कमांड प्रदान करता है जो आपको माध्य और मानक विचलन देखने की अनुमति देता है। , लेकिन यह पांच संख्या सारांश (न्यूनतम, क्यू 25, माध्य, क्यू 75, अधिकतम) प्रदान नहीं करता है। आप विस्तार विकल्प का उपयोग कर सकते हैं, लेकिन फिर आपको प्रत्येक चर के लिए आउटपुट का पृष्ठ मिलता है। यदि आप मतलब, मानक विचलन, और एक पंक्ति पर पांच संख्या सारांश प्राप्त करना चाहते हैं, तो आप univar कमांड प्राप्त करना चाहते हैं। यूनिवर्स कमांड को जॉन आर। ग्लासन द्वारा लिखा गया था और वह स्टेटा तकनीकी बुलेटिन 51 में दिखाई देता है। आप खोजी यूनिवर्स टाइप करके स्टेटस के अंदर से डाउनलोड कर सकते हैं (देखें मैं प्रोग्राम को खोजने के लिए कैसे खोजित कमांड का उपयोग कर सकता हूं और अधिक जानकारी के लिए अतिरिक्त सहायता प्राप्त कर सकता हूं के बारे में findit का उपयोग कर) आइए हम उच्च स्तरीय और परे डेटा फ़ाइल का इस्तेमाल करते हुए यूनिवर्स कमांड का इस्तेमाल करने का उदाहरण दे सकते हैं जो हम अपने स्टेट क्लासेस में उपयोग करते हैं। यहाँ आपको सारांश से प्राप्त आउटपुट दिखाई देता है यहां उत्पादन है जिसे आप यूनिवर्स से प्राप्त कर सकते हैं। यदि आप vlabel विकल्प शामिल करते हैं, तो इसमें टेबल में मौजूद चर लेबल भी शामिल होते हैं। बॉक्सप्लॉट विकल्प प्रत्येक वेरिएबल से ऊपर एक मिनी बॉक्स प्लॉट दिखाता है यहाँ हम पुरुषों और महिलाओं के लिए अलग से टेबल प्रदर्शित करने के लिए (महिला) विकल्प का उपयोग करते हैं। हम एक हेडर के साथ तालिका प्राप्त करने के लिए (मादा) और एकहार्ड विकल्प का उपयोग कर सकते हैं जो पढ़ने में थोड़ा आसान हो सकता है। यहाँ हम चर लिखने के लिए एक बॉक्सप्लेट के लिए पूछते हैं और पूछते हैं कि बॉक्स प्लॉट्स को उसी पैमाने का उपयोग करके प्लान किया गया है (जो किकेरल के माध्यम से है) ताकि हम नर और मादाओं के बॉक्सप्लेट की तुलना कर सकें। आप देख सकते हैं कि महिला के लिए बॉक्स प्लॉट की औसत उच्च है। (यदि हम onescal ऑप्शन को छोड़े हैं, तो प्रत्येक बॉक्सप्लेट अपने पैमाने पर होगा)। अधिक जानकारी के लिए अधिक जानकारी के लिए, संक्षेप में सहायता या संदर्भ पुस्तिका देखें। इस वेब साइट की सामग्री को कैलिफोर्निया विश्वविद्यालय द्वारा किसी विशेष वेब साइट, किताब या सॉफ़्टवेयर उत्पाद के समर्थन के रूप में नहीं समझा जाना चाहिए। स्टैटा में समीक्षकों के आँकड़े एक बार आपके डेटासेट के विश्लेषण के लिए तैयार हो जाने के बाद 1 किसी भी अच्छा अनुभवजन्य प्रोजेक्ट का पहला चरण सारांश आंकड़े बनाने के लिए होना चाहिए। सारांश आंकड़े आपके डेटासेट का पता लगाने, पैटर्न ढूंढने और शायद ब्याज के आपके प्रश्न को परिशोधित करने का एक तरीका है। इस कार्यशाला में, आप बुनियादी आंकड़ों के आंकड़े, क्रॉस-टॅब्यूलेशन, और सारांश आँकड़ों की तेजी से समृद्ध तालिकाओं को बनाने के लिए स्टाटा का प्रयोग करना सीखेंगे। इस कार्यशाला को सिंटैक्स सिखाने के बजाय डिज़ाइन और कमानों पर क्लिक करने के लिए डिज़ाइन किया गया है। डू फाइल लिखने का मुख्य लाभ यह है कि आप विभिन्न परियोजनाओं पर हमेशा से कुछ का उपयोग कर सकते हैं, यदि आप स्टेटा को बिंदु के आधार पर उपयोग करते हैं और कमांड पर क्लिक करते हैं, तो आपको हर बार खरोंच से शुरू करने की निंदा की जाएगी। हम कनाडाई समुदाय स्वास्थ्य सर्वेक्षण (सीसीएचएस) से एक डाटासेट का उपयोग करेंगे। आप इसे फ़ोल्डर सम्मिलित पथ में पा सकते हैं, डेटासेट यू है: STAFFJLStatasummarystatsprojectsummstats. dta, सीसीएचएस से एक सबसेट मैंने बनाया और साफ किया (बाइनरी 0-1 बनाने के लिए याद किया)। आरंभ करने से पहले, प्रत्येक वेरिएबल 2 के विवरण को देखने दें: एक साधारण सारणी हमेशा आपके डेटा पर आपका पहला थैली होना चाहिए। टैबलेट कमांड स्टेटा व्यूअर में आवृत्ति और संचयी वितरण तालिका देता है। कहते हैं कि आप नमूने में प्रतिवादी के अनुपात को जानना चाहते हैं जो कभी भी फ्लू शॉट प्राप्त करता है: ध्यान दें कि आप अपने डेटासेट में उपसमूहों के लिए टैब्यूल्यूशन को देखने के लिए (या बायोस्ट) उपसर्ग से टैबलेट कमांड को जोड़ सकते हैं। उपसर्ग bysort एक संयोजन का संयोजन है और आप समान रूप से इसे दो आदेशों में तोड़ सकते हैं, लेकिन यह सामान्य रूप से सरल है कि बायस्टोर्ट स्टेटा पहले डेटा को सॉर्ट करे, फिर श्रेणी के आधार पर जानकारी वापस करे। उदाहरण के लिए, यहां देखें कि फ्लू शॉट्स के पैटर्न प्रत्येक प्रांत के लिए अलग दिखते हैं: यदि आप केवल एक उपसमूह में दिलचस्पी रखते हैं, तो आप टैग्लेट कमांड के साथ अगर क्वालीफायर का उपयोग कर सकते हैं। यहाँ, हम कहते हैं कि हम ओंटारियो के लिए नमूने में फ्लू शॉट्स की आवृत्ति जानना चाहते हैं: अंत में, आप स्पष्ट चर का उपयोग करते हुए साधारण क्रॉस-सारणीकरण करने के लिए टैबलेट कमांड का उपयोग कर सकते हैं। कहते हैं कि आप जानना चाहते हैं कि नमूने में कितनी महिलाओं ने अपने जीवन में 100 से ज्यादा सिगरेट पीए थे: एक बार जब आप अपने डेटा को सारणीबद्ध करते हैं, तो आप बारंबारता के अलावा सारांश आँकड़ों को देखना शुरू कर सकते हैं। कमांड रिटर्न का मतलब है, मानक विचलन, न्यूनतम, अधिकतम और आवृत्ति। उदाहरण उसी तरह बनाया गया है जिस तरह से सारणीकरण उदाहरण था। सबसे पहले हम पूरे नमूने के लिए सारांश आंकड़े देखते हैं, और फिर हम सबम्प्लेम्स (प्रत्येक प्रांत) के आंकड़ों को देखते हैं। यदि क्वालीफायर एक विशिष्ट उपसमूह के लिए सारांश आंकड़े देता है तो इसका उपयोग करना इन उदाहरणों में हमने प्रांत द्वारा नमूना को विभाजित करने पर ध्यान केंद्रित किया है, लेकिन किसी भी सामान्य चर का इस्तेमाल किया जा सकता है। बाद के उदाहरणों में, हम पुरुषों और महिलाओं, धूम्रपान करने वालों और गैर-धूम्रपान करने वालों, शारीरिक रूप से सक्रिय या नहीं देखेंगे। जिस तरह से आप अपने डेटा को देख पाते हैं, उस प्रकार के प्रश्नों पर निर्भर करता है, जिन्हें आप अपने प्रश्न को स्पष्ट करने के लिए पूछना चाहते हैं, और आपके विशिष्ट विश्लेषण का हो सकता है। कमांडों के इस संयोजन से आपको स्ताटा में सरल एक-रास्ता और दो-तरफ़ा सारांश आंकड़े तालिकाएं बना सकते हैं। कमांड (टैबलेट) का पहला भाग एक निश्चित वैरिएबल के अनुसार आपके डेटा को विभाजित करेगा (यहां हम सेक्स का उपयोग करेंगे)। दूसरा भाग एक अन्य चर के लिए सारांश आंकड़े देगा (अधिमानतः मात्रात्मक)। कहते हैं कि आप जानना चाहते हैं कि कैसे पुरुष और महिला अपने दैनिक उपभोग के फल और सब्जियों में भिन्न हैं: यह तालिका हमें नमूना में पुरुषों और महिलाओं के लिए फल, सब्जियों के दैनिक खपत का औसत, मानक विचलन और आवृत्ति देगा। : यदि आप जानना चाहते हैं कि विभिन्न प्रान्तों के पुरुषों और महिलाओं के फल और सब्जियों की उनकी औसत दैनिक खपत में अलग-अलग प्रकार के पैटर्न हैं, तो आप प्रांत द्वारा प्रांत को एक ही प्रश्न करने के लिए दोबारा आदेश का पुनः उपयोग कर सकते हैं: नोट करें कि आप अगर क्वालीफायर यहाँ (जैसा कि हमने टैबलेट में किया और कमांड्स को सारांशित किया), एक प्रांत केवल 3 को देखने के लिए आप एक त्वरित चार-तरफ़ सारांश आंकड़े तालिका बनाने के लिए टैबलेट का उपयोग भी कर सकते हैं, संक्षेप () कमांड कर सकते हैं। उदाहरण के लिए, यदि आप दैनिक और फल और सब्जियों की खपत को अलग-अलग धूम्रपान करने वाली महिलाओं के साथ देखना चाहते हैं, तो आप इसके लिए एक मेज बना सकते हैं: परिणाम एक निश्चित पैटर्न दिखता है: धूम्रपान करने वालों की तरह वे कम फल खाते हैं और गैर धूम्रपान करने वालों की तुलना में सब्जियां, और महिलाओं को पुरुषों के मुकाबले अधिक फल और सब्जियां खाती हैं, औसत 4 पर। टैबस्टैट कमांड एक सारणी में न्यूमेरिक वेरिएबल्स की श्रृंखला के लिए सारांश आंकड़े दिखाता है, संभवत: एक अन्य परिवर्तनीय (पर वातानुकूलित) बिना () विकल्प के बिना, टैबस्टैट को संक्षेप करने के लिए एक उपयोगी विकल्प है क्योंकि यह आपको प्रदर्शित होने वाले आंकड़ों की सूची निर्दिष्ट करने की अनुमति देता है। द्वारा () विकल्प के साथ, टैबस्टैट वर्जन के विभिन्न मूल्यों के लिए varlist के दोनों रिपोर्ट आँकड़ों में अपने सारांश () विकल्प के साथ प्रयोग किए गए टैबलेट के समान होता है टैबस्टैट कमांड, प्रस्तुत आंकड़ों के संदर्भ में और अधिक लचीलेपन की अनुमति देता है और तालिका का प्रारूप। पहली पंक्ति पूरे नमूने के लिए 4 चर (HWTGHTM HWTGWTK HWTGBMI PACFD) के लिए आंकड़े (माध्य, मानक विचलन और आवृत्ति) वापस करेगा। परिणाम विंडो इस प्रकार दिखती है: दूसरी पंक्ति स्ताता को ऐसा करने के लिए कहती है, लेकिन नर और मादा के बीच नमूना को विभाजित करने के लिए। इसका नतीजा है: ध्यान दें कि हम कुल कैसे प्राप्त करते हैं, इसलिए यदि आप विभाजित नमूने और कुल में रुचि रखते हैं, तो दोनों को अलग से करने की कोई ज़रूरत नहीं है। अंत में, कमांड की तीसरी पंक्ति, बायस्टोर्ट उपसर्ग के साथ, प्रत्येक प्रांत के बदले में ऐसा करती है, और प्रत्येक उप-नमूना को पुरुष और महिला में विभाजित करती है परिणाम एक ही प्रारूप में हैं, हालांकि यह पुरुष और महिला संयुक्त के लिए सबम (यानी प्रांतीय) कुल जोड़ता है, लेकिन सभी प्रांतों के लिए भव्य कुल नहीं: ध्यान दें कि आप उस आंकड़े लेते हैं जो तालिका में रिपोर्ट किए जाते हैं। उपलब्ध आंकड़े सहायता टैबस्टैट में सूचीबद्ध हैं: टेबल कमांड आंकड़ों के तालिकाओं की गणना और प्रदर्शित करता है। बस टैबस्टैट के रूप में, आप जिन आंकड़ों की रिपोर्ट कर सकते हैं, उन्हें चुन सकते हैं, लेकिन आप यह भी चुन सकते हैं कि आप कौन-सी वेरिएबल चाहते हैं, जो आंकड़े आपके लिए रिपोर्ट किए गए हैं, साथ ही आपके द्वारा कौन सी वेरिएबल्स को क्रॉस-टैब्लेट की जानकारी चाहिए सिंटैक्स की संरचना सरल है, लेकिन एक करीब से देखती है: यह पीएसीएफडी के साथ एक पंक्ति बना देगा, जबकि पंक्ति वैरिएबल (लेकिन केवल अगर पीएसीएफडी के लिए मान नहीं है .5), डीएचएचएसएक्स को सुपरराओ चर और प्रत्येक सेल की सामग्री मतलब, मानक विचलन और चर FVCDTOT की आवृत्ति: क्या हम बेहतर कर सकते हैं हाँ, हम कर सकते हैं अधिकतम चार चर को () में निर्दिष्ट किया जा सकता है, इसलिए तीन पंक्ति, कॉलम, और सुपर कॉलम वेरिएबल्स के साथ, सात-मार्ग तालिकाओं को प्रदर्शित किया जा सकता है। आज हम एक सात-मार्ग तालिका नहीं करेंगे, लेकिन सुपरा के साथ एक चार-तरफा तालिका (अगर पांच तरह की तालिका होगी): वाक्यविन्यास समान है, यह केवल और अधिक जटिल दिखता है। तालिका पंक्तिवार कोलवर सुपरकोवल अगर वजन में, options6 हमारे उदाहरण में, पंक्ति चर फिर पीएसीडीएफडी है, कॉलम चर एसएमके 01 बी है। हम अगर क्वालीफायर को अवलोकन के लिए प्रतिबंधित करने के लिए उपयोग कर रहे हैं जिसके लिए पंक्ति और स्तंभ चर के मूल्य या तो 0 या 1 हैं, तब कोशिकाओं की सामग्री का मतलब फिर से, मानक विचलन और चर FVCDTOT की आवृत्ति है, और हमें DHHSEX को एक सुपरराओ चर इस तालिका को पढ़ने का तरीका सरल है: एक महिला प्रतिवादी जो दैनिक गतिविधि से अधिक 15 मिनट में संलग्न नहीं करता है और कभी भी एक पूरी सिगरेट धूम्रपान नहीं करता है, वह औसत 5.1 फल और सब्जी की इकाइयों पर रोजाना खाता है। अब, अंतिम चरण में सुपरकोलम और सुपरराओ के साथ एक चार-तरफा तालिका का आधार है: तालिका पीएसीएफडी एसएमके 101 बी एफएलयू 160 अगर ((पीएसीएफडीडीएडी) amp (एसएमके 101 बी 0 एसएमके 01 बी 1) एम्प (एफएलयू 1600 एफएलयू 1601) एपी (एफयूसीडीटीओटी एसडी एफवीसीडीटीओटी एन एफवीसीडीटीओटी) द्वारा (डीएचएचएसएक्स) अब, आप खुद से पूछ सकते हैं, क्या मुझे सचमुच सब कुछ करने की ज़रूरत है कि सिर्फ सारांश आँकड़ों को देखने के लिए जवाब आपके परिष्कार स्तर, आपके शोध प्रश्न या आपके पर्यवेक्षक अनुसंधान एजेंडे के आधार पर भिन्न होगा, कुछ के लिए, सारणीबद्ध, सारांश और शायद सारणीबद्ध, सारांश () पर्याप्त से अधिक हो जाएगा दूसरों के लिए, टैबस्टेट और टेबल वास्तव में बहुत ही उपयोगी उपकरण हो सकते हैं। हम आपको डेटा के साथ खेलने के लिए प्रोत्साहित करते हैं, और अधिक औपचारिक सांख्यिकीय विश्लेषण करने से पहले अपने डेटासेट का अंतरंग ज्ञान प्राप्त करने के लिए प्रोत्साहित करते हैं। स्ताटा में सारांश आंकड़े बनाने पर पूरक रीडिंग के लिए कई अच्छे इंट्रैनेट स्रोत हैं। जब आप किसी खोज इंजन में कोई क्वेरी दर्ज करते हैं और आपको बहुत अधिक उपयोगकर्ता लिखित सलाह मिलती है, तो विशिष्ट रहें 1 ltodesigt से डेटा प्राप्त करने के बारे में गाइड देखें, स्टेटा 2 पर डेटा साफ करने के लिए आपको कमांड का वर्णन करने से पहले कुछ प्रशासनिक आदेश देखेंगे (यहां डेस को छोटा किया गया है) 3 वाक्यविन्यास बस होगा: टैब डीएचएचएसईएक्स अगर जीओओजीपीआरवी 35, योग (एफवीसीडीटीओटी) 4 हम नहीं कर सकते इसका अर्थ देखने से निष्कर्ष निकालना हमें यह जांचना होगा कि इन साधनों में से कोई भी अन्य की तुलना में सांख्यिकीय रूप से अलग है या नहीं। हालांकि, इन सारांश आंकड़ों को देखते हुए आंकड़ों में एक अच्छी शुरूआत की जांच पैटर्न है। 5 इस डेटासेट में d एक गायब डेटा कोड है 6 इस आदेश की सुविधाओं की एक विस्तृत प्रस्तुति के लिए स्ताता के आदेश विंडो में मदद तालिका टाइप करें
No comments:
Post a Comment