Wednesday 14 March 2018

का प्रयोग - अध्यारोपित - डेटा - इन - stata - विदेशी मुद्रा


स्टेटा में एकाधिक इम्प्रेशन: इम्प्रूविंग यह स्टेटा सीरीज़ में एकाधिक इम्पाउंटेशन का हिस्सा है। इस श्रृंखला में शामिल विषयों की सूची के लिए, परिचय देखें। यह खंड आपसे अभियोग प्रक्रिया के विवरण के माध्यम से बात करेगा। सुनिश्चित करें कि आपने कम से कम पिछले अनुभाग पढ़ा है, इम्पाउंटेशन मॉडल बनाना। इसलिए आपको यह पता चल गया है कि आपके परिणामों की वैधता पर क्या प्रभाव पड़ सकता है। उदाहरण डेटा प्रक्रिया को वर्णन करने के लिए, अच्छी तरह से एक गढ़े डेटा सेट का उपयोग करें। उदाहरण अनुभाग में उन लोगों के विपरीत, यह डेटा सेट वास्तविक दुनिया डेटा के लिए कुछ समानता बनाने के लिए डिज़ाइन किया गया है। महिला (बाइनरी) दौड़ (स्पष्ट, तीन मान) शहरी (बाइनरी) एडु (निर्णायक, चार मानों का आदेश दिया गया है) एक्सप (निरंतर) मजदूरी (निरंतर) लापता मादाओं को छोड़कर सभी चर के प्रत्येक मूल्य यादृच्छिक रूप से पूरी तरह से गायब होने का 10 मौका है, लेकिन वास्तविक दुनिया में हम यह नहीं जानते कि यह समय से पहले एमसीएआर है। इस प्रकार हम जांच लेंगे कि क्या यह एमएसीएआर या एमएआर (एमएएनआर को देखे गए आंकड़ों को देखकर जांच नहीं की जा सकती है) का उपयोग करके निर्णय लेने में निर्णय लिया गया है: यूनब संख्या: संयुक्त संदेश: शहरी मजदूरी गलत अनुमानित राशि, जनरल (याद) स्थानीय मिस्वार्स लोकल कॉवर: लिस्ट न्यूवर्स - वर्गाई न्यूलाइन (3) कोवर्सक्वाट लॉगेट पर वर्गास की अनुपस्थिति को याद करते हैं मिस्वावर कॉवर स्थानीय कोवर्स के अग्रेच नवर नई लाइन (3) कोर्वर के निवेर के द्वारा विभिन्न प्रकार के एनवर के लापता द्वारा प्रदर्शित करते हैं, लॉग (देखें) परिणाम के लिए फाइल हमारा लक्ष्य सेक्स, नस्ल, शिक्षा स्तर और अनुभव पर मजदूरी वापस करना है। उद्धृत उत्तरों को देखने के लिए, ऐसा फ़ाइल खोलें, जो डेटा सेट बनाता है और सामान्य आदेश की जांच करता है जो मजदूरी को परिभाषित करता है। अभिकर्ता प्रक्रिया के लिए पूरा कोड निम्नलिखित में पाया जा सकता है फ़ाइल: अभद्र प्रक्रिया कई आउटपुट बनाती है। अच्छी तरह से इस पृष्ठ पर प्रकाश डाला गया, हालांकि, संबंधित ग्राफ़ सहित एक पूर्ण लॉग फ़ाइल यहां पाई जा सकती है: इस आलेख के प्रत्येक अनुभाग में लॉग के संबंधित अनुभाग के लिंक होंगे। इस पृष्ठ पर वापस लौटने के लिए अपने ब्राउज़र में उद्धृत करें क्लिक करें सेट अप मील के आदेशों का उपयोग करने में पहला कदम है कि आपके डेटा का मील सेट हो। यह कुछ हद तक svyset के समान है tsset। या xtset मील सेट कमांड स्ताता को बताता है कि इसे आपके द्वारा बनाए गए अतिरिक्त आरोपण को कैसे स्टोर करना चाहिए। हम विस्तृत प्रारूप का उपयोग करने का सुझाव देते हैं, क्योंकि यह थोड़ा तेज है दूसरी ओर, mlong थोड़ा कम स्मृति का उपयोग करता है स्टेटा को विस्तृत डेटा संरचना का उपयोग करने के लिए टाइप करें: स्टेटा को मॉल (सीमांत लंबी) डेटा संरचना का उपयोग करने के लिए टाइप करें: व्यापक बनाम लंबी शब्दावली को नयी आकृति से उधार लिया गया है और संरचना समान हैं। हालांकि, वे बराबर नहीं हैं और आप मील द्वारा उपयोग किए गए डेटा संरचना को बदलने के लिए कभी भी नयी आकृति प्रदान नहीं करेंगे इसके बजाय, टाइप मील कन्वर्ट व्यापक या मील कन्वर्ट mlong (जोड़ें, स्पष्ट अगर डेटा पिछले परिवर्तन के बाद से नहीं सहेजा गया है)। ज्यादातर समय आपको इस बारे में चिंता करने की ज़रूरत नहीं है कि आरोपी कैसे जमा हो जाती है: मील कमांड अपने आप को ये समझ लेती है कि आप प्रत्येक अभियोग के लिए जो भी करते हैं उसे लागू करने के लिए। लेकिन अगर आपको डेटा को किसी तरह से ढेर करने की आवश्यकता है जो आपके लिए नहीं है, तो आपको उस संरचना के विवरण के बारे में जानने की आवश्यकता होगी जो आपने इस्तेमाल कर रहे हैं। आपको बहुत सावधान रहना होगा, बहुत सावधान होना चाहिए। यदि आप ऐसी चीजों में दिलचस्पी रखते हैं (शायद ही कभी इस्तेमाल किए गए फ्लॉन्ग और फ़्लॉन्सेप स्वरूपों सहित), इसे करें फ़ाइल चलाते हैं और डेटा ब्राउज़र की जांच करते समय यह उन टिप्पणियों को पढ़ता है, जो यह देखने के लिए कि डेटा प्रत्येक प्रपत्र में कैसा दिखता है। वेरिएबल्स को पंजीकृत करना मील के तीन प्रकार के चर को पहचानते हैं: इम्पास्पटेड वेरिएबल्स वेरिएबल्स हैं जो मील को छेड़ने या आरोपित करना है। नियमित वेरिएबल वेरिएबल्स होते हैं जो मील पसंद नहीं कर रहे हैं, या तो पसंद द्वारा या क्योंकि वे किसी भी मान नहीं खो रहे हैं। निष्क्रिय वेरिएबल्स वेरिएबल्स हैं जो कि अन्य चर द्वारा पूरी तरह से निर्धारित हैं। उदाहरण के लिए, मजदूरी से मजदूरी के अनुसार मजदूरी निर्धारित की जाती है, या मोटापे के लिए एक संकेतक वजन और ऊंचाई के एक फ़ंक्शन द्वारा निर्धारित किया जा सकता है। इंटरैक्शन शर्तें भी निष्क्रिय वैरिएबल हैं, यद्यपि यदि आप स्टैटस इंटरेक्शन सिंटैक्स का उपयोग करते हैं तो आपको उन्हें ऐसे ही घोषित करना होगा निष्क्रिय चर अक्सर परिवर्तनों पर समस्याजनक 8212 उदाहरण हैं। गैर linearity। और इंटरैक्शन से पता चलता है कि उनसे अनुचित तरीके से पक्षपातपूर्ण अनुमानों का नेतृत्व कैसे किया जा सकता है। यदि निष्क्रिय वैरिएबल को नियमित चर के आधार पर निर्धारित किया जाता है, तो किसी भी प्रकार की अभद्रता की आवश्यकता नहीं है, इसलिए इसे नियमित रूप से चर के रूप में माना जा सकता है। निष्क्रिय वेरिएबल्स को केवल तभी इलाज किया जाना चाहिए जैसे वे आरोपित चर पर निर्भर करते हैं। एक चर को दर्ज करने के बारे में बताता है कि यह किस तरह का चर है Impeded चर हमेशा पंजीकृत होना चाहिए: मील दर्ज imputed varlist जहां varlist आरोपित की वास्तविक सूची द्वारा प्रतिस्थापित किया जाना चाहिए। नियमित रूप से चर अक्सर पंजीकृत नहीं होते हैं, लेकिन इसका एक अच्छा विचार है: नियमित रूप से पंजीकृत varlist डायरेक्ट वैरिएबल पंजीकृत होना चाहिए: मील पंजीकृत निष्क्रिय वैललिस्ट हालांकि, निष्क्रिय वैरिएबल्स अधिक बार दोष लगाने के बाद बनाए जाते हैं। मील निष्क्रिय के साथ ऐसा करें और वे स्वचालित रूप से निष्क्रिय रूप से पंजीकृत हो जाएंगे हमारे उदाहरण डेटा में, महिला को छोड़कर सभी चर आरोपित किए जाने की आवश्यकता है। उपयुक्त मील रजिस्टर कमांड है: माइन रजिस्टर अभिमानित रेस-मजदूरी (नोट करें कि आप अपने varlist के रूप में उपयोग नहीं कर सकते हैं, भले ही आपको अपने सभी चर पर दबाव डालना पड़ सकता है, क्योंकि इसमें प्रतिलिपि संरचना का ट्रैक रखने के लिए मील द्वारा जोड़ा गया सिस्टम चर शामिल होगा नियमित रूप से महिला को पंजीकरण करना वैकल्पिक है, लेकिन एक अच्छा विचार है: नियमित रूप से महिला का पंजीकरण करना विसंगति मॉडल की जांच करना चर के प्रकारों के आधार पर, स्पष्ट अभिप्राय के तरीके हैं: दौड़ (स्पष्ट, तीन मान): शहरी (बाइनरी) शहरी (शहरी): लॉगिट एडु (निर्णायक, चार मानों का आदेश दिया गया है): ओगलिट एक्सप (निरंतर): पुनर्गठन वेतन (निरंतर): महिला को प्रतिरोपित करने की आवश्यकता नहीं होती है, लेकिन उन्हें दोष के मॉडल में शामिल किया जाना चाहिए क्योंकि यह विश्लेषण मॉडल में है और इसका कारण प्रासंगिक होने की संभावना अभिक्रिया करने से पहले हम प्रत्येक आरोपी मॉडल को जांचेंगे। हमेशा अपने प्रत्येक आरोपित मॉडल को व्यक्तिगत रूप से चलाने के लिए, यह देखने के लिए कि क्या वे एकजुट हो जाते हैं और (इन्हें संभव हो सकता है) यह सत्यापित करें कि वे सही तरीके से निर्दिष्ट हैं इन मॉडलों में से प्रत्येक को चलाने के लिए कोड है: मैलगिट दौड़ i. urban exp वेतन i. edu i. female लॉगिन शहरी i. race exp वेतन i. edu i. female ologit edu i. urban i. race exp वेतन वेतन i. f महिला रिसा i. urban i. race मजदूरी i. edu if महिला रिग्तेस मजदूरी i. urban i. race exp i. edu i. female ध्यान दें कि जब स्पष्ट चर (आदेश दिया गया या नहीं) कोचर के रूप में दिखाई देता है I उन्हें सूचक चर के सेट में फैलता है बाद में अच्छी तरह से देखें, मील बांधने की जंजीर कमांड के आउटपुट में उस व्यक्तिगत मॉडल के आदेश शामिल हैं जो इसे चलाता है। इस प्रकार एक उपयोगी शॉर्टकट, खासकर यदि आपके पास बहुत से चर का आरोप लगाया गया है, तो अपनी मील की जंजीर कमांड को सूअररुन विकल्प के साथ सेट करने के लिए इसे किसी भी वास्तविक छल करने से रोकें, इसे चलाएं, और फिर आउटपुट से कमांड की प्रतिलिपि बनाएं। अपने परीक्षण के लिए फ़ाइल करते हैं अभिसरण समस्याएं ध्यान देने वाली पहली बात यह है कि इन सभी मॉडलों को सफलतापूर्वक चलाया जाता है। कॉमप्लेक्स मॉडल जैसे मोब्लिसिट यदि आपके पास बड़ी संख्या में स्पष्ट वैरिएबल हैं, तो यह एकजुट करने में विफल हो सकता है, क्योंकि अक्सर छोटे सेल आकार होते हैं। समस्या के कारणों को नीचे पिन करने के लिए, अधिकांश चर को हटा दें, सुनिश्चित करें कि मॉडल जो छोड़ दिया गया है, साथ काम करता है, और फिर वे एक समय में एक या छोटे समूहों में वापस जोड़ते हैं, जब तक कि यह कार्य करने से रोकता है। कुछ प्रयोग के साथ आप समस्या चर या चर के संयोजन की पहचान करने में सक्षम होना चाहिए। उस बिंदु पर आपको यह तय करना होगा कि क्या आप श्रेणियों को जोड़ सकते हैं या चर को छोड़ सकते हैं या एक व्यावहारिक मॉडल बनाने के लिए अन्य परिवर्तन कर सकते हैं। प्रीफेक्ट भविष्यवाणी सही भविष्यवाणी नोट करने के लिए एक अन्य समस्या है। अभिप्राय प्रक्रिया पूरी तरह से भविष्यवाणी की गई टिप्पणियों को जिस तरह से लॉग इन कर सकते हैं ड्रॉप नहीं कर सकता। आप उन्हें गिरने से पहले छोड़ सकते हैं, लेकिन ऐसा लगता है कि कई अभियोगों के उद्देश्य को हराने के लिए। वैकल्पिक तरीकों को बढ़ने (या सिर्फ एग) विकल्प जोड़ने के लिए है यह क्वाटूगेंटेड रेग्रेन्चक्वाट दृष्टिकोण का इस्तेमाल करने के लिए मैनेजमेंट को श्रृंखलित करता है, जो नकली अवलोकनों को बहुत कम भार के साथ इस तरह से कहते हैं कि उनका परिणाम पर एक नगण्य प्रभाव होता है, लेकिन सही भविष्यवाणी को रोका जा सकता है। विवरण के लिए अनुभाग को देखें STATA एमआई दस्तावेजों में स्पष्ट डेटाकोट के आरोप के दौरान सही भविष्यवाणी का मुद्दा। मिस्सीपसिफिकेशन की जांच करना आपको यह भी मूल्यांकन करने का प्रयास करना चाहिए कि क्या मॉडल सही ढंग से निर्दिष्ट हैं या नहीं। यह निर्धारित करने के तरीके की एक पूर्ण चर्चा है कि क्या एक प्रतिगमन मॉडल ठीक से निर्दिष्ट है या नहीं इस आलेख के दायरे से परे है, लेकिन जो उपयुक्त उपकरण आपको मिलते हैं उसका उपयोग करें यहां कुछ उदाहरण दिए गए हैं: अवशिष्ट बनाम फिट वैल्यू प्लॉट्स निरंतर चर के लिए, अवशिष्ट बनाम फिट वैल्यू प्लॉट (आसानी से आरवीएफप्लोट के साथ किया जाता है) उपयोगी हो सकता है 8212 कई उदाहरण उन समस्याओं का पता लगाने के लिए उपयोग करते हैं। अनुभव के लिए भूखंड पर विचार करें: पुनर्गठन की अवधि i. urban i. race wage i. edu i. female rvfplot ध्यान दें कि कैसे कई बिंदुएं निचले बाएं में एक रेखा के साथ संकुचित हो जाती हैं, और कोई अंक नीचे नहीं हैं: यह बाधा को दर्शाता है कि अनुभव शून्य से कम नहीं हो सकता, जिसका मतलब है कि फिट मान हमेशा अवशिष्टों के बराबर या उसके बराबर होना चाहिए, या वैकल्पिक रूप से स्थिर अवयवों को उचित मूल्यों के नकारात्मक से अधिक या उसके बराबर होना चाहिए। (यदि ग्राफ़ दोनों अक्षों पर समान पैमाने पर था, तो बाधा रेखा 45 डिग्री लाइन होगी।) यदि सभी बिंदु ऊपर की तुलना में समान पंक्ति से नीचे होते हैं, तो यह आपको बताएगा कि चर पर ऊपरी बाध्य है कम बाउंड की बजाय बाधा रेखा के y - अवरोधन आपको किसी भी मामले में सीमा बताता है। आप दोनों के निचले बाउंड और ऊपरी बाउंड भी कर सकते हैं, उन दोनों के बीच एक बैंड में सभी बिंदुओं को लगा सकते हैं। आलोचनात्मक मॉडल, रिग्रेस अनुभव के लिए अनुचित है क्योंकि यह इस बाधा को लागू नहीं करेगा। उसी कारण से मजदूरी के लिए यह भी अनुचित है वैकल्पिक में ट्रन्क्रिग, एल (0) और पीएमएम (अच्छी तरह से pmm का उपयोग) शामिल हैं। इंटरैक्शन जोड़ना इस उदाहरण में, ऐसा लगता है कि चर के बीच संबंध वंश, लिंग और शहरी समूहों के बीच भिन्न हो सकते हैं। इस प्रकार, मिसाल-परिभाषा की जांच करने का एक तरीका मॉडल को इंटरैक्शन शर्तों को जोड़ना है और यह देखना है कि क्या वे महत्वपूर्ण हो जाते हैं या नहीं। उदाहरण के लिए, स्पष्ट मॉडल की तुलना अच्छी तरह से करें: पुनर्गठन की अवधि i. race wage i. edu i. urban i. female एक के साथ जिसमें इंटरैक्शन शामिल हैं: रिग्रेस ऍक्स्प (i. race i. urban i. female) (c. wage i. edu ) अच्छी तरह से अन्य चर के मॉडल के लिए समान तुलना करें। यह बहुत अधिक आउटपुट बनाता है, इसलिए परिणामों के लिए लॉग फ़ाइल देखें मादा और अन्य वैरिएबल के बीच परस्पर क्रियाएं एक्सपी के लिए मॉडल में महत्वपूर्ण हैं वेतन। edu। और शहरी दौड़ या शहरी और अन्य वैरिएबल के बीच कुछ महत्वपूर्ण बातचीतएं हैं, लेकिन लगभग नहीं (और ध्यान रखें कि इस कई गुणांकों के साथ .05 के महत्व का स्तर का उपयोग करते हुए कुछ गलत सकारात्मक उम्मीदों के मुताबिक)। इस तरह से पुरुषों और महिलाओं को अलग-अलग आरोपित कर देते हैं। यह डेटा सेट के लिए एक विशेष रूप से अच्छा विकल्प है क्योंकि महिला कभी गायब नहीं होती है अगर ऐसा होता है, तो उन टिप्पणियों को छोड़ देना पड़ता है जो महिलाएं गायब हो रही हैं क्योंकि उन्हें एक समूह या दूसरे में नहीं रखा जा सकता है अभिप्राय कमांड में इसका मतलब है कि महिला (महिला) विकल्प जोड़ना। मॉडल का परीक्षण करते समय, इसका मतलब है कि महिला के साथ कमांड शुरू करना: उपसर्ग (और महिलाओं को सूची से हटाकर) सुधार के आरोपण मॉडल इस प्रकार हैं: बायसोर्ट महिला: रेग एप i. urban i. race मजदूरी i. edu मादा द्वारा: लगीट शहरी एपीसी i. race wage i. edu मादा द्वारा: mlogit race exp i. urban मजदूरी i. edu मादा द्वारा : reg मजदूरी exp i. urban i. race i. edu द्वारा मादा: ologit edu exp i. urban i. race वेतन pmm खुद को दोष के संदर्भ के बाहर नहीं चलाया जा सकता, लेकिन इसके बाद से प्रतिगमन के आधार पर आप इसका परीक्षण करने के लिए नियमित प्रतिगमन का उपयोग कर सकते हैं । इन मॉडलों को फिर से जांचना चाहिए, लेकिन अच्छी तरह से उस प्रक्रिया को छोड़ देना चाहिए। मील बांधने वाले जंजीर के लिए मूल सिंटैक्स है: मील छेड़छाड़ (विधि 1) varlist1 (method2) varlist2 regvars प्रत्येक विधि निम्नलिखित varlist imputing के लिए इस्तेमाल करने के लिए विधि को निर्दिष्ट करता है विधि के लिए संभावनाएं पुनर्गठन हैं pmm। truncreg। intreg। logit। ologit। mlogit। प्वाइजन। और एनब्रेग रेगवार्स नियमित चर की एक सूची है, जो कपटपूर्ण मॉडल में संलिप्तता के रूप में इस्तेमाल किया जाता है, लेकिन आरोपित नहीं हुआ (कोई भी नहीं हो सकता) मूल विकल्प हैं: एन (एन) आरएसईड (आर) सेवरेट्रेस (ट्रेसफाइल। प्रतिस्थापन) एन जोड़ना है एन डेटा सेट में जोड़ा जाने के लिए आरोपण की संख्या। आर यह है कि यादृच्छिक संख्या जनरेटर 8212 के लिए इस्तेमाल किया जाने वाला बीज है, यदि आप इसे सेट नहीं करते हैं, तो आपको प्रत्येक बार कमांड चलाए जाने पर थोड़ा अलग इंपुशन होंगे। ट्रेसफाइल एक डाटासेट है जिसमें मैल अभियोग जंजीर अभद्र प्रक्रिया के बारे में जानकारी संग्रहीत करेगा। कनवर्जेन्स की जांच के लिए इस डाटासेट का उपयोग करें। किसी विशिष्ट विधि के लिए प्रासंगिक विकल्प, कोष्ठकों के अंदर, लेकिन अल्पविराम (उदाहरण (मैलगिट, एग)) के साथ विधि के साथ जाते हैं। विकल्प, जो पूर्ण रूप से दोषपूर्ण प्रक्रिया के लिए प्रासंगिक हैं (जैसे (महिला)) अल्पविराम के बाद, अंत में जाते हैं हमारे उदाहरण के लिए, यह कमांड होगा: शहरी (लोगट) शहरी (मैलगिट) रेस (ओlogिट) एड्यू (बीपीएम) एक्सपर्ट मजदूरी के लिए, (5) रेसेड (440 9) (महिला) द्वारा नोट करें कि इसमें एक सॉफ़्टवेयर शामिल नहीं है () विकल्प इस लेखन के रूप में, () और savetrace () द्वारा एक ही समय में उपयोग नहीं किया जा सकता है, संभवतः क्योंकि प्रत्येक समूह के लिए प्रत्येक के लिए एक ट्रेस फ़ाइल की आवश्यकता होगी स्ताटा इस समस्या से अवगत है और हमें उम्मीद है कि यह जल्द ही बदला जाएगा। इस आलेख के प्रयोजनों के लिए, ट्रेस फ़ाइल का उपयोग करने के लिए समय आने पर, () विकल्प को अच्छी तरह से निकाल दें यदि आपके शोध में यह समस्या सामने आती है, तो कार्य-आस-पास के बारे में हमसे बात करें इम्प्रेशन की संख्या का चयन करना अधिकारियों के बीच कुछ असहमति है कि कितने आरोपण पर्याप्त हैं कुछ लोग कहते हैं कि लगभग सभी परिस्थितियों में 3-10, स्टटा दस्तावेज में कम से कम 20 सुझाव दिए गए हैं, जबकि व्हाइट, रॉयस्टन, और लकड़ी का तर्क है कि छल की संख्या लगभग मामलों के प्रतिशत के बराबर होना चाहिए, जो कि लापता मूल्यों के साथ हैं। हालांकि, हम किसी भी तर्क से अवगत नहीं हैं कि आरोपण की संख्या में बढ़ोतरी से समस्याएं उत्पन्न होती हैं (बस एक अन्य दोष का असीम लाभ असीमित रूप से शून्य तक पहुंचता है) आपके विश्लेषण में आरोपण की संख्या को बढ़ाने से आपके भाग पर अनिवार्य रूप से कोई काम नहीं होता है। बस add () विकल्प की संख्या को कुछ बड़ा करने के लिए बदलें दूसरी तरफ, कंप्यूटर के लिए यह बहुत काम हो सकता है 8212 बहुविध अभद्रता ने कई शोधकर्ताओं को दुनिया की नौकरियों में पेश किया है जो कि चलाने के लिए घंटों या दिन लगते हैं। आप आम तौर पर यह मान सकते हैं कि अपेक्षित समय की मात्रा का उपयोग किया गया आरोपणों की संख्या के अनुपात में होगा (उदाहरण के लिए अगर कोई फ़ाइल को पांच छिद्रों के साथ चलाने के लिए दो घंटे लगते हैं, तो संभवतः दस छेड़ने के साथ चलने में लगभग चार घंटे लगेंगे)। तो हमारे सुझाव का पालन करता है: पांच छेड़छाड़ के साथ शुरू करें (मोटे तौर पर वैध माना जाता है whats के कम अंत) अपने अनुसंधान परियोजना पर काम करें जब तक कि आप अपने अंतिम रूप में विश्लेषण के बारे में काफी आश्वस्त नहीं रहें। क्या फाइलों के साथ सब कुछ करना सुनिश्चित करें ताकि आप इसे फिर से चालू कर सकें ध्यान दें कि प्रक्रिया से लेकर अंतिम विश्लेषण तक की प्रक्रिया कितनी देर तक ले जाती है। इस बात पर विचार करें कि आपके पास कितना समय है और तय करें कि आप कितने छेड़छाड़ को चलाने के लिए खर्च कर सकते हैं, उस समय अंगूठे के नियम का उपयोग करके आरोपणों की संख्या के लिए आनुपातिक है। यदि संभव हो तो, लापता डेटा वाले मामलों के प्रतिशत के बराबर लगभग अवरोधन की संख्या बनाएं (आवश्यक वस्तु का उच्च अंत अनुमान) अगर चीजें गलत होने पर ठीक होने के लिए समय दें, जैसा कि वे आम तौर पर करते हैं अपनी फाइल में आरोपण की संख्या को बढ़ाएं और इसे शुरू करें। जब कोई फ़ाइल चलाता है, कुछ और करो, जैसे अपना पेपर लिखें Imputations जोड़ना अपने परिणामों को काफी नहीं बदलना चाहिए 8212 और संभावना है कि वे करते हैं, अपने आप को भाग्यशाली है कि प्रकाशन करने से पहले पता चला है। इम्प्रेशन प्रक्रिया को गति देते हुए कई अभद्रता ने कई शोधकर्ताओं को दुनिया की नौकरियों की शुरुआत की है, जो कि चलाने के लिए घंटे, दिन या सप्ताह भी लेते हैं। आम तौर पर स्ताटा कोड को तेजी से चलाने के लिए अपना समय व्यतीत करने में अच्छा नहीं होता है, लेकिन कई अपवाद एक अपवाद हो सकता है। आप के लिए सबसे तेज़ कंप्यूटर का उपयोग करें एसएससीसी सदस्यों के लिए जिसका मतलब है कि लिंटाट पर नौकरियां चलाने के लिए सीखना, एसएससीसीएस लिनक्स कंप्यूटिंग क्लस्टर लिनक्स के रूप में मुश्किल नहीं है जैसा कि आप सोच सकते हैं 8212 Linstat के निर्देशों का उपयोग कर रहा है एकाधिक अभिप्राय में अधिक स्टेटा आज्ञाओं की तुलना में अधिक पढ़ने और डिस्क को लिखना शामिल है। कभी-कभी इसमें मौजूदा कार्यशील निर्देशिका में अस्थायी फ़ाइलों को लिखना शामिल होता है। अपने डेटा सेट और कार्यशील निर्देशिका दोनों के लिए, आपके लिए उपलब्ध सबसे तेज़ डिस्क स्थान का उपयोग करें। सामान्य स्थानीय डिस्क स्थान में नेटवर्क डिस्क स्थान की तुलना में तेज़ हो जाएगा, और Linstat ramdisk (एक quotedirectoryquot जो वास्तव में रैम में संग्रहीत है) स्थानीय डिस्क स्थान की तुलना में तेज़ हो जाएगा। दूसरी ओर, आप स्थायी रूप से डेटा सेट को कहीं भी सेट नहीं करना चाहते हैं, लेकिन नेटवर्क डिस्क स्थान। तो अपनी फाइल करने पर विचार करें, ऐसा कुछ करें: विंडोज (Winstat या आपके खुद के पीसी) यह तब लागू होता है जब आप भी आरोपित डेटा का इस्तेमाल कर रहे होते हैं यदि आपका डेटा सेट बहुत बड़ा है जो अपवाद के बाद धीमी गति से काम करता है, तो ऊपर की प्रक्रिया मदद कर सकती है। कन्वर्जेंस एमआईसीई के लिए जांच एक पुनरावृत्ति प्रक्रिया है प्रत्येक पुनरावृत्ति में, मैल ने जंजीर मॉडल के पहले अनुमान का जिक्र किया, जो कि दोनों देखे गए डेटा और पिछली यात्रा से आरोपित डेटा का उपयोग करते हैं। इसके बाद परिणामस्वरूप वितरण से नए आरोपित मूल्यों को खींचता है। ध्यान दें कि एक परिणाम के रूप में, प्रत्येक पुनरावृत्ति में पिछले अभद्रता के साथ कुछ आत्मसम्मान है। पहला पुनरावृत्ति एक विशेष मामला होना चाहिए: इसमें, मैल ने जंजीर का पहला आकलन किया है, चर के लिए आरोपित मॉडल के अनुमानित आंकड़ों पर आधारित कुछ सबसे कम मूल्यों के आधार पर और उस चर के लिए आरोपित मूल्यों को आकर्षित करता है। इसके बाद, वेरिएबल के लिए अगले कम से कम लापता मूल्यों के साथ मॉडल का अनुमान लगाया जाता है, जो कि दोनों पहचाने जाने वाले मूल्यों और पहले चर के आरोपित मूल्यों का उपयोग करते हैं, और बाकी के वैरिएबल के लिए समान होता है। इस प्रकार पहली बार चलना अक्सर एटिपिकल होता है, और क्योंकि पुनरावृत्तियों को सहसंबद्ध होता है, यह बाद के पुनरावृत्तियों परमाणुओं को भी बना सकता है। इस से बचने के लिए, आप द्वारा अनुरोध किए गए प्रत्येक आरोपित डेटा के लिए डिफ़ॉल्ट रूप से मील की जंजीरों को दस पुनरावृत्तियों के माध्यम से चला जाता है, केवल दसवें पुनरावृत्तियों के परिणामों को सहेजता है। पहले नौ पुनरावृत्तियों को जला-इन अवधि कहा जाता है आम तौर पर यह पहली बार चलने के प्रभावों के लिए बहुत समय बिताने के लिए काफी समय है और प्रक्रिया के लिए एक स्थिर स्थिति में प्रवेश करने के लिए। बहरहाल, आपको अभिसरण के लिए जांच करनी चाहिए और बर्निन () विकल्प का उपयोग करके सुनिश्चित करने के लिए पुनरावृत्तियों की संख्या में वृद्धि करना चाहिए। ऐसा करने के लिए, ट्रेस फ़ाइल को मैनेजमेंट के जरिए बचाया गया है। इसमें प्रत्येक पुनरावृत्ति में प्रत्येक आरोपित चर के माध्य और मानक विचलन शामिल हैं। ये अनियमित रूप से भिन्न होंगे, लेकिन उन्हें किसी भी प्रवृत्ति को नहीं दिखाया जाना चाहिए। चेक करने का आसान तरीका है टीएसलाइन के साथ लेकिन यह डेटा को फिर से बदलने की आवश्यकता है। हमारा पसंदीदा अभिकर्मक मॉडल () द्वारा उपयोग करता है इसलिए यह एक ट्रेस फ़ाइल सहेज नहीं सकता। इस प्रकार पल के लिए () से अच्छी तरह से दूर होता है अच्छी तरह से बर्नइन () विकल्प को 100 में बढ़ाया जा सकता है ताकि यह देखने में आसान हो जाए कि स्थिर ट्रेस क्या दिखता है। अच्छी तरह से फिर से कनवर्जेंस की जांच करने के लिए नयी आकृति प्रदान करें और चिल्लप का उपयोग करें: मैल इंपक्शन जंजीर (लॉजिट) शहरी (एमओजीआईटी) रेस (ओlogिट) एड्यू (बीएमएम) एक्सपर्ट मजदूरी महिला को सुरक्षित रखें, (5) आरएसईडी (88) सेवरेट्रेस (एड्रेस्रेस, बदलें) बर्निन 100) एक्सट्रैस का इस्तेमाल करते हैं, विस्तृत अर्थ एसडी, आई (आईएआर) जे (एम) टीएसएसएटी आईओएसटी टीएसलाइन एक्सएमएमआई, शीर्षक (एक्सपीरिएक्नुक्वाट के इम्प्टेंटेड वैल्यू के एमएएनएन) की प्रतिलिपि बनाने की जगह पीएनजी, टीएसलाइन एक्सब्सड, शीर्षक (प्रतिस्थापक के अनुभवों का इम्तप्ट वैल्यूज का मानक विचलन) प्रतिस्थापन (प्रति उद्धरण रेखा एक आबंटन कोट के लिए है) किंवदंती (ऑफ) ग्राफ निर्यात कॉन्फ्लोज़ 02, पुनर्स्थापना की जगह, परिणामी ग्राफ कोई स्पष्ट समस्या नहीं दिखाते हैं: यदि आप करते हैं संकेतों को देखते हुए कि प्रक्रिया दस बार पुनरावृत्तियों के बाद समाहित नहीं हो सकती है, बर्निन () विकल्प के साथ आरोपित मूल्यों को सहेजने से पहले किए गए पुनरावृत्तियों की संख्या में वृद्धि करें यदि कनवर्जेन्स कभी हासिल नहीं किया जाता है तो यह दोषपूर्ण मॉडल के साथ एक समस्या को इंगित करता है। छेड़छाड़ के बाद इम्प्रुटेड वैल्यू की जांच करना, आपको यह देखना होगा कि क्या आरोपित डेटा को देखे गए आंकड़ों के समान है या नहीं। दुर्भाग्य से यह निर्धारित करने के लिए कोई औपचारिक परीक्षा नहीं है कि क्या पर्याप्त मात्रा में बताए गए हैं। प्रश्न: यदि डेटा मार्स हैं लेकिन एमसीएआर नहीं हैं, तो आरोपित डेटा व्यवस्थित रूप से मनाया गया डेटा से अलग होना चाहिए। विडंबना यह है कि, कम लापता मूल्यों को आप पर लगाया जाना है, अधिक भिन्नता आप आरोपित डेटा और देखे गए डेटा (और आरोपण के बीच) के बीच देखेंगे। बाइनरी और स्पष्ट चर के लिए, आवृत्ति तालिकाओं की तुलना करें। निरंतर चर के लिए, तुलना करना और मानक विचलन एक अच्छा प्रारंभिक बिंदु है, लेकिन आपको वितरण के संपूर्ण आकार को भी देखना चाहिए। इसके लिए हम कर्नेल घनत्व ग्राफ़ या शायद हिस्टोग्राम सुझाते हैं। सभी आरोपित मूल्यों को जमा करने के बजाय प्रत्येक अभिशाप को अलग से देखें ताकि आप देख सकें कि उनमें से कोई एक गलत हो गया है या नहीं। मील एक्सईक: प्रत्येक आरोपी को अलग-अलग तरीके से बाद के आदेश को लागू करने के लिए स्टैटा को बताएं। यह मूल डेटा पर भी लागू होता है, टाइटजरोथ अभिकथन। क्वाट इस प्रकार: मील एक्सईक: टैब रेस आपको छह आवृत्ति सारणी देगा: एक मूल डेटा के लिए, और प्रत्येक पांच आरोपण के लिए एक। हालांकि, हम मनाया गया आंकड़ों को सिर्फ आरोपित आंकड़ों से जोड़ना चाहते हैं, पूरे डेटा सेट नहीं। इसकी आवश्यकता के लिए टैब की एक शर्त को जोड़ना आवश्यक है, लेकिन निरीक्षण डेटा नहीं। विशेष छेड़छाड़ पर मील एक्सईक अधिनियम बनाने के लिए एक संख्या या संख्या सूची जोड़ें: मील xeq 0: टैब रेस मी xeq 15: टैब रेस अगर मिस्रेस यह दौड़ के मनाया मूल्यों के लिए आवृत्ति सारणी बनाता है और फिर सभी पाँच आरोपणों में आरोपित मूल्यों को बनाता है। यदि आपके पास जांच करने के लिए एक चरणीय संख्या है, तो आप उन पर आसानी से लूप कर सकते हैं: विभिन्न प्रकार के शहरी रेस एड्यू मी xeq 0: tab var mi xeq 15: tab var if missvar परिणाम के लिए लॉग फ़ाइल देखें। निरंतर चर पर चालू आंकड़े चलाने से एक ही प्रक्रिया होती है, लेकिन कर्नेल घनत्व ग्राफ़ बनाने से जटिलता जुड़ती है: आपको या तो ग्राफ को सहेजना होगा या खुद को देखने का मौका देना होगा। मील एक्सईक: प्रत्येक आक्षेप के लिए कई आदेश ले सकता है: प्रत्येक को एक पंक्ति में उन्हें प्रत्येक के अंत में अर्धविराम () के साथ रखें (यह काम नहीं करेगा यदि आपने सामान्य समाप्ति-समाप्ति सीमांकक को अर्धविराम में बदल दिया है।) नींद का आदेश एक निश्चित अवधि के लिए विराम के लिए स्टेता को बताता है, मिलीसेकंड में मापा जाता है। मील xeq 0: घनत्व मजदूरी 1000 मील xeq 15: यदि मिसवेर नींद 1000 के बाद कंडिशन मजदूरी 1000 फिर से, यह सब स्वचालित हो सकता है: विभिन्न प्रकार के मजदूर मजदूरी एक्सएम मी xeq 0: राशि में माइल एक्सईक 15: राशि वाले अगर मिस्वावर मी एक्सईक 0: कंडिटी var नींद 1000 मील xeq 15: कन्डेसटी वेर अगर मिस्वार स्लीप 1000 रेखांकन सहेजा जा रहा है एक बिट पेचीदा हो सकता है, क्योंकि आपको ग्राफ़ को हर आरोपण से अलग फाइल नाम देना होगा। दुर्भाग्य से आप अभद्रता संख्या को मील एक्सएक के भीतर नहीं एक्सेस कर सकते हैं। हालांकि, आप भ्रष्टाचार संख्याओं पर प्रमेय संख्याएं कर सकते हैं, फिर उनमें से प्रत्येक पर मील एक्सईक कार्य किया जा सकता है: forval i15 mi xeq i: kdensity exp यदि गलतफ़ेक्स ग्राफ निर्यात expi. png, इसे पिछले संस्करण के साथ जोड़कर प्रतिस्थापित करता है: foreach var varlist मजदूरी एक्ज़िम मील xeq 0: sum var mi xeq 15: sum var अगर मिस्वावर मी xeq 0: kdensity var graph export chkvar0.png, forval i15 mi xeq i: kdensity var की जगह अगर missvar graph export chkvari. png, प्रतिस्थापित, परिणाम के लिए, लॉगफाइल को देखें । इसकी परेशानी यह है कि मजदूरी के मूल्य के मूल्यों का मतलब सभी छेड़छाड़ में मजदूरी के मनाया मूल्यों के मतलब से अधिक है। और एक्सपी के आरोपित मूल्यों का मतलब एक्सपी के मनाए गए मूल्यों के माध्य से कम है हमें पता नहीं है कि डेटा मार्च है, लेकिन एमएसीआर नहीं है, इसलिए उम्मीद की गई आंकड़ों के साधनों के आस-पास संकलित डेटा के माध्यम से उम्मीद की जाती है। हमें यह बताने के लिए कोई औपचारिक परीक्षा नहीं है कि यह एक समस्या है या नहीं। हालांकि, इसे संदेह उठाना चाहिए, और यदि इन आरोपित आंकड़ों के साथ अंतिम परिणाम पूर्ण मामलों के विश्लेषण के परिणामों से अलग हैं, तो यह सवाल उठाता है कि क्या अंतर दोष के मॉडल के साथ समस्याओं की वजह से है। अंतिम संशोधित: 8232012 विशेषताएँ सिंमा बोफाले और जियोवन्नी उर्गा द्वारा स्टेटा का इस्तेमाल करते हुए वित्तीय अर्थमिति, समय-श्रृंखला के विश्लेषण के लिए एक उत्कृष्ट परिचय प्रदान करते हैं और यह वित्तीय स्थिति के लिए स्ताटा में कैसे करना है। मध्य पूर्व और उत्तरी अफ्रीका (मेना) क्षेत्र दोनों, डेटा की उपलब्धता और डेटा की गुणवत्ता से ग्रस्त हैं इस क्षेत्र पर डेटा एकत्र करने, साफ़ करने और पेश करने का कोई भी प्रयास एक वेल है चौथे पोलैंड स्ताटा उपयोगकर्ता समूह की बैठक सोमवार, 17 अक्टूबर 2016 को एसजीएच वारसॉ स्कूल ऑफ इकोनॉमिक्स, वारसा, पोलैंड में आयोजित की जाती है। स्टेटा उपयोगकर्ता समूह मील का लक्ष्य बारिश डेटा: पाशन के माध्यम से प्रत्येक चर के निर्माण और लेबलिंग को स्वचालित करने के लिए स्टेटा का प्रयोग अक्सर डेटा के काम में एक व्यक्ति को लगता है कि एक ही काम को फिर से करना चाहिए और 22 वां लंदन स्ताट उपयोगकर्ता समूह की बैठक गुरुवार, 8 और शुक्रवार, 9 सितंबर 2016 को कैस बिजनेस स्कूल, लंदन में आयोजित की जाती है। लंदन स्ताटा उपयोगकर्ता समूह की बैठक नवीनतम स्टेटा पाठ्यक्रम इस 2-दिवसीय पाठ्यक्रम में कई प्रमुख अर्थमिति पद्धतियों का एक व्यावहारिक मार्गदर्शन प्रदान किया गया है, जो अक्सर एआरएमए मॉडल, अनिवियेट और मल्टीवीयेट गेर्ट मॉडल, जोखिम प्रबंधन विश्लेषण और संभोग के माध्यम से वित्तीय समय श्रृंखला के स्टाइलिज़ तथ्यों को मॉडल करने के लिए उपयोग किया जाता है। वैकल्पिक तकनीक का प्रदर्शन स्टेटा के जरिए सचित्र किया जाएगा। पाठ्यक्रम के भीतर व्यावहारिक सत्रों में ब्याज दर डेटा, संपत्ति की कीमतें और विदेशी मुद्रा समय श्रृंखला शामिल है। यह कोर्स प्रो गियोवन्नी उर्गा द्वारा दिया जाता है, जो स्टेटस-बोफ़ेली, एस और उर्गा, जी (2016), स्टटा प्रेस: ​​टेक्सास का उपयोग करके वित्तीय अर्थमिति के लेखक हैं। रैखिक मॉडल रेखीय मान्यताओं का उपयोग करके ब्याज की भविष्यवाणियों के एक सेट से परिणाम को परिभाषित करता है। प्रतिगमन मॉडल रेखीय मॉडल का एक सबसेट है, इनमें से एक है, यदि नहीं तो सबसे मौलिक उपकरण एक सांख्यिकीविद् हो सकता है। इस कोर्स में प्रतिगमन विश्लेषण, कम से कम चौराहों, प्रतिगमन मॉडल का उपयोग करना और मजबूत अनुमान के तरीकों को शामिल किया गया है। यह पाठ्यक्रम आपको डेटा प्रबंधन और स्टेटा का उपयोग करके अपने वर्कफ़्लो के पूर्ण स्वचालन के लिए उन्नत टूल प्रदान करेगा। यह 2-दिवसीय पाठ्यक्रम स्टाटा में उपलब्ध मुख्य डेटा प्रबंधन कमांड की समीक्षा करके शुरू होता है और यह स्पष्ट करता है कि उन्हें स्ता प्रोग्राम प्रोग्रामिंग के साथ गठबंधन कैसे करना है और आप सरल स्टेटा प्रोग्रामों का उपयोग करके कोड कैसे सीखेंगे। यह पाठ्यक्रम प्रतिभागियों पर चयन के आधार पर पॉलिसी मूल्यांकन के लिए आधुनिक माइक्रो-इकनॉमिक्रिक विधियों के उचित उपयोग के लिए सैद्धांतिक और व्यावहारिक दोनों के लिए आवश्यक उपकरण प्रदान करेगा, अनुभवजन्य विश्लेषण के लिए बेयसियन विधियों के परिचय के रूप में तैयार किए गए दो पाठ्यक्रमों का दूसरा भाग। हम कई सैद्धांतिक मुद्दों से शुरू करेंगे, जिसमें एक्सचेंजिबिलिटी, पूर्व-पोस्टर विश्लेषण, मॉडल तुलना और परिकल्पना परीक्षण, और लापता डेटा के मॉडल शामिल होंगे। हम पूर्व प्रेरणा की मौलिक समस्या की भी जांच करेंगे। एक बोली की आवश्यकता है

No comments:

Post a Comment