मानक विचलन बनाम मानक त्रुटि: क्या अंतर है?

विभिन्न ब्रह्मांडों से जुड़वाँ बच्चे

द्वारा फोटो मार्टिन सांचेज़ on Unsplash

Sमानक विचलन और मानक त्रुटि दो सांख्यिकीय अवधारणाएँ हैं जो अक्सर भ्रम पैदा करती हैं। क्या उनकी व्याख्याएँ समान हैं या वे किसी पूर्णतः भिन्न चीज़ का प्रतिनिधित्व करने के लिए हैं? हम इस पोस्ट में और अधिक चर्चा करेंगे।

मानक विचलन (एसडी) क्या है?

RSI मानक विचलन उपाय परिवर्तनशीलता (उर्फ, द विस्तार) के आसपास डेटा बिंदुओं की मतलब किसी दिए गए डेटासेट में। दूसरे शब्दों में, यह हमें बताता है कि औसतन प्रत्येक डेटा बिंदु माध्य से कितनी दूर है।

जनसंख्या मानक विचलन

वास्तविक दुनिया में, हम एक में एक निश्चित विशेषता का अनुमान लगाने में रुचि रखते हैं आबादी. मानक विचलन एक है इन विशेषताओं का उदाहरण.

जब आपके पास ... हो सब किसी जनसंख्या से डेटा बिंदु, आप गणना कर सकते हैं जब सही है निम्न सूत्र का उपयोग करके जनसंख्या मानक विचलन का मान।

लेखक द्वारा छवि

नमूना मानक विचलन

अक्सर, समय, वित्तीय या तकनीकी सीमाओं के कारण जनसंख्या से सभी डेटा बिंदु एकत्र करना मुश्किल होता है। उदाहरण के लिए, यदि हम गणना करना चाहें जब सही है लॉस एंजिल्स में घरेलू आय का मानक विचलन, हमें लॉस एंजिल्स के सभी परिवारों से आय प्राप्त करने की आवश्यकता होगी, जो करना लगभग असंभव है।

इसके बजाय, हम जनसंख्या से यादृच्छिक नमूने एकत्र कर सकते हैं और जनसंख्या मानक विचलन का उपयोग करके अनुमान लगा सकते हैं नमूना मानक विचलन। नमूना मानक विचलन का सूत्र है

लेखक द्वारा छवि

नमूना मानक विचलन के लिए N-1 का उपयोग क्यों करें?

आप देखेंगे कि हम नमूना मानक विचलन के लिए जनसंख्या माध्य (μ) के बजाय नमूना माध्य (x̄) का उपयोग कर रहे हैं क्योंकि हम जनसंख्या माध्य के बारे में कुछ भी नहीं जानते हैं। x̄ μ के लिए एक उचित अनुमान है।

इसलिए, नमूना डेटासेट में कोई भी मान X, μ की तुलना में x̄ के करीब होगा। नमूना मानक विचलन में अंश कृत्रिम रूप से अपेक्षा से छोटा हो जाएगा। परिणामस्वरूप, नमूना मानक विचलन होगा कम करके आंका.

इसे ठीक करने के लिए पूर्वाग्रह नमूना मानक विचलन में, हम उपयोग करेंगे "एन" के स्थान पर "एन-1" (उर्फ, बेसेल का सुधार) नमूना मानक विचलन के लिए.

एन-1 का उपयोग करने से नमूना मानक विचलन एन का उपयोग करने की तुलना में बड़ा हो जाएगा। इसलिए, हमारे पास जनसंख्या मानक विचलन का कम पक्षपाती अनुमान है, जो हमें परिवर्तनशीलता का एक रूढ़िवादी अनुमान देता है।

मानक त्रुटि (एसई) क्या है?

इससे पहले कि हम मानक त्रुटि पर चर्चा करें, आइए सबसे पहले इसकी अवधारणाओं से परिचित हों नमूना वितरण और नमूने का वितरण.

नमूना वितरण बनाम नमूना वितरण

RSI नमूना वितरण बस है डेटा वितरण नमूने का जो जनसंख्या से यादृच्छिक रूप से लिया गया है।

उदाहरण के लिए, हम लॉस एंजिल्स में 100 यादृच्छिक लोगों से पूछते हैं कि उनकी आय क्या है। नमूना वितरण का वर्णन करता है वास्तविक इन 100 लोगों में आय वितरण।

लेकिन नमूनाकरण वितरण क्या है?

RSI नमूने का वितरण विश्व का सबसे लोकप्रिय एंव नमूना आँकड़ा का वितरण (उदाहरण के लिए, एक ही जनसंख्या से लिए गए कई नमूनों पर नमूना माध्य, नमूना भिन्नता, नमूना मानक विचलन और नमूना अनुपात) (यानी, बार-बार नमूना लेना).

उदाहरण के लिए, हम लॉस एंजिल्स में 100 यादृच्छिक लोगों से पूछते हैं कि उनकी आय क्या है। फिर औसत आय की गणना करें। हम इसे 1000 बार दोहराते हैं, फिर हमारे पास 1000 अलग-अलग औसत आय होती है। इन 1000 औसत आय के वितरण को नमूना वितरण कहा जाता है।

इसलिए, नमूना वितरण का वितरण है नमूना डेटा जब नमूने का वितरण का वितरण है नमूना आँकड़ा.

अवधारणा है मानक त्रुटि नमूना वितरण के लिए प्रासंगिक है, नमूना वितरण के लिए नहीं।

RSI मानक त्रुटि एक मीट्रिक है जो इसका वर्णन करती है एक आँकड़े की परिवर्तनशीलता में नमूने का वितरण।

मानक त्रुटि (एसई) की व्याख्या कैसे करें?

मानक त्रुटि मापती है कि कितनी दूर है नमूना आँकड़ा (जैसे, नमूना माध्य) से होने की संभावना है वास्तविक जनसंख्या आँकड़ा (उदाहरणार्थ, जनसंख्या माध्य)।

हमें मानक त्रुटि (एसई) की आवश्यकता क्यों है?

आमतौर पर आप निर्माण करना चाह सकते हैं विश्वास अंतराल जब हम सांख्यिकीय अनुमान लगाने का प्रयास करते हैं, और एक आत्मविश्वास अंतराल का निर्माण करने के लिए एक संभावना निर्दिष्ट करना अधिक जानकारीपूर्ण होता है जिसमें माध्य शामिल होता है।

  • यदि अंतर्निहित डेटा सामान्य रूप से वितरित किया जाता है, तो नमूना वितरण भी सामान्य रूप से वितरित किया जाता है। तब हम कह सकते हैं कि हम 68% आश्वस्त हैं कि जनसंख्या माध्य 1 मानक त्रुटि के भीतर है या 95% 2 मानक त्रुटियों के भीतर होगा, आदि।
  • यदि अंतर्निहित डेटा सामान्य रूप से वितरित नहीं है, लेकिन नमूना आकार काफी बड़ा है, तो हम भरोसा कर सकते हैं केंद्रीय सीमा प्रमेय (सीएलटी) यह कहने के लिए कि नमूना वितरण लगभग सामान्य रूप से वितरित है, तो हम आत्मविश्वास अंतराल के बारे में समान बयान दे सकते हैं।

मानक त्रुटि (एसई) की गणना कैसे करें?

मानक त्रुटि की गणना करने के लिए हम आम तौर पर निम्नलिखित सूत्र का उपयोग करते हैं। मैं अगले अनुभागों में इस सूत्र को कैसे प्राप्त किया जाए, इस पर चर्चा करूंगा।

लेखक द्वारा छवि

मानक त्रुटि के उदाहरण क्या हैं?

मानक त्रुटि विभिन्न प्रकार पर लागू की जा सकती है आँकड़े. कुछ लोकप्रिय उदाहरण हैं

  • नमूना माध्य की मानक त्रुटि (उर्फ, माध्य की मानक त्रुटि, SEM)
  • नमूना अनुपात की मानक त्रुटि (उर्फ, अनुपात की मानक त्रुटि, एसईपी)

माध्य की मानक त्रुटि (SEM) क्या है?

माध्य की मानक त्रुटि (या बस मानक त्रुटि), इंगित करती है कि कितना भिन्न है नमूना माध्य से होने की सम्भावना है औसत जनसंख्या.

तकनीकी रूप से, माध्य की मानक त्रुटि की गणना नमूना माध्य के मानक विचलन के रूप में की जाती है।

लेखक द्वारा छवि

काल्पनिक रूप से, हम निम्नलिखित चरणों का उपयोग करके दोहराए गए नमूनों के तहत मानक त्रुटि की गणना कर सकते हैं:

  1. जनसंख्या से एक नया नमूना बनाएं।
  2. चरण 1 में निकाले गए नमूने के नमूना माध्य की गणना करें
  3. चरण 1 और 2 को कई बार दोहराएँ।
  4. मानक त्रुटि पिछले चरणों के नमूना साधनों के मानक विचलन की गणना करके प्राप्त की जाती है।

की बदौलत केंद्रीय सीमा प्रमेय (सीएलटी), हमें दोहराए गए नमूनों के अंतर्गत नमूना वितरण पर विचार करने की आवश्यकता नहीं है। इसके बजाय, नमूना साधनों के नमूना वितरण का अनुमान केवल एक यादृच्छिक नमूने से लगाया जा सकता है।

केंद्रीय सीमा प्रमेय में कहा गया है कि नमूना माध्य का a के साथ लगभग सामान्य वितरण होता है μ का माध्य और एक σ/√n का मानक विचलन (या मानक त्रुटि)।.

SEM का सूत्र कैसे प्राप्त करें?

लेखक द्वारा छवि

इसलिए,

लेखक द्वारा छवि

अधिकांश मामलों में, जनसंख्या डेटा का मानक विचलन अज्ञात है। हम नमूना डेटा के मानक विचलन (नमूना मानक विचलन) का उपयोग करके इसका अनुमान लगाएंगे।

इसलिए,

लेखक द्वारा छवि

अनुपात की मानक त्रुटि (एसईपी) क्या है?

अनुपात की मानक त्रुटि दर्शाती है कि कितना भिन्न है नमूना अनुपात से होने की सम्भावना है जनसंख्या अनुपात.

अनुपात की मानक त्रुटि की गणना नमूना अनुपात के मानक विचलन के रूप में की जाती है।

लेखक द्वारा छवि

आप देखेंगे कि प्रत्येक नमूना डेटा में, हमारे पास केवल 1 या 0 डेटा है। प्रत्येक मान एक का अनुसरण करता है बर्नौली वितरण. परिकलित नमूना अनुपात अब द्विआधारी मान नहीं हैं। इसके बजाय, उनका मान 0 और 1 के बीच कोई भी हो सकता है।

केंद्रीय सीमा प्रमेय में कहा गया है कि नमूना अनुपात में लगभग सामान्य वितरण होता है पी का मतलब और एक √P(1-P)/√n का मानक विचलन (या मानक त्रुटि)।, जहां P जनसंख्या अनुपात है।

एसईपी का फार्मूला कैसे प्राप्त करें?

लेखक द्वारा छवि

एसईएम के समान,

लेखक द्वारा छवि
लेखक द्वारा छवि

हम अनुमान लगा सकते हैं σ नमूना मानक विचलन का उपयोग करना √पी(1-पी) (अर्थात, बर्नौली वितरण का मानक विचलन)

लेखक द्वारा छवि

निष्कर्ष:

मानक विचलन और मानक त्रुटि समान अवधारणाएँ हैं जिन्हें मापने के लिए दोनों का उपयोग किया जाता है परिवर्तनशीलता.

मानक विचलन इंगित करता है कि कैसे नमूना डेटा मान में माध्य से भिन्न हैं नमूना वितरण.

मानक त्रुटि इंगित करता है कि कैसे नमूना डेटा आँकड़े में जनसंख्या आँकड़े से भिन्न हैं नमूने का वितरण.

पढ़ने के लिए आपका शुक्रिया !!!

यदि आप इस लेख का आनंद लेते हैं और चाहेंगे मेरे लिए कॉफ़ी खरीदो, कृप्या अ यहां क्लिक करे.

आप एक के लिए साइन अप कर सकते हैं सदस्यता मेरे लेखों तक पूर्ण पहुंच अनलॉक करने के लिए, और माध्यम पर हर चीज़ तक असीमित पहुंच प्राप्त करने के लिए। कृपया सदस्यता के यदि आप चाहते हैं कि जब भी मैं कोई नया लेख पोस्ट करूं तो मुझे एक ईमेल सूचना प्राप्त हो।

मानक विचलन बनाम मानक त्रुटि: क्या अंतर है? स्रोत https://towardsdatascience.com/standard-deviation-vs-standard-error-whats-the-difference-ae969f48adef?source=rss—-7f60cf5620c9—4 से https://towardsdatascience.com/feed द्वारा पुनर्प्रकाशित

<!–

->

समय टिकट:

से अधिक ब्लॉकचेन कंसल्टेंट्स