Statistical tests are the only way in quality and manufacturing to provide objective evidence for decision-making. They help identify variations in processes and distinguish between random fluctuations and actual problems. In engineering, statistics help identify patterns, outliers, and sources of failure in system performance, ensuring data-driven decision-making. By rigorously analyzing experimental results, engineers can validate product designs and manufacturing processes, detecting potential problems before implementation. This systematic approach reduces the risk of unexpected failures and enhances overall safety by ensuring reliability and compliance with international safety मानकों.
यह पोस्ट विनिर्माण में उपयोग किए जाने वाले मुख्य सांख्यिकीय परीक्षणों की समीक्षा करेगी और कुल गुणवत्ता प्रबंधन (कुल गुणवत्ता प्रबंधन).
ध्यान दें: चूंकि वे इंजीनियरिंग, अनुसंधान और विज्ञान से भी संबंधित हैं, इसलिए निम्नलिखित 2 सांख्यिकीय परीक्षण और विश्लेषण
- सहसंबंध विश्लेषण: दो चरों के बीच संबंध की शक्ति और दिशा को मापता है (उदाहरण के लिए, पियर्सन सहसंबंध गुणांक)।
- रिग्रेशन विश्लेषण: चरों के बीच संबंध की जांच करता है (उदाहरण के लिए, इनपुट कारक और प्रक्रिया आउटपुट), सरल रैखिक से लेकर बहु रिग्रेशन तक।
यहां शामिल नहीं हैं, बल्कि इंजीनियरिंग के लिए मुख्य 10 एल्गोरिदम के बारे में एक विशिष्ट लेख में हैं।
सामान्य वितरण परीक्षण

सांख्यिकीय परीक्षणों की दुनिया में, कई सामान्य सांख्यिकीय विधियाँ (t-परीक्षण, ANOVA, रैखिक प्रतिगमन, आदि) यह मानती हैं कि डेटा सामान्य रूप से/गाऊसी रूप से वितरित है (या कि अवशिष्ट/त्रुटियाँ सामान्य हैं)। इस धारणा का उल्लंघन करने से परिणाम अविश्वसनीय हो सकते हैं: p-मान भ्रामक हो सकते हैं, विश्वास अंतराल गलत हो सकते हैं, और टाइप I/II त्रुटियों का जोखिम बढ़ जाता है। ध्यान दें कि कुछ परीक्षण, जैसे 1-तरफ़ा ANOVA, गैर-सामान्य वितरण को यथोचित रूप से अच्छी तरह से संभाल सकते हैं।
ध्यान दें: यदि आपका डेटा सामान्य नहीं है, तो नीचे वास्तविक जीवन के मामले देखें, आपको गैर-पैरामीट्रिक परीक्षणों (जैसे मैन-व्हिटनी यू परीक्षण या क्रुस्कल-वालिस परीक्षण) का उपयोग करने की आवश्यकता हो सकती है, जो सामान्यता नहीं मानते हैं, या अपने डेटा को रूपांतरित करने की आवश्यकता हो सकती है, जो इस पोस्ट के दायरे से बाहर हैं।
हालांकि इसके लिए कई सांख्यिकीय परीक्षण मौजूद हैं, हम यहां शापिरो-विल्क परीक्षण का विस्तृत विवरण देंगे, जो विशेष रूप से छोटे नमूना आकारों के लिए प्रसिद्ध है, आमतौर पर n < 50, लेकिन इसे 2000 तक उपयोग किया जा सकता है।
आपकी जानकारी के लिए, अन्य सामान्य वितरण परीक्षण:
- कोलमोगोरोव-स्मिरनोव (K-S) परीक्षण (लिलिफोर्स सुधार के साथ): बड़े नमूना आकारों के साथ बेहतर काम करता है, जबकि शापिरो-विल्क की तुलना में कम संवेदनशील होता है, खासकर छोटे डेटासेट के लिए
- एंडरसन-डार्लिंग परीक्षण: सभी नमूना आकारों के लिए अच्छा है और वितरण की पूंछ (चरम) में अधिक संवेदनशीलता रखता है, जबकि चरम सीमाओं में सामान्यता से विचलन का पता लगाने के लिए अधिक शक्तिशाली है।
शापिरो-विल्क सामान्य वितरण परीक्षण कैसे करें
1. शापिरो-विल्क परीक्षण सांख्यिकी (W) की गणना करें: \(W = \frac{\left(\sum_{i=1}^{n} a_i x_{(i)}\right)^2}{\sum_{i=1}^{n} (x_i – \bar{x})^2}\)ध्यान दें: चूंकि \(a_i\) गुणांकों की गणना महत्वहीन नहीं है और आमतौर पर एक तालिका या एल्गोरिथम की आवश्यकता होती है, यही कारण है कि शापिरो-विल्क परीक्षण लगभग हमेशा R, Python के SciPy, MS जैसे सॉफ़्टवेयर द्वारा गणना की जाती है Excel ऐड-ऑन या अन्य समर्पित सॉफ़्टवेयर। मैन्युअल गणना के लिए, यह पृष्ठ 50 तक के नमूनों के लिए सभी \(a_i\) गुणांक और p-मान प्रदान करता है। W का मान 0 और 1 के बीच होता है (W = 1: पूर्ण सामान्यता। W < 1: यह 1 से जितना दूर होगा, आपका डेटा उतना ही कम सामान्य होगा)। 2. W पर्याप्त नहीं है। यह विश्वास स्तर प्राप्त करने के लिए अपने संबंधित p-मान के साथ काम करता है। शापिरो-विल्क तालिका में, पर n नमूना आकार की पंक्ति में, अपने गणना किए गए W के सबसे करीब का मान देखें और उसका संबंधित शीर्ष पर p-मान | अंश भारित क्रमित नमूना मानों के वर्ग योग का प्रतिनिधित्व करता है। भाजक नमूना माध्य से वर्ग विचलनों का योग है (अर्थात, नमूना विचरण, (n-1) द्वारा स्केल किया गया)। \(x_{(i)}\) = i-वाँ क्रम सांख्यिकी (अर्थात्, नमूने में i-वाँ सबसे छोटा मान) \(x_i\) = i-वाँ प्रेक्षित मान \(\bar{x}\) = नमूना माध्य \(a_i\) = स्थिरांक (भार) जो मानक सामान्य वितरण ((N(0,1))) से एक नमूने के क्रम सांख्यिकी के माध्य, प्रसरण और सहप्रसरण से गणना किए जाते हैं, और केवल n (नमूना आकार) पर निर्भर करते हैं। n = नमूना आकार |
3. परिणाम: यदि p-मान चुने हुए अल्फा-स्तर (उदाहरण 0.05) से अधिक है, तो सांख्यिकीय प्रमाण है कि परीक्षण किया गया डेटा सामान्य रूप से वितरित है। | |
सामान्य वितरण परीक्षण के लिए, अक्सर एक संख्यात्मक विधि को हेनरी की रेखा, Q-Q प्लॉट या हिस्टोग्राम जैसी ग्राफिकल विधि के साथ मिलाने की सलाह दी जाती है:
गैर-सामान्य वितरणों पर ध्यान दें!
जबकि सामान्य/गाऊसी वितरण सबसे सामान्य मामला है, इसे स्वचालित रूप से नहीं मानना चाहिए। दैनिक प्रति-उदाहरणों में शामिल हैं:
- व्यक्तियों के बीच धन और आय का वितरण। यह एक पैरेटो (शक्ति नियम) वितरण का अनुसरण करता है, जिसमें अत्यंत धनी व्यक्तियों की एक लंबी पूंछ होती है।
- किसी देश में शहरों की जनसंख्या का आकार जिपफ के नियम (शक्ति नियम) का अनुसरण करता है, जिसमें कुछ बहुत बड़े शहर और कई छोटे कस्बे होते हैं।
- भूकंप की तीव्रता और आवृत्ति एक पावर लॉ/गुटेनबर्ग-रिचर वितरण के अनुरूप होती है: छोटे भूकंप आम हैं, बड़े भूकंप दुर्लभ हैं।
- वित्तीय बाजारों में दैनिक मूल्य परिवर्तन या प्रतिफल: मोटे-पूंछ वाले/भारी-पूंछ वाले वितरण, गॉसियन नहीं; सामान्य वितरण द्वारा अनुमानित की तुलना में बड़े विचलन अधिक बार होते हैं।
- भाषा में शब्दों की आवृत्ति, जैसा कि ऊपर शहर की जनसंख्या में देखा गया है, ज़िपफ के नियम (शक्ति नियम) का अनुसरण करती है: कुछ शब्द अक्सर उपयोग किए जाते हैं, अधिकांश शब्द दुर्लभ होते हैं।
- इंटरनेट ट्रैफिक/वेबसाइट की लोकप्रियता: पावर लॉ/लॉन्ग टेल: कुछ साइटों पर लाखों हिट्स होते हैं, जबकि अधिकांश पर बहुत कम होते हैं।
- कंप्यूटर सिस्टम पर फ़ाइल का आकार: लॉग-नॉर्मल या पावर लॉ के अनुसार होता है, जिसमें कुछ बहुत बड़ी फ़ाइलें और कई छोटी फ़ाइलें होती हैं।
- मानव जीवनकाल/दीर्घायु: दाईं ओर झुका हुआ (इसके साथ मॉडल किया जा सकता है) वाइबुल या गोम्पर्ट्ज़ वितरण), सामान्य नहीं; अधिक लोग वृद्धावस्था में मरते हैं।
- सोशल नेटवर्क कनेक्शन एक शक्ति नियम का पालन करते हैं: कुछ उपयोगकर्ताओं के पास कई कनेक्शन होते हैं; अधिकांश के पास कुछ ही होते हैं।
इनमें से अधिकांश की विशेषता "कुछ बड़े, कई छोटे" है, जो पावर लॉ, हेवी टेल्स, एक्सपोनेंशियल या लॉग-नॉर्मल डिस्ट्रीब्यूशन की पहचान है, न कि गॉसियन के सममित आकार की।
टी-टेस्ट (स्टूडेंट का टी-टेस्ट)
विलियम सीली गोसेट द्वारा 1908 में "स्टूडेंट" उपनाम से विकसित टी-टेस्ट (जिसे "स्टूडेंट का टी" भी कहा जाता है) एक सांख्यिकीय परीक्षण है जिसका उपयोग तब किया जाता है जब नमूने का आकार छोटा हो और जनसंख्या का विचरण अज्ञात हो। दो जनसंख्याओं के माध्यों की तुलना पर केंद्रित यह परीक्षण विनिर्माण क्षेत्र में सबसे अधिक उपयोग किए जाने वाले परीक्षणों में से एक है।

उद्देश्य: टी-टेस्ट इंजीनियरों और गुणवत्ता विशेषज्ञों को यह निर्धारित करने में मदद करता है कि क्या दो समूहों के माध्यों के बीच या नमूना माध्य और ज्ञात मानक के बीच सांख्यिकीय रूप से महत्वपूर्ण अंतर है। इसका उपयोग आमतौर पर परिकल्पना परीक्षण में यह मूल्यांकन करने के लिए किया जाता है कि क्या प्रक्रिया परिवर्तनों या उत्पाद संशोधनों का कोई प्रभाव पड़ा है। नेतृत्व किया वास्तविक सुधारों या अंतरों के लिए, जो संयोग से अपेक्षित से परे हों।
उद्योग में व्यावहारिक उदाहरण:
- ऑटोमोबाइल निर्माण में, गुणवत्ता में निरंतरता सुनिश्चित करने के लिए दो अलग-अलग आपूर्तिकर्ताओं से प्राप्त स्टील की तन्यता शक्ति की तुलना करने के लिए टी-टेस्ट का उपयोग किया जा सकता है।
- फार्मास्यूटिकल्स में, टी-टेस्ट का उपयोग यह विश्लेषण करने के लिए किया जाता है कि क्या एक नई उत्पादन प्रक्रिया से प्राप्त गोलियों का औसत वजन मानक से काफी अलग है।
- इलेक्ट्रॉनिक्स में, इंजीनियर यह सत्यापित करने के लिए टी-टेस्ट का उपयोग कर सकते हैं कि क्या डिज़ाइन परिवर्तन में एक circuit board इसके परिणामस्वरूप विद्युत प्रतिरोध में मापने योग्य सुधार होता है।
छात्र के टी-टेस्ट को कैसे करें
टी-टेस्ट के कई प्रकार होते हैं; यहां दिया गया उदाहरण तथाकथित "दो-नमूना टी-टेस्ट" के "अयुग्मित" संस्करण पर केंद्रित होगा, जिसमें दो अलग-अलग उत्पादन बैचों के नमूनों की तुलना की जाएगी।
- अपनी शून्य और वैकल्पिक परिकल्पनाएँ बताइए; इस उदाहरण में “माध्यों में कोई अंतर नहीं है” बनाम “माध्यों में अंतर है”।
- तुलना किए जा रहे दो उत्पादन बैचों से अपना डेटा एकत्र करें और गणना करें
- दो नमूना माध्य \(\bar{X} = \frac{1}{n_1} \sum_{i=1}^{n_1} X_i\) और \(\bar{Y} = \frac{1}{n_2} \sum_{j=1}^{n_2} Y_j\)
- दो नमूना प्रसरणों की गणना करें: (S_X^2 = frac{1}{n_1-1} sum_{i=1}^{n_1} (X_i – bar{X})^2) और (S_Y^2 = frac{1}{n_2-1} sum_{j=1}^{n_2} (Y_j – bar{Y})^2)
- नमूना आकार।
- परीक्षण सांख्यिकी की गणना करें। हालांकि यह विधि मानती है कि दोनों नमूने स्वतंत्र हैं और दोनों नमूने सामान्य रूप से वितरित जनसंख्या से हैं, फिर भी दो स्थितियाँ हैं:
- यदि समान प्रसरण मान लिए जाएं ('पूल्ड' टी-टेस्ट: पूल्ड विचरण: (S_p^2 = frac{ (n_1-1)S_X^2 + (n_2-1)S_Y^2 }{ n_1 + n_2 – 2 })
परीक्षण सांख्यिकी: (t = frac{ bar{X} – bar{Y} }{ S_p sqrt{ frac{1}{n_1} + frac{1}{n_2} } }) - यदि असमान प्रसरण (वेल्च का टी-परीक्षण): परीक्षण सांख्यिकी: (t = frac{ bar{X} – bar{Y} }{ sqrt{ frac{S_X^2}{n_1} + frac{S_Y^2}{n_2} } }) स्वतंत्रता की डिग्री (अनुमानित, वेल्च-सैटर्थवेट): (df = frac{left( frac{S_X^2}{n_1} + frac{S_Y^2}{n_2} right)^2}{ frac{ (S_X^2 / n_1)^2 }{ n_1 – 1 } + frac{ (S_Y^2 / n_2)^2 }{ n_2 – 1 } })
- यदि समान प्रसरण मान लिए जाएं ('पूल्ड' टी-टेस्ट: पूल्ड विचरण: (S_p^2 = frac{ (n_1-1)S_X^2 + (n_2-1)S_Y^2 }{ n_1 + n_2 – 2 })
- परिकलित (t) और स्वतंत्रता की डिग्री (समान प्रसरण के लिए \(n_1+n_2-2\) या वेल्च सूत्र) का उपयोग करके टी-वितरण से पी-मान को देखें या उसकी गणना करें (यह इस बात पर निर्भर करता है कि यह एक-पूंछ वाला परीक्षण है या दो-पूंछ वाला परीक्षण)।
- परिणाम: चुने गए आत्मविश्वास स्तर और स्वतंत्रता की डिग्री के आधार पर सांख्यिकीय सारणियों से प्राप्त महत्वपूर्ण t-मान के साथ परिकलित t-मान की तुलना करें; वैकल्पिक रूप से, p-मान के लिए सॉफ़्टवेयर का उपयोग करें। यदि t-सांख्यिकी महत्वपूर्ण मान से अधिक है या p-मान आपके निर्धारित सीमा (आमतौर पर 0.05) से कम है, तो शून्य परिकल्पना को अस्वीकार करें।
से लिंक करें टी-टेस्ट महत्वपूर्ण मान तालिका
The rest of this article is reserved for members
To limit scraping bots (currently 40,000 hits per day!),
we had to restrict access to full articles and tools to registered members only.
to access all the rest.











