Statistical tests are the only way in quality and manufacturing to provide objective evidence for decision-making. They help identify variations in processes and distinguish between random fluctuations and actual problems. In engineering, statistics help identify patterns, outliers, and sources of failure in system performance, ensuring data-driven decision-making. By rigorously analyzing experimental results, engineers can validate product designs and manufacturing processes, detecting potential problems before implementation. This systematic approach reduces the risk of unexpected failures and enhances overall safety by ensuring reliability and compliance with international safety المعايير.
This post will review main statistical tests used in manufacturing and إدارة الجودة الشاملة (إدارة الجودة الشاملة).
ملاحظة: نظرًا لأنها تتعلق أيضًا بالهندسة والبحث والعلوم، فإن الاختبارات والتحليلات الإحصائية 2 التالية
- تحليل الارتباط: measures the strength and direction of the relationship between two variables (e.g., بيرسون correlation coefficient).
- تحليل الانحدار: فحص العلاقة بين المتغيرات (على سبيل المثال، عوامل المدخلات ومخرجات العملية)، من الانحدار الخطي البسيط إلى الانحدار المتعدد.
ليست مدرجة هنا ولكن في مقال محدد عن الخوارزميات العشر الرئيسية للهندسة.
اختبارات التطبيع

في عالم الاختبارات الإحصائية، تفترض العديد من الأساليب الإحصائية الشائعة (اختبارات t، و ANOVA، والانحدار الخطي، وما إلى ذلك) أن البيانات موزعة بشكل طبيعي/غاوسي (أو أن البقايا/الأخطاء طبيعية). يمكن أن يؤدي انتهاك هذا الافتراض إلى جعل النتائج غير موثوقة: يمكن أن تكون قيم p مضللة، وقد تكون فترات الثقة خاطئة، ويزداد خطر حدوث أخطاء من النوع الأول/الثاني. لاحظ أن بعض الاختبارات، مثل اختبار ANOVA أحادي الاتجاه، يمكنها التعامل مع التوزيع غير الطبيعي بشكل معقول.
ملاحظة: إذا كانت بياناتك غير طبيعية، انظر الحالات الواقعية أدناه، فقد تحتاج إلى استخدام اختبارات غير بارامترية (مثل اختبار مان-ويتني يو أو اختبار كروسكال-واليس)، والتي لا تفترض الحالة الطبيعية، أو تحويل بياناتك، وهي خارج نطاق هذا المنشور.
على الرغم من وجود العديد من الاختبارات الإحصائية لهذا الغرض، إلا أننا سنفصّل هنا اختبار شابيرو-ويلك المشهور خاصةً لأحجام العينات الصغيرة، عادةً ما تكون ن < 50، ولكن يمكن استخدامه حتى 2000.
لمعلوماتك، اختبارات التطبيع الشائعة الأخرى
-
- اختبار Kolmogorov-Smirnov (K-S) (مع تصحيح Lilliefors): يعمل بشكل أفضل مع أحجام العينات الأكبر بينما يكون أقل حساسية من اختبار Shapiro-Wilk خاصةً لمجموعات البيانات الصغيرة
- اختبار أندرسون-دارلينغ: جيد مع جميع أحجام العينات ولديه حساسية أكبر في ذيول (الحدود القصوى) للتوزيع، بينما يكون أكثر قوة في الكشف عن الانحرافات عن الحالة الطبيعية في الحدود القصوى.
كيفية إجراء اختبار شابيرو-ويلك للمعيارية
|
1. احسب أو احسب إحصائية اختبار شابيرو-ويلك (W): [latex]W = \frac{\lft(\sum_{{i={i=1}^{n} a_i x_{(i)}\(i)}\right)^2}{{{sum_{{i={1=}^{n} (x_i - \bar{x})^2}[/latex] Note: as the calculation of the [latex]a_i[/latex] coefficients is nontrivial and generally requires a table or algorithm, which is why the Shapiro-Wilk test is nearly always computed by software such as R, Python’s SciPy, MS إكسل add-ons or other dedicated softwares. لإجراء عملية حسابية يدوية، هذه الصفحة يوفر جميع معاملات [latex]a_i[/latex] وقيمة p للعينات حتى 50. وتتراوح قيمة W بين 0 و1 (W = 1: الحالة الطبيعية الكاملة. W < 1: كلما كانت القيمة W < 1: كلما كانت أبعد من 1، كلما كانت بياناتك أقل طبيعية). 2. W ليست كافية. فهي تعمل بالاقتران مع قيمة p-قيمة p المقابلة لها للحصول على مستوى الثقة. في جدول شابيرو-ويلك، عند صف حجم العينة n، ابحث عن أقرب قيمة لحجم العينة المحسوبة W واحصل على القيمة المقابلة لها قيمة p في الأعلى |
يمثل البسط المجموع التربيعي لقيم العينة المرتبة المرجحة. المقام هو مجموع الانحرافات التربيعية عن الوسط الحسابي للعينة (أي تباين العينة، مقسومًا على (ن-1)). [latex]x_{(i)}[/latex] = الإحصاء من الرتبة i (أي أصغر قيمة i في العينة) [latex]x_i[/latex] = القيمة المرصودة i- [latex]\bar{x}[/latex] = متوسط العينة [latex]a_i[/latex] = الثوابت (الأوزان) المحسوبة من المتوسط والتباينات والتباينات المشتركة لإحصائيات الرتبة لعينة من توزيع طبيعي معياري ((N(0,1))، وتعتمد فقط على n (حجم العينة). ن = حجم العينة |
|
3. النتيجة: إذا كانت قيمة p أكبر من مستوى ألفا المختار (مثال 0.05)، فهناك دليل إحصائي على أن البيانات المختبرة موزعة بشكل طبيعي. |
|
لاختبار الحالة الطبيعية، يُنصح في كثير من الأحيان بمزج طريقة عددية مع طريقة بيانية مثل خط هنري أو مخططات Q-Q أو الرسوم البيانية :
ضع في اعتبارك التوزيعات غير الطبيعية!
على الرغم من أن التوزيع الطبيعي/غاوسي هو الحالة الأكثر شيوعًا، إلا أنه لا ينبغي افتراضه تلقائيًا. ومن بين الأمثلة المضادة اليومية:
- توزيع الثروة والدخل بين الأفراد. ويتبع توزيع باريتو (قانون القوة)، وهو توزيع منحرف مع وجود “ذيل طويل” من الأفراد الأثرياء جداً.
- تتبع أحجام سكان المدن في بلد ما قانون زيبف (قانون القوة)، مع وجود عدد قليل جدًا من المدن الكبيرة جدًا والعديد من البلدات الصغيرة.
- إن مقادير الزلازل وتواترها هي قانون قوة/توزيع غوتنبرغ-ريختر: الزلازل الصغيرة شائعة، والكبيرة نادرة.
- التغيرات اليومية في الأسعار أو العوائد اليومية في الأسواق المالية: التوزيعات ذات الذيل السمين/الثقيل الذيل، وليست غاوسية؛ تحدث الانحرافات الكبيرة بشكل متكرر أكثر مما يتوقعه التوزيع الطبيعي.
- ترددات الكلمات في اللغة، مثل سكان المدينة أعلاه، يتبع قانون زيبف (قانون القوة): كلمات قليلة تُستخدم كثيرًا، ومعظم الكلمات نادرة.
- حركة المرور على الإنترنت/شعبية الموقع الإلكتروني: قانون القوة/الذيل الطويل: بعض المواقع تحظى بملايين الزيارات، ومعظمها يحظى بعدد قليل جداً من الزيارات.
- أحجام الملفات على أنظمة الكمبيوتر: لوغاريتم عادي أو قانون القوة، مع وجود عدد قليل جداً من الملفات الكبيرة جداً والعديد من الملفات الصغيرة.
- Human lifespans/longevity: right-skewed (can model with ويبول or Gompertz distributions), not normal; more people die at older ages.
- تتبع اتصالات الشبكة الاجتماعية قانون القوة: عدد قليل من المستخدمين لديهم العديد من الاتصالات؛ ومعظمهم لديهم اتصالات قليلة.
تتميز معظمها بـ “القليل منها كبير والكثير منها صغير”، وهي من سمات قوانين القوة، وذيول ثقيلة، وتوزيعات أسية أو لوغاريتمية أسية أو لوغاريتمية لوغاريتمية وليس بالشكل المتماثل لغاوسي.
اختبار t-Test (اختبار الطالب t-Test)
اختبار t-Test (المعروف أيضًا باسم “t للطالب”)، الذي طوره ويليام سيلي جوسيه تحت اسم مستعار “الطالب” في عام 1908، هو اختبار إحصائي يُستخدم لمقارنة المتوسطات عندما تكون أحجام العينات صغيرة والتباين بين المجتمع غير معروف. يركز هذا الاختبار على مقارنة متوسطات مجموعتين سكانيتين، وهو أحد أكثر الاختبارات استخداماً في مجال التصنيع.

الغرض: the t-Test helps engineers and quality professionals determine if there is a statistically significant difference between the means of two groups or between a sample mean and a known standard. It’s commonly used in hypothesis testing to evaluate whether process changes or product modifications have قاد to real improvements or differences, beyond what could be expected by chance.
أمثلة عملية في هذا المجال:
- في مجال تصنيع السيارات، يمكن استخدام اختبار t-Test لمقارنة قوة الشد للصلب من موردين مختلفين لضمان اتساق الجودة.
- في المستحضرات الصيدلانية، يُستخدم اختبار t-Test لتحليل ما إذا كانت عملية الإنتاج الجديدة تنتج أقراصًا ذات وزن وسطي يختلف اختلافًا كبيرًا عن المعيار.
- In electronics, engineers may use the t-Test to verify if a تغيير التصميم in a لوحة الدائرة الكهربية results in a measurable improvement in electrical resistance.
How-to the Student’s t-Test
They are many variants of the t-test; the example here will focus on a so-called “two-sample t-test” in its “unpaired” version, comparing the samplings of 2 different productions batches.
- State your null and alternative hypotheses; in this example “there is no difference between means” vs “there are different”
- Collect your data from the 2 production batches being compared and calculate
- the 2 sample means [latex]\bar{X} = \frac{1}{n_1} \sum_{i=1}^{n_1} X_i[/latex] and [latex]\bar{Y} = \frac{1}{n_2} \sum_{j=1}^{n_2} Y_j[/latex]
- Calculate the 2 sample variances: [latex]S_X^2 = \frac{1}{n_1-1} \sum_{i=1}^{n_1} (X_i – \bar{X})^2[/latex] and [latex]S_Y^2 = \frac{1}{n_2-1} \sum_{j=1}^{n_2} (Y_j – \bar{Y})^2[/latex]
- sample sizes.
- Calculate the test statistic. While the method assumes both samples are independent & both samples are from normally distributed populations, there is still two cases:
- if equal variances assumed (“pooled” t-test;): Pooled variance: [latex]S_p^2 = \frac{ (n_1-1)S_X^2 + (n_2-1)S_Y^2 }{ n_1 + n_2 – 2 }[/latex]
Test statistic: [latex]t = \frac{ \bar{X} – \bar{Y} }{ S_p \sqrt{ \frac{1}{n_1} + \frac{1}{n_2} } }[/latex] - if unequal variances (Welch’s t-test): Test statistic: [latex]t = \frac{ \bar{X} – \bar{Y} }{ \sqrt{ \frac{S_X^2}{n_1} + \frac{S_Y^2}{n_2} } }[/latex] Degrees of freedom (approximate, Welch-Satterthwaite): [latex]df = \frac{\left( \frac{S_X^2}{n_1} + \frac{S_Y^2}{n_2} \right)^2}{ \frac{ (S_X^2 / n_1)^2 }{ n_1 – 1 } + \frac{ (S_Y^2 / n_2)^2 }{ n_2 – 1 } }[/latex]
- if equal variances assumed (“pooled” t-test;): Pooled variance: [latex]S_p^2 = \frac{ (n_1-1)S_X^2 + (n_2-1)S_Y^2 }{ n_1 + n_2 – 2 }[/latex]
- Use the calculated ( t ) and degrees of freedom ([latex]n_1+n_2-2[/latex] for equal variances, or the Welch formula) to look up or compute the p-value from the t-distribution (depending on whether it’s a one-tailed or two-tailed test).
- النتيجة: compare the calculated t-value with the critical t-value from statistical tables based on your chosen confidence level and degrees of freedom; alternatively, use software for the p-value. If the t-statistic exceeds the critical value or the p-value is below your threshold (typically 0.05), reject the null hypothesis.
Link to the t-Test critical values table
The rest of this article is reserved for members
To limit scraping bots (currently 40,000 hits per day!),
we had to restrict access to full articles and tools to registered members only.
to access all the rest.











