Product Design, Manufacturing & Innovation Resources
» 製品デザイン » 方法論 » 品質工学で必ず知っておくべき6つの統計的検定

品質工学で必ず知っておくべき6つの統計的検定

statistical tests for quality and engineering

Statistical tests are the only way in quality and manufacturing to provide objective evidence for decision-making. They help identify variations in processes and distinguish between random fluctuations and actual problems. In engineering, statistics help identify patterns, outliers, and sources of failure in system performance, ensuring data-driven decision-making. By rigorously analyzing experimental results, engineers can validate product designs and manufacturing processes, detecting potential problems before implementation. This systematic approach reduces the risk of unexpected failures and enhances overall safety by ensuring reliability and compliance with international safety 基準.

この記事では、製造業で使用されている主な統計的検定について解説します。 総合品質管理 (TQM).

注:これらは工学、研究、科学にも関係するため、以下の2つの統計的検定と分析

  • 相関分析: 2 つの変数間の関係の強さと方向を測定します (例: ピアソン 相関係数)。
  • 回帰分析: 変数間の関係(例えば、入力要因とプロセス出力)を、単純線形回帰から重回帰まで分析する。

それらはここには含まれていませんが、工学における主要な10個のアルゴリズムに関する特定の記事に記載されています。

正規性検定

A well-lit laboratory setting, with a desk displaying various scientific equipment - beakers, pipettes, and a microscope. In the center, a whiteboard showcases a clear step-by-step process of hypothesis testing, with equations and diagrams explaining the fundamentals. The background features a bookshelf filled with technical manuals and industry-specific literature, conveying an atmosphere of academic rigor and attention to detail. The overall mood is one of scientific inquiry and problem-solving, with a focus on the systematic approach to quality control.
品質管理およびエンジニアリング分野で最もよく使用される統計的検定方法を列挙してください。

統計検定の世界では、多くの一般的な統計手法(t検定、ANOVA、線形回帰など)は、データが正規分布(ガウス分布)に従う(または残差/誤差が正規分布に従う)ことを前提としています。この前提に反すると、結果の信頼性が損なわれる可能性があります。p値が誤解を招く可能性があり、信頼区間が誤っている可能性があり、第一種/第二種過誤のリスクが高まります。ただし、一元配置分散分析(1-way ANOVA)のように、非正規分布にも比較的うまく対応できる検定もあります。

注:データが正規分布に従わない場合(以下の実例を参照)、正規分布を仮定しないノンパラメトリック検定(マン・ホイットニーU検定やクラスカル・ウォリス検定など)を使用するか、データを変換する必要があるかもしれません。ただし、これらの方法は本記事の範囲外です。

この目的のためにいくつかの統計的検定が存在するが、ここでは特にサンプルサイズが小さい場合に有名なシャピロ・ウィルク検定について詳しく説明する。通常n < 50だが、最大2000まで使用できる。

参考までに、その他の一般的な正規性検査は以下のとおりです。

    • コルモゴロフ・スミルノフ(KS)検定(リリフォース補正付き):サンプルサイズが大きいほど性能が向上するが、特に小規模データセットではシャピロ・ウィルク検定よりも感度が低い。
    • アンダーソン・ダーリング検定:あらゆるサンプルサイズで有効であり、分布の両端(裾野)においてより高い感度を持ち、極端な値における正規性からの逸脱を検出する能力が高い。

シャピロ・ウィルク正規性検定の実施方法

1. シャピロ・ウィルク検定統計量(W)を計算します。

(W = frac{left(sum_{i=1}^{n} a_i x_{(i)}right)^2}{sum_{i=1}^{n} (x_i – bar{x})^2})

注: (a_i) 係数の計算は簡単ではなく、一般的に表またはアルゴリズムが必要となるため、シャピロ-ウィルク検定はほとんどの場合、R、Python の SciPy、MS などのソフトウェアで計算されます。 Excel アドオンやその他の専用ソフトウェア。 手動計算の場合は、このページ サンプル数が最大 50 までのすべての (a_i) 係数と p 値を提供します。

Wの値は0から1の範囲です(W = 1:完全な正規分布。W < 1:1から離れるほど、データは正規分布から外れます)。

2. Wだけでは不十分です。信頼水準を得るには、対応するp値と組み合わせて使用​​します。シャピロ・ウィルク表では、 n サンプルサイズの行で、計算した W に最も近い値を探し、それに対応する値を取得します。 上部にp値を表示

分子は、重み付けされた順序付きサンプル値の二乗和を表します。

分母は標本平均からの偏差の二乗の合計(つまり、標本分散を(n-1)倍したもの)です。

(x_{(i)}) = i番目の順序統計量(つまり、サンプル中のi番目に小さい値)

(x_i) = i 番目の観測値

(bar{x}) = 標本平均

(a_i) = 標準正規分布 ((N(0,1))) からの標本の順序統計量の平均、分散、共分散から計算される定数 (重み) であり、n (標本サイズ) のみに依存します。

n = サンプルサイズ

3. 結果: p値が選択した有意水準(例:0.05)より大きい場合、テスト対象のデータが正規分布しているという統計的証拠がある。

正規性検定では、数値的手法とヘンリーの線、QQプロット、ヒストグラムなどのグラフ的手法を組み合わせることがよく推奨されます。

非正規分布に注意!

正規分布(ガウス分布)が最も頻繁に見られるケースではあるが、それを自動的に仮定すべきではない。日常的な反例としては以下のようなものがある。

  • 個人間の富と所得の分布。これはパレート分布(べき乗則)に従うが、非常に裕福な個人が「長い裾野」を占めるという偏りがある。
  • 国の都市の人口規模はジップの法則(べき乗則)に従い、ごく少数の非常に大きな都市と多数の小さな町が存在する。
  • 地震の規模と発生頻度はべき乗則/グーテンベルク・リヒター分布に従う。つまり、小規模な地震は頻繁に発生するが、大規模な地震はまれである。
  • 金融市場における日々の価格変動や収益率:正規分布ではなく、裾の厚い分布(ファットテール分布)となる。大きな変動は、正規分布で予測されるよりも頻繁に発生する。
  • 言語における単語の出現頻度は、上記の都市人口と同様に、ジップの法則(べき乗法則)に従います。つまり、頻繁に使用される単語は少なく、ほとんどの単語はまれにしか使用されません。
  • インターネットのトラフィック/ウェブサイトの人気度:べき乗則/ロングテール:数百万のアクセスがあるサイトもあれば、ほとんどはごくわずかしかないサイトもある。
  • コンピュータシステムのファイルサイズは、対数正規分布またはべき乗則に従い、ごく少数の非常に大きなファイルと多数の小さなファイルが存在する。
  • 人間の寿命/長寿: 右に偏っている (モデル化可能) ワイブル またはゴンペルツ分布)であり、正規分布ではない。高齢になるほど死亡者数が多くなる。
  • ソーシャルネットワーク上のつながりはべき乗則に従う。つまり、多くのつながりを持つユーザーは少数であり、ほとんどのユーザーは少数のつながりしか持たない。

これらのほとんどは、「少数の大きな値と多数の小さな値」という特徴を持ち、べき乗則、裾の重い分布、指数分布または対数正規分布の特徴であり、ガウス分布のような対称的な形状ではありません。

 

t検定(スチューデントのt検定)

t検定(別名「スチューデントのt検定」)は、1908年にウィリアム・シーリー・ゴセットが「スチューデント」というペンネームで開発した統計的検定法で、標本サイズが小さく、母集団の分散が不明な場合に平均値を比較するために用いられます。2つの母集団の平均値の比較に特化しており、製造業において最もよく用いられる検定法の1つです。

A meticulously crafted laboratory setting, with an array of scientific instruments and test equipment laid out on a sleek, modern workbench. Beakers, test tubes, and digital displays cast a soft, ambient glow, illuminated by precise, directional lighting from overhead. In the foreground, a statistical analysis program is open on a computer screen, displaying complex graphs and charts. The middle ground features an engineer in a white lab coat carefully recording data, while the background showcases a wall of technical diagrams and engineering schematics. The overall atmosphere conveys a sense of analytical rigor, technical expertise, and a commitment to quality control.
統計的検定を行うための様々な科学機器を備えた実験室環境。

目的: t検定は、エンジニアや品質管理担当者が、2つのグループの平均値間、または標本平均値と既知の標準値との間に統計的に有意な差があるかどうかを判断するのに役立ちます。これは、プロセス変更や製品変更が統計的に有意な差をもたらすかどうかを評価するための仮説検定でよく使用されます。 導かれた 偶然では期待できない、真の改善や差異をもたらす。

業界における具体的な事例:

  • 自動車製造においては、t検定を用いて、異なる2つのサプライヤーから供給された鋼材の引張強度を比較し、品質の一貫性を確保することがある。
  • 医薬品分野では、t検定は、新しい製造プロセスによって製造される錠剤の平均重量が、標準値と有意に異なるかどうかを分析するために使用される。
  • 電子工学では、エンジニアはt検定を使用して、 デザイン変更回路基板 その結果、電気抵抗が測定可能なほど改善される。

スチューデントのt検定の実施方法

t検定には多くのバリエーションがありますが、ここでは、いわゆる「2標本t検定」の「非対応」バージョンに焦点を当て、2つの異なる生産バッチの標本を比較します。

  1. 帰無仮説と対立仮説を述べてください。この例では、「平均値に差はない」と「平均値に差がある」です。
  2. 比較対象の2つの生産バッチからデータを収集し、計算します。
    • 2つの標本平均は、(bar{X} = frac{1}{n_1} sum_{i=1}^{n_1} X_i) および (bar{Y} = frac{1}{n_2} sum_{j=1}^{n_2} Y_j) である。
    • 2 つの標本分散を計算します: (S_X^2 = frac{1}{n_1-1} sum_{i=1}^{n_1} (X_i – bar{X})^2) および (S_Y^2 = frac{1}{n_2-1} sum_{j=1}^{n_2} (Y_j – bar{Y})^2)
    • サンプルサイズ。
  3. 検定統計量を計算します。この方法は、両方のサンプルが独立しており、両方のサンプルが正規分布母集団から抽出されたものであることを前提としていますが、それでも次の2つのケースが考えられます。
    • 等分散を仮定した場合 (プールされたt検定): プールされた分散: (S_p^2 = frac{ (n_1-1)S_X^2 + (n_2-1)S_Y^2 }{ n_1 + n_2 2 })
      検定統計量: (t = frac{ bar{X} – bar{Y} }{ S_p sqrt{ frac{1}{n_1} + frac{1}{n_2} } })
    • 分散が等しくない場合 (ウェルチのt検定): 検定統計量: (t = frac{ bar{X} – bar{Y} }{ sqrt{ frac{S_X^2}{n_1} + frac{S_Y^2}{n_2} } }) 自由度 (近似値、ウェルチ・サタースウェイト): (df = frac{left( frac{S_X^2}{n_1} + frac{S_Y^2}{n_2} right)^2}{ frac{ (S_X^2 / n_1)^2 }{ n_1 – 1 } + frac{ (S_Y^2 / n_2)^2 }{ n_2 – 1 } })
  4. 計算された ( t ) と自由度 (等分散の場合は (n_1+n_2-2)、またはウェルチの公式) を使用して、t 分布から p 値を調べたり計算したりします (片側検定か両側検定かによって異なります)。
  5. 結果: 計算したt値を、選択した信頼水準と自由度に基づいた統計表の臨界t値と比較します。あるいは、p値の計算にはソフトウェアを使用します。t統計量が臨界値を超える場合、またはp値が閾値(通常は0.05)を下回る場合は、帰無仮説を棄却します。

リンク先 t検定の臨界値表

🔒

The rest of this article is reserved for members

To limit scraping bots (currently 40,000 hits per day!),
we had to restrict access to full articles and tools to registered members only.

Log in →  or  Register (100% free) →

to access all the rest.

取り上げるトピック: 統計的検定、品質管理、製造プロセス、客観的証拠、意思決定、正規性検定、シャピロ・ウィルク検定、ノンパラメトリック検定、p値、第一種過誤、第二種過誤、データ駆動型、回帰分析、相関分析、総合品質管理(TQM)、ANOVA、信頼性、ISO 9001、ISO 25010、ISO 31000、ISO 9000、およびISO 17025。

歴史的背景

1974
1974
1978
1980
1980
1980
1980
1972
1974
1975-06-01
1980
1980
1980
1980
1980

(日付が不明または関連性がない場合、例えば「流体力学」などでは、その注目すべき出現時期の概算値が提示されます。)

フルサイズの画像とダウンロードは、登録会員のみが100%無料で利用できます。