Product Design, Manufacturing & Innovation Resources
» 제품 디자인 » 방법론 » 품질 엔지니어링을 위한 필수 통계 테스트 6가지

품질 엔지니어링을 위한 필수 통계 테스트 6가지

statistical tests for quality and engineering

Statistical tests are the only way in quality and manufacturing to provide objective evidence for decision-making. They help identify variations in processes and distinguish between random fluctuations and actual problems. In engineering, statistics help identify patterns, outliers, and sources of failure in system performance, ensuring data-driven decision-making. By rigorously analyzing experimental results, engineers can validate product designs and manufacturing processes, detecting potential problems before implementation. This systematic approach reduces the risk of unexpected failures and enhances overall safety by ensuring reliability and compliance with international safety 표준.

이 글에서는 제조 분야에서 사용되는 주요 통계 검정들을 검토하고… 전사적 품질 관리 (TQM).

참고: 다음 두 가지 통계 테스트 및 분석은 공학, 연구 및 과학과도 관련이 있으므로 함께 제시합니다.

  • 상관 분석: 두 변수 간의 관계의 강도와 방향을 측정합니다(예: 피어슨 상관계수).
  • 회귀 분석: 단순 선형 회귀 분석부터 다중 회귀 분석까지, 변수(예: 입력 요소와 공정 출력) 간의 관계를 조사합니다.

이 내용은 여기에 포함되어 있지 않지만, 엔지니어링 분야의 주요 알고리즘 10가지에 대한 특정 기사에 자세히 설명되어 있습니다.

정규성 검정

A well-lit laboratory setting, with a desk displaying various scientific equipment - beakers, pipettes, and a microscope. In the center, a whiteboard showcases a clear step-by-step process of hypothesis testing, with equations and diagrams explaining the fundamentals. The background features a bookshelf filled with technical manuals and industry-specific literature, conveying an atmosphere of academic rigor and attention to detail. The overall mood is one of scientific inquiry and problem-solving, with a focus on the systematic approach to quality control.
품질 및 엔지니어링 분야에서 가장 많이 사용되는 통계적 검정 방법을 나열하십시오.

통계 검정 분야에서 흔히 사용되는 많은 통계 방법(t-검정, 분산 분석, 선형 회귀 분석 등)은 데이터가 정규 분포를 따른다고 가정합니다(또는 잔차/오차가 정규 분포를 따른다고 가정합니다). 이러한 가정을 위반하면 결과가 신뢰할 수 없게 될 수 있습니다. p값이 오해의 소지가 생기고, 신뢰 구간이 잘못될 수 있으며, 제1종/제2종 오류의 위험이 증가합니다. 다만, 일원 분산 분석과 같은 일부 검정은 비정규 분포도 비교적 잘 처리할 수 있습니다.

참고: 데이터가 정규 분포를 따르지 않는 경우(아래 실제 사례 참조), 정규 분포를 가정하지 않는 비모수 검정(예: Mann-Whitney U 검정 또는 Kruskal-Wallis 검정)을 사용하거나 데이터를 변환해야 할 수 있습니다. 하지만 이러한 방법은 이 글의 범위를 벗어납니다.

이를 위한 여러 통계적 검정 방법이 있지만, 여기서는 특히 표본 크기가 작은 경우(일반적으로 n < 50)에 유용하지만 최대 2000까지 사용할 수 있는 샤피로-윌크 검정에 대해 자세히 설명하겠습니다.

참고로, 다른 일반적인 정규성 검사는 다음과 같습니다.

    • 콜모고로프-스미르노프(KS) 검정(릴리포스 보정 적용): 표본 크기가 클수록 성능이 우수하며, 특히 소규모 데이터셋의 경우 샤피로-윌크 검정보다 민감도가 낮습니다.
    • 앤더슨-달링 검정: 모든 표본 크기에 적합하며, 분포의 꼬리 부분(극단값)에서 민감도가 높고, 극단값에서 정규성에서 벗어나는 것을 감지하는 데 더 강력한 검정력을 갖습니다.

샤피로-윌크 정규성 검정 수행 방법

1. 샤피로-윌크 검정 통계량(W)을 계산하십시오.

(W = frac{left(sum_{i=1}^{n} a_i x_{(i)}right)^2}{sum_{i=1}^{n} (x_i – bar{x})^2})

참고: (a_i) 계수의 계산은 간단하지 않고 일반적으로 표나 알고리즘이 필요하기 때문에 샤피로-윌크 검정은 거의 항상 R, Python의 SciPy, MS 등의 소프트웨어를 사용하여 계산됩니다. 뛰어나다 추가 기능 또는 기타 전용 소프트웨어. 수동 계산을 원하시면 이 페이지를 참조하세요. 최대 50개의 샘플에 대한 모든 (a_i) 계수와 p-값을 제공합니다.

W 값은 0에서 1 사이의 값을 가지며, W = 1은 완벽한 정규성을 나타내고, W < 1은 1에서 멀어질수록 데이터의 정규성이 떨어진다는 것을 의미합니다.

2. W 값만으로는 충분하지 않습니다. 신뢰 수준을 얻으려면 해당 p값과 함께 사용해야 합니다. 샤피로-윌크 표에서, n개의 샘플 크기를 갖는 행에서 계산된 W 값에 가장 가까운 값을 찾아 해당 값을 가져옵니다. 상단에 있는 p값

분자는 가중치가 부여된 정렬된 표본 값의 제곱합을 나타냅니다.

분모는 표본 평균으로부터의 제곱 편차의 합(즉, 표본 분산을 (n-1)로 나눈 값)입니다.

(x_{(i)}) = i번째 순서 통계량(즉, 표본에서 i번째로 작은 값)

(x_i) = i번째 관측값

(bar{x}) = 표본 평균

(a_i) = 표준 정규 분포((N(0,1)))에서 추출한 샘플의 순서 통계량의 평균, 분산 및 공분산으로부터 계산된 상수(가중치)이며 n(샘플 크기)에만 의존합니다.

n = 표본 크기

3. 결과: p값이 선택된 유의수준(예: 0.05)보다 크면, 검정 대상 데이터가 정규분포를 따른다는 통계적 근거가 있다고 볼 수 있습니다.

정규성 검정을 위해서는 수치적 방법과 헨리 선, QQ 플롯 또는 히스토그램과 같은 그래프적 방법을 함께 사용하는 것이 흔히 권장됩니다.

비정규 분포에 주의하세요!

정규/가우스 분포가 가장 흔한 경우이지만, 자동으로 가정해서는 안 됩니다. 일상적으로 접하는 반례는 다음과 같습니다.

  • 개인 간의 부와 소득 분배는 파레토 분포(멱법칙 분포)를 따르며, 매우 부유한 사람들이 긴 꼬리 형태로 분포하는 비대칭적인 형태를 보인다.
  • 한 국가의 도시 인구 규모는 소수의 매우 큰 도시와 다수의 작은 마을로 구성된 지프의 법칙(멱법칙)을 따른다.
  • 지진의 규모와 빈도는 멱법칙/구텐베르크-리히터 분포를 따릅니다. 즉, 작은 지진은 흔하고 큰 지진은 드뭅니다.
  • 금융 시장의 일일 가격 변동 또는 수익률은 가우시안 분포가 아닌 두꺼운 꼬리 분포를 따르며, 정규 분포에서 예측하는 것보다 큰 편차가 더 자주 발생합니다.
  • 언어에서 단어의 빈도는 위의 도시 인구 분포와 마찬가지로 지프의 법칙(멱법칙)을 따릅니다. 즉, 자주 사용되는 단어는 소수이고, 대부분의 단어는 드물게 사용됩니다.
  • 인터넷 트래픽/웹사이트 인기: 멱법칙/롱테일: 일부 사이트는 수백만 건의 조회수를 기록하지만, 대부분의 사이트는 조회수가 매우 적습니다.
  • 컴퓨터 시스템의 파일 크기는 로그 정규 분포 또는 멱법칙 분포를 따르며, 매우 큰 파일 몇 개와 작은 파일 다수로 구성됩니다.
  • 인간 수명/장수: 오른쪽으로 치우친 분포 (모델링 가능) 와이블 (곰페르츠 분포와 같은) 정규 분포가 아니며, 고령층에서 사망률이 더 높습니다.
  • 소셜 네트워크 연결은 멱법칙을 따른다. 소수의 사용자는 많은 연결을 갖고 있고, 대부분의 사용자는 적은 연결을 갖고 있다.

이러한 분포의 대부분은 '큰 값은 적고 작은 값은 많다'는 특징을 가지며, 멱법칙, 두꺼운 꼬리, 지수 분포 또는 로그정규 분포와 같은 특징을 보이고, 가우시안 분포처럼 대칭적인 형태를 띠지는 않습니다.

 

t-검정(스튜던트 t-검정)

1908년 윌리엄 실리 고셋이 '스튜던트'라는 가명으로 개발한 t-검정(또는 '스튜던트의 t-검정')은 표본 크기가 작고 모집단 분산을 알 수 없을 때 평균을 비교하는 데 사용되는 통계 검정입니다. 두 모집단의 평균을 비교하는 데 초점을 맞추고 있으며, 제조업 분야에서 가장 널리 사용되는 검정 중 하나입니다.

A meticulously crafted laboratory setting, with an array of scientific instruments and test equipment laid out on a sleek, modern workbench. Beakers, test tubes, and digital displays cast a soft, ambient glow, illuminated by precise, directional lighting from overhead. In the foreground, a statistical analysis program is open on a computer screen, displaying complex graphs and charts. The middle ground features an engineer in a white lab coat carefully recording data, while the background showcases a wall of technical diagrams and engineering schematics. The overall atmosphere conveys a sense of analytical rigor, technical expertise, and a commitment to quality control.
다양한 과학 기기들이 통계적 검정을 수행하는 실험실 환경.

목적: t-검정은 엔지니어와 품질 전문가가 두 그룹의 평균 간 또는 표본 평균과 알려진 표준 간에 통계적으로 유의미한 차이가 있는지 판단하는 데 도움이 됩니다. 이는 일반적으로 공정 변경이나 제품 수정이 효과가 있는지 평가하기 위한 가설 검정에 사용됩니다. ~ 주도의 우연에 의해 예상되는 것 이상의 실질적인 개선이나 차이를 가져옵니다.

업계의 실제 사례:

  • 자동차 제조에서 t-검정은 서로 다른 두 공급업체의 강철 인장 강도를 비교하여 일관된 품질을 보장하는 데 사용될 수 있습니다.
  • 제약 분야에서 t-검정은 새로운 생산 공정이 표준과 유의미하게 다른 평균 중량의 정제를 생산하는지 분석하는 데 사용됩니다.
  • 전자공학에서 엔지니어는 t-검정을 사용하여 특정 조건이 충족되는지 확인할 수 있습니다. 디자인 변경 에서 회로 기판 그 결과 전기 저항이 눈에 띄게 향상됩니다.

학생 t-검정 방법

t-검정에는 여러 변형이 있지만, 여기서는 두 개의 서로 다른 생산 배치에서 추출한 샘플을 비교하는 소위 '비대응' 버전의 '두 표본 t-검정'에 초점을 맞추겠습니다.

  1. 귀무가설과 대립가설을 명시하십시오. 이 예시에서는 '평균 간에 차이가 없다'와 '평균 간에 차이가 있다'입니다.
  2. 비교 대상인 두 생산 배치에서 데이터를 수집하고 계산하세요.
    • 두 표본 평균은 (bar{X} = frac{1}{n_1} sum_{i=1}^{n_1} X_i) 및 (bar{Y} = frac{1}{n_2} sum_{j=1}^{n_2} Y_j)입니다.
    • 두 표본 분산을 계산합니다. (S_X^2 = frac{1}{n_1-1} sum_{i=1}^{n_1} (X_i – bar{X})^2) 및 (S_Y^2 = frac{1}{n_2-1} sum_{j=1}^{n_2} (Y_j – bar{Y})^2)
    • 표본 크기.
  3. 검정 통계량을 계산합니다. 이 방법은 두 표본이 서로 독립적이고 두 표본 모두 정규 분포를 따르는 모집단에서 추출되었다고 가정하지만, 여전히 두 가지 경우가 있습니다.
    • 등분산 가정 시 (통합 t-검정): 통합 분산: (S_p^2 = frac{ (n_1-1)S_X^2 + (n_2-1)S_Y^2 }{ n_1 + n_2 – 2 })
      검정 통계량: (t = frac{ bar{X} – bar{Y} }{ S_p sqrt{ frac{1}{n_1} + frac{1}{n_2} } })
    • 분산이 같지 않은 경우 (웰치 t-검정): 검정 통계량: (t = frac{ bar{X} – bar{Y} }{ sqrt{ frac{S_X^2}{n_1} + frac{S_Y^2}{n_2} } }) 자유도(근사치, 웰치-새터스웨이트): (df = frac{left( frac{S_X^2}{n_1} + frac{S_Y^2}{n_2} right)^2}{ frac{ (S_X^2 / n_1)^2 }{ n_1 – 1 } + frac{ (S_Y^2 / n_2)^2 }{ n_2 – 1 } })
  4. 계산된 (t) 값과 자유도((n_1+n_2-2)는 등분산의 경우, 또는 Welch 공식)를 사용하여 t 분포에서 p값을 찾거나 계산합니다(단측 검정인지 양측 검정인지에 따라 다름).
  5. 결과: 계산된 t값을 선택한 신뢰 수준과 자유도에 따른 통계표의 임계 t값과 비교하거나, p값을 계산하는 소프트웨어를 사용하십시오. t 통계량이 임계값을 초과하거나 p값이 임계값(일반적으로 0.05)보다 낮으면 귀무 가설을 기각합니다.

링크 t-검정 임계값 표

🔒

The rest of this article is reserved for members

To limit scraping bots (currently 40,000 hits per day!),
we had to restrict access to full articles and tools to registered members only.

Log in →  or  Register (100% free) →

to access all the rest.

다룬 주제: 통계적 검정, 품질 관리, 제조 공정, 객관적 증거, 의사 결정, 정규성 검정, 샤피로-윌크 검정, 비모수 검정, p값, 제1종 오류, 제2종 오류, 데이터 기반, 회귀 분석, 상관 분석, 전사적 품질 관리(TQM), 분산 분석(ANOVA), 신뢰성, ISO 9001, ISO 25010, ISO 31000, ISO 9000, ISO 17025.

역사적 맥락

1974
1974
1978
1980
1980
1980
1980
1972
1974
1975-06-01
1980
1980
1980
1980
1980

(날짜를 알 수 없거나 관련이 없는 경우, 예를 들어 "유체역학"의 경우, 주목할 만한 등장 시기를 대략적으로 추정하여 제공합니다.)

인기 게시물 및 기사

최고급 오리지널 도구

고화질 이미지 및 다운로드는 등록된 회원에게만 100% 무료로 제공됩니다.

> 로그인 <