Product Design, Manufacturing & Innovation Resources
» 로지스틱 회귀

로지스틱 회귀

1960
  • David Cox
의료 및 금융 애플리케이션을 위한 로지스틱 회귀 데이터를 분석하는 통계학자입니다.

(설명을 위한 생성된 이미지입니다)

범주형, 일반적으로 이진 종속 변수에 대한 회귀 모델입니다. 결과 변수를 직접 모델링하는 대신, 로지스틱(시그모이드) 함수를 사용하여 결과 변수의 발생 확률을 모델링합니다. 이 모델은 독립 변수들의 선형 조합으로 사건의 로그 오즈를 예측합니다. [latex]ln(frac{p}{1-p}) = beta_0 + beta_1 x_1 + dots + beta_p x_p[/latex], 여기서 p는 사건의 확률입니다.

로지스틱 회귀는 이진 분류 문제에 사용되는 기본적인 알고리즘입니다. 이는 결과 변수가 연속형이 아닌 경우로 선형 회귀의 개념을 확장한 일반화 선형 모델(GLM)의 한 유형입니다. 선형 회귀를 이진(0/1) 결과 변수에 직접 적용하면 논리적 범위 [0, 1]을 벗어나는 예측 확률이 생성될 수 있고, 오차 분산이 일정하다는 최소제곱법(OLS)의 가정을 위반하기 때문에 문제가 발생합니다.

로지스틱 회귀는 연결 함수를 사용하여 결과값을 변환함으로써 이 문제를 해결합니다. 로지스틱 회귀는 성공 확률(p)과 실패 확률(1-p)의 비율입니다. 이 변환식 [latex]text{logit}(p) = ln(p/(1-p))[/latex]는 확률을 [0, 1] 범위에서 전체 실수 범위 [latex](-∞, +∞)[/latex]로 매핑하여 선형 모델에 적합하게 만듭니다.

확률로 돌아가기 위해 로짓 함수의 역함수인 로지스틱 함수 또는 시그모이드 함수를 적용합니다. [latex]p = frac{e^{beta_0 + beta_1 x_1 + dots}}{1 + e^{beta_0 + beta_1 x_1 + dots}}[/latex]. 선형 회귀와 달리, 모수([latex]beta[/latex])는 최소 제곱법으로 추정하지 않습니다. 대신, 일반적으로 최대 우도 추정(MLE)을 사용하여 모수를 구합니다. MLE는 실제 데이터를 관측할 가능성을 최대화하는 모수 값을 찾는 반복적인 과정입니다. 이 모델은 다항 로지스틱 회귀를 통해 다중 클래스 문제를 처리하도록 확장할 수 있습니다.

UNESCO Nomenclature: 1209
통계

유형

소프트웨어/알고리즘

분열

상당한

용법

널리 사용됨

전구체

  • 선형 회귀
  • Probability theory (Bernoulli distribution)
  • 최대우도추정법 (RA 피셔 개발)
  • 프로빗 모델(이진 결과 변수에 대한 초기 모델)
  • 일반화 선형 모델의 개념

응용 프로그램

  • 의학적 진단 (예: 증상을 기반으로 질병 발생 여부 예측)
  • 신용평가 및 재무위험평가
  • 이메일 클라이언트의 스팸 감지
  • customer churn prediction in telecommunications and subscription services
  • 선거 결과 예측

특허:

NA

잠재적 혁신 아이디어

현재 하루 4만 건이 넘는 봇 트래픽을 차단하기 위해 이 콘텐츠는 커뮤니티 회원만 이용할 수 있습니다.
> 로그인 < 또는 >등록 < 이 콘텐츠를 비롯한 모든 제한된 콘텐츠와 도구는 (100% 무료로) 이용할 수 있습니다.

관련 용어: 로지스틱 회귀, 분류, 이진 결과, 시그모이드 함수, 로그 오즈, 최대 우도 추정, 머신 러닝, 예측 모델링, 일반화 선형 모델, 범주형 데이터.

역사적 맥락

로지스틱 회귀

1950
1952
1956
1960
1967
1967
1970
1950
1950
1953
1960
1960
1967
1970
1970

(날짜를 알 수 없거나 관련이 없는 경우, 예를 들어 "유체역학"의 경우, 주목할 만한 등장 시기를 대략적으로 추정하여 제공합니다.)

관련 발명, 혁신 및 기술 원칙

고화질 이미지 및 다운로드는 등록된 회원에게만 100% 무료로 제공됩니다.

> 로그인 <