Product Design, Manufacturing & Innovation Resources
Casa » Confondimento algoritmico

Confondimento algoritmico

2020
  • Sharad Goel
  • Ravi Shroff
  • Jennifer Skeem
  • Christopher Slobogin
Team di scienziati dei dati che analizzano il confondimento algoritmico nelle applicazioni AI.

(Immagine generata a solo scopo illustrativo)

Il confondimento algoritmico si verifica quando un procuratore Una variabile utilizzata da un algoritmo è correlata a un attributo protetto (come razza o genere) e anche al risultato di interesse. L'algoritmo potrebbe inavvertitamente imparare a discriminare in base all'attributo protetto utilizzando il proxy, anche se l'attributo protetto stesso è esplicitamente escluso dai dati di input del modello.

Algorithmic confounding is a subtle but powerful source of bias. It arises because machine learning models are exceptionally good at finding statistical correlations, even spurious ones. While a developer might remove a sensitive feature like ‘race’ to prevent discrimination, the model can latch onto other features that act as proxies. A classic example is the use of ZIP codes in loan applications. Due to historical residential segregation, ZIP codes can be highly correlated with race. An algorithm might learn that applicants from certain ZIP codes are higher risk, not because of their location, but because the location is a proxy for a racial group that has historically been denied loans, creating a feedback loop of discrimination.

Questo fenomeno si distingue dal tradizionale confondimento statistico perché l'algoritmo non viene semplicemente tratto in inganno, ma apprende attivamente una politica discriminatoria dai dati. Identificare e mitigare questo problema richiede più della semplice rimozione delle caratteristiche. Spesso implica l'utilizzo di tecniche di inferenza causale per comprendere le vere relazioni tra le variabili, oppure l'impiego di algoritmi che tengano conto dell'equità e che possano essere vincolati a ignorare l'influenza di variabili proxy note. La difficoltà risiede nel fatto che quasi ogni variabile può essere, in una certa misura, una variabile proxy, rendendo difficile la sua completa eliminazione.

UNESCO Nomenclature: 1203
- Informatica

Tipo

Sistema astratto

Interruzione

Incrementale

Utilizzo

Uso diffuso

Precursori

  • concept of confounding variables in statistics and epidemiology
  • legal doctrine of disparate impact
  • research on redlining and housing discrimination
  • development of machine learning classification algorithms

Applicazioni

  • auditing of pre-trial risk assessment tools like COMPAS
  • development of proxy-aware bias detection methods
  • design of fair credit scoring models that avoid redlining proxies
  • improving fairness in automated hiring systems by identifying and mitigating confounding variables

Brevetti:

NA

Idee e potenziali innovazioni

A causa dell'eliminazione del traffico generato dai bot, che attualmente supera i 40.000 al giorno, questo contenuto è riservato ai membri della community.
> Accedi O > Registrati L'accesso a questo contenuto, così come a tutti gli altri contenuti e strumenti riservati, è (100% gratuito).

Argomenti correlati: confondimento algoritmico, variabile proxy, impatto sproporzionato, bias algoritmico, apprendimento automatico, equità, redlining, attributi protetti, discriminazione indiretta, inferenza causale.

Contesto storico

Confondimento algoritmico

1997-04-23
2001
2010
2020
1993
1998
2010
2016

(se la data è sconosciuta o non rilevante, ad esempio "meccanica dei fluidi", viene fornita una stima approssimativa della sua notevole comparsa)

Invenzioni, innovazioni e principi tecnici correlati

Le immagini a grandezza naturale e i download sono disponibili, 100% gratuitamente, solo per i membri registrati.

> Login <