Product Design, Manufacturing & Innovation Resources
Hogar » Confusión algorítmica

Confusión algorítmica

2020
  • Sharad Goel
  • Ravi Shroff
  • Jennifer Skeem
  • Christopher Slobogin
Equipo de científicos de datos que analizan la confusión algorítmica en aplicaciones de IA.

(Imagen generada únicamente con fines ilustrativos)

La confusión algorítmica se produce cuando un apoderado Una variable utilizada por un algoritmo está correlacionada con un atributo protegido (como la raza o el sexo) y también con el resultado de interés. El algoritmo puede aprender inadvertidamente a discriminar en función del atributo protegido utilizando el proxy, incluso si el propio atributo protegido se excluye explícitamente de los datos de entrada del modelo.

Algorithmic confounding is a subtle but powerful source of bias. It arises because machine learning models are exceptionally good at finding statistical correlations, even spurious ones. While a developer might remove a sensitive feature like ‘race’ to prevent discrimination, the model can latch onto other features that act as proxies. A classic example is the use of ZIP codes in loan applications. Due to historical residential segregation, ZIP codes can be highly correlated with race. An algorithm might learn that applicants from certain ZIP codes are higher risk, not because of their location, but because the location is a proxy for a racial group that has historically been denied loans, creating a feedback loop of discrimination.

Esto es distinto de la confusión estadística tradicional, porque el algoritmo no sólo está siendo engañado, sino que está aprendiendo activamente una política discriminatoria a partir de los datos. Identificar y mitigar esta situación requiere algo más que la simple eliminación de características. A menudo implica técnicas de inferencia causal para comprender las verdaderas relaciones entre variables, o el uso de algoritmos que tengan en cuenta la imparcialidad y que puedan ser limitados para ignorar la influencia de variables sustitutivas conocidas. El reto reside en el hecho de que casi cualquier variable puede ser en cierta medida un proxy, lo que dificulta su eliminación completa.

UNESCO Nomenclature: 1203
- Informática

Tipo

Sistema abstracto

Ruptura

Incremental

Uso

Uso generalizado

Precursores

  • concept of confounding variables in statistics and epidemiology
  • legal doctrine of disparate impact
  • research on redlining and housing discrimination
  • development of machine learning classification algorithms

Aplicaciones

  • auditing of pre-trial risk assessment tools like COMPAS
  • development of proxy-aware bias detection methods
  • design of fair credit scoring models that avoid redlining proxies
  • improving fairness in automated hiring systems by identifying and mitigating confounding variables

Patentes:

NA

Ideas para posibles innovaciones

Debido al bloqueo del tráfico generado por bots, que actualmente supera los 40.000 al día, este contenido está reservado para los miembros de la comunidad.
> Iniciar sesión < o > Registrarse < (100% gratis) para acceder a esto, al igual que a todo el demás contenido y herramientas restringidos.

Relacionado con: confusión algorítmica, variable indirecta, impacto dispar, sesgo algorítmico, aprendizaje automático, equidad, exclusión social, atributos protegidos, discriminación indirecta, inferencia causal.

Contexto histórico

1997-04-23
2001
2010
2020
1993
1998
2010
2016

(Si la fecha es desconocida o no es relevante, por ejemplo "mecánica de fluidos", se proporciona una estimación redondeada de su aparición notable)

Las imágenes a tamaño completo y las descargas sólo están disponibles, 100% gratis, para los miembros registrados.

> Acceso <