Product Design, Manufacturing & Innovation Resources

家 » 算法混淆

算法混淆

2020

Sharad Goel
Ravi Shroff
Jennifer Skeem
Christopher Slobogin

（图片仅供参考）

当……时，就会发生算法混淆。代理人算法使用的变量与受保护属性（例如种族或性别）以及感兴趣的结果相关。即使受保护属性本身已明确从模型的输入数据中排除，算法仍可能无意中通过使用代理变量来学习基于该受保护属性进行区分。

算法混淆是一种微妙但却影响深远的偏差来源。它的产生是因为机器学习模型非常擅长发现统计相关性，即使是虚假相关性也不例外。 While a developer might remove a sensitive feature like ‘race’ to prevent discrimination, the model can latch onto other features that act as proxies. A classic example is the use of ZIP codes in loan applications. Due to historical residential segregation, ZIP codes can be highly correlated with race. An algorithm might learn that applicants from certain ZIP codes are higher risk, not because of their location, but because the location is a proxy for a racial group that has historically been denied loans, creating a feedback loop of discrimination.

这与传统的统计混淆不同，因为算法并非仅仅被误导，而是主动从数据中学习歧视性策略。识别和缓解这种情况需要的不仅仅是特征移除。它通常需要运用因果推断技术来理解变量之间的真实关系，或者使用公平感知算法，这些算法可以被约束为忽略已知代理变量的影响。挑战在于，几乎任何变量都可能在某种程度上是代理变量，这使得完全消除代理变量变得困难。

Algorithms, 人工智能（AI）, 机器学习, 风险管理

UNESCO Nomenclature: 1203

- 计算机科学

类型

抽象系统

中断

递增

用法

广泛使用

前体

统计学和流行病学中的混杂变量概念
差别影响的法律原则
关于住房歧视和歧视性住房政策的研究
机器学习分类算法的开发

应用程序

对 COMPAS 等审前风险评估工具进行审计
开发代理感知偏差检测方法
设计避免歧视性信用评分代理的公平信用评分模型
通过识别和减轻混杂变量来提高自动化招聘系统的公平性

专利：

潜在创新理念

由于机器人流量被拦截（目前每天超过 4 万），此内容仅限社区成员查看。
> 登录 > 或者 > 注册 < （100% 免费）即可访问此内容，以及所有其他受限内容和工具。

相关概念：算法混淆、代理变量、差别影响、算法偏差、机器学习、公平性、歧视性政策、受保护属性、间接歧视、因果推断。

历史背景

综合 R 档案网络 (CRAN)

CRAN 是 R 软件、其文档以及数千个用户贡献的扩展包的主要存储库。它是一个由遍布全球的 FTP 和 Web 服务器组成的网络，用于存储相同且最新版本的 R 代码和文档。这个集中式但分布式的系统是 R 生态系统的基础，确保全球用户能够轻松访问和复制。

Agile Project Management

敏捷项目管理是一种在整个项目生命周期内交付项目的迭代方法。它将大型项目分解成更小、更易于管理的任务，并在短迭代或“冲刺”中完成。这允许频繁地重新评估、调整计划并灵活地应对变化。它优先考虑客户协作、可运行的软件以及对变化的响应，而不是详尽的文档和僵化的计划。

偏见缓解处理阶段

根据模型训练过程，算法偏差缓解技术可分为三个主要阶段。预处理方法直接修改训练数据本身（例如，重加权、重采样）。处理中方法将公平性约束直接融入模型的学习算法中。后处理方法在模型做出预测后对其进行调整，以提高公平性。

算法混淆

1997-04-23

2001

2010

2020

1993

1998

2010

2016

尼尔森的可用性五要素

Jakob Nielsen 是一位著名的可用性顾问，主要从事 UI 和网页设计，他通过五个质量组件来定义可用性：易学性（用户第一次完成基本任务的难易程度如何？）、效率（用户学会后能多快完成任务？）、可记忆性（用户在一段时间不使用后能否重新获得熟练程度？）、错误（用户犯了多少错误？）和满意度（使用起来有多愉快？）。