アルゴリズムの混同は、 プロキシ アルゴリズムで使用される変数は、保護対象属性(人種や性別など)および関心のある結果と相関関係にある。保護対象属性自体がモデルの入力データから明示的に除外されている場合でも、アルゴリズムはプロキシを使用することで、意図せず保護対象属性に基づいて差別することを学習してしまう可能性がある。

(画像はイメージです)
アルゴリズムの混同は、 プロキシ アルゴリズムで使用される変数は、保護対象属性(人種や性別など)および関心のある結果と相関関係にある。保護対象属性自体がモデルの入力データから明示的に除外されている場合でも、アルゴリズムはプロキシを使用することで、意図せず保護対象属性に基づいて差別することを学習してしまう可能性がある。
アルゴリズムによる交絡は、微妙ながらも強力なバイアスの原因となる。これは、機械学習モデルが、たとえ見せかけの相関関係であっても、統計的な相関関係を見つけるのに非常に優れているために生じる。 While a developer might remove a sensitive feature like ‘race’ to prevent discrimination, the model can latch onto other features that act as proxies. A classic example is the use of ZIP codes in loan applications. Due to historical residential segregation, ZIP codes can be highly correlated with race. An algorithm might learn that applicants from certain ZIP codes are higher risk, not because of their location, but because the location is a proxy for a racial group that has historically been denied loans, creating a feedback loop of discrimination.
これは従来の統計的交絡とは異なり、アルゴリズムが単に誤った方向に導かれているのではなく、データから差別的な方針を積極的に学習しているという点で特徴的です。これを特定して軽減するには、単に特徴量を削除するだけでは不十分です。多くの場合、変数間の真の関係を理解するための因果推論手法、または既知の代理変数の影響を無視するように制約できる公平性を考慮したアルゴリズムの使用が必要となります。課題は、ほぼすべての変数が何らかの形で代理変数になり得るため、完全な排除が難しいという点にあります。
ボットによるトラフィック(現在1日あたり4万件以上)を排除するため、このコンテンツはコミュニティメンバー限定となっています。
> ログイン < または > 登録 < (100%無料)でこれにアクセスできます。他のすべての制限付きコンテンツとツールも同様です。
アルゴリズムの交絡
(日付が不明または関連性がない場合、例えば「流体力学」などでは、その注目すべき出現時期の概算値が提示されます。)
フルサイズの画像とダウンロードは、登録会員のみが100%無料で利用できます。
> ログイン <