Product Design, Manufacturing & Innovation Resources
घर » पूर्वाग्रह शमन प्रसंस्करण चरण

पूर्वाग्रह शमन प्रसंस्करण चरण

2010
कृत्रिम बुद्धिमत्ता में पक्षपात शमन तकनीकों पर सहयोग कर रहे डेटा वैज्ञानिक।.

(यह छवि केवल उदाहरण के लिए बनाई गई है)

एल्गोरिथम संबंधी पूर्वाग्रह निवारण तकनीकों को मॉडल प्रशिक्षण प्रक्रिया के संदर्भ में तीन मुख्य चरणों में वर्गीकृत किया गया है। पूर्व-प्रसंस्करण विधियाँ प्रशिक्षण डेटा को ही संशोधित करती हैं (जैसे, पुनर्भारण, पुनर्नमूनाकरण)। अंतःप्रसंस्करण विधियाँ निष्पक्षता संबंधी बाधाओं को सीधे मॉडल के शिक्षण एल्गोरिथम में शामिल करती हैं। पश्चात-प्रसंस्करण विधियाँ निष्पक्षता में सुधार के लिए मॉडल द्वारा की गई भविष्यवाणियों को समायोजित करती हैं।

यह तीन-भाग वाला वर्गीकरण पूर्वाग्रह को दूर करने के लिए एक संरचित ढांचा प्रदान करता है। प्री-प्रोसेसिंग डेटा-केंद्रित है; इसका उद्देश्य मॉडल द्वारा डेटा को देखने से पहले एक "निष्पक्ष" डेटासेट बनाना है। रीवेइंग जैसी तकनीकें असंतुलन को दूर करने के लिए डेटा बिंदुओं को अलग-अलग महत्व प्रदान करती हैं, जबकि ओवर/अंडर-सैंपलिंग विभिन्न समूहों से उदाहरणों की संख्या को समायोजित करती है। यह दृष्टिकोण मॉडल-स्वतंत्र है, लेकिन डेटा के अंतर्निहित वितरण को बदल सकता है।

इन-प्रोसेसिंग मॉडल-केंद्रित होती है। यह लर्निंग एल्गोरिदम के ऑब्जेक्टिव फंक्शन को संशोधित करके उसमें अनुचितता के लिए पेनल्टी टर्म शामिल करती है। उदाहरण के लिए, एक मॉडल को सटीकता को अधिकतम करने के साथ-साथ समूहों के बीच त्रुटि दरों के अंतर को न्यूनतम करने के लिए अनुकूलित किया जा सकता है। इससे अधिक एकीकृत समाधान प्राप्त हो सकते हैं, लेकिन इसके लिए कोर एल्गोरिदम को संशोधित करना पड़ता है, जिससे यह कम लचीला हो जाता है।

पोस्ट-प्रोसेसिंग पूर्वानुमान-केंद्रित होती है। यह प्रशिक्षित, संभावित रूप से पक्षपाती मॉडल के आउटपुट को लेती है और उन्हें निष्पक्षता मानदंड को पूरा करने के लिए समायोजित करती है। इसमें विभिन्न समूहों के लिए वर्गीकरण सीमा को बदलना शामिल हो सकता है। यह सबसे कम हस्तक्षेपकारी विधि है क्योंकि यह मॉडल को एक ब्लैक बॉक्स की तरह मानती है, लेकिन इससे समग्र उपयोगिता कम हो सकती है और यह तदर्थ प्रतीत हो सकती है। चरण का चुनाव प्रशिक्षण डेटा तक पहुंच, मॉडल को संशोधित करने की क्षमता और विशिष्ट निष्पक्षता लक्ष्यों जैसे कारकों पर निर्भर करता है।

UNESCO Nomenclature: 1203
कंप्यूटर विज्ञान

Type

सार प्रणाली

व्यवधान

संतोषजनक

उपयोग

व्यापक उपयोग

शगुन

  • मशीन लर्निंग में असंतुलित डेटासेट को संभालने की तकनीकें
  • गणित में विवश अनुकूलन विधियाँ
  • निष्पक्षता मापदंडों का विकास जो उद्देश्यों या बाधाओं के रूप में कार्य कर सकें
  • मशीन लर्निंग के क्षेत्र में समग्र विकास

आवेदन

  • आईबीएम द्वारा विकसित एआईएफ360 टूलकिट, जो तीनों श्रेणियों के एल्गोरिदम को लागू करता है।
  • गूगल का व्हाट-इफ टूल, जो मॉडल के व्यवहार और निष्पक्षता की पड़ताल करने की अनुमति देता है।
  • fairlearn, निष्पक्षता का आकलन और सुधार करने के लिए एक ओपन-सोर्स पायथन पैकेज है।
  • अंतर्निहित पूर्वाग्रह पहचान और निवारण सुविधाओं की पेशकश करने वाले वाणिज्यिक एआई प्लेटफॉर्म

पेटेंट:

NA

संभावित नवाचार विचार

बॉट ट्रैफिक को कम करने के कारण, जो वर्तमान में प्रति दिन 40,000 से अधिक है, यह सामग्री केवल समुदाय के सदस्यों के लिए आरक्षित है।
> लॉगिन < या > रजिस्टर < इस सामग्री और अन्य सभी प्रतिबंधित सामग्रियों और उपकरणों तक पहुंच (100% निःशुल्क) है।

संबंधित विषय: पूर्वाग्रह निवारण, पूर्व-प्रसंस्करण, प्रक्रिया के दौरान, पश्चात-प्रसंस्करण, निष्पक्ष मशीन लर्निंग, पुनर्मूल्यांकन, पुनर्नमूनाकरण, निष्पक्षता संबंधी बाधाएं, एल्गोरिथम निष्पक्षता, एआई नैतिकता।

ऐतिहासिक संदर्भ

पूर्वाग्रह शमन प्रसंस्करण चरण

1993
1997-04-23
2001
2010
2020
1990
1993
1998
2010
2016

(यदि तिथि अज्ञात है या प्रासंगिक नहीं है, उदाहरण के लिए "द्रव यांत्रिकी", तो इसके उल्लेखनीय उद्भव का एक अनुमानित आंकड़ा प्रदान किया गया है)

शीर्ष पोस्ट और लेख

शीर्ष मूल उपकरण

पंजीकृत सदस्यों के लिए पूर्ण आकार की छवियाँ और डाउनलोड 100% निःशुल्क उपलब्ध हैं।