Hogyan csökkenti az elfogult adatkészleteket az AI tudatos megközelítése

Elfogult adatkészletek és etikus mesterséges intelligencia

A mesterséges intelligencia alapú megoldásoknak adatkészletekre van szükségük ahhoz, hogy hatékonyak legyenek. Ezeknek az adatkészleteknek a létrehozása pedig szisztematikus szinten implicit torzítási problémával jár. Minden ember szenved elfogultságoktól (tudatos és tudattalan egyaránt). Az elfogultság számos formát ölthet: földrajzi, nyelvi, társadalmi-gazdasági, szexista és rasszista. És ezek a szisztematikus torzítások adatokba süllyednek, ami olyan mesterséges intelligencia-termékeket eredményezhet, amelyek állandósítják és felerősítik a torzítást. A szervezeteknek figyelmes megközelítésre van szükségük az adatkészletekbe való torzítás elkerülése érdekében.

Példák, amelyek illusztrálják az elfogultsági problémát

Ennek az adathalmaz-elfogultságnak az egyik figyelemre méltó példája, amely akkoriban sok negatív sajtót kapott, egy olyan önéletrajz-olvasási megoldás, amely a férfi jelölteket részesítette előnyben a nőkkel szemben. Ennek az az oka, hogy a toborzóeszköz adatkészleteit az elmúlt évtized önéletrajzai alapján fejlesztették ki, amikor a jelentkezők többsége férfi volt. Az adatok torzak voltak, és az eredmények ezt a torzítást tükrözték. 

Egy másik széles körben ismertetett példa: A Google I/O éves fejlesztői konferenciáján a Google megosztotta az AI-alapú bőrgyógyászati ​​segédeszköz előnézetét, amely segít az embereknek megérteni, mi történik a bőrükkel, hajukkal és körmeikkel kapcsolatos problémákkal. A bőrgyógyász asszisztens hangsúlyozza, hogy a mesterséges intelligencia hogyan fejlődik, hogy segítse az egészségügyi ellátást – ugyanakkor felhívta a figyelmet arra is, hogy a mesterséges intelligencia elfogultsága bekúszhat a bírálatok nyomán, miszerint az eszköz nem megfelelő a színes bőrűek számára.

Amikor a Google bejelentette az eszközt, a vállalat megjegyezte:

Annak érdekében, hogy mindenki számára építsünk, modellünk olyan tényezőket vesz figyelembe, mint az életkor, a nem, a rassz és a bőrtípus – a sápadt bőrtől, amely nem barnul, a barna bőrig, amely ritkán ég le.

Google, A mesterséges intelligencia használata a gyakori bőrproblémák megoldására

De a Vice egyik cikke szerint a Google nem használt átfogó adatkészletet:

A feladat elvégzéséhez a kutatók egy 64,837 12,399 képből álló képzési adatkészletet használtak 3.5 90 betegről, két államban. A képen látható bőrbetegségek ezrei közül azonban csak XNUMX százalék származott Fitzpatrick V. és VI. bőrtípusú betegektől – a barna bőrt, illetve a sötétbarna vagy fekete bőrt képviselő betegektől. A tanulmány szerint az adatbázis XNUMX százalékát világos bőrű, sötétebb fehér bőrű vagy világosbarna bőrű emberek alkották. Az elfogult mintavétel eredményeként a bőrgyógyászok szerint az alkalmazás túl- vagy aluldiagnosztizálhatja azokat az embereket, akik nem fehérek.

Vice, a Google új bőrgyógyászati ​​alkalmazását nem a sötétebb bőrű emberek számára tervezték

A Google azt válaszolta, hogy finomítani fogja az eszközt, mielőtt hivatalosan kiadná:

A mesterséges intelligencia által működtetett bőrgyógyászati ​​segédeszközünk több mint három éves kutatás csúcspontja. Mióta munkánk megjelent a Nature Medicine-ben, folyamatosan fejlesztjük és finomítjuk technológiánkat további adatkészletek beépítésével, amelyek több ezer ember által adományozott adatokat és több millió más, bőrproblémával kapcsolatos képet tartalmaznak.

Google, A mesterséges intelligencia használata a gyakori bőrproblémák megoldására

Bármennyire is reméljük, hogy az AI és a gépi tanulási programok korrigálni tudják ezeket az elfogultságokat, a valóság továbbra is fennáll: okos mivel adathalmazaik tiszták. A régi programozási mondás frissítésében szemét be/szemét ki, az AI-megoldások csak annyira erősek, amennyire az adatkészleteik minősége a kezdetektől fogva. A programozók javítása nélkül ezeknek az adatkészleteknek nincs megfelelő háttértapasztalata ahhoz, hogy kijavítsák magukat – mivel egyszerűen nincs más vonatkoztatási keretük.

Az adatkészletek felelősségteljes felépítése mindennek a lényege etikus mesterséges intelligencia. És az emberek állnak a megoldás középpontjában. 

A Mindful AI az Ethical AI

Az elfogultság nem légüres térben történik. Az etikátlan vagy elfogult adatkészletek abból adódnak, hogy a fejlesztési szakaszban rossz megközelítést alkalmaznak. A torzítási hibák elleni küzdelem módja egy felelős, emberközpontú megközelítés, amelyet az iparágban sokan mindful AI-nak hívnak. A Mindful AI három kritikus összetevőből áll:

1. A tudatos mesterséges intelligencia emberközpontú

Az AI-projekt kezdetétől, a tervezési szakaszban az emberek igényeinek kell állniuk minden döntés középpontjában. És ez minden embert jelent – ​​nem csak egy részhalmazt. Ezért kell a fejlesztőknek egy sokszínű, globálisan dolgozó emberekből álló csapatra támaszkodniuk az AI-alkalmazások befogadó és torzításmentes képzésére.

Az adatkészletek csoportos beszerzése egy globális, változatos csapattól biztosítja a torzítások korai azonosítását és kiszűrését. A különböző etnikumokhoz, korcsoportokhoz, nemekhez, iskolai végzettségekhez, társadalmi-gazdasági hátterekhez és helyszínekhez tartozók könnyebben felismerhetik azokat az adatsorokat, amelyek az egyik értékcsoportot előnyben részesítik a másikkal szemben, így kiiktatják a nem szándékos torzítást.

Vessen egy pillantást a hangalkalmazásokra. A tudatos mesterséges intelligencia megközelítés alkalmazása és a globális tehetségtár erejének kihasználása során a fejlesztők figyelembe vehetik a nyelvi elemeket, például a különböző dialektusokat és akcentusokat az adatkészletekben.

Az emberközpontú tervezési keretrendszer kialakítása a kezdetektől kritikus fontosságú. Sokat tesz annak biztosításában, hogy a generált, összegyűjtött és címkézett adatok megfeleljenek a végfelhasználók elvárásainak. De az is fontos, hogy az embereket a termékfejlesztés teljes életciklusa során a körben tartsuk. 

A hurokban lévő emberek abban is segíthetnek a gépeknek, hogy jobb AI-élményt hozzanak létre minden egyes közönség számára. A Pactera EDGE-nél a mesterséges intelligencia adatprojekt csapatai globálisan elhelyezkednek, és megértik, hogy a különböző kultúrák és kontextusok hogyan befolyásolhatják a megbízható mesterséges intelligencia képzési adatok gyűjtését és kezelését. Rendelkeznek a szükséges eszközökkel a problémák megjelöléséhez, figyeléséhez és kijavításához, mielőtt egy AI-alapú megoldás életbe lépne.

A Human-in-the-loop AI egy projekt „biztonsági háló”, amely egyesíti az emberek erősségeit – és változatos hátterét a gépek gyors számítási teljesítményével. Ezt az emberi és mesterséges intelligencia együttműködést már a programok kezdetétől meg kell teremteni, hogy a torzított adatok ne képezzenek alapot a projektben. 

2. A tudatos mesterséges intelligencia a felelős

A felelősségvállalás azt jelenti, hogy gondoskodni kell arról, hogy az AI-rendszerek torzításoktól mentesek legyenek, és etikán alapuljanak. Arról van szó, hogy tisztában kell lenni azzal, hogyan, miért és hol jönnek létre az adatok, hogyan szintetizálják azokat az AI-rendszerek, és hogyan használják fel azokat olyan döntések meghozatalára, amelyeknek etikai vonatkozásai lehetnek. Ennek egyik módja a vállalkozásoknak az alulreprezentált közösségekkel való együttműködés, hogy befogadóbbak és kevésbé elfogultak legyenek. Az adatfeljegyzések területén az új kutatások rávilágítanak arra, hogy egy több annotátorból álló többfeladatos modell, amely az egyes annotátorok címkéit külön részfeladatként kezeli, hogyan segíthet enyhíteni a tipikus alapigazság-módszerekben rejlő lehetséges problémákat, ahol az annotátorok nézeteltérései az alulreprezentáltságból és figyelmen kívül hagyható egyetlen alapigazság megjegyzéseinek összesítésekor. 

3. Megbízható

A megbízhatóság abból fakad, hogy a vállalkozás átlátható és megmagyarázható az AI-modell képzésének, működésének és az eredményeknek a miértjét illetően. Egy vállalkozásnak szakértelemre van szüksége a mesterséges intelligencia lokalizációjával kapcsolatban, hogy lehetővé tegye ügyfelei számára, hogy mesterséges intelligencia-alkalmazásaikat befogadóbbá és személyre szabottabbá tegyék, tiszteletben tartva a helyi nyelv és a felhasználói élmény kritikus árnyalatait, amelyek országról a másikra növelhetik vagy megtörhetik egy mesterségesintelligencia-megoldás hitelességét. . Például egy vállalkozásnak személyre szabott és lokalizált környezetekhez kell megterveznie alkalmazásait, beleértve a nyelveket, dialektusokat és a hangalapú alkalmazások ékezeteit. Így egy alkalmazás ugyanolyan kifinomult hangélményt biztosít minden nyelven, az angoltól az alulreprezentált nyelvekig.

Méltányosság és sokszínűség

Végső soron a figyelmes mesterségesintelligencia biztosítja, hogy a megoldások tisztességes és változatos adathalmazokra épüljenek, amelyekben az egyes eredmények következményeit és hatását figyelik és értékelik, mielőtt a megoldás piacra kerül. Azáltal, hogy figyelmesek vagyunk, és az embereket is bevonjuk a megoldás fejlesztésének minden részébe, segítünk abban, hogy az AI-modellek tiszták, minimálisan elfogultak és a lehető legetikusabbak maradjanak.

Mit gondolsz?

Ez az oldal Akismet-et használ a levélszemét csökkentése érdekében. Ismerje meg, hogyan dolgozik a megjegyzésed.