Miksi tekoäly epäonnistuu naisten kohdalla?

Pikkukaupungin naiset riisuttiin pornosivustolle
Sosiaalisen median alusta X:n Grok-tekoäly riisuu naisia ja tyttöjä
Tällainen on täydellinen nainen
Virheettömästä naisesta tuli TikTok-tähti

Naisten väitetään olevan skeptisempiä tekoälyn käytön suhteenniin työelämässä, kuin sen ulkopuolellakin. Yllättyneet jonoon, sillä onko tämä ihmekään, jos sen avulla luodaan työkaluja, joilla voidaan riisua vaatteet naisten päältä, tai luoda aikuisviihdesisältöä verkkoon, ja miljoonista käyttäjistä koostuviin Telegram-ryhmiin: ilman naisten, tai tyttöjen suostumusta. Halusit kuulla tämän tai et, tekoälyllä tuotetut valealastonkuvat alkavat olla jo niin suuri bisnes verkossa, ettei mikään lainsäädäntökään ole ehtinyt hypätä tähän kelkkaan vielä mukaan.

Naisia kannustetaan aktiivisesti tekoälyn hyödyntämiseen, mutta yhä vähempi osuus naisista hyödyntää sitä työssään verrattuna miehiin. Tekoälyn, sekä naisten välillä vallitsee ristiriita: tekoälyllä on suuri vaikutus naisoletettujen, sekä myös nuorten mielenterveyteen, turvallisuuteen, terveyteen, ja urakehitykseen. Tekoäly kuvaa naiset usein epärealistisen täydellisenä, sileäihoisina, hoikkina, ja symmetrisinä, sekä tekoälyn luoma nainen on myös hymyilevä, ystävällinen, yhteistyökykyinen, ja huolehtiva. Yksilön mahdollisesti heikoksi jäänyt tekoälyn lukutaito tekee lähes mahdottomaksi tunnistaa, onko jokin kuva tekoälyllä generoitu vai ei. Tosin, tämän päivän deepfake, eli syväväärennökset alkavat olla jo niin tarkkoja, ettei niiden aitoutta pystytä välttämättä todentamaan.

Tekoälyn avulla luotu naisvihamielinen sisältö on omiaan aiheuttamaan mainehaittaa naisille, sillä digiaikakausi mahdollistaa seksuaaliväkivallan harjoittamisen verkon kautta liian helposti. On myös raportoitu, että naiset ovat kokeneet vaikeuksia työllistyä sen jälkeen, kun heistä on levitetty väärennettyä, seksuaalissävytteistä materiaalia verkossa.

Ratkaisuehdotuksiakin on jo asiantuntijoiden toimesta toki väläytelty: juuri naisten kannattaakin siivota kuvansa pois verkon syövereistä, ettei niitä käytettäisi väärin, tai ainakin kannattaa varoa lataamasta mitään hyvälaatuisia kuvia verkkoon. Naurettavan huono ohjeistus, eritoten niille naisille, jotka toimivat digiyrittäjinä verkossa vaikkapa sosiaalisen median palvelutuotannon parissa: ei siis muuta kuin lappu luukulle, jottei LinkedInin profiilikuvaasi käytettäisi pornograafisen materiaalin tuottamiseksi!


Miksi naiset jäävät näkymättömäksi teknologiakehityksessä?

Miksi tekoälyllä on ylipäätään ongelmia naisten kanssa? Onko naisiin kohdistuva tekoälypohjainen syrjintä yleisempää, kuin miesten kohtaamat ongelmat tekoälyn kanssa? Miksi näin on, ja mitä asialle voitaisiin tehdä? Puretaan ongelmaa hieman osiin.

On tutkittu, että tekoälypohjaiset rekrytointijärjestelmät voivat sisältää merkittäviä sukupuolivinoumia. Tutkimuksen mukaan tekoälymallit suosittelivat yhtä päteviä naisia systemaattisesti matalapalkkaisempiin tehtäviin kuin miehiä. Yksi konkreettinen esimerkki tapahtui Amazonin rekrytoinnissa, jossa hyödynnettiin tekoälypohjaista työkalua sopivien kandidaattien seulomiseen. Järjestelmä koulutettiin rekrytointidatalla, jossa miehet olivat yliedustettuina teknologia-alalla. Urakatkokset, esimerkiksi perhevapaat, toimivat osaltaan epäsuorana sukupuolisignaalina, ja työkalu myös rankaisi niitä ansioluetteloita, joissa esiintyi sana “nainen”.

Auton puheohjaus ei tunnistanut naiskuljettajan ääntä, ennen kuin he toistivat komentoja useaan kertaan, tai korottivat ääntään. Ongelma ei ole ulottunut ainoastaan naiskuljettajiin, vaan puheohjauksella on ollut vaikeuksia tunnistaa eri etnisiä ryhmiä, kielimuotoja, sekä aksentteja.

Ylläolevia esimerkkejä kutsutaan vinoumiksi, eli tekoälyjärjestelmän systemaattisiksi virheiksi tai epätasapuolisiksi toimintatavoiksi, jotka suosivat tai heikentävät tiettyjä ihmisryhmiä. Rekrytointityökalun tapauksessa vinouma johti naishakijoiden epäoikeudenmukaiseen kohteluun, kun taas puheohjauksen tapauksessa vinouma näkyi heikompana suorituskykynä naisten äänten tunnistamisessa. Vinoumat syntyvät usein koulutusdatan epätasapainoista, tai yhteiskunnassa jo olemassa olevien ennakkoluulojen heijastumisesta dataan.

Ongelma ei siis suoranaisesti ole itse tekoälyssä, vaan siinä, miten ihmiset suunnittelevat, kouluttavat ja arvioivat sitä. Tekoälykehittäjien tulisi kiinnittää enemmän huomiota koulutusdatan edustavuuteen, mallien testaamiseen eri käyttäjäryhmillä, sekä mahdollisten vinoumien tunnistamiseen jo kehitysvaiheessa. Näin voidaan vähentää riskiä siitä, että tekoälyjärjestelmät toistavat, tai vahvistavat yhteiskunnassa esiintyviä epätasa-arvoisia rakenteita.

💡 Lisää tekoälyn epäonnistumisia voit lukea täältä.


Tekoäly heijastaa tekijöitään, käyttäjiään, sekä yhteiskuntaa


Vinouma ei muodostu ainoastaan epätasapainossa olevasta datasta (eng. imbalanced data, eli datasetissä tietyt ryhmät ja luokat ovat yliedustettuina, ja toiset aliedustettuina), vaan se voi muodostua oikeastaan missä vaan vaiheessa tekoälyjärjestelmän kehitystä. Kuinka helppoa on sitten tunnistaa, ja määrittää mahdolliset vinoumat?

Tekoälyjärjestelmän kehitysprosessissa määritellään usein seuraavat vaiheet:

1) Ongelman määrittely: Kenen/keiden näkökulmasta ongelma määritellään? Kuka vaikuttaa siihen, mitä riskejä priorisoidaan, ja keiden kokemukset jätetään vähemmälle huomiolle? Mitä voidaan pitää kehityksen hyvänä lopputuloksena? Liike-elämässä usein päätökset tehdään luonnollisesti liiketoiminnallisesta näkökulmasta.

2) Datan kerääminen: Tekoälyjärjestelmä vaatii paljon dataa, jonka pohjalta se oppii. Ei ole yksiselitteistä vastausta siihen, mikä on sopiva määrä dataa, ja pelkkä määrä ei yksinään ratkaise kaikkea. Datan laatu, monipuolisuus, sekä tasapainoisuus ovat avainasemassa. Tärkeämpää on pohtia, ovatko kaikki ryhmät yhtä hyvin edustettuina, ja onko mahdollista, että jotkin ilmiöt eivät näy datassa ollenkaan?


3) Datan valinta ja muokkaus: Dataa valmistellessa vielä päätetään, mitkä muuttujat* ovat tärkeitä, mitkä jätetään pois, miten data jaetaan koulutus- ja testiaineistoihin. Ihmisistä kerätyssä datassa sama yksilö ei voi olla sekä koulutus-, että testidatassa, sillä muuten malli muistaa yksilön.

*Ihmisistä kerätyssä datassa muuttujalla tarkoitetaan mm. ikää, sukupuolta, pituutta, koulutustasoa, terveystietoja jne.

4) Mallin koulutus: Mallin koulutuksessa yksi datasetti varataan mallin treenaamiseen, toinen datasetti mallin testaamiseen, ja pieni prosenttiosuus datasta tarvittaessa mallin validointiin. Jos validointidatassa on samat vinoumat kuin mallin treenaamiseen käytetyssä datassa, malli ei pysty tunnistamaan ennakkoluuloisia tuloksia. Jos datajako prosentteina tehdään myös huolimattomasti, yksi vähemmistöryhmä voi päätyä vain testidataan, ja malli ei tällöin pysty oppimaan tätä dataa. Se voi puolestaan jopa vahvistaa jo olemassaolevaa vinoumaa.

Vinouman korjaaminen on myös haasteellista, sillä tietojenkäsittelytiede itsessään ei tunnista oikeudenmukaisuutta samalla tavalla kuin ihminen. Tietokone, tai tekoäly ei ymmärrä moraalia, tasa-arvoa, tai reiluutta, vaan sen tehtävänä on käsitellä dataa, sääntöjä ja todennäköisyyksiä. Tekoäly ei siis ymmärrä oikeudenmukaisuutta, vaan se oppii tilastollisia malleja.

Tekoäly siis yksinään ei ole luonut sukupuolittunutta väkivaltaa, jota naiset ja tytöt kohtaavat enenevissä määrin tänä päivänä: se on kuitenkin suuressa roolissa väkivallan määrän, ja laajuuden moninkertaisemisessa. Tekoälyn kehitystä ei pitäisi enää tarkastella pelkästään teknisenä kysymyksenä, vaan myös sukupuolten välisten valtasuhteiden näkökulmasta.


💡 Kiinnostaako lukea aiheesta lisää? Caroline Criado Perez on julkaissut menestyskirjan “Näkymättömät naiset”, joka tutkii, miten sukupuolivinouma tiedossa ja tilastoinnissa vaikuttaa naisten asemaan ja turvallisuuteen eri elämänalueilla.


Lue lisää aiheesta tekoäly

Seuraava
Seuraava

Kuka seuraa sijaintiasi juuri nyt?