Mar 1, 2021

Algoritmer og søkemotor

Gjest:    Skrevet av ThAOSteen (Finn ham på Twitter her)



Kommentarer til artikkel:

https://www.aftenposten.no/meninger/debatt/i/vAwd0l/microsofts-algoritmer-skal-ha-oss-til-aa-se-seksualisert-innhold


La meg først begynne med ordet algoritme. Et godt norsk ord for algoritme er “oppskrift”. Det finnes dårlige oppskrifter og gode oppskrifter. Og vi vurderer de som gode eller dårlige basert på hvordan resultatet blir ut fra hva du er lovet. Det finnes dårlige algoritmer og det finnes gode algoritmer. Ikke naive, dumme eller farlige. Dette er følelser som kommer fra den som ser resultatet av algoritmene, altså, subjektivt. Algoritmer må vi se på objektivt. De gjør enten det de skal gjøre, eller så gjør de ikke det.


Algoritmene produserer resultat basert på inngangsverdier. Det som kommer inn som data, er med på å produsere resultatet. Når Brandtzæg klager på algoritmer, så er det egentlig inngangsverdiene han klager på. Og inngangsverdier er laget av meg og deg. Det er vi som søker etter seksualisert innhold. At Bing kommer med forslag på hva du kanskje søker etter, er altså resultat av en velfungerende algoritme, som har inngangsverdier laget av de som benytter søkemotoren. Brandtzæg sier at algoritmene er naive, dumme eller farlige. De er ikke det, det er det vi mennesker som er.

Brandtzæg sier selv at han har fått utprøvd Bing på flere maskiner (som er rene) og på flere nettverk, så han er også klar over at det er flere ting enn bare søkeresultat fra tidligere som kan være med på å påvirke hva som kommer opp. Ting som SEO (Search-engine optimization), betalt plassering, nettverkstopologi (land, m.m.) og tilbakemelding fra brukere.

Når Bing endrer på resultatene, så kaller Brandtzæg det å rydde opp, men han burde jo si at datasettet som algoritmene benytter har blitt manipulert, og ikke lenger reflekterer hva algoritmene har generert av data. En slik direkte manipulering av databaser krever manpower, ettersom det ikke er algoritmestyrt, og det er ressurskrevende. Jo mer akseptabelt det blir å gjøre slike direkte redigeringer i resultatene, jo mer ressurser kreves det, og kun store aktører vil da til slutt klare å holde alt oppdatert. En ny aktør kan risikere å bruke all sin tid på å lage unntak, og ikke på å forbedre søkemotorens algoritmer.


Vi må få vite hvordan algoritmene fungerer, sier Brandtzæg. Jeg er enig, men det er ikke min og din bruk som er den største trusselen mot relevante søkeresultat. Datasettene er ofte manipulert av SEO, og det finnes folk hvis jobb er nettopp å optimalisere plassering av søkeord på nettsteder slik at det kommer høyere opp på resultatlisten.


Ironien i at Brandtzæg vil ha algoritmer med “sunn fornuft” i stedet for algoritmer basert på statistikk er jo ikke helt tapt på meg heller. Det fører jo til det stikk motsatte av hva han påstår han ønsker å se. Det er veldig sjeldent vi ser to mennesker være enig om hva som er “sunn fornuft”. 

Et eksempel ( https://gizmodo.com/why-cant-this-soap-dispenser-identify-dark-skin-1797931773 ) kan jo være selskapet som solgte såpedispensere, og brukte “sunn fornuft” for å finne ut om noen hadde henda under, og testet bare med hvite hender. Så snart en med svarte hender kom, så ga ikke såpedispenseren såpe. Dårlig algoritme eller dårlig datasett? Begge deler.


Det var svar på hva jeg mener er feil med konklusjonen til innlegget. Nå må vi se på metodikk. Metodikken var å prøve seg frem på “rene” maskiner på forskjellige nettverk. Tanken på “ren” maskin er god, men det er jo ganske irrelevant. De færreste av oss har “rene” maskiner etter den første uken. Da har søkemotorer vi benytter samlet all den informasjon om oss den trenger for å finne ut hva vi liker å se på. Det er en mye mer relevant øvelse å hva søkeresultater du får på en maskin som kjenner deg godt. Hvis du har liten interesse i seksualisert innhold, men du fortsetter å få massevis av treff på seksualisert innhold, så er det større problem, enn om du har den interessen.

Det er altså lite interessant å se hva som kommer opp i hurtigfeltet, slik som Brandtzæg fokuserer på. Det er mye viktigere å se hva som kommer opp i de faktiske søkeresultatene. Ett av eksemplene til Brandtzæg er “Gutter”, som gir forslaget “Gutteromper”. Om du trykker på resultatet av søket, så får du opp treff som treningsstudioer, stock photos, folk som diskuterer om de foretrekker gutter eller jenters rumper, strikkeoppskrifter, Ikkepedia, folk som diskuterer homofili, anmeldelse av bøker, osv. Ikke noe som vi burde gi noen stor grunn til å diskutere Bing sin makt som søkemotor.


Bing har også gitt brukere muligheten til å unngå diverse innhold. Et kjapt søk viser oss at Bing har noe som kalles “SafeSearch”, som vil fjerne adult content og lignende. ( Block adult content with SafeSearch (microsoft.com) ). 


Helt til slutt, overskriften er en påstand om at Microsoft skal ha oss til å se seksualisert innhold. Jeg har ikke sett noen som helst bevis for denne påstanden i teksten til Brandtzæg, og heller ikke andre steder på nettet, og påstanden er i verste fall i kategorien konspirasjon.


No comments:

Post a Comment

Note: Only a member of this blog may post a comment.