Sådan kan Microsoft censurere dine filer i skyen


Af Kasper Villum Jensen & Jens Nielsen
 27. januar 2012 kl. 16.30


 
ANNONCE:
 
kravlenisser.jpg
Ifølge en opgørelse fra slutningen af sidste år er der 17 millioner brugere, der regelmæssigt uploader materiale til deres gratis cloud-tjenste fra Microsoft, Skydrive.

Tjenesten giver mulighed for at lægge op til 25 GB filer op i skyen, men man må hverken gemme frække fotos, lumre tekster eller noget andet, der kunne tænkes at være stødende for en åbenbart temmelig sart omverden.

At selskabet rent faktisk håndhæver de skrappe bestemmelser, og i nogle tilfælde endda gør det med nidkærhed - kom bag på mange, viste den seneste tids debat på her på sitet.

CRNs søstermedie ComON har derfor forsøgt at finde ud af, hvordan Microsoft sorterer i brugernes data og finder de frække billeder, som er fy-fy. Er det udelukkende et computersystem, der scanner fotos og tegninger, eller har Microsoft ansat mennesker, der sidder og vurderer billedernes lødighed? Og er det de samme mennesker, eller særlige eksperter, der bestemmer, om billederne skal godkendes eller føre til lukningen af ophavsmandens Skydrive-konto?


Spørg en ven
Desværre har Microsoft ikke ønsket at deltage i denne artikel. Hvordan selskabet forvalter kontrollen i med Skydrive er foreløbigt en hemmelighed, meddeler selskabet.

For at få et overblik over, hvordan filter-teknologien i dagens it-univers fungerer, har vi i stedet sprurgt os for hos DTU's Center for billedanalyse, og hos den førende danske udbyder af blokeringssoftware, firmaet Access Innovation, der laver AccessProxy.

Svarene giver et fingerpeg om, hvor effektive de fleste filtre er i dag. Men hvilke computer-kræfter - og hvilke menneskelige ressourcer - Microsoft tager i anvendelse for at spotte en lidt for vovet kravlenisse, kan vi desværre kun gisne om.

"Billedgenkendelse er en udfordring, man gerne har ville løse i mange år, og der er gået mange karrierer i at løse det problem. Derfor er der en myriade af forskellige metoder i spil," siger Henrik Aanæs, lektor på DTU Informatics.

Han er tilknyttet afdelingen for Billedanalyse og Computergrafik, hvor de ansatte for eksempel har brugt kunstig intelligens og billedgenkendelse til at finde atomkraftværker og mulige guldkilder på Grønland ud fra luftfotografier.

Han kender ikke til Microsofts metoder til at filtrere billeder, men ifølge ham bygger meget billedgenkendelse stadig på godt gammeldags computer-knofedt.

"Computere er jo dybest set snotdumme. Men de kan lave rigtig, rigtig, rigtig mange beregninger. Så basalt set tager man nogle billeder, man godt kan lide og nogle man ikke kan lide, så forsøger man at skabe noget statistik ved at køre nogle mere eller mindre intelligente filtre, som man kan lave en klassifikation," siger lektor Henrik Aanæs.


Vi kigger efter pixels og kanter
Hans kollega Anders Lindbjerg Dahl ved DTU Informatics uddyber.

"Den mest simple måde er at kigge efter fordelingen af pixel-intensiteter. Der vil billeder med meget hud blive sorteret fra - og billeder med meget hud vil typisk være karakterisk for pornografi, men andre billeder vil selvfølgelig også risikere at blive sorteret fra," siger Anders Lindbjerg Dahl.

Pixelintensiteten er groft sagt koncentrationens af pixels med den samme farver i et område af billedet. Det er tydeligt at se i billedets histogram, der er en grafisk fremvisning af filens datasæt.  

Et andet basalt element i billedgenkendelse er kantdetektion. Altså at finde de omrids og kanter i billedet, der udgør motiverne.

Firmaet Paraben laver usb-nøglen PornDetectionStick, der kan finde porno på en computer ved at tilkoble usb-porten.
Firmaet forklarer sin teknologi på følgende måde. Skin Detection finder hudfarve og -tekstur i billederne. Background Elimination fjerner baggrundsbilleder, så de vigtigste motiver og symboler er lettere at analysere. Edge Detection stiller skarpt på motivet. Face Detection spotter ansigter. Body Part Layout Decision finder og beslutter, om der er tale om en krop der er upassende.
 


Fortsættes ...
« forrige
1 2
»


Alle artikler om: