Facebooks human-AI-blanding til lydtranskription står nu over for privatlivets kontrol i Europa – TechCrunch


Facebooks førende privatlivsregulator i Europa beder nu virksomheden om detaljerede oplysninger om driften af ​​en tale-til-tekst-funktion i Facebooks Messenger app, og hvordan den overholder EU-lovgivningen.

I går rapporterede Bloomberg, at Facebook bruger menneskelige entreprenører til at transkribere app-brugernes lydmeddelelser – alligevel er dens privatlivspolitik ikke tydelig omtale af det faktum, at faktiske mennesker muligvis lytter til dine optagelser.

En side i Facebooks helpcenter indeholder også en "note", der siger "Voice to Text bruger maskinindlæring" – men siger ikke, at funktionen også drives af folk, der arbejder for Facebook, der lytter til.

En talsmand for den irske databeskyttelseskommission sagde til os: “I forlængelse af vores fortsatte engagement med Google, Apple og Microsoft i forbindelse med behandlingen af ​​personoplysninger i forbindelse med den manuelle transkription af lydoptagelser, vi søger nu detaljerede oplysninger fra Facebook om den aktuelle behandling og hvordan Facebook mener, at sådan behandling af data er i overensstemmelse med deres GDPR-forpligtelser .”

Bloombergs rapport følger lignende afsløringer om AI-assistentteknologier, der tilbydes af andre tech-giganter, herunder Apple, Amazon, Google og Microsoft – som også har tiltrukket sig opmærksomhed fra europæiske personlige reguleringsmyndigheder i de seneste uger.

Hvad dette fortæller os, er, at hypen omkring AI-stemmeassistenter er stadig glans over en langt mindre højteknologisk backend. Selv som surringer af maskinlæring af markedsføring guff er blevet brugt til at kappe de 'mekaniske tyrkiske' komponenter (dvs. mennesker), der kræves for, at teknologien kan leve op til kravene.

Dette er faktisk en meget gammel historie. Til wit: En fuld årti siden rapporterede en britisk opstart kaldet Spinvox, som havde hævdet at have avanceret stemmegenkendelsesteknologi til konvertering af telefonsvarer til tekstmeddelelser, at han læner sig meget på callcentre i Sydafrika og Filippinerne … bemandet af, ja, faktiske mennesker.

Vender tilbage til nutidens "banebrydende" teknologi, efter Bloombergs rapport, at Facebook sagde, at den suspenderede menneskelige transkriptioner tidligere i denne måned – sammen med Apple og Google ved at stoppe manuelle anmeldelser af lyduddrag for deres respektive stemmeangivelsesgrænser. (Amazon har siden føjet en fravalg til Alexa-appens indstillinger.)

Vi spurgte Facebook, hvor det i Messenger-appen havde informeret brugerne om, at menneskelige entreprenører kunne bruges til at transkribere deres stemmechats / lydbeskeder; og hvordan det indsamlede Messenger-brugernes samtykke til denne form for databehandling – inden man suspenderede menneskelige anmeldelser.

Virksomheden besvarede ikke vores spørgsmål. I stedet for gav en talsperson os følgende udsagn: “Ligesom Apple og Google stoppede vi menneskelig gennemgang af lyd for mere end en uge siden. ”

Facebook beskrev også lyduddragene, som det sendte til entreprenører som maskerede og de-identificerede; sagde, at de kun blev samlet, når brugerne havde tilmeldt sig transkription på Messenger; og blev kun brugt til forbedring af transkriptionens ydeevne for AI.

Det gentog også en langvarig tilbagetrækning fra virksomheden for brugerens bekymring over generel aflytning fra Facebook, idet den sagde, at den aldrig lytter til folks mikrofoner uden enhedstilladelse eller uden eksplicit aktivering af brugerne.

Hvordan Facebook samler tilladelse til at behandle data er imidlertid et centralt spørgsmål.

Virksomheden har for nylig for eksempel anvendt en manipulerende samtykkestrøm for at skubbe brugere i Europa til at tænde ansigtsgenkendelsesteknologi – rullende tilbage til sin tidligere holdning, vedtaget som svar på tidligere lovgivningsmæssige indgreb, for at slukke teknikken over hele blokken.

Så meget hviler på, hvordan Facebook nøjagtigt har beskrevet databehandlingen på ethvert tidspunkt, hvor det beder brugerne om at acceptere, at deres stemmemeddelelser gennemgås af mennesker (forudsat at de er afhængige af samtykke som dets retsgrundlag for behandling af disse data).

At samle samtykke til generelle T & C'er for brug af produktet er også usandsynligt, at det overholder EU's privatlivsret, da blokens generelle databeskyttelsesforordning kræver samtykke at være begrænset til formål, såvel som fuldt informeret og frit givet.

Hvis Facebook er afhængig af legitime interesser for at behandle Messenger-brugernes lyduddrag for at forbedre dens AI's ydelse, er det nødvendigt at afbalancere sine egne interesser imod enhver risiko for folks privatliv.

Stemme-AI'er er især problematiske i denne henseende, fordi lydoptagelser muligvis også fanger personlige data fra ikke-brugere – i betragtning af at folk i nærheden af ​​en enhed (eller faktisk en person i den anden ende af telefonlinjen der giver dig en besked) kunne få deres personlige data indfanget uden nogensinde at have haft chancen for at give samtykke til, at Facebook-entreprenører fik hørt det.

Lækager af Google Assistant-uddrag til den belgiske presse fremhævede for nylig både den følsomme karakter af optagelser og risikoen for genidentifikation, som sådanne optagelser udgør – med journalister, der er i stand til at identificere nogle af menneskerne i optagelserne.

Flere pressemeddelelser har også antydet, at entreprenører, der er ansat af tech-giganter, rutinemæssigt overhører intime detaljer, der er fanget via en række produkter, der inkluderer muligheden for at optage lyd og streame disse personlige data til skyen til behandling.