18. november 2024
Danmark går glip af markante forbedringer af samfundet, fordi store mængder følsomme data ikke kan deles på tværs af organisationer. Nu har et forskerhold af dataloger fundet en måde at kryptere data, så de kan deles og behandles anonymt med maskinlæring.
Hver dag indsamler virksomheder, forskere og institutioner store mængder data, som ikke ser dagens lys på grund af privatlivs- eller konkurrencehensyn. Men hvad ville der ske, hvis disse data kunne anonymiseres og deles på tværs af organisationer – for eksempel i jagten på at skabe bedre medicin eller optrevle kriminelle netværk? Deling og kryptering af data er afgørende for, at disse scenarier kan lade sig gøre.
I projektet “Privacy and Machine Learning” har et hold af dataloger med støtte fra DIREC taget et afgørende skridt mod en løsning, der baner vejen for, at endnu mere data kan deles til gavn for hele samfundet.
“Der er stort potentiale i at bruge følsomme data til at forbedre forskellige sektorer. For eksempel i form af bedre medicin eller bedre opsporing af hvidvask. Det handler bare om at at udvikle krypteringsteknologier, der tillader at vi kan behandle anonymiserede data,” forklarer Peter Scholl, lektor i datalogi på Aarhus Universitet og leder af projektet.
Udfordringen med deling af følsomme data ligger i at sikre, at data forbliver private under behandlingen. Her kommer krypteringsmetoden multiparty computation (MPC) ind i billedet.
MPC er en teknik, der tillader flere parter at dele krypterede data, uden at afsløre deres input for hinanden. På den måde kan alle parter tilgå det samlede resultat uden at det kan spores, hvem der bidrager med hvilke data.
“Med MPC kan vi behandle data, som forbliver krypterede for alle parter. Ingen kan se de andres data, men de kan stadig lære noget om resultatet og bruge dem til at udvikle nye produkter,” uddyber Peter Scholl.
I finansverdenen kan metoden bane vejen for, at banker kan samarbejde om svindelopsporing ved at kombinere deres kunders betalingsdata uden at afsløre kundernes identitet eller konkurrencefølsomme oplysninger. Det samme gælder for sundhedsvæsenet, hvor hospitaler vil kunne få adgang til større datasæt, hvis patienters scanningsbilleder kunne deles på tværs af landet.
MPC er ikke en gratis affære. Serverplads, strømforbrug og andre store investeringer spiller kraftigt ind. Balancen mellem pris, sikkerhed og ydeevne er hårfin. Derfor har projektet også fokus på at finde måder, som gør krypteringen mere effektiv.
Den udfordring arbejder Hiraku Morita på at løse som postdoc i datalogi ved Københavns og Aarhus Universitet. I artiklen “MAESTRO: Multi-party AES using Lookup Tables” benytter han og forskerteamet en ny teknik, der med såkaldte opslagstabeller kan hjælpe algoritmen med at udføre de påkrævede beregninger og øge algoritmens effektivitet.
“De fleste mennesker kan svare hurtigt på, hvad fem gange fem er, fordi vi har lært tabellerne udenad eller kan huske dem visuelt. På samme måde kan vi hjælpe algoritmen med at huske de mange svære funktioner, den skal beregne, så den ikke bruger mere båndbredde end nødvendigt,” siger Hiraku Morita.
Han fortæller, at industrien allerede har udtrykt interesse for teknologien.
“Mange virksomheder har vist interesse for at bruge vores metoder, men det kan tage lang tid at få en protokol klar til kommerciel brug. Måske ser vi det ske inden for de næste par år,” afslutter Hiraku Morita.
Læs mere om projektet her.
Lektor Peter Scholl t.v. og postdoc Hiraku Morita t.h.