CSAM til Apple dekonstruert

Eg føl med på kva som blir skrive om planane for CSAM*-deteksjon i iCloud Photos i iOS 15. Bruce Schneier, ein velkjent person med omfattane erfaring og kompetanse på kryptografi og informasjonsikkerheit, har hatt nokre innlegg i etterkant på sin blogg Schneier on Security.

* CSAM=Child Sexual Abuse Material

Driftige folk har teke tak i Apple sin NeuralHash-algoritme som vil bli brukt til å skanne bilete på dine Apple-einheit før opplasting til iCloud Photos. Ein har klart å dekonstruere (reverse engineer) algoritma. Etter sigande var ho allereie på plass i iOS 14.3, om enn ikkje aktivert. Ein klarte å eksportere modellen til ONNX (Open Neural Network Exchange). Du kan teste NeuralHash på Linux eller MacOS. Når eg ser på stega for å få generert ein hash (matematisk kontrollsum) for eit bilete, fell ting meir på plass i høve det eg har stussa på:

  1. Convert image to RGB.
  2. Resize image to 360×360.
  3. Normalize RGB values to [-1, 1] range.
  4. Perform inference on the NeuralHash model.
  5. Calculate dot product of a 96×128 matrix with the resulting vector of 128 floats.
  6. Apply binary step to the resulting 96 float vector.
  7. Convert the vector of 1.0 and 0.0 to bits, resulting in 96-bit binary data.

Det første steget konverterer bilete til eit standard fargerom. Steg to forminskar bilete til 360 ganger 360 punkt. Omsett til megapixels er det 0,1296 megapixels eller 129600 punkt. I dag fotograferer iPhone med 12 megapixels (12 million punkt). Bilete blir kraftig forminska som medfører at uhorveleg mykje informasjon/detaljar forsvinn. Eg har ei viss forståing for forminskinga dersom alt av bileter, ikkje berre det du fotograferer skal kontrollerast. Kvaliteten av det du tek vare på vil variere alt etter kjelda det kjem frå.

For meg betyr det at det er brøkdelen av informasjonen i eit bilete som dannar grunnlaget for kontrollsum. Dess mindre grunnlag ein har, dess større sjanse er at ein får samanfallande kontrollsum mellom to bilete. Apple sin påstand om at sjansen for kollisjon er 1 til 1 billion kjøper eg ikkje. Store talverdiar på amerikansk er million, billion, trillion. På norsk er det million, milliard, billion, billiard, trillion. Etter forminskinga går grunnlaget vidare til normalisering av fargeverdiane før ein er over i NeuralHash-modellen. Det ser ut til at dei splittar ting opp i matriser med eit visst punktareal, men dette går over hovudet på meg. Ver merksam på at det er ei maskinell «tolking» av bilete som vert vurdert, ikkje punkt for punkt:

Illustrasjon henta frå video til Sumsub

denne sida er det i gong ein diskusjon der ein har fleire bilete som er vidt forskjellige, som (etter påstand) genererer same kontrollsum: 59a34eebe31910abfb06f308. Du finn bileta sist i innlegget.

Min påstand er at kontrollsummane frå CSAM-bilete vil bli kjent. Årsaken til det kan være alt frå at organisasjonane blir hacka til ein ansatt (utru eller idelogisk) gjer dei kjent. Å gjere bileta kjent er straffbart som spreiing av barneporno, men ein kontrollsum, f.eks. 59a34eebe31910abfb06f308, kan ikkje avsløre bilete. Konsekvensane for å avsløre kontrollsummen vil vere vesentlig mindre. Deretter vil nokon starte å generere bilete som dannar tilsvarande kontrollsummar. Bileta vil bli brukt i kampanjar:

Tenk deg at du får ei melding om å betale x bitcoin for å unngå å få din Apple-konto sperra. Du betalar ikkje og får tilsendt bilete som har same kontrollsummane som CSAM-bilete. Ifølgje denne artikkelen vil 30 samsvarande kontrollsummar utløyse at kontoen din blir flagga hos Apple og deaktivert.

Det er her eg ser at Apple sin påstand om sjansen for same kontrollsum for to ulike bilete er urealistisk. 1 til 1 billion tilseier at det i praktisk vil være så godt som umogleg. Dersom så var, ville ikkje 30 treff det som skulle til for å flagge kontoen, men eit tal langt mindre. Eg hadde sett for meg 5, kanskje 10 treff for å ta godt i.

Etter flagging går bileta til manuelle gjennomsyn. Eg tippar det kan ta laaaang tid, spesielt om mange er råka av det same. I mellomtida er alt utstyr låst ute av kontoen din. Still deg spørsmåla:

  • Kva vil du kunne tape dersom du mister Apple-kontoen din?
  • Kor lenge tåler du at Apple-kontoen din kan vere deaktivert?

Bilete som genererer same kontrollsum i Apple NeuralHash:

Legg att eit svar

Fill in your details below or click an icon to log in:

WordPress.com logo

Du kommenterer no med WordPress.com-kontoen din. Logg ut /  Endre )

Google photo

Du kommenterer no med Google-kontoen din. Logg ut /  Endre )

Twitter-bilde

Du kommenterer no med Twitter-kontoen din. Logg ut /  Endre )

Facebook-foto

Du kommenterer no med Facebook-kontoen din. Logg ut /  Endre )

Koplar til %s

This site uses Akismet to reduce spam. Learn how your comment data is processed.