Čo je Diferenciálna ochrana osobných údajov a ako zachováva svoje údaje anonymné?
Spoločnosť Apple si kladie za svoju povesť, že zabezpečuje, že údaje, ktoré zhromažďuje od vás, zostávajú súkromné. Ako? Používaním niečoho nazývaného "Diferenciálna súkromia".
Čo je rozdielová súkromia?
Apple to vysvetľuje takto:
Spoločnosť Apple používa technológiu ochrany osobných údajov, aby pomohla zistiť spôsoby používania veľkého počtu používateľov bez toho, aby to ohrozilo súkromie jednotlivcov. Ak chcete zamaskovať totožnosť jednotlivca, Differential Privacy pridá matematický šum do malej vzorky individuálneho vzoru používania. Keďže viac ľudí zdieľa rovnaký vzor, začnú sa objavovať všeobecné vzory, ktoré môžu informovať a zlepšiť skúsenosti používateľov.
Filozofiou ochrany osobných údajov je to, že každý používateľ, ktorého zariadenie, či už ide o iPhone, iPad alebo Mac, pridáva výpočet do väčšieho množstva súhrnných údajov (veľký obrázok vytvorený z menších obrázkov), nemal by byť odhalený ako zdroj, nieto, aké údaje prispeli.
Spoločnosť Apple nie je jedinou spoločnosťou, ktorá to robí - či už spoločnosť Google aj spoločnosť Microsoft ju používali ešte skôr. Ale Apple ju popularizoval, keď o tom hovoril podrobne na svojom 2016 WWDC keynote.
Takže, ako sa to líši od ostatných anonymizovaných údajov, spýtate sa? No, anonymizované údaje môžu byť stále použité na odvodenie osobných informácií, ak viete o osobe dosť.
Povedzme, že hacker má prístup k anonymizovanej databáze, ktorá odhaľuje mzdové účty spoločnosti. Povedzme, že tiež vedia, že zamestnanec X sa presťahuje do inej oblasti. Hacker by potom mohol jednoducho vyhľadávať databázu pred a po Zamestnancovi X sa pohybuje a ľahko odvodí svoj príjem.
V záujme ochrany citlivých informácií zamestnancov X sa diferenciálna ochrana súkromia zmení dáta s matematickým "šumom" a inými technikami tak, že pri dotazovaní na databázu dostanete len priblíženie koľko (alebo niekto iný) Zamestnanec X bol zaplatený.
Preto sa jeho súkromie zachováva kvôli "rozdielu" medzi poskytnutými údajmi a pridaným šumom, takže je potom dosť neurčité, že je prakticky nemožné vedieť, či údaje, ktoré hľadáte, sú skutočne jednotlivci.
Ako funguje Apple Differential Privacy?
Diferenciálna ochrana osobných údajov je relatívne nová koncepcia, ale myšlienkou je, že môže dať spoločnosti záujem na základe údajov od používateľov bez toho, aby vedeli, čo presne tieto údaje hovoria alebo od ktorých pochádza.
Spoločnosť Apple sa napríklad spolieha na tri komponenty, aby vykonala prácu na riešení Diferenciálnej ochrany osobných údajov v zariadení Mac alebo iOS: hash, subsampling a hluk.
Hashing preberá reťazec textu a zmení ho na kratšiu hodnotu s pevnou dĺžkou a zmení tieto klávesy na nezvratne náhodné reťazce jedinečných znakov alebo "hash". Toto zakrýva vaše dáta, takže zariadenie nie je uložené v pôvodnej podobe.
Podvzorkovanie znamená, že namiesto zhromažďovania každého slova osoba typuje, Apple bude používať len menšiu vzorku z nich. Povedzme napríklad, že máte dlhý textový rozhovor s priateľom, ktorý používa emoji. Namiesto zhromažďovania celej konverzácie by podsúbor mohol namiesto toho používať iba tie časti, o ktoré sa zaujíma Apple, ako napríklad emoji.
A nakoniec, vaše zariadenie vtláča šum a pridá náhodné dáta do pôvodnej množiny údajov, aby to bolo viac vágne. To znamená, že Apple dostane výsledok, ktorý bol maskovaný niekedy tak mierne, a preto nie je úplne presný.
Toto všetko sa deje na vašom zariadení, takže už bolo skrátené, zamiešané, vzorkované a rozmazané ešte predtým, ako je dokonca poslaný do cloudu, aby analyzoval Apple.
Kde sa používa diferencovaná súkromia spoločnosti Apple?
Existuje množstvo prípadov, keď Apple sila chcete zozbierať údaje na zlepšenie svojich aplikácií a služieb. Práve teraz však spoločnosť Apple používa len diferenciálnu ochranu súkromia v štyroch špecifických oblastiach.
- Keď dosť ľudí nahradí slovo určitým emojiom, stáva sa návrhom pre každého.
- Keď sa nové slová pridajú k dostatočným miestnym slovníkom, ktoré sa považujú za bežné, Apple ju pridá do slovníka všetkých ostatných.
- Môžete použiť hľadaný výraz v kategórii Spotlight a potom vám poskytnú návrhy aplikácií a otvoríte daný odkaz v danej aplikácii alebo vám ho umožníte nainštalovať z App Store. Povedzme napríklad, že hľadáte "Star Trek", čo naznačuje aplikáciu IMDB. Čím viac ľudí otvorí alebo nainštaluje aplikáciu IMDB, tým viac sa objaví vo všetkých výsledkoch vyhľadávania.
- Poskytuje presnejšie výsledky pre tipy vyhľadávania v poznámkach. Povedzme napríklad, že máte poznámku so slovom "apple" v nej. Vykonávate vyhľadávacie vyhľadávanie a prináša vám výsledky nielen pre definíciu slovníka, ale aj pre webové stránky Apple, pre umiestnenie Apple Stores a tak ďalej. Pravdepodobne, čím viac ľudí klepá na určité výsledky, tým vyššie a častejšie sa objavia v vyhľadávaní pre všetkých ostatných.
Ako príklad používame emojis. V systéme iOS 10 spoločnosť Apple uviedla na iMessage novú funkciu výmeny emodži. Zadajte slovo "láska" a môžete ho nahradiť emojim srdca. napíšte slovo "pes" a - uhádli ste to - môžete ho nahradiť emojimom psa.
Podobne je možné, aby váš iPhone predpovedal, aký emoji chcete tak, že ak píšete správu "Chystám sa prechádzať pes", váš iPhone vám pomôže navrhnúť emoji.
Takže Apple berie všetky tie malé kúsky údajov iMessage, ktoré zhromažďuje, skúma ich ako celok a dokáže odvodiť vzory od toho, čo píšu ľudia a v akom kontexte. To znamená, že váš iPhone vám môže dať šikovnejšie voľby, pretože to prináša úžitok z tých textových rozhovorov, ktoré ostatní vytvárajú a myslí si, "je to pravdepodobne emoji, ktorý chcete."
Je to dedina (Emoji)
Nevýhodou ochrany osobných údajov je, že v malých vzorkách neposkytuje presné výsledky. Jeho moc spočíva v tom, že konkrétne údaje sú neurčité, takže ich nemožno pripísať žiadnemu používateľovi. Na to, aby fungovala a fungovala dobre, sa musí zúčastniť mnoho užívateľov.
Je to trochu ako pri pohľade na bitmapovú fotografiu veľmi blízko. Nebudete mať možnosť vidieť, čo to je, ak sa pozriete na niekoľko bitov, ale keď sa vrátite späť a pozriete sa na celú vec, obraz sa stáva čistejším a viac definovaným, aj keď nie je super rezolúcia.
Preto, aby sa zlepšila výmena emódií a predikcia (okrem iného), musí spoločnosť Apple zhromažďovať údaje iPhone a Mac z celého sveta, aby im poskytla čoraz jasnejší obraz o tom, čo ľudia robia, a tým zlepšujú svoje aplikácie a služby. Obracia sa na všetky tieto náhodné, hlučné, davné údaje a vynáša to za vzorky - napríklad koľko používateľov používa broskyňové emoji namiesto "zadku".
Takže sila Diferenciálnej ochrany súkromia závisí od toho, že spoločnosť Apple dokáže preskúmať veľké množstvo agregovaných údajov, a zároveň zabezpečuje, že nie je múdrejší, kto ich posiela.
Ako odstrániť rozdielové súkromie v iOS a macOS
Ak stále nie ste presvedčený o tom, že pre vás je to rozdielová ochrana osobných údajov, máte šťastie. Môžete sa odhlásiť priamo z nastavení zariadenia.
Na zariadení so systémom iOS klepnite na položku "Nastavenia" a potom na položku "Ochrana osobných údajov".
Na obrazovke Súkromie klepnite na "Diagnostika a použitie".
Nakoniec na obrazovke Diagnostika a využitie klepnite na položku "Neposielajte".
V systéme macOS otvorte systémové predvoľby a kliknite na položku Zabezpečenie a ochrana osobných údajov..
V predvoľbách Bezpečnosť a ochrana osobných údajov kliknite na kartu Ochrana osobných údajov a potom skontrolujte, či nie je začiarknuté políčko Odoslať údaje o diagnostike a používaní spoločnosti Apple. Upozorňujeme, že budete musieť kliknúť na ikonu uzamknutia v ľavom dolnom rohu a predtým, ako túto zmenu vykonáte, zadajte systémové heslo.
Je samozrejme oveľa viac, pokiaľ ide o diferenciálnu ochranu súkromia, a to ako v teórii, tak v aplikácii, ako toto zjednodušené vysvetlenie. Mäso a zemiaky z neho závisia ťažko na niektorých vážnych matematikách a ako taký, môže to byť dosť ťažké a komplikované.
Dúfajme, že toto vám dáva predstavu o tom, ako to funguje, a že máte väčšiu dôveru v spoločnosti, ktorá zhromažďuje určité údaje bez obáv z identifikácie.