همچون دیگر شرکت های بزرگ فناوری، اپل نیز مایل است تا جای ممکن دانسته های خود درباره مشتریانش را گسترش دهد؛ در عین حال که همواره از خود به عنوان حساس ترین شرکت در رابطه با حریم خصوصی کاربران یاد می کند. با در نظر داشتن این مورد و همچنین گسترش روزافزون بررسی های آماری عادات کاربران توسط شرکت های بزرگ فناوری، قطعا اپل نمی تواند از قافله عقب بماند و عجیب نخواهد بود اگر راهکار خود برای پارادوکس حریم خصوصی-آمار کاربری را در کنفرانس WWDC 2016 به بحث بگذارد.
به گزارش wired، در طی کنفرانس هفته گذشته اپل در سان فرانسیسکو، کریگ فدریگی مدیر بخش مهندسی نرم افزار این شرکت یادآور شد که اپل داده های آماری پروفایل کاربران را جمع آوری نکرده و تا جای ممکن محاسبات آنچه به داده های شخصی مربوط می شود روی دستگاه کاربر صورت می گیرد و روی سرورها انجام نمی شود (همانند کدنگاری و امن سازی ارتباط دو طرفه در اپلیکیشن iMessage و Facetime). با این حال فدریگی تایید نمود که جمع آوری داده های کاربری جهت ساخت نرم افزارهای بهتر و کاربردی تر الزامی بوده و اینکه راهکار اپل به جای کدنگاری داده ها (که قابل کدگشایی و دستیابی به داده های کاربری است) ، حریم خصوصی تفاضلی خواهد بود (حریم خصوصی تفاضلی یا Differential Privacy که در ادامه مطلب از آن به DP یاد می کنیم).
آرون روث استاد علوم کامپیوتری دانشگاه پنسیلوانیا (کسی که فدریگی در صحبت های خود از او به عنوان مولف کتاب ” Algorithmic Foundations of Differential Privacy” یاد نمود) می گوید: “هنگامی که مجموعه بزرگی از داده های کاربران را در اختیار دارید، ممکن است مایل باشید یک الگوریتم یادگیری ماشینی را جهت استخراج بینش ها و نگرش های آماری مورد استفاده قرار دهید؛ در عین حال که می خواهید کسی قادر نباشد مطلب ویژه ای را درباره کاربران مشخصی به دست آورد. DP اجازه می دهد نگرش آماری لازم را از داده ها استخراج کنید و از منظر ریاضی ثابت شده که دستیابی به مشخصات و هویت کاربران ممکن نیست”. بینش های آماری مورد بحث در بهبود اپلیکیشن صفحه کلید، شکلک ها، دستیار هوشمند، جستجوی محلی با Spotlight و دیگر موارد مشابه به کار می روند.
واقعیت اینکه حذف شناسه کاربری و موارد مشابه از داده ها کافی نیست و این احتمال وجود دارد که بتوان داده ها را به هویت واقعی اشخاص مرتبط نمود. شبکه رسانه ای آنلاین Netflix در سال 2007 مجموعه آماری بزرگی را از امتیاز دهی کاربرانش منتشر کرد و پس از حذف مشخصات کاربران آنها را در اختیار محققین قرار داد تا جهت بهبود سیستم پیشنهاداتش مورد استفاده قرار دهند. به فاصله کوتاهی، دو محقق از دانشگاه تگزاس الگوی امتیاز دهی کاربران را با الگوی مشابه در وب سایت IMDB مقایسه کردند و از آنجایی که هویت برخی کاربران مشخص بود، نتیجه را می توانید خود حدس بزنید!
به گفته فدریگی، DP جهت ناممکن ساختن شناسایی کاربران از روش هایی چون Hashing (تبدیل داده ها به رشته ای از کارکترهای در هم ریخته با طول مشخص و ثابت)، نمونه برداری یا subsampling (برداشت تنها بخشی از داده ها) و noise injection ( افزودن داده های تصادفی به داده های موجود که منجر به پنهان سازی داده های حساس شخصی و هویت کاربر می شود) استفاده می کند. مورد آخر یا همان noise injection توسط یک الگوریتم ریاضی پیاده سازی می شود که ارتباطی به حجم و ماهیت داده ها نداشته و می توان آن را از معادله حذف نمود. با این وجود، اپل کلیتی از روش محاسباتی خود را جهت پیاده سازی DP در اختیار آرون روث گذاشته و آنطور که او می گوید، این شرکت در مسیر درستی قرار گرفته است.
شاید حق بادوستمون Rohit باشه ولی خب تلاش برای حفظ حریم خیلی مهمه همینطور که قبل تر اگه کسی به منزل ویا هر چیزی از ما دستبرد میزد ما امنیت اون محل یا وسیله رو بیشتر میکردیم و اگر میگفتیم بی معنیه خب الان وضعیت فرق میکرد
بنظرم چیزی به اسم حریم خصوصی تو موبایل و اینترنت بی معنیه . ما که تو گوشیمون هیچی نگه نمیداریم.