1 / 13

امنیت پایگاه داده های آماری

امنیت پایگاه داده های آماری. رسول جلیلی jalili@sharif.edu. مقدمه. پایگاه داده های آماری عموماً برای تولید آمار بروی داده های مختلف به کار می روند. رويکرد های امنیتی پایگاه داده های آماری باید از لو دادن هر داده منفرد خود داری کنند. امنیت پایگاه داده های آماری به دوشکل می تواند کنترل شود:

steven-wall
Download Presentation

امنیت پایگاه داده های آماری

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. امنیت پایگاه داده های آماری رسول جلیلی jalili@sharif.edu رسول جليلي- درس امنيت پايگاه داده ها- نيمسال دومتحصيلي91-92

  2. مقدمه • پایگاه داده های آماری عموماً برای تولید آمار بروی داده های مختلف به کار می روند. • رويکرد های امنیتی پایگاه داده های آماری باید از لو دادن هر داده منفرد خود داری کنند. • امنیت پایگاه داده های آماری به دوشکل می تواند کنترل شود: • خودداری از پرس و جوهایی که مقادیر صفات مختلف را برمیگرداند • صرفا با اجازه دادن به پرس و جوهایی که توابع تجمعی آماری مانند SUM، MAX، MIN، COUNT و AVERAGE را به کار میبرند Q1: SELECT COUNT (*) FROM PERSON WHERE CONDITION; Q2: SELECT AVG (INCOME) FROM PERSON WHERE CONDITION; رسول جليلي- درس امنيت پايگاه داده ها- نيمسال دوم تحصيلي 91-92

  3. مثال • مثال: • اگر به دنبال حقوق سالیانه S.jahed باشیم و بدانیم که او در شهر بم کرمان زندگی می کند و خانم است و در حال گرفتن مدرک PhD خود است، می توان با استفاده از پرس و جوی آماری Q1(در اسلاید قبلی) و با استفاده از شرایط زیر تعداد کسانی که این شرایط را دارند را محاسبه کنیم: (LAST_DEGREE=‘Ph.D.’ AND SEX=‘F’ AND CITY= ‘Bam’ AND STATE=‘Kerman’) رسول جليلي- درس امنيت پايگاه داده ها- نيمسال دوم تحصيلي 91-92

  4. مثال-2 حال اگر جواب Q1 با شرایط گفته شده در اسلاید قبلی 1 (یک) باشد، با انجام پرس و جوی Q2 با استفاده از شرایط مشابه اسلاید قبلی، می توان به درآمد سالیانه S.Jahed رسید. حتی اگر تعداد نتیجه مربوط به Q1 دقیقاً یک نباشد ولی نزدیک به آن و عدد کوچکی باشد، می توان به کمک توابع تجمعی آماری مانند Max، Minو Average حدود و یا بازه ای از حقوق S.Jahed را پی برد. رسول جليلي- درس امنيت پايگاه داده ها- نيمسال دوم تحصيلي 91-92

  5. مفاهیم پایه ای-1 • SDB مرجع به فرم پایگاه داده ای رابطه ای است. • N تعداد موجودیتها و m تعداد صفات شمای SDB میباشد • این پایگاه داده مرجع در اسلاید بعدی آمده است: • Xij به معنای مقدار jامین صفت (Aj) از رکورد iام موجود در SDB میباشد . • هر صفت Aj دارای |Aj|مقادیر ممکن است. رسول جليلي- درس امنيت پايگاه داده ها- نيمسال دوم تحصيلي 91-92

  6. مفاهیم پایه ای-2 رسول جليلي- درس امنيت پايگاه داده ها- نيمسال دوم تحصيلي 91-92

  7. مفاهیم پایه ای-3 • SDBهای خاص منظوره، مانند پایگاه داده های نظرسنجی، بعضی آمارها را در فرم جدول ارائه می دهند. (Macrostatistics نامیده می شوند) • شکل روبرو تعداد را در قالب جدول 3 بعدی نشان می دهد. رسول جليلي- درس امنيت پايگاه داده ها- نيمسال دوم تحصيلي 91-92

  8. مفاهیم پایه ای-4 • پرس و جوهای آماری می تواند با استفاده از بعضی کلیدها (keys) و یا فرمولهای خصوصیتی(Characteristics Formulas) انجام شود. • آمارهای مبتنی بر کلید در فرم هایی مانند Sum(C, Salary) و C=(Ali, Taghi,Naghi, javad) می باشد. • فرمولهای خصوصیتی (مشخص شده با استفاده از A و B و . . .) یک فرمول منطقی از صفات ترکیب شده با اپراتورهای And، Orو Not می باشند. • مثال: • A= (Sex=F) ((Dept-Code=Dept1)(Dept_code=Dept2)) (Birth-Year<1965) رسول جليلي- درس امنيت پايگاه داده ها- نيمسال دوم تحصيلي 91-92

  9. مفاهیم پایه ای-5 یک فرمول خصوصیتی(CF) مجموعه ای از رکوردها را مشخص میکند که مجموعه پرس و جو (Query Set) نامیده میشود (X(A)) و تعداد رکوردهای X(A)، |X(A)| خواهد بود. All: برای هر CF مانند C، رابطه X(C)  X(All). برقرار است. این یعنی مجموعه پرس و جوهای (query set) هر C زیر مجموعه ای از کل SDB است. مجموعه های ابتدایی(Elementary Sets) مجموعه های پرس و جوی ساده غیر قابل تجزیه ای هستند: C=(A1=a1)(A2=a2)… (AM=aM), که Ajیک صفت از SDB و aj یکی از مقادیر آن صفت است تعداد مجموعه های ابتدایی (E) در یک SDB با صفات A1,…Am برابر است با E=|A1|* … * |Am| که بعضی از مقادیر خالی می باشند. رسول جليلي- درس امنيت پايگاه داده ها- نيمسال دوم تحصيلي 91-92

  10. مفاهیم پایه ای-6 پرس و جوهای مهم آماری در SDB از قرار زیر هستند: Count(C) = |X(C)| Sum (C, Aj) = iX(C)Xij Rfreq(C) = Count(C)/N (relative frequency of the query set.) Avg(C,Aj) Max(C,Aj) Min(C,Aj) Median(C,Aj) = |X(C)|/2 (used to compute the median value in an ordered set of a numerical value of an attribute Aj.) آمار حساس، آماری است که به افشای محرمانگی اطلاعات بروی یک موجودیت واحد SDB منجر گردد. رسول جليلي- درس امنيت پايگاه داده ها- نيمسال دوم تحصيلي 91-92

  11. تکنیک های حفاظت از استنتاج • یکی از دلایل در خطر بودن امنیت SDBها، امکان استنتاج اطلاعات محرمانه مربوط به موجودیت های نمایش داده شده در SDB می باشد. • با در نظر گرفتن Ai به عنوان یک صفت با اطلاعات محرمانه غیر عددیو یا یک صفت عددی، و Xj که یک موجودیت را در SDB تعریف می کند: • Exact Compromise: زمانی رخ می دهد که کاربر با استفاده از تعدادی پرس و جوی آماری بتواند مقدار 1 برای صفت غیر عددی Ai و یا مقدار دقیق عددی رکورد j ام از SDB را استنتاج نماید. • Partial Compromise: زمانی اتفاق می افتد که کاربر با استفاده از تعدادی پرس و جوی آماری مقدار صفر را برای صفت غیر عددی Ai و یا یک مقدار تقریبی از مقدار صفت عددی را بتواند استنتاج نماید.. رسول جليلي- درس امنيت پايگاه داده ها- نيمسال دوم تحصيلي 91-92

  12. تکنیک های حفاظت از استنتاج-2 • انواع تکنیک ها: • مفهومی(Conceptual) • به مسئله استنتاج در سطح مفهوم نگاه می کند و با مدل داده ای مفهومی SDB کار میکند. • مبتنی بر محدودیت(Restriction-based) • حفاظت از استنتاج را بوسیله محدود سازی بعضی پرس و جوهای آماری تامین می کند • پرس و جوها شامل تعداد بسیار کم و یا بسیار زیادی از رکوردها نباید باشند. • باید به کارایی سیستم در اثر رد کردن تعداد زیادی از پرس و جو ها نیز توجه داشته باشد. • مبتنی بر انحراف(Perturbation-based) • حفاظت از استنتاج را با تعریف بعضی تغییرات بروی اطلاعات بکار گرفته برای جواب دادن به پرس و جوهای آماری تامین می کند. • این تغییرات می تواند بر داده های ذخیره شده در SDB و یا اینکه نتایج محاسبه شده قبل از افشاء به کاربر باشد. رسول جليلي- درس امنيت پايگاه داده ها- نيمسال دوم تحصيلي 91-92

  13. پایان مركز امنيت شبكه شريف http://nsc.sharif.edu رسول جليلي- درس امنيت پايگاه داده ها- نيمسال دوم تحصيلي 91-92

More Related