امنیت پایگاه داده های آماری
This presentation is the property of its rightful owner.
Sponsored Links
1 / 13

امنیت پایگاه داده های آماری PowerPoint PPT Presentation


  • 107 Views
  • Uploaded on
  • Presentation posted in: General

امنیت پایگاه داده های آماری. رسول جلیلی [email protected] مقدمه. پایگاه داده های آماری عموماً برای تولید آمار بروی داده های مختلف به کار می روند. تکنیک های امنیتی پایگاه داده های آماری باید از لو دادن هر داده منفرد خود داری کنند. امنیت پایگاه داده های آماری به دوشکل می تواند کنترل شود:

Download Presentation

امنیت پایگاه داده های آماری

An Image/Link below is provided (as is) to download presentation

Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author.While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server.


- - - - - - - - - - - - - - - - - - - - - - - - - - E N D - - - - - - - - - - - - - - - - - - - - - - - - - -

Presentation Transcript


6605954

امنیت پایگاه داده های آماری

رسول جلیلی

[email protected]

رسول جليلي- درس امنيت پايگاه داده ها- نيمسال دوم تحصيلي 86-87


6605954

مقدمه

  • پایگاه داده های آماری عموماً برای تولید آمار بروی داده های مختلف به کار می روند.

  • تکنیک های امنیتی پایگاه داده های آماری باید از لو دادن هر داده منفرد خود داری کنند.

  • امنیت پایگاه داده های آماری به دوشکل می تواند کنترل شود:

    • خودداری از پرس و جوهایی که مقادیر صفات مختلف را برمیگرداند

    • صرفا با اجازه دادن به پرس و جوهایی که توابع تجمعی آماری مانند SUM، MAX، MIN، COUNT و AVERAGE را به کار میبرند

      Q1:SELECT COUNT (*) FROM PERSON

      WHERECONDITION;

      Q2:SELECT AVG (INCOME) FROM PERSON

      WHERECONDITION;

رسول جليلي- درس امنيت پايگاه داده ها- نيمسال دوم تحصيلي 86-87


6605954

مثال

  • مثال:

    • اگر به دنبال حقوق سالیانه S.jahed باشیم و بدانیم که او در شهر بم کرمان زندگی می کند و خانم است و در حال گرفتن مدرک PhD خود است، می توان با استفاده از پرس و جوی آماری Q1(در اسلاید قبلی) و با استفاده از شرایط زیر تعداد کسانی که این شرایط را دارند را محاسبه کنیم:

      (LAST_DEGREE=‘Ph.D.’ AND SEX=‘F’ AND CITY= ‘Bam’ AND STATE=‘Kerman’)

رسول جليلي- درس امنيت پايگاه داده ها- نيمسال دوم تحصيلي 86-87


6605954

مثال-2

حال اگر جواب Q1 با شرایط گفته شده در اسلاید قبلی 1 (یک) باشد، با انجام پرس و جوی Q2 با استفاده از شرایط مشابه اسلاید قبلی، می توان به درآمد سالیانه S.Jahed رسید.

حتی اگر تعداد نتیجه مربوط به Q1 دقیقاً یک نباشد ولی نزدیک به آن و عدد کوچکی باشد، می توان به کمک توابع تجمعی آماری مانند Max، Minو Average حدود و یا بازه ای از حقوق S.Jahed را پی برد.

رسول جليلي- درس امنيت پايگاه داده ها- نيمسال دوم تحصيلي 86-87


6605954

مفاهیم پایه ای-1

  • SDB مرجع به فرم پایگاه داده ای رابطه ای است.

  • N تعداد موجودیتها و M تعداد صفات شمای SDB میباشد

  • این پایگاه داده مرجع در اسلاید بعدی آمده است:

    • Xij به معنای مقدار jامین صفت (Aj) از رکورد iام موجود در SDB میباشد .

    • هر صفت Aj دارای |Aj|مقادیر ممکن است.

رسول جليلي- درس امنيت پايگاه داده ها- نيمسال دوم تحصيلي 86-87


6605954

مفاهیم پایه ای-2

رسول جليلي- درس امنيت پايگاه داده ها- نيمسال دوم تحصيلي 86-87


6605954

مفاهیم پایه ای-3

  • SDBهای خاص منظوره، مانند پایگاه داده های نظرسنجی، بعضی آمارها را در فرم جدول ارائه می دهند. (Macrostatistics نامیده می شوند)

  • شکل روبرو تعداد را در قالب جدول 3 بعدی نشان می دهد.

رسول جليلي- درس امنيت پايگاه داده ها- نيمسال دوم تحصيلي 86-87


6605954

مفاهیم پایه ای-4

  • پرس و جوهای آماری می تواند با استفاده از بعضی کلیدها (keys) و یا فرمولهای خصوصیتی(Characteristics Formulas) انجام شود.

  • آمارهای مبتنی بر کلید در فرم هایی مانند Sum(C, Salary) و C=(Ali, Taghi,Naghi, javad) می باشد.

  • فرمولهای خصوصیتی (مشخص شده با استفاده از A و B و . . .) یک فرمول منطقی از صفات ترکیب شده با اپراتورهای And، Orو Not می باشند.

  • مثال:

    • A= (Sex=F) ((Dept-Code=Dept1)(Dept_code=Dept2)) (Birth-Year<1965)

رسول جليلي- درس امنيت پايگاه داده ها- نيمسال دوم تحصيلي 86-87


6605954

مفاهیم پایه ای-5

یک فرمول خصوصیتی(CF) مجموعه ای از رکوردها را مشخص میکنند که مجموعه پرس و جو ها(Query Set) نامیده میشود و تعداد رکوردهای X(A)، |X(A)| خواهد بود.

All: برای هر CF مانند C، رابطه X(C)  X(All). برقرار است. این یعنی مجموعه پرس و جوهای (query set) هر C زیر مجموعه ای از کل SDB است.

مجموعه های ابتدایی(Elementary Sets) مجموعه های پرس و جوی ساده غیر قابل تجزیه ای هستند:

C=(A1=a1)(A2=a2)… (AM=aM),

که Ajیک صفت از SDB و aj یکی از مقادیر آن صفت است

تعداد مجموعه های ابتدایی (E) در یک SDB با صفات A1,…Am برابر است با E=|A1|* … * |Am| که بعضی از مقادیر خالی می باشند.

رسول جليلي- درس امنيت پايگاه داده ها- نيمسال دوم تحصيلي 86-87


6605954

مفاهیم پایه ای-6

پرس و جوهای مهم آماری در SDB از قرار زیر هستند:

Count(C) = |X(C)|

Sum (C, Aj) = iX(C)Xij

Rfreq(C) = Count(C)/N (relative frequency of the query set.)

Avg(C,Aj)

Max(C,Aj)

Min(C,Aj)

Median(C,Aj) = |X(C)|/2 (used to compute the median value in an ordered set of a numerical value of an attribute Aj.)

آمار حساس، آماری است که به افشای محرمانگی اطلاعات بروی یک موجودیت واحد SDB منجر گردد.

رسول جليلي- درس امنيت پايگاه داده ها- نيمسال دوم تحصيلي 86-87


6605954

تکنیک های حفاظت از استنتاج

  • یکی از دلایل در خطر بودن امنیت SDBها، امکان استنتاج اطلاعات محرمانه مربوط به موجودیت های نمایش داده شده در SDB می باشد.

  • با در نظر گرفتن Ai به عنوان یک صفت با اطلاعات محرمانه غیر عددی( که مقدارش یک است اگر موجودیت مورد نظر ویژگی مورد توصیف توسط این صفت را دارد و در غیر این صورت مقدارش صفر است) و یا یک صفت عددی، و Xj که یک موجودیت در SDB تعریف می کند:

    • Exact Compromise: زمانی رخ می دهد که کاربر با استفاده از تعدادی پرس و جوی آماری بتواند مقدار 1 برای صفت غیر عددی Ai و یا مقدار دقیق عددی رکورد j ام از SDB را استنتاج نماید.

    • Partial Compromise: زمانی اتفاق می افتد که کاربر با استفاده از تعدادی پرس و جوی آماری مقدار صفر را برای صفت غیر عددی Ai و یا یک مقدار تقریبی از مقدار صفت عددی را بتواند استنتاج نماید..

رسول جليلي- درس امنيت پايگاه داده ها- نيمسال دوم تحصيلي 86-87


6605954

تکنیک های حفاظت از استنتاج-2

  • انواع تکنیک ها:

    • مفهومی(Conceptual)

      • به مسئله استنتاج در سطح مفهوم نگاه می کند و با مدل داده ای مفهومی SDB کار میکند.

    • مبتنی بر محدودیت(Restriction-based)

      • حفاظت از استنتاج را بوسیله محدود سازی بعضی پرس و جوهای آماری تامین می کند

      • پرس و جوها شامل تعداد بسیار کم و یا بسیار زیادی از رکوردها نباید باشند.

      • باید به کارایی سیستم در اثر رد کردن تعداد زیادی از پرس و جو ها نیز توجه داشته باشد.

  • مبتنی بر انحراف(Perturbation-based)

    • حفاظت از استنتاج را با تعریف بعضی تغییرات بروی اطلاعات بکار گرفته برای جواب دادن به پرس و جوهای آماری تامین می کند.

    • این تغییرات می تواند بر داده های ذخیره شده در SDB و یا اینکه نتایج محاسبه شده قبل از افشاء به کاربر باشد.

رسول جليلي- درس امنيت پايگاه داده ها- نيمسال دوم تحصيلي 86-87


6605954

پایان

مركز امنيت شبكه شريف

http://nsc.sharif.edu

رسول جليلي- درس امنيت پايگاه داده ها- نيمسال دوم تحصيلي 86-87


  • Login