slide1 n.
Download
Skip this Video
Loading SlideShow in 5 Seconds..
יסודות סטטיסטיקה יישומית PowerPoint Presentation
Download Presentation
יסודות סטטיסטיקה יישומית

Loading in 2 Seconds...

play fullscreen
1 / 75

יסודות סטטיסטיקה יישומית - PowerPoint PPT Presentation


  • 216 Views
  • Uploaded on

יסודות סטטיסטיקה יישומית. מטרת הקורס. הקורס נועד להקנות כלים סטטיסטיים לפתרון בעיות נפוצות בתעשייה ולפתח יכולת חשיבה סטטיסטית. מה עשויה לעשות חשיבה סטטיסטית ?. להפריד בין עובדות למבדות. למקד תשומת לב בבעיה. לשכנע לעבור מתיקונים לכוונונים. להבין את המצב האמיתי שקיים.

loader
I am the owner, or an agent authorized to act on behalf of the owner, of the copyrighted work described.
capcha
Download Presentation

PowerPoint Slideshow about 'יסודות סטטיסטיקה יישומית' - lajos


An Image/Link below is provided (as is) to download presentation

Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author.While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server.


- - - - - - - - - - - - - - - - - - - - - - - - - - E N D - - - - - - - - - - - - - - - - - - - - - - - - - -
Presentation Transcript
slide1

יסודות סטטיסטיקה יישומית

קורס לסטטיסטיקה יישומית - נושא ראשון:נתונים

slide2
מטרת הקורס

הקורס נועד להקנות כלים סטטיסטיים לפתרון בעיות נפוצות בתעשייה ולפתח יכולת חשיבה סטטיסטית.

קורס לסטטיסטיקה יישומית - נושא ראשון:נתונים

slide3
מה עשויה לעשות חשיבה סטטיסטית ?
  • להפריד בין עובדות למבדות.
  • למקד תשומת לב בבעיה.
  • לשכנע לעבור מתיקונים לכוונונים.
  • להבין את המצב האמיתי שקיים.
  • לעזור לקבוע מטרות ויעדים נכונים.
  • לתרום לשיפור ערך.

קורס לסטטיסטיקה יישומית - נושא ראשון:נתונים

slide4
תיאור הקורס
  • חלק I – יסודות גישה ובקרת איכות סטטיסטית(עבודה עם נתונים,יסודות סטטיסטיקה תיאורית,SPC ואיכות התהליך)
  • חלק II– שיטות סטטיסטיות מתקדמות (ניתוח שונות,מידול בעזרת רגרסיה ותכנון ניסויים תעשייתיים)

קורס לסטטיסטיקה יישומית - נושא ראשון:נתונים

i 1 2
חלק I – נושא ראשון: נתונים1. אסוף2. שיטות גראפיות

קורס לסטטיסטיקה יישומית - נושא ראשון:נתונים

slide7
3 רמות ניהול תהליך
  • כיבוי שריפות
  • תפעולית
  • אסטרטגית

קורס לסטטיסטיקה יישומית - נושא ראשון:נתונים

slide8
הדרך מנתונים למידע
  • אסוף נתונים.
  • מבט ראשוני תוך שימוש בכלים גראפיים.
  • ניפוי (ניקוי) נתונים.
  • טיפול בנתונים תוך שימוש בכלים כמותיים.
  • ניתוח (מסקנות והמלצות).
  • מידע.

קורס לסטטיסטיקה יישומית - נושא ראשון:נתונים

slide9

כדי לקבל החלטות אנחנו זקוקים למידע.שאלה: " העולם מלא רעש,אז איך להפוך נתונים למידע ?"

תשובה: בעזרת כלים סטטיסטיים

קורס לסטטיסטיקה יישומית - נושא ראשון:נתונים

slide10
דוגמה לחוסר הבנה סטטיסטית

נומינל = ממוצע

  • מעל ממוצע – טוב !
  • מתחת לממוצע – רע !

פיזור = אפס

יש למנוע (לסלק) כל מה שסוטה מערך נומינלי

קורס לסטטיסטיקה יישומית - נושא ראשון:נתונים

get the facts before you decide
אסוף נתונים – מטרהGet the facts before you decide

ISO 9000: 2000

“ Eight Quality Management Principles”

Principle 7: Factual approach to decision making

Effective decisions are based on the analysis of data and information

  • Organizations perform better when their decisions are based on facts. Therefore:
  • Organizations must base decisions on the analysis of factual information and data.

קורס לסטטיסטיקה יישומית - נושא ראשון:נתונים

slide12
מטרת אסוף נתונים – דוגמות
  • FRACAS (Failure Reporting, Analysis, and Correction Action System)
  • Quality Costs (effectiveness of the quality management system)
  • Customer Satisfaction Survey

קורס לסטטיסטיקה יישומית - נושא ראשון:נתונים

slide13
סוגי נתונים

קורס לסטטיסטיקה יישומית - נושא ראשון:נתונים

slide14
4 סולמות של נתונים

קורס לסטטיסטיקה יישומית - נושא ראשון:נתונים

four types of data
Four types of data

The four levels were proposed by Stanley Smith Stevens in his 1946 article.Different mathematical operations on variables are possible, depending on the level at which a variable is measured.

קורס לסטטיסטיקה יישומית - נושא ראשון:נתונים

categorical variables
Categorical Variables

1. Nominal scale:

  • gender,
  • race,
  • religious affiliation,
  • the number of a bus.

Possible operations:

קורס לסטטיסטיקה יישומית - נושא ראשון:נתונים

categorical variables cont
Categorical Variables(cont.)

2.Ordinal scale :

  • results of internet page rank,
  • alphabetic order,
  • Mohs hardness scale (10 levels from talc to diamond)
  • customer satisfaction grade ,
  • quality sort,
  • customer importance (QFD)
  • vendor’s priority,
  • severity of failure or RPN (FMECA),
  • the power of linkage (QFD)

Possible operations:

קורס לסטטיסטיקה יישומית - נושא ראשון:נתונים

numerical data
Numerical data.

3. Interval scale:

  • temperature in Celsius or Fahrenheit scale ,
  • object coordinate,
  • electric potential.

Possible operations:

קורס לסטטיסטיקה יישומית - נושא ראשון:נתונים

numerical data cont
Numerical data (cont.)

4. Ratio scale:

  • most physical quantities, such as mass, or energy,
  • temperature, when it is measured in kelvins,
  • amount of children in family,
  • age.

Possible operations:

קורס לסטטיסטיקה יישומית - נושא ראשון:נתונים

slide20
תוכנית אסוף נתוני איכות צריכה לספק תשובה ל-5 שאלות
  • מה ?- יש לזהות תכונות קריטיות לאיכות
  • היכן ? – להגדיר נקודות קריטיות של התהליך
  • כמה?- להגדיר מדגם אופטימלי
  • מתי ? – להגדיר תדירות הדגימה
  • איך ? – להגדיר שיטת בדיקה (מדידה) וכלים נחוצים

קורס לסטטיסטיקה יישומית - נושא ראשון:נתונים

slide21
3 עקרונות של אסוף נתונים
  • בשלב התחלתי תוכנית אסוף נתונים צריכה להתייחס רק למטרות המחקר.
  • בשלב סופי תוכנית אסוף נתונים צריכה להתייחס רק לתוצאות המחקר.
  • תמיד תבדוק אישית את הנתונים שנאספו, אל תניח מראש שנתונים יאספו בדיוק בהתאם לתוכנית שפיתחת.

קורס לסטטיסטיקה יישומית - נושא ראשון:נתונים

slide22
שתי שיטות לאסוף נתונים

קורס לסטטיסטיקה יישומית - נושא ראשון:נתונים

slide23
שיטה סבילה
  • תשומות נבדקות (בחינת קבלה)
  • תפוקות נבחנות (בדיקה סופית)
  • פרמטרים של תהליך מבוקרים (מעקב אחר התהליך-SPC)

קורס לסטטיסטיקה יישומית - נושא ראשון:נתונים

slide24
שיטה פעילה
  • קלטים - should be changed
  • תגובות - should be measured
  • גורמים בלתי נשלטים – should be simulated
  • גורמים נשלטים - should be changed

קורס לסטטיסטיקה יישומית - נושא ראשון:נתונים

slide25
טכניקות איסוף נתונים אפשריות
  • ראיון
  • מילוי טופס (גיליון)
  • מדידה
  • צילום
  • Electronic Data Reporting
  • ....- ולא לשכוח נקודות (ספרות)בקורת !

קורס לסטטיסטיקה יישומית - נושא ראשון:נתונים

slide26
ניתוח מדדים ל:
  • מגמה (ממוצע, חציון, שכיח) – מדגם קטן יחסית
  • פיזור (שונות,סטיית תקן,טווח) - מדגם בינוני
  • צורת ההתפלגות (skewness, kurtosis)- מדגם גדול

קורס לסטטיסטיקה יישומית - נושא ראשון:נתונים

slide27
בעיות של נתונים
  • העדר נתונים
  • מחסור נתונים
  • נתון לא מזוהה
  • נתונים לא רלוונטיים
  • נתונים שגויים (למשל:בעקבות שגיאות מדידה כגון:דיוק,דייק,אמינות,אי יציבות,כושר הבחנה)
  • נתונים מורעשים
  • אי-שלמות של נתונים

קורס לסטטיסטיקה יישומית - נושא ראשון:נתונים

slide28
איתור וניפוי חריגים

חריג (outlier) – שונה לגמרי משאר האוכלוסייה/מדגם,לכן לגביו קיים חשד, שהוא בא מאוכלוסייה אחרת.

קורס לסטטיסטיקה יישומית - נושא ראשון:נתונים

slide29
ניפוי חריגים

אם, כתוצאה של שימוש באיזשהו test, הנתון מזוהה כחריג, יש להוציא אותו מהמדגם.אחרי זה ניתן להפעיל את אותו test שוב על מה שנותר .

מדיניות לגבי החריג שהוצא:

  • פשוט להוריד אותו
  • לנתח אותו בנפרד

קורס לסטטיסטיקה יישומית - נושא ראשון:נתונים

slide30
שיטת ניפוי חריגים למשתנה חד מימדי

Grubbs’ Test: if T>Tcr

קורס לסטטיסטיקה יישומית - נושא ראשון:נתונים

slide31
טבלה ל- Tcr

קורס לסטטיסטיקה יישומית - נושא ראשון:נתונים

pareto s 80 20 rule vital few and trivial many
Pareto's 80/20 rule"vital few and trivial many"

In anything a few (20 percent) are vital and many(80 percent) are trivial.

  • 20 percent of the people owned 80 percent of the wealth.
  • 20 percent of the defects causing 80 percent of the problems.
  • 20 percent of the work (the first 10 percent and the last 10 percent) consume 80 percent of your time and resources.
  • 20 percent of your stock takes up 80 percent of your warehouse space
  • 80 percent of your stock comes from 20 percent of your suppliers.
  • 80 percent of your sales will come from 20 percent of your sales staff.
  • 20 percent of your staff will cause 80 percent of your problems, but another 20 percent of your staff will provide 80 percent of your production.

How It Can Help You

It reminds you to focus on the 20 percent that matters. Of the things you do during your day, only 20 percent really matter. Those 20 percent produce 80 percent of your results. Identify and focus on those things.

קורס לסטטיסטיקה יישומית - נושא ראשון:נתונים

slide33

שיטות גראפיות פשוטות להצגה וניתוח נתונים

קורס לסטטיסטיקה יישומית - נושא ראשון:נתונים

star radar spider plot

Star/Radar/Spider Plot

Figure 1:A typical radar graph with two plots

קורס לסטטיסטיקה יישומית - נושא ראשון:נתונים

slide35
דיאגראמה עכביש

קורס לסטטיסטיקה יישומית - נושא ראשון:נתונים

purpose
Purpose
  • The star plotis a method of displaying multivariate data.
  • Each star represents a single observation.
  • Typically, star plots are generated in a multi-plot format with many stars on each page and each star representing one observation.
  • Star plots are used to examine the relative values for a single data point (e.g., point 3 is large for variables 2 and 4, small for variables 1, 3, 5, and 6) and to locate similar points or dissimilar points

קורס לסטטיסטיקה יישומית - נושא ראשון:נתונים

sample plot
Sample Plot
  • The plot below contains the star plots of 16 cars.
  • The variable list for the sample star plot is:

1. Price

2. Mileage (MPG)

3. 1978 Repair Record (1 = Worst, 5 = Best)

4. 1977 Repair Record (1 = Worst, 5 = Best)

5. Headroom

6. Rear Seat Room

7. Trunk Space

8. Weight

9. Length

קורס לסטטיסטיקה יישומית - נושא ראשון:נתונים

slide39
We can look at these plots individually or we can use them to

identify clusters of cars with similar features.

  • We can look at the star plot of the Cadillac Seville :

it is one of the most expensive cars,

gets below average (but not among the worst) gas mileage,

has an average repair record,

and has average-to-above-average roominess and size.

  • We can then compare the Cadillac models (the last three plots) with the AMC models (the first three plots).

The AMC models tend to be inexpensive,

have below average gas mileage,

and are small in both height and weight and in roominess.

The Cadillac models are expensive,

have poor gas mileage,

and are large in both size and roominess.

קורס לסטטיסטיקה יישומית - נושא ראשון:נתונים

questions
Questions

The star plot can be used to answer the following

questions:

  • What variables are dominant for a given observation?
  • Which observations are most similar, i.e., are there clusters of observations?
  • Are there outliers?

קורס לסטטיסטיקה יישומית - נושא ראשון:נתונים

weakness in technique
Weakness in Technique
  • Star plots are helpful for small-to-moderate-sized

multivariate data sets.

  • Their primary weakness is that their effectiveness is limited to data sets with less than a few hundred points.
  • After that, they tend to be overwhelming.

קורס לסטטיסטיקה יישומית - נושא ראשון:נתונים

slide42
דיאגראמת עוגה

קורס לסטטיסטיקה יישומית - נושא ראשון:נתונים

slide43
דיאגראמת עוגה

קורס לסטטיסטיקה יישומית - נושא ראשון:נתונים

pivot chart
Pivot Chart

קורס לסטטיסטיקה יישומית - נושא ראשון:נתונים

histogram http www stat sc edu west javahtml histogram html
Histogramhttp://www.stat.sc.edu/~west/javahtml/Histogram.htmlHistogramhttp://www.stat.sc.edu/~west/javahtml/Histogram.html

קורס לסטטיסטיקה יישומית - נושא ראשון:נתונים

cumulative histogram
Cumulative Histogram

קורס לסטטיסטיקה יישומית - נושא ראשון:נתונים

bihistogram
Bihistogram

קורס לסטטיסטיקה יישומית - נושא ראשון:נתונים

slide48
דיאגראמה פארטו

קורס לסטטיסטיקה יישומית - נושא ראשון:נתונים

slide49
דיאגראמה פארטו

קורס לסטטיסטיקה יישומית - נושא ראשון:נתונים

slide50
דיאגראמה פארטו

קורס לסטטיסטיקה יישומית - נושא ראשון:נתונים

box and whisker plot 1
Box-and-Whisker Plot (1)

18 27 34 52 54 59 61 68 78 82 85 87 91 93 100

  • 68 is the median
  • 52 is the lower quartile
  • 87 is the upper quartile
  • 35 is the interquartile range (IQR)

קורס לסטטיסטיקה יישומית - נושא ראשון:נתונים

box and whisker plot 2
Box-and-Whisker Plot(2)

קורס לסטטיסטיקה יישומית - נושא ראשון:נתונים

box and whisker plot 3
Box-and-Whisker Plot (3)
  • There is a useful variation of the box plot that more specifically identifies outliers. To create this variation:
  • Calculate the median and the lower and upper quartiles.
  • Plot a symbol at the median and draw a box between the lower and upper quartiles.
  • Calculate the interquartile range (the difference between the upper and lower quartile) and call it IQ.
  • Calculate the following points:
  • L1 = lower quartile - 1.5*IQL2 = lower quartile - 3.0*IQU1 = upper quartile + 1.5*IQU2 = upper quartile + 3.0*IQ
  • The line from the lower quartile to the minimum is now drawn from the lower quartile to the smallest point that is greater than L1. Likewise, the line from the upper quartile to the maximum is now drawn to the largest point smaller than U1.
  • Points between L1 and L2 or between U1 and U2 are drawn as small circles. Points less than L2 or greater than U2 are drawn as large circles.
  • Questions The box plot can provide answers to the following questions:
  • Is a factor significant?
  • Does the location differ between subgroups?
  • Does the variation differ between subgroups?
  • Are there any outliers?
  • Importance: Check the significance of a factor The box plot is an important EDA tool for determining if a factor has a significant effect on the response with respect to either location or variation. The box plot is also an effective tool for summarizing large quantities of information.

קורס לסטטיסטיקה יישומית - נושא ראשון:נתונים

box and whisker plot 4
Box-and-Whisker Plot (4)

קורס לסטטיסטיקה יישומית - נושא ראשון:נתונים

box and whisker plot 5
Box-and-Whisker Plot (5)

קורס לסטטיסטיקה יישומית - נושא ראשון:נתונים

slide56
דיאגראמה פיזור

קורס לסטטיסטיקה יישומית - נושא ראשון:נתונים

scatter plot no relationship
Scatter Plot: No Relationship

קורס לסטטיסטיקה יישומית - נושא ראשון:נתונים

scatter plot strong linear positive correlation relationship
Scatter Plot: Strong Linear (positive correlation) Relationship

קורס לסטטיסטיקה יישומית - נושא ראשון:נתונים

scatter plot strong linear negative correlation relationship
Scatter Plot: Strong Linear (negative correlation) Relationship

קורס לסטטיסטיקה יישומית - נושא ראשון:נתונים

scatter plot exact linear positive correlation relationship
Scatter Plot: Exact Linear (positive correlation) Relationship

קורס לסטטיסטיקה יישומית - נושא ראשון:נתונים

scatter plot quadratic relationship
Scatter Plot: Quadratic Relationship

קורס לסטטיסטיקה יישומית - נושא ראשון:נתונים

scatter plot sinusoidal relationship damped
Scatter Plot: Sinusoidal Relationship (damped)

קורס לסטטיסטיקה יישומית - נושא ראשון:נתונים

scatter plot variation of y does not depend on x
Scatter Plot: Variation of YDoes Not Depend on X

קורס לסטטיסטיקה יישומית - נושא ראשון:נתונים

scatter plot variation of y does depend on x
Scatter Plot: Variation of Y Does Depend on X

קורס לסטטיסטיקה יישומית - נושא ראשון:נתונים

scatter plot outlier
Scatter Plot: Outlier

קורס לסטטיסטיקה יישומית - נושא ראשון:נתונים

slide67
תרשים רץ (1)

קורס לסטטיסטיקה יישומית - נושא ראשון:נתונים

slide68
תרשים רץ (2)

קורס לסטטיסטיקה יישומית - נושא ראשון:נתונים

slide69
תרשים רץ + גבולות בקרה = תרשים בקרה

קורס לסטטיסטיקה יישומית - נושא ראשון:נתונים

lag plot 1
Lag Plot-(1)

קורס לסטטיסטיקה יישומית - נושא ראשון:נתונים

lag plot 2

Interpolate these…

To get the final prediction

New Point

Lag Plot (2)

xt

xt-1

קורס לסטטיסטיקה יישומית - נושא ראשון:נתונים

lag plot random data
Lag Plot: Random Data

קורס לסטטיסטיקה יישומית - נושא ראשון:נתונים

lag plot moderate autocorrelation
Lag Plot: Moderate Autocorrelation

קורס לסטטיסטיקה יישומית - נושא ראשון:נתונים

lag plot strong autocorrelation and autoregressive model
Lag Plot: Strong Autocorrelation and Autoregressive Model

קורס לסטטיסטיקה יישומית - נושא ראשון:נתונים

lag plot sinusoidal models and outliers
Lag Plot: Sinusoidal Models and Outliers

קורס לסטטיסטיקה יישומית - נושא ראשון:נתונים