statistics n.
Download
Skip this Video
Loading SlideShow in 5 Seconds..
สถิติ เบื้องต้น Statistics PowerPoint Presentation
Download Presentation
สถิติ เบื้องต้น Statistics

Loading in 2 Seconds...

play fullscreen
1 / 56

สถิติ เบื้องต้น Statistics - PowerPoint PPT Presentation


  • 163 Views
  • Uploaded on

สถิติ เบื้องต้น Statistics. ผศ. ( พิเศษ )น.พ.นภดล สุชาติ พ.บ. M.P.H. สติติคืออะไร. เทคนิคในการรวบรวม วิเคราะห์ ตีความข้อมูล เป็นเครื่องมือของการวิจัยที่อาศัยการวิเคราะห์ข้อมูลเป็นหลัก. Scale of Measurement. Nominal Scale (เช่น ชาย, หญิง วิเคราะห์โดย Mode, Frequency)

loader
I am the owner, or an agent authorized to act on behalf of the owner, of the copyrighted work described.
capcha
Download Presentation

PowerPoint Slideshow about 'สถิติ เบื้องต้น Statistics' - amaris


An Image/Link below is provided (as is) to download presentation

Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author.While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server.


- - - - - - - - - - - - - - - - - - - - - - - - - - E N D - - - - - - - - - - - - - - - - - - - - - - - - - -
Presentation Transcript
statistics

สถิติเบื้องต้นStatistics

ผศ.(พิเศษ)น.พ.นภดล สุชาติ

พ.บ. M.P.H.

slide2
สติติคืออะไร
  • เทคนิคในการรวบรวม วิเคราะห์ ตีความข้อมูล
  • เป็นเครื่องมือของการวิจัยที่อาศัยการวิเคราะห์ข้อมูลเป็นหลัก
scale of measurement
Scale of Measurement
  • Nominal Scale

(เช่น ชาย, หญิง วิเคราะห์โดย Mode, Frequency)

  • Ordinal Scale(เช่น คะแนน Grade A, B, C)
  • Interval Scale(arbitrary zero, ระยะห่างของแต่ละหน่วยเท่าๆกัน หาค่าเฉลี่ยได้ เช่น องศาเซลเซียส, ฟาเรนไฮต์)
  • Ratio Scale (true zero) น้ำหนัก, รายได้
slide4

ประเภทของสถิติ

สถิติเชิงอนุมาน

สถิติเชิงพรรณนา

Mean

Mode

Median

Variance

SD

Non Parametric

Parametric

t-test

ANOVA

ANCOVA

Factor Analysis

Pearson’s

Nominal

Ordinal

Spearman

Mann-Whitney

Chi Square

Median Test

Sign Test

slide5
สถิติเชิงพรรณนา, สถิติเชิงอนุมาน
  • สถิติเชิงพรรณา (Descriptive Statistics) ใช้กับกลุ่มประชากร ได้แก่ Mean, Mode, Median, Variance,Standard Deviation เป็นต้น
  • สถิติเชิงอนุมาน (Inference Statistics) เป็นสถิติเชิงทดสอบสมมุติฐาน ว่าสมมติฐานที่ตั้งไว้เป็นจริงหรือไม่ ได้แก่การประเมินค่าพารามิเตอร์ในประชากร (Estimation) และการทดสอบสมมุติฐาน (Hypothesis Testing) แบ่งออกเป็น Parametric และ Non parametric statistics
slide6

ประเภทของสถิติ

Geometric Mean

Coefficient of Variation

RATIO

INTERVAL

ORDINAL

NOMINAL

Parametric

Median, Percentile

Spearman

Kendall, Kendall W

Non-Parametric

Mode, Frequency

Contingency Coefficient

parametric statistics
Parametric Statistics
  • กลุ่มประชากรที่มีการแจกแจงแบบโค้งปกติ ข้อมูลทั้งหมดเรียกว่า Population ค่าที่คำนวณได้เรียก Parameter แต่ถ้าเก็บมาเพียงบางส่วนจากประชากรจะเรียก Sample ค่าที่ได้เรียกว่าค่าสถิติ (Statistics) มี Scale แบบ Ratio หรือ Interval scale เช่น t-test, ANOVA, Correlation, Multiple Regression เป็นต้น
non parametric statistics
Non Parametric Statistics
  • คือสถิติที่ใช้กับกลุ่มประชากรที่ไม่เข้าเงื่อนไขของ Parametric มี Scale การวัดแบบ Ordinal และ Nominal เช่นใช้วิธี Chi Square, Log Rank Test, Mann Whitney, Wilcoxon เป็นต้น
research hypothesis statistical hypothesis
สมมติฐานการวิจัย Research Hypothesisสมมติฐานทางสถิติ Statistical Hypothesis
  • สมมติฐานการวิจัย คือการคาดการณ์ผลวิจัย
  • สมมติฐานทางสถิติ คือ H0 และH1
  • Null Hypothesis = H0มักเขียนในรูปปฏิเสธหรือไม่มีความแตกต่าง ไม่สัมพันธ์กัน
  • Alternative Hypothesis = H1 มักเขียนในรูปมีความแตกต่าง มีความสัมพันธ์กันและเขียนให้สอดคล้องกับสมมติฐานการวิจัย
p value
p value
  • ยิ่ง p value ยิ่งมีค่าน้อยก็จะเลื่อนไปทางด้านหางของ H0 จึงปฏิเสธ H0 หรือก็คือเลื่อนเข้าไปใน H1 มากขึ้นจึงยอมรับ H1 ซึ่งสอดคล้องกับสมมติฐานการวิจัย
slide11

Alpha and Beta errors

THE TRUTH

CONCLUSION

drawn from

analysis

alpha and beta errors
Alpha and Beta errors
  • Alpha error = 0.05 หรือ 5%

ความเชื่อถือได้ 95% = 1-a, Confidence Intervalหรือ = 0.01 หรือ 1 % (ความเชื่อถือได้ 99% ) เรียกว่าระดับนัยสำคัญ

  • Beta error = 20% (power of test = 1-b)
z distribution
Z distribution
  • โค้งเริ่มที่ – Infinity ไปถึง + Infinity
  • Mean=0, SD=1
t distribution
student’s distribution

sample < 30

T distribution= A symmetric distribution with mean zero and a standard deviation larger than that for the normal distribution for small sample sizes.

As n increase t distribution approaches the normal distribution.

t distribution
f distribution
F distribution
  • A continuous statistical distribution which arises in the testing of whether two observed samples have the same variance.
  • F distribution=The probability distribution used to test the the equality of two estimates of the variance.
  • It is the distribution use with the F-test in ANOVA
slide21
การกระจายค่า z และพื้นที่ใต้โค้ง
95 confidence interval
95% Confidence Interval

95% C.I. = Mean + 2 SD

chi square distribution counted
Chi Square Distributionสำหรับตัวเลขจาการนับ (Counted)
  • โค้งเริ่มที่ 0 ไปที่ + Infinity มีค่าเป็นบวกเสมอ
  • ที่ df=1 a=0.05 Chi Square= 3.84
  • ถ้า P < 0.05 จะยอมรับ Ha
  • ถ้า c2 > 3.84 จะยอมรับ Ha
chi square
Chi Square
  • Tests the hypothesis that the row and column variables are independent, without indicating strength or direction of the relationship.
  • ตรวจสอบว่าต่างกันหรือไม่แต่ไม่บอกว่าต่างกันมากน้อยเท่าไรและไม่บอกว่ามากกว่าหรือน้อยกว่า(เงื่อนไข Row และ Column เป็นอิสระต่อกัน)
chi square table cross tab
Chi-Square Tableหาความสัมพันธ์ Crosstab

ป่วย ไม่ป่วย

Exposure +

Exposure -

  • ที่ df=1 a=0.05 Chi Square= 3.84
  • degree of freedom (df) = (Row-1)x(Column-1)
  • เช่น ตาราง Contingency table (2x2 table) มี df=1
chi square observed1 observed2
Chi-Square Observed1, Observed2วิเคราะห์ว่าต่างกันหรือไม่
  • Ho : Observed1 และ Observed2 ไม่ต่างกัน
  • Ha : Observed1 และ Observed2 ต่างกัน
  • Expected=(O1+O2)/2
  • ที่ df=1 a= 0.05 Chi Square= 3.84
  • ถ้า p value < 0.05 หรือถ้า c2 > 3.84 จะยอมรับ Ha

(O-E)2

E

c2=

S

slide27

Chi-Square วิเคราะห์ความสัมพันธ์ ของ 2x2 table (Crosstabs)

ป่วย ไม่ป่วย รวม

  • c2 = n (ad-bc)2 efgh

Exposure +

Exposure -

รวม

Ho : Exposureและการป่วยไม่สัมพันธ์กัน

Ha : Exposureและการป่วยสัมพันธ์กัน

ที่ df=1 a= 0.05 Chi Square = 3.84

ถ้า p value < 0.05 หรือ

ถ้า c2 > 3.84 จะยอมรับ Ha

t test
t-test
  • The statistical test for comparing a mean with a norm or for comparing two means with small sample size (n =<30).
  • It is also use for testing whether a correlation coefficient or a regression coefficient is zero.
t test1
การเปรียบเทียบค่าเฉลี่ย 2 กลุ่มตัวอย่าง

Mean1 = 5.6 Mean2 = 5.1

Variance = 10 Variance = 12

Sample Size = 30 Sample Size = 100

เช่น Mean1 จะเท่ากับ Mean2 หรือไม่

t-test
slide30

ประเภทของ t-test

Means

t-test

1 กลุ่ม

Population

2 กลุ่ม

One Sample

มีความสัมพันธ์กัน

เป็นอิสระต่อกัน

Paired t-test

t-test Group

the one sample t test
The One-Sample t Test
  • procedure tests whether the mean of a single variable differs from a specified constant.
the paired samples t test
The Paired-Samples t Test
  • procedure compares the means of two variables for a single group. It computes the differences between values of the two variables for each case and tests whether the average differs from 0.
the independent samples t test
The Independent-Samples t Test
  • procedure compares means for two groups of cases. Ideally, for this test, the subjects should be randomly assigned to two groups, so that any difference in response is due to the treatment (or lack of treatment) and not to other factors.
association r correlation coefficient
Positive

Association

Negative

Association

Associationr = Correlation Coefficient

No Association

Except Non-Linear

r = +1

r = -1

r = 0

. .

. . .

. . .

. . .

. .

. .

. .

. .

. .

association r correlation coefficient1
Associationr = Correlation Coefficient

x และ y มีความสัมพันธ์ในรูปพาราโบลา

y

. . . . .

. . . .

. .

แม้ว่า slope = 0

x และ y ก็ยังมีความสัมพันธ์

กันได้ Mathematics Relationship

x

slide37
r = สัมประสิทธิ์สหสัมพันธ์
  • r เป็นบวกแสดงว่า x เพิ่ม y จะเพิ่ม ถ้า x ลด y จะลดด้วย
  • r เป็นลบแสดงว่า x เพิ่ม y จะลด ถ้า x ลด y จะเพิ่ม
  • r เข้าใกล้ 1 แสดงว่า x และ y มีความสัมพันธ์ทิศทางเดียวกันและมีความสัมพันธ์กันมาก
  • r = 0 แสดงว่า x และ y ไม่มีความสัมพันธ์กันเลย (ยกเว้น Non-Linear)
slide38
r จะบอกความสัมพันธ์ดังนี้
  • r = 0.8-1.0 มีความสัมพันธ์กันมาก
  • r = 0.5-0.8 มีความสัมพันธ์กันปานกลาง
  • r = 0.2-0.5 มีความสัมพันธ์กันน้อย
  • r = 0-0.2 ไม่ควรสนใจกับความสัมพันธ์นี้
r square
r Square
  • r2 ไม่มีหน่วย
  • ถ้า r2 มีค่าเข้าใกล้ 1 แสดงว่าเปอเซนต์ที่ x สามารถอธิบายการเปลี่ยนของ y มีค่ามาก
  • ถ้า r2 มีค่าเข้าใกล้ 0 แสดงว่าเปอเซนต์ที่ x สามารถอธิบายการเปลี่ยนของ y มีค่าน้อย
slide40
ความถดถอยชนิดอื่นๆ ที่ไม่ใช่เส้นตรง
  • Polynomial Regressiony=a+bx+cx2+dx3+...
  • Multiple Regressiony=a+ b1x1 + b2x2 + b3x3 +…+bnxn
  • Non-Linear Regressiony=acbx
  • Sigmoid Curves
slide41
ตัวแปร
  • ข้อมูลได้จากการสังเกต วัด สอบถาม หน่วยศึกษาอาจเป็นคน สัตว์ สิ่งของ
  • ตัวแปรแตกต่างกันเพราะ
    • คุณลักษณะแตกต่างกัน
    • เวลาแตกต่างกัน
    • สถานที่แตกต่างกัน
slide42
ประเภทของข้อมูล
  • แบ่งตามที่มา
    • ข้อมูลปฐมภูมิ (Primary Data)
    • ข้อมูลทุติยภูมิ (Secondary Data)
slide44
ข้อมูลเชิงคุณภาพ

อยู่รูปแบบของข้อความ เช่น เชื้อชาติ เพศ สีผิว

Qualitative Variables

Categorical Variables

Nominal Variables

Ordered Variables

Coded Variable

ข้อมูลเชิงปริมาณ

ได้จากการชั่ง ตวง วัด เช่น น้ำหนัก ความดันโลหิต

Quantitative Variable

1. Discrete Data เช่นจำนวนสิ่งของ จำนวนคน

2. Continuous Data เช่น น้ำหนัก ความกว้าง

ข้อมูลเชิงคุณภาพและข้อมูลเชิงปริมาณข้อมูลเชิงคุณภาพและข้อมูลเชิงปริมาณ
slide45
ข้อมูลเชิงคุณภาพ
  • ชาย 30 คน หญิง 30 คน
  • เป็นข้อมูลได้จากการนับ
  • สูบบุหรี่ 15 คน ไม่สูบบุหรี่ 45 คน
  • เป็นข้อมูลได้จากการนับ
slide46
ข้อมูลเชิงคุณภาพ
  • ความเห็นต่อการให้บริการของศูนย์คอมพิวเตอร์
slide47
ข้อมูลเชิงคุณภาพ-->ข้อมูลเชิงปริมาณข้อมูลเชิงคุณภาพ-->ข้อมูลเชิงปริมาณ
  • แต่ถ้ารวมกันเป็น 3 ตาราง
  • ความเห็นต่อการให้บริการของศูนย์คอมพิวเตอร์
  • ความเห็นต่อการให้บริการของศูนย์ข้อมูล
  • ความเห็นต่อการให้บริการของศูนย์พิมพ์
  • ต่ำสุด = 3 สูงสุด = 15อาจจัดเป็นข้อมูลเชิงปริมาณ
slide48
ข้อมูลเชิงปริมาณ-->ข้อมูลเชิงคุณภาพข้อมูลเชิงปริมาณ-->ข้อมูลเชิงคุณภาพ
  • วัดส่วนสูง = 149 155.5 160 167 169 170.5 172
  • เป็นข้อมูลเชิงปริมาณ
  • แต่ถ้าจัดกลุ่มให้ <150 = เตี้ย
  • 150-170=ปานกลาง
  • >170=สูง
  • เตี้ย ปานกลาง สูง จำนวนอย่างละกี่คน ? เป็นข้อมูลเชิงคุณภาพ
  • รายละเอียดของข้อมูลจะสูญเสียไป
  • จาก Ratio Scale เปลี่ยนเป็น Ordinal Scale
slide49
การวิเคราะห์ความสัมพันธ์การวิเคราะห์ความสัมพันธ์
slide50
เปรียบเทียบ หรือ หาความสัมพันธ์
  • เปรียบเทียบ 2 ประชากร / ตัวแปร
  • ความสัมพันธ์ 2 ประชากร / ตัวแปร
  • ตัวแปรเชิงปริมาณใช้ ค่าเฉลี่ย
  • ตัวแปรเชิงคุณภาพใช้ ค่าสัดส่วน
parametric
Parametric
  • ข้อมูลเชิงปริมาณใช่หรือไม่
  • แจกแจงแบบปกติหรือไม่ ใช้ Explore Data
    • Mean, Mode, Median,
    • Box Plot, Histogram
    • Skewness, Kurtosis
  • ถ้าหลายประชากรทดสอบความเท่ากันของความแปรปรวน
cohort study
Cohort Study

มี/ได้รับปัจจัยเสี่ยง

Exposure +

ป่วย

ไม่ป่วย

ไม่มี/

ไม่ได้รับปัจจัยเสี่ยง

Exposure -

ป่วย

ไม่ป่วย

ศึกษาจากสิ่งที่คาดว่าเป็นสาเหตุไปหาผล

หาค่า Relative Risk (หรือ Risk Ratio)ได้

Relative Risk = (Risk กลุ่มE+)/(Risk กลุ่มE-)

slide53

Cohort Study & Relative Risk

Relative Risk = (Risk กลุ่ม E+)/(Risk กลุ่ม E -)

Relative Risk = {a/(a+b)}/{c/(c+d)}

case control study
Case-Control Study

มี/ได้รับปัจจัยเสี่ยง

กลุ่มป่วย

(Case)

ไม่มี/ไม่ได้รับปัจจัยเสี่ยง

มี/ได้รับปัจจัยเสี่ยง

กลุ่มไม่ป่วย

(Control)

ไม่มี/

ไม่ได้รับปัจจัยเสี่ยง

ศึกษาจากผลย้อนกลับไปสิ่งที่คาดว่าเป็นสาเหตุ

หาค่า Odds Ratio ได้

case control study odds ratio
Case-Control StudyOdds Ratio

Odds=probability that it happens / probability that it does not

เช่น Odds ของลูกเต๋าที่จะออกหมายเลข 6 เท่ากับ 1:5

Odds = ad/bc

แต่ถ้าโรคนั้นพบน้อย Odds Ratio จะมีค่าใกล้เคียงกับ Relative Risk

references
References
  • ภิรมย์ กมลรัตนกุล, การอบรมการพัฒนาศักยภาพคณะกรรมการสนับสนุนงานวิชาการในส่วนภูมิภาค, ที่โลตัสปางสวนแก้ว; 2ก.ย.45
  • T D V Swinscow and MJ Campbell, Statistic at square One, Tenth edition, BMJ Books
  • MJ Campbell, Statistic at square Two, BMJ Books