00:00

Introduction to Basic Statistical Principles in Python for Data Analysis

Understanding statistical principles is crucial for data collection, organization, and interpretation. Descriptive statistics offers a quantitative approach to analyzing data, focusing on measures of central tendency, variability, and correlation. It includes concepts like mean, median, variance, skewness, and correlation coefficients. Visualization tools like box plots, histograms, and heatmaps provide a visual approach to data analysis. Python is a powerful tool for implementing statistical analysis in data science projects.

tenev
Download Presentation

Introduction to Basic Statistical Principles in Python for Data Analysis

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Βασικές Αρχές Στατιστικής με Python

  2. Γιατί στατιστική;  Για συλλογή δεδομένων  Για πινακοποίηση  Για ερμηνεία αριθμητικών δεδομένων

  3. ΠΕΡΙΓΡΑΦΙΚΗ ΣΤΑΤΙΣΤΙΚΗ (DESCRIPTIVE STATISTICS) ΠΟΣΟΤΙΚΗ ΠΡΟΣΕΓΓΙΣΗ (QUANTITATIVE APPROACH) ΟΠΤΙΚΗ ΠΡΟΣΕΓΓΙΣΗ (VISUAL APPROACH)

  4. QUANTITATIVE APPROACH ΜΕΤΡΟ ΚΕΝΤΡΙΚΗΣ ΤΑΣΗΣ (MEASURE OF CENTRAL TENDENCY) ΜΕΤΡΟ ΜΕΤΡΟ ΣΧΕΤΙΚΟΤΗΤΑΣ (MEASURE OF CORRELATION) ΜΕΤΑΒΛΗΤΟΤΗΤΑΣ (MEASURE OF VARIABILITY)

  5. MEAN MODE WEIGHTED MEAN MEDIAN HIGH MEASURE OF CENTRAL TENDENCY MEDIAN LOW HARMONIC MEAN GEOMETRIC MEAN MEDIAN

  6. VARIANCE STANDARD DEVIATION RANGE MEASURE OF VARIABILITY PERCENTILES SKEWNESS

  7. SKEWNESS Thenormal distribution istheprobability distribution without anyskewness. Therearetwotypesof skewness: • PositiveSkewness • NegativeSkewness

  8. Kurtosis

  9. Measures of Correlation Between Pairs of Data Δύο μεταβλητές x, y με μέτρα συσχέτισης: •Positive correlation: όταν μεγαλύτερες τιμές του ? αντιστοιχούν σε μεγαλύτερες τιμές του ? και αντίστροφα. •Negative correlation: όταν μεγαλύτερες τιμές του ? αντιστοιχούν σε μικρότερες τιμές του ? και αντίστροφα. •Weak or no correlation exists: όταν δεν υπάρχει καμία εμφανής συσχέτιση. ?? ?? … ?? ?? … x y ??−? ?? ??−? ??

  10. MEASURE OF CORRELATION CORRELATION COEFFICIENT COVARIANCE

  11. Correlation Coefficient Αποτελεί ένα μέτρο της συσχέτισης μεταξύ των δεδομένων και συμβολίζεται με ? ?. • Η τιμή ? ? > 0 δείχνει θετική συσχέτιση μεταξύ των δεδομένων. • Η τιμή ? ? < 0 δείχνει αρνητική συσχέτιση μεταξύ των δεδομένων. • Η τιμή ? ? = −1 αποτελεί τη μικρότερη δυνατή τιμή του ?. Αντιστοιχεί σε μια τέλεια αρνητική γραμμική σχέση μεταξύ των μεταβλητών. • Η τιμή ? ? ≈ 0, ή όταν το ? είναι γύρω στο μηδέν, σημαίνει ότι η συσχέτιση μεταξύ των μεταβλητών είναι ασθενής. •

  12. Covariance Αποτελεί μέτρο που ποσοτικοποιεί την ισχύ και την κατεύθυνση μιας σχέσης μεταξύ ενός ζεύγους μεταβλητών. • Εάν η συσχέτιση (correlation) είναι θετική, τότε και η συνδιακύμανση (covariance) είναι θετική. Μια ισχυρότερη σχέση αντιστοιχεί σε υψηλότερη τιμή της συνδιακύμανσης. • Αν η συσχέτιση είναι αρνητική, τότε και η συνδιακύμανση είναι αρνητική. Μια ισχυρότερη σχέση αντιστοιχεί σε χαμηλότερη (ή υψηλότερη απόλυτη) τιμή της συνδιακύμανσης. • Εάν η συσχέτιση είναι ασθενής, τότε η συνδιακύμανση είναι κοντά στο μηδέν. •

  13. VISUAL APPROACH BOX PLOTS HEATMAPS HISTOGRAMS X-Y PLOTS PIE CHARTS BAR CHARTS

  14. BOX PLOT PIE CHART HISTOGRAM X-Y PLOTS BAR CHART HEATMAPS

More Related