1 / 21

materi

data science

Abbi
Download Presentation

materi

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Menjelajah Dunia Data Science budi rahardjo (@rahard) budi.rahardjo.id 2021

  2. VLSI/Security/Social Media/IoT/AI/Big Data • Lecturer at ITB • Manage .ID domain 1997- 2005 • Founder & chairman of ID-CERT • Serial technopreneur 5/29/21 BR - Cybersecurity Risks in Payment System 2

  3. Data dihasilkan setiap saat https://ipcarrier.blogspot.co.id/2017/06/90-of-all-data-generated-in-last-2-years.html

  4. Formula 1

  5. Moneyball Moneyball

  6. Keputusan Berbasis Data

  7. Analisis Data Pribadi untuk berbagai kepentingan

  8. Apa itu Data Science

  9. Data Science Venn Diagram http://drewconway.com/zia/2013/3/26/the-data-science-venn-diagram

  10. Data Science Joke Data Science Joke

  11. Lawakan Data Science BIS (orang bisnis), IT (orang IT) BIS: Carikan data pendapatan penduduk kota Bandung dari BPS IT: Data BPS tidak akurat BIS: Kalau begitu gunakan data dari Pajak IT: Datanya juga tidak akurat BIS: Kalau begitu, kita rata-ratakan saja IT: Bisa saya kalikan juga kalau mau …

  12. Kebutuhan Data Tools • Format • Column, CSV, JSON, XML, free format • Data wrangling, manipulasi data • Jenis (tipe) • Teks, binary (images, audio, video, blobs) • Visualization • Untuk mendapatkan ide bagaimana memodelkan data yang tepat • Untuk mendapatkan insight (kapan posting, topik apa, ...) • Menghapus atribut yang tidak diperlukan

  13. Tools untuk memproses data • Bahasa pemrograman / statistik • S, R, … • Bahasa pemrograman umum • Python (and its libraries; Numpy, Pandas, Scipy ...) • Data visualization • Bergantung kepada bahasa pemrograman yang digunakan • Matplotlib,

  14. Statistik • Linear regression • k-Nearest Neighbors (k-NN) • k-means • Naïve Bayes • …

  15. Linear Regression • Merupakan salah satu dasar dari statistik • “Hello World” dari statistik • Given data, cari persamaan (linear) dengan menggunakan modul Scipy Y = a * x + b • Gunakan matplotlib untuk menampilkan plot • Contoh

  16. Format Data: teks, CSV -0.27401, 3.18278 -0.07620, 3.62942 0.08811, 402732 0.43954, 5.32418 0.37771, 5.28896 0.56864, 5.63677 0.53763, 5.51476 -0.40151, 2.77337 -0.29323, 2.98579 …

  17. Case Studies • Visualisasi Data Covid-19 • Detecting email spam • Weather • Sentiment analysis • Political tendencies • data dari rumah sakit • data dari IoT • log web server

  18. Visualisasi Data COVID-19 Animasi dan koding • https://www.youtube.com/ watch?v=PG6vOqU8jWI Kode • https://github.com/rahard/p emrograman-covid-19

  19. Penutup • Data Science merupakan satu bidang menarik yang membutuhkan berbagai latar belakang keilmuan • Membutuhkan satu tim, bukan individual

More Related