Data scientist kini jadi profesi yang banyak diminati oleh talenta digital, tentunya hal ini dikarenakan tingginya kebutuhan perusahaan akan talenta yang membantu mengolah data mereka. Berdasarkan report US Bureau of Labor Statistics profesi data scientist akan tumbuh hingga 27.9% di tahun 2026. Salah satu alasan utamanya adalah karena profesi data scientist bisa mengolah berbagai data yang dimiliki perusahaan untuk membantu decision making (Sumber: Knowledgehut). Jika tertarik untuk terjun ke profesi ini, kamu harus tahu dulu mengenai data science belajar apa hingga skill apa saja yang dibutuhkan.
Kini, ada banyak sumber belajar data science gratis yang bisa kamu manfaatkan, diantaranya:
- Data Science Indonesia = Repositori data science berbahasa Indonesia
- Awesome Data Science = Algoritma, buku, jurnal, hingga tutorial praktis
- Data Science Blogs – Towards Data Science = Materi data science dari 60+ kontributor
- Data Science Cheat Sheet = Berbagai tips interview data science
- Data Science for Beginners = Etika data science, statistik, hingga visualisasi data
- The Open Source Data Science Masters = Ilmu data science yang dibuat langsung oleh praktisi di berbagai industri
- Best of ML with Python = Project machine learning menggunakan Python seperti data loading & extraction, hingga interpretasi model
- Data Science Interview Resources = Tips menyusun CV hingga bocoran jawaban interview data science
- Data Science Curriculum = Roadmap dan materi belajar data science
Namun, walaupun saat ini ada banyak sumber gratis yang bisa kamu manfaatkan untuk belajar data science, jika kamu tidak mengetahui secara komprehensif materi data science, roadmap belajar kamu juga berkemungkinan menjadi kurang efektif. Maka dari itu, simak artikel ini untuk mengetahui bocoran materi data science yang bisa kamu jadikan panduan untuk menyiapkan karier jadi data scientist.
Baca juga: 5 Rekomendasi Sertifikasi Data Scientist Terbaik
Bocoran Data Science Belajar Apa:
Jika kamu saat ini sedang menyusun roadmap untuk belajar data science, maka kamu bisa mengikuti bocoran ini:
Data Science Methodology
Bocoran data science belajar apa yang pertama adalah mempelajari data science methodology yaitu mempelajari pengertian data science dan memahami profesi data scientist secara keseluruhan mulai dari skill yang harus dimiliki, prospek karier, rata-rata gaji, hingga hal-hal lain yang harus disiapkan oleh data scientist. Selain itu, kamu juga harus mempelajari basic ilmu mengenai data, modelling, evaluasi model dan employment.
Data Science Belajar Apa: SQL
Bocoran data science belajar apa selanjutnya adalah SQL yaitu bahasa pemrograman untuk menyimpan dan memproses informasi di dalam basis data relasional. Untuk menguasai SQL kamu harus mempelajari beberapa hal seperti:
- Data, database, dan data lifecycle
- SQL, DBMS, dan Google Collabs Environment
- Perintah-perintah dalam SQL seperti insert, create, delete, dan lain sebagainya
- Fungsi-fungsi SQL seperti function, keys, subquer, dan lain sebagainya
- Cara ekspor dan impor data
Data Science Belajar Apa: Programming
Selanjutnya, data science juga perlu mempelajari programming mulai dari mempelajari mengenai condition, iteration, dan function, hingga mempelajari array dan berbagai tipe data lainnya. Nantinya, jika sudah memiliki basic programming, kamu bisa lanjut mempelajari cara membuat function di Python dan string manipulation library.
Data Science Belajar Apa: NumPy
Bocoran data science belajar apa selanjutnya adalah NumPy yaitu library Python yang fokus pada scientific computing untuk memudahkan data science melakukan perhitungan saintifik seperti matriks, statistisk, aljabar, dan lain sebagainya. Untuk menguasai NumPy kamu harus mempelajari beberapa hal seperti dasar-dasar NumPy hingga cara membuat matrix dan array manipulation.
Statistics
Pada dasarnya data science merupakan gabungan dari ilmu matematika, komputer, dan statistika. Maka dari itu, untuk jadi data scientist kamu juga harus mempelajari ilmu-ilmu statistika seperti:
- Tipe-tipe data pada statistika
- Correlation, causality, statistical plot, dan lain sebagainya
- Cara sampling dan testing
Data Visualization
Data visualization penting untuk data scientist agar bisa memberikan informasi yang sudah didapatkan dari data yang diolah untuk kepentingan bisnis. Seorang data scientist harus bisa membuat visualisasi data yang mudah dilihat dan dipahami oleh para pengambil keputusan. Untuk bisa membuat visualisasi data yang maksimal kamu harus mempelajari beberapa hal seperti:
- Dasar-dasar data visualization
- Cara melakukan simple plot menggunakan Pandas
- Membuat single plot dan subplot dengan Matplotlib
- Mempelajari annotation, axis, dan legend
Machine Learning
Saat ini penerapan machine learning dalam data science sudah digunakan hampir di seluruh aktivitas manusia. Untuk bisa mengoptimalkan machine learning kamu harus mempelajari:
- Teori-teori dan pendekatan machine learning
- Cara data mining dan membuat pattern
- Cara membuat classification beserta metode-metodenya
- Mempelajari K-Means, DB Scan, dan hierarchical clustering
- Mempelajari evaluation metrics dan model selection
- Melakukan standardisasi, normalisasi, dan split data
- Menyeimbangkan data yang sudah ada menggunakan feature selection dan dimensionality reduction
- Mempelajari HTML, Flask, dan model machine learning API
Baca juga: Kegiatan yang Dilakukan di Training Data Science
Dataframe
Dataframe adalah data tabular atau tabel dengan array dua dimensi yaitu baris dan kolom. Untuk bisa menguasai dataframe, kamu harus mempelajari:
- Dasar-dasar dataframe menggunakan Pandas
- Cara menggunakan sorting, filtering, grouping, dan lain sebagainya
- Mempelajari merging dataframe, melting table, dan lambda functions
- Cara indexing di dataframe
Rekomendasi Kursus Data Science
Faktanya, walaupun saat ini sudah banyak sumber belajar gratis untuk data science, ternyata untuk terjun berkarier ke profesi ini tidak semudah itu. Kamu bisa saja belajar secara otodidak dari berbagai sumber gratis di internet, tapi kemungkinan hanya akan memahami teorinya saja. Mengutip dari knowledgehut, untuk bisa mengasah skill agar jadi data scientist profesional itu cukup sulit jika belajar mandiri. Oleh karena itu, kamu bisa ambil alternatif lain dengan belajar di Bootcamp Data Science Digital Skola, di kelas ini kamu akan diajarkan oleh mentor expert dengan kurikulum yang disesuaikan dengan kebutuhan industri, dibimbing bikin portofolio, hingga konseling karier dengan HR expert. Klik button di bawah ini untuk info lengkapnya!