GitHub adalah profit company yang menawarkan hosting service Git repository berbasis cloud. Pada dasarnya, hal ini mampu memudahkan individu dan tim untuk melakukan version control maupun kolaborasi. GitHub memiliki friendly interface yang mudah digunakan oleh pemula. Keberadaan GitHub mampu memudahkan pemahaman secara teknis serta penggunaan command line. Selain itu, setiap orang bisa mendaftar dan melakukan hosting public code repository secara gratis. Inilah yang membuat repositori GitHub semakin populer bagi kebutuhan open-source projects. Sebagai suatu perusahaan, GitHub menghasilkan uang dengan menjual private code repositories yang di-hosting.
Pada awal didirikan, tujuan utama dari pembangunan GitHub adalah meng-hosting proyek open source menggunakan distributed version control system dari Git. Selama 13 tahun, GitHub telah mengembangkan lokasi sentral sebagai host dari proyek open source dan menjadi tempat berbagi sumber daya di dalam lingkup komunitas. Dengan 45 juta repositories yang dapat diakses dalam mode publik, GitHub menawarkan berbagai wawasan termasuk open source project, libraries, learning platform, persiapan interview, tips menulis CV, dan sebagainya.
Erat kaitannya dengan version control, nyatanya GitHub juga bermanfaat bagi kelangsungan kerja para Data Scientist. Sebagai Data Scientist, kamu membutuhkan GitHub sebagai sarana untuk melakukan kolaborasi, membuat perubahan pada proyek secara aman, dan melacak sekaligus mengembalikan perubahan dari waktu ke waktu. Berkembangnya tren pada suatu sistem membuatnya lebih mudah diakses oleh Data Scientist untuk menuliskan coding secara mandiri. Ada beberapa rekomendasi repositori GitHub yang wajib dikunjungi oleh data science enthusiast. Simak daftarnya di bawah ini.
BACA JUGA: Bocoran Prospek Kerja Sains Data Terkini
Repositori GitHub yang Wajib Dikunjungi Data Science Enthusiast
Fakta menariknya, kini ada lebih dari 45 juta repositori GitHub publik yang tersedia, tentunya untuk mencari repositori GitHub terbaik untuk data science dari 45 juta itu bukan hal yang mudah. Oleh karena itu, berikut rangkuman rekomendasi 10 repositori GitHub terbaik untuk data science:
Repositori GitHub – Data Science Indonesia
Repositori GitHub yang satu ini dibuat secara khusus untuk kamu yang mencari sumber repositori dengan bahasa Indonesia yang mudah dipahami. Hasil kurasinya telah meliputi:
- Machine learning frameworks
- Libraries
- Rekomendasi buku bagi data science enthusiast
Selain itu, kamu juga berkesempatan memperoleh akses dataset yang mudah untuk dipraktikkan. Tidak hanya dataset, setiap data scientist yang mengaksesnya bisa membuka akses menuju berbagai rangkuman konferensi dan kumpulan paper. Repositori GitHub ini juga membuka peluang untuk berkontribusi, asalkan memakai resource dengan bahasa Indonesia.
Bila kamu adalah pengguna baru, tidak perlu kebingungan mengenai cara menggunakan repositori yang satu ini. Tersedia panduan penggunaan yang bisa diikuti secara mudah, mulai dari mengunduh sampai mengunggah repositori terbaru. Selain machine learning, repositori ini juga menyediakan sumber deep learning dan reinforcement learning.
BACA JUGA: 5 Perusahaan Impian Data Scientist di Dunia
Repositori GitHub – Awesome Data Science
Repositori yang satu ini tergolong open source dan bisa kamu pelajari untuk praktik pemecahan masalah data science di dunia nyata. Ketersediaan materi yang lengkap membuatnya menjadi salah satu shortcut untuk membantu kamu menjadi data scientist profesional. Pembelajaran dimulai dengan pemahaman mengenai pengertian data science dan gambarannya secara garis besar. Dilanjutkan dengan pembahasan mengenai sumber-sumber belajar yang bisa kamu akses secara langsung di dalam GitHub tersebut. Beberapa diantaranya adalah:
- Algoritma
- Materi perkuliahan
- Podcast
- Buku dan jurnal
- Publikasi
- Tutorial praktis
Masing-masing bisa dibuka secara langsung menuju website dari sumber pembelajaran tersebut. Hingga saat ini, ada sekitar 170 kontributor yang turut andil untuk melengkapi sumber belajar di repositori Awesome Data Science. Selain daftar lengkap dan akses yang instan, kamu juga memperoleh rekomendasi kursus yang dapat dibuka secara gratis. Pastikan kamu membuka dan mengakses repositori GitHub ini karena juga dilengkapi dengan penjelasan garis besar dari masing-masing sumber belajar sebelum kamu mengklik setiap link yang ada di dalamnya.
Repositori GitHub – Data Science Blogs
Kamu butuh sumber blog data science yang sudah terkurasi dengan lengkap? Repositori GitHub yang bernama Data Science Blogs adalah jawabannya. Tidak hanya materi berbasis data science, nyatanya kamu juga menemukan berbagai bacaan internet mengenai machine learning. Seiring berkembangnya waktu, ada banyak blog yang telah ditambahkan oleh lebih dari 80 kontributor.
Alasan lain yang menjadikan repositori ini sebagai salah satu rekomendasi adalah sudah mendapatkan lebih dari 5800 stars sebagai sumber belajar data science yang bermanfaat.
Repositori GitHub – Data Science Cheatsheet
Data Scientist tentu sangat terbantu dengan keberadaan repositori yang satu ini. Seperti namanya, kamu dapat mengakses cheat sheet data science yang berguna untuk membantu exam reviews, persiapan interview, dan sebagainya. Baik pemula maupun berpengalaman, kamu juga dapat belajar lebih lanjut mengenai pemahaman dasar dari statistik dan aljabar linier. Seluruhnya sudah mewakili lebih dari satu semester pembahasan materi mengenai machine learning. Repositori ini akan terus dikembangkan dari waktu ke waktu berdasarkan update informasi terbaru.
Mungkin kamu bertanya-tanya mengenai alasan untuk tidak memasukkan Python atau SQL ke dalam cheat sheet ini. Hal tersebut dikarenakan si author berencana menciptakan lahan belajar yang meliputi algoritma, model, dan konsep yang jarang berubah di industri terkait. Technical language dan data structure sering kali berubah-ubah menurut kebutuhannya bagi perusahaan. Mempraktikkan keterampilan tersebut secara langsung tentu akan lebih masuk akal dilakukan secara langsung.
BACA JUGA: Rekomendasi Data Sources Gratis untuk Data Visualization
Repositori GitHub – FreeCodeCamp
Di repositori GitHub FreeCodeCamp, kamu bisa belajar banyak mengenai ilmu bahasa pemrograman yang sering digunakan oleh data science dan software engineer seperti:
- Python
- Node.js
- React.js
Selain itu, ada juga banyak materi terkait data science yang lebih spesifik seperti:
- Machine learning
- Data analysis
- Data visualization
Dan sesuai namanya, di repositori ini semuanya gratis bisa kamu akses kapan saja. Sebagai tambahan informasi, repositori GitHub FreeCodeCamp ini merupakan repositori paling populer saat ini.
Repositori GitHub – TensorFlow
TensorFlow adalah framework open-source untuk kebutuhan machine learning dan artificial intelligence yang dibuat oleh Google Brain Team. TensorFlow juga memiliki repositori GitHub yang bisa diakses siapa saja secara gratis yang berisi berbagai materi terkait skills machine learning. Selain itu, di repositori ini juga kamu bisa belajar:
- Computer Vision
- Natural language processing
- Recommendation system
Repositori GitHub – The Algorithms
Selanjutnya repositori The Algorithms yang berisi berbagai kode algoritma terkait Python. Ada beberapa koleksi kode yang bisa kamu akses seperti:
- Machine learning
- Neural networks
- Digital image processing
- Computer Vision
Repositori GitHub – Awesome Machine Learning
Repositori GitHub Awesome Machine learning ini menyediakan berbagai kebutuhan data scientist seperti:
- Machine learning libraries
- Frameworks
- Tools
Selain itu, di repositori ini juga kamu bisa mendapatkan berbagai materi terkati:
- Computer vision
- Natural language processing
- General-Purpose Machine Learning
- Data Analysis
- Data Visualization
- Neural Networks
Repositori GitHub – DATA SCIENCE I-PYTHON NOTEBOOKS
Repositori selanjutnya adalah berisi Python Notebook yang digunakan di setiap aspek machine learning, rekayasa data, hingga augmentasi data. Repositori GitHub ini memiliki Python Notebook data science dan framework pembelajaran terkait:
- TensorFlow
- Theano
- Caffe
- Keras
- Scikit-learn
- Hadoop
- Mapreduce
Selain itu, di repositori ini kamu juga belajar mengenai cara membuat berbagai grafik yang mudah digunakan untuk menggambarkan hasil analisis data dengan cara yang mudah diterapkan.
Repositori GitHub – HOMEMADE MACHINE LEARNING
Repositori ini berisi berbagai contoh kode dan algoritma terkait machine learning yang paling banyak digunakan dan diimplementasikan menggunakan Python, matematika, dan logika. Selain itu, di repositori ini setiap algoritma dijelaskan melalui environment yang interaktif di Jupyer Notebook sehingga kode-kode tersebut tidak hanya bisa dijalankan pada set pelatihan untuk analisis data, tapi juga penjelasan matematika yang menjadikannya salah satu sumber terbaik untuk memperkuat hasil data. Di sini juga kamu bisa mengakses materi terkait:
- Supervised Learning
- Unsupervised Learning
- Neural network
Belajar Data Science Bersama Digital Skola
Itulah daftar repositori GitHub yang wajib kamu kunjungi sebagai seorang data science enthusiast. Masing-masing sudah mencakup sumber dataset maupun materi pembelajaran yang lengkap untuk tingkatkan keterampilan sebagai seorang Data Scientist. Pastikan kamu akses masing-masing repositori untuk melengkapi wawasan serta praktik langsung untuk membantu memecahkan permasalahan serta kasus nyata dalam lingkup data science.
Mau belajar data science berbasis praktik bersama para ahli di bidangnya? Belajar sekarang di Bootcamp Data Science dan bersiaplah untuk menjadi profesional siap kerja hanya dalam 3 bulan bersama Digital Skola karena kelas ini didesain untuk pemula sehingga bisa diikuti oleh siapa saja tanpa latar belakang IT sekalipun. Kamu akan belajar skill dari basic hingga advanced dengan fasilitas lengkap seperti:
- Modul belajar komprehensif
- Portofolio
- Real experience internship
- Job connector
Info lengkap klik button di bawah!