Disclaimer!
Halaman ini adalah proyek yang saya mulai (Jan 31, 2025 ) sebagai bagian dari dokumentasi mempelajari SQL, yang didapatkan melalui berbagai sumber data dan informasi yang tersedia. Setiap konten yang ada, bukan hanya sekedar dan/atau adalah copy-paste ataupun tindakan pembajakan dan penyebarluasan materi/isi/konten yang berasal dari sumber (Referensi dan Rujukan) yang disertakan, tetapi pemahaman saya mengenai SQL. Proyek ini selalu dan akan terus berjalan selama SQL masih ada dan dipakai.
Selengkapnya mengenai masing-masing project dapat dilihat di post terkait atau view details.
Overview
Web page screenshot
Presentasi hasil
Pendahuluan
Dokumentasi ini merangkum empat studi kasus utama dalam data science, mulai dari analisis statistik hingga implementasi pembelajaran mesin dan deep learning. Setiap studi kasus mencakup pendekatan unik untuk memecahkan permasalahan berbasis data, memberikan wawasan, dan menawarkan solusi praktis. Proyek ini bertujuan untuk mengeksplorasi berbagai permasalahan nyata yang ada dalam dunia data, seperti mengetahui efektivitas dari suatu kegiatan, analisis harga dalam pasar, mesin yang dapat memberikan rekomendasi kepada pengguna hingga mempelajari bahasa isyarat menggunakan klasifikasi gambar.
Detail Proses
Studi Kasus 1: Sales Force Training
Latar Belakang
Perusahaan X ingin meningkatkan penjualan mereka. Dari data penjualan sebelumnya menunjukkan bahwa penjualan rata-rata yaitu $100 per transaksi. Setelah melakukan training kepada pekerja sales, data penjualan terbaru (yang diambil dari 25 sampel pekerja sales) tersimpan dalam tabel data di bawah ini :
Rumusan Masalah
- Apakah terdapat peningkatan signifikan dalam jumlah transaksi setelah pelatihan?
- Bagaimana pengaruh pelatihan pekerja sales terhadap rata-rata penjualan per transaksi di Perusahaan X?
Tujuan
- Mengaplikasikan analisis dari uji statistika untuk menentukan apakah harus menolak atau menerima hipotesis nol (H₀) berdasarkan hasil uji.
- Menilai apakah pelatihan sales force memiliki dampak signifikan terhadap rata-rata penjualan.
Highlight Proyek
- Metode: Statistik deskriptif dan inferensial (One-Sample T-Test).
- Hasil Utama: Tidak terdapat peningkatan signifikan dalam rata-rata transaksi setelah pelatihan.
- Insight: Pelatihan belum dan/atau bukan strategi yang efektif untuk meningkatkan rata-rata jumlah transaksi pekerja sales di perusahaan X.
Selengkapnya mengenai studi kasus, dapat dilihat di Studycase: Sale Force Training
Studi Kasus 2: Housing Price
Latar Belakang
Dalam era informasi saat ini, banyaknya pilihan yang tersedia mengenai suatu properti, seperti ukuran, lokasi, dan kualitas bangunan, dapat memberikan wawasan yang berharga jika dianalisis dengan tepat. Data-data itu, ketika digabungkan dan dianalisis, dapat membantu dalam memahami dinamika pasar serta memberikan panduan untuk pembelian. Hal tersebut menunjukkan bahwa variabel seperti lokasi dan ukuran tanah memainkan peran penting dalam menentukan harga properti, tetapi hubungan ini belum dipahami sepenuhnya.
Rumusan Masalah
- Apa saja faktor-faktor yang mempengaruhi harga jual suatu properti?
- Apakah tiap faktor atau variabel memiliki hubungan yang saling memengaruhi terhadap harga jual?
Tujuan
Eksplorasi berbagai faktor yang memengaruhi harga properti menggunakan dataset “Housing Price”
Highlight Proyek
- Metode: Exploratory Data Analysis dan Transformasi Data (Log Transformation).
- Hasil Utama: Lokasi dengan fasilitas lengkap menjadi faktor dominan, dan luas bangunan memiliki korelasi tinggi terhadap harga properti.
- Insight: Segmentasi pasar properti berdasarkan fasilitas dan ukuran bangunan terlihat jelas.
Selengkapnya mengenai studi kasus, dapat dilihat di Studycase: Housing Price
Studi Kasus 3: Machine Learning
Latar Belakang
Proyek ini menggunakan dataset dari 73.516 pengguna dan 12.294 judul anime untuk menganalisis preferensi penonton dan memberikan rekomendasi anime yang relevan.
Rumusan Masalah
Apa saja faktor yang memengaruhi pengguna dalam memberikan rating terhadap suatu anime?
Tujuan
- Membangun model yang dapat memberikan rekomendasi kepada pengguna
- Memberikan pengguna rekomendasi anime berdasarkan pola interaksi pengguna sebelumnya.
- Memberikan pengguna rekomendasi anime berdasarkan anime (konten) yang telah sebelumnya telah disukai oleh pengguna.
Highlight Proyek
- Metode:
- Collaborative Filtering untuk mengidentifikasi pola rating pengguna.
- Content-Based Filtering untuk menentukan kesamaan antar anime berdasarkan genre.
- Hasil Utama:
- Sistem rekomendasi berhasil menampilkan anime dengan rating relevan, seperti Noragami dan Bleach.
- Genre thriller dan kompleks mendapatkan rating tertinggi, mencerminkan preferensi penonton terhadap cerita mendalam.
- Insight: Rekomendasi mencerminkan preferensi pengguna, baik secara acak maupun berdasarkan pilihan pengguna. Namun, pengujian lebih lanjut diperlukan untuk mengatasi data dengan distribusi tidak seimbang
Selengkapnya mengenai studi kasus, dapat dilihat di Studycase: Machine Learning
Studi Kasus 4: Deep Learning
Latar Belakang
American Sign Language (ASL) adalah bahasa visual yang digunakan oleh komunitas tunarungu dan individu dengan gangguan pendengaran di Amerika Utara. Bahasa ini memiliki tata bahasa yang khas, memadukan gerakan tangan, ekspresi wajah, dan gerakan tubuh untuk menyampaikan makna. ASL bukan hanya digunakan untuk mengeja huruf atau angka, tetapi juga untuk mengekspresikan ide, perasaan, dan konsep yang lebih kompleks. Sebagai bahasa yang kaya dan beragam, ASL berbeda dari bahasa lisan yang lebih umum digunakan.
Rumusan Masalah
- Bagaimana model deep learning dapat mempelajari dan mengenali pose tangan dalam ASL?
- Apakah hasil dari kinerja model memang dapat diterapkan di kehidupan nyata?
Tujuan
- Membangun model klasifikasi gambar untuk mengenali huruf dalam bahasa isyarat ASL.
- Mengoptimalkan performa model menggunakan teknik augmentasi data dan hyperparameter tuning.
Highlight Proyek
- Metode: CNN menggunakan Sequential API dengan hyperparameter tuning.
- Hasil Utama:
- Model mencapai akurasi validasi 100% setelah 10 epoch, namun risiko overfitting perlu diperhatikan.
- Model kesulitan mengenali kelas tertentu seperti R dan N.
- Insight:
- Model berkinerja baik untuk sebagian besar kelas, namun memerlukan perbaikan untuk kelas-kelas dengan performa rendah.
- Teknik augmentasi data atau peningkatan jumlah data untuk kelas tertentu dapat meningkatkan akurasi.
Selengkapnya mengenai studi kasus, dapat dilihat di
Kesimpulan dan Penutup
Dokumentasi ini mencakup berbagai pendekatan dalam data science untuk memecahkan tantangan nyata:
- Analisis Statistik dan Eksploratif dalam Sales Force Training dan Housing Price.
- Implementasi Machine Learning untuk Anime Recommender System.
- Pemanfaatan Deep Learning untuk klasifikasi bahasa isyarat dalam ASL Classification.
Setiap studi kasus tidak hanya memberikan solusi praktis, tetapi juga insight yang dapat digunakan untuk pengembangan strategi dan inovasi di masa depan.