Link GColab : https://colab.research.google.com/drive/1nfYBezMTtRNqEcmB_rhUclOUG212faPU?usp=sharing
Dalam analisis di atas, kita ingin melihat apakah terdapat perbedaan signifikan dalam Indeks Prestasi Semester (IPS) antara siswa yang lulus tepat waktu dan yang tidak. Untuk itu, kita melakukan visualisasi distribusi IPS berdasarkan status kelulusan tepat waktu menggunakan diagram boxplot.
Pendahuluan
Dalam laporan ini, kami akan menganalisis data transkrip nilai mahasiswa untuk mengeksplorasi beberapa aspek, termasuk IPS per semester per mahasiswa, hubungan antara IPS dan lulusan tepat waktu, korelasi antara predikat kelulusan 'Pujian' dengan lulusan tepat waktu, hubungan antara durasi studi dan predikat kelulusan, serta perbandingan prestasi akademik berdasarkan jenis kelamin.
IPS per Semester per Mahasiswa
Untuk menganalisis data pertama – tama kami harus mencari IPS dari setiap mahasiswa dengan cara menjumlahkan nilai lalu membaginya dengan jumlah mata kuliah persemester. Setelah mendapatkan Nilai IPS per semester, lalu di rubah menjadi object dari atribut semester. Setelah itu di gabungkan dengan data lulusan. Dari nilai IPS ini di hasilkan gambaran tentang kinerja akademik dari setiap mahasiswa.
- Membuat Nilai IPS per Semester
- Mengubah Nilai Semester Menjadi Atribut yang diisikan IPS persemester
- Menggabungkan Nilai IPS per semester dengan Data lulusan Berdasarkan NIM
Membuat Kolom Lama Kuliah
Pada proses ini kita membuat kolom yang berisikan lama kuliah permahasiswa. Kolom ini berisikan tahun dan bulan lama mahasiswa melaksanakan perkuliahan hingga lulus.
Preprocessing
Pada proses ini dilakukan untuk mencari missing data dan duplikat data agar hasil analisis menjadi lebih maksimal.
- Mencari Data Hilang
- Manangani Duplikat Data
Dalam analisis di atas, kita ingin melihat apakah terdapat perbedaan signifikan dalam Indeks Prestasi Semester (IPS) antara siswa yang lulus tepat waktu dan yang tidak. Untuk itu, kita melakukan visualisasi distribusi IPS berdasarkan status kelulusan tepat waktu menggunakan diagram boxplot.
Hasil uji hipotesis menunjukkan dua nilai penting:
- T-Statistic: Merupakan nilai statistik dari uji t. Ini mengindikasikan seberapa jauh rata-rata antara dua kelompok berbeda dalam satuan standar.
- P-Value: Merupakan nilai probabilitas. P-value yang lebih kecil menunjukkan bahwa perbedaan antara dua kelompok tersebut lebih signifikan secara statistik.
Analisis apakah ada korelasi positif antara predikat kelulusan 'Pujian' dengan lulusan tepat waktu
Kita menggunakan analisis Chi-square (χ2) untuk mengevaluasi hubungan antara dua variabel kategorikal: predikat kelulusan dan status kelulusan (tepat waktu atau tidak tepat waktu).
Langkah-langkah yang dilakukan adalah sebagai berikut:
- Buat Tabel Kontingensi: Pertama, kita membuat tabel kontingensi yang menunjukkan jumlah observasi di setiap kombinasi kategori predikat dan status kelulusan.
- Hitung Korelasi Cramer's V: Kemudian, kita menggunakan koefisien korelasi Cramer's V untuk mengukur kekuatan hubungan antara kedua variabel. Korelasi Cramer's V adalah ukuran efek yang sering digunakan untuk variabel kategorikal dalam analisis Chi-square.
- Interpretasi Koefisien Korelasi: Berdasarkan nilai koefisien Cramer's V, kita menafsirkan kekuatan hubungan antara dua variabel. Biasanya, koefisien diinterpretasikan sebagai berikut:
- Jika nilai koefisien > 0.1, hubungan dianggap kuat.
- Jika nilai koefisien antara 0.05 dan 0.1, hubungan dianggap sedang.
- Jika nilai koefisien < 0.05, hubungan dianggap lemah.
Analisis untuk melihat apakah durasi studi lebih pendek berkorelasi dengan predikat kelulusan yang lebih baik
Dalam analisis ini, kita ingin melihat apakah terdapat korelasi antara total bulan studi (lama kuliah dalam bulan) dan predikat kelulusan siswa. Langkah-langkahnya adalah sebagai berikut:
- Pemrosesan Data: Pertama, kita membagi kolom 'lama_kuliah' menjadi tahun dan bulan, kemudian menghitung total bulan studi dan menyimpannya dalam kolom baru 'total_bulan_studi'. Selain itu, kolom 'predikat' dikonversi menjadi tipe data kategori.
- Visualisasi Distribusi: Kita membuat visualisasi distribusi dari 'total_bulan_studi' menggunakan histogram untuk melihat sebaran data. Kemudian, kita juga membuat count plot untuk melihat distribusi predikat kelulusan.
- Uji Korelasi Pearson: Dilakukan pengujian korelasi antara 'total_bulan_studi' dan 'predikat' menggunakan koefisien korelasi Pearson. Korelasi Pearson mengukur seberapa kuat hubungan linier antara dua variabel. Nilai korelasi berkisar antara -1 hingga 1, di mana nilai positif menunjukkan korelasi positif, nilai negatif menunjukkan korelasi negatif, dan nilai mendekati 0 menunjukkan korelasi yang lemah.
- Visualisasi Hubungan: Terakhir, kita membuat box plot untuk melihat hubungan antara 'total_bulan_studi' dan 'predikat'. Box plot ini menampilkan distribusi total bulan studi berdasarkan predikat kelulusan.
Hitung rata-rata nilai total untuk masing-masing jenis kelamin dan bandingkan untuk melihat apakah ada perbedaan signifikan dalam prestasi akademik berdasarkan jenis kelamin.
Visualisasi yang dibuat merupakan diagram batang yang menampilkan rata-rata nilai IPS (Indeks Prestasi Semester) berdasarkan jenis kelamin mahasiswa. Langkah-langkahnya adalah sebagai berikut:
- Penghitungan Rata-Rata Nilai IPS: Pertama, dilakukan pengelompokan data berdasarkan jenis kelamin menggunakan metode groupby. Kemudian, dihitung rata-rata nilai IPS untuk setiap kelompok jenis kelamin menggunakan fungsi mean().
- Visualisasi dengan Diagram Batang: Data rata-rata nilai IPS untuk setiap jenis kelamin ditampilkan dalam diagram batang. Setiap jenis kelamin direpresentasikan dengan warna yang berbeda untuk memudahkan pemahaman.
- Penjelasan Visualisasi: Diagram batang ini membantu kita membandingkan rata-rata nilai IPS antara jenis kelamin laki-laki dan perempuan. Dengan melihat diagram ini, kita dapat memperoleh pemahaman tentang apakah terdapat perbedaan signifikan dalam rata-rata nilai IPS antara kedua kelompok jenis kelamin tersebut.
Komentar
Posting Komentar