Langsung ke konten utama

Postingan

Menampilkan postingan dari Desember, 2020

Mengenal Librari Pandas, Hewan yang Menyukai Data

source: twoarddatascience.com Pandas merupakan salah satu librari pemrosesan data yang tersedia di python. Librari pandas digunakan untuk memberikan pengetahuan terhadap data yang dianalisis. Biasanya penggunaan pandas digunakan bersama library numpy. Sebelum mengenal lebih jauh, mari kita mulai dengan meng- install librari pandas dan numpy. Penginstallan dapat dilakukan pada terminal atau cmd, command promt. Dengan mengetikkan berikut  pip install numpy pip install pandas Setelah melakukan instalisasi, pada file program yang kita buat perlu di- import kedua library tersebut agar pemrosesan dapat dilakukan. In [1]: import pandas as pd In [2]: import numpy as np Bila program dilakukan melalui notebook baris data bersifat intrisik, hubungan antara data tidak dapat dipatahkan kecuali oleh anda sendiri dengan mengulang kernel. Perlu diingat untuk setiap pemrosesan data, pengerjaan harus algoritmik sehingga hal yang diharapkan dapat terjadi. Ada beberapa perintah dasar yang

Pre-Processing, Membersihkan Dataframe pada Python

Sebagian kita mungkin mengenal python sebagai salah satu bahasa pemrograman yang dapat digunakan untuk mengolah data. Salah satu module yang cukup umum ialah Pandas. Namun, sedikit dari kita menyadari pentingnya membersihkan data sebelum digunakan.  Sebelum masuk ke Pemrosesan mari kita nikmati sebuah meme dari reddit: gambar 1.0 Data yang diolah tidak selalu bersih. Pada beberapa kasus terdapat data unknown atau data yang keluar dari batas wajar dan tidak sesuai mengikuti aturan di dunia nyata. Misal juamlah kuantitas belanja yang mencapai puluhan ribu pada sekali check out atau kuantitas yang nilainya lebih kecil dari satu. Oleh karena itu, diperlukan pembersihan dataset dari data yang rusak atau kotor. Banyak metode yang dapat dilakukan untuk menormalisasi data, di antaranya mengantinya dengan modus, rata-rata, median, atau menghapusnya. Pada kasus ini, penulis menggunakan teknik dropping atau menghapus data yang rusak atau tak sesuai denagn method .drop(). Sebelum membersihk