Langsung ke konten utama

Memilah Data Menggunakan Library Pandas

sc: makeameme.org

Filtering data? Pake filter rokok? atau pake saringan tahu?

Ketika mengolah data menggunakan python, khususnya library pandas, kita mungkin tidak akan menggunakan semua data ataupun kolom pada dataset yang kita miliki. Kita hanya akan memilih data mana yang akan kita gunakan agar pengolahan lebih rapi dan simpel. 

Pandas menyediakan banyak cara untuk menyeleksi data. Tiap cara penyeleksi memiliki keunikan tersendiri dalam metodenya. Penggunaan method perlu memerhatikan kenyamanan dan keperluan.

Sebelum menyeleksi data, salah satu method yang kiranya perlu diaplikasikan ialah ".columns". Method ini akan menampilkan list kolom-kolom dari data frame yang kita gunakan.

Pada tulisan kali ini, aku pake dataset dari kaggle. Data yang aku pake berjudul HRDataset_v14.csv. Dataset bisa diakses pada link di atas.


Setelah mengetahui kolom apa saja yang terdapat pada dataset kita dapat mulai menyeleksi data. Ada beberapa cara yang dapat digunakan. 

1. Seleksi dengan conditional dalam kurung siku.


Kita dapat memfilter data dengan metode df[((conditional))] dengan begitu akan muncul data dengan klasifikasi sesuai kondisional. Perlu diingat contditional yang digunakan pada teknik di atas menggunakan ( | sebagai or, & sebagai and). Berbeda dengan dasar pyhton. 

2. Dengan method query


Cara ini menghasilkan data terfilter yang sama dengan cara sebelumnya. Hanya saja pada pemfilteran tak perlu mencatut lagi dataset, cukup masukkan nama kolom dengan "`" dan semuanya dibungkus dengan apostrof/petik. Cara ini menggunakan syntax conditional yang sama dengan python. 

3. Menggunakan method .loc

method .loc digunakan untuk mengakses baris atau index tertentu. Kita dapat memvariasikan penggunaanya dengan conditional untuk memfilter data.  Syntax conditional yang digunakan mirip dengan conditional pada pemfilteran dengan kurung siku seperti biasa.

4. Menggunakan method terkhusus (eq, ne, le, lt, ge, gt)
Method ini adalah method yang cukup simpel. Namun penggunaannya sangat terkhusus. Tiap method mewakili satu jenis conditional. Penggunaanya dapat dikali brasi dengan method lain.
eq ekuivalen dengan "==" atau data sama dengan 
lt ekuivalen dengan "<" atau data lebih kecil cari
le ekuivalen dengan "<=" atau data lebih kecil sama dengan
gt ekuivalen dengan ">" atau data lebih besar dari
ge ekuivalen dengan ">=" atau data lebih besar sama dengan

Mungkin itu dulu beberapa cara memilah data. Mungkin ga selalu tepat, karena bisa jadi penulis melakukan kesalahn atau kekurang pahaman. Segala bentuk kritik dan saran sangat lah diterima. Terima kasih sudah membaca, semoga jadi berkah untuk kita semua.













Komentar

Postingan populer dari blog ini

Solusi Mengenai Masalah Air Bersih

  Haloo semuaa, kembali lagi bersamaku, kali ini aku akan memberikan sebuah solusi untuk permasalahan pada blog ku sebelumnya yang berjudul “Masalah air bersih di daerah gunung putri”.  Sebelumnya, permasalahan air bersih di daerah gunung putri terkadang mengalami masalah, seperti air yang tiba-tiba kotor atau mati air. Keadaan air yang kotor ini kadang bisa diperparah jika terjadi banjir di daerah sekitar, karena banyak lumpur yang menumpuk. Nah, maka dari itu aku dan teman kelompokku akan memberikan solusi yang akan digunakan, tetapi lebih fokus ke dalam permasalahan air yang kotor ingin diubah menjadi bersih kembali.  Pada kali ini kami akan menawarkan sebuah solusi untuk masalah air bersih pada daerah ini. Solusi ini aku buat untuk mengatasi air kotor yang terkadang muncul. Kami menaruh solusi dengan menggunakan sensor pada setiap titik pada pipa hingga bak penampungan ketika melakukan penyaringan terhadap air. Sensor ini akan dibuat untuk bekerja secara otomatis, jad...

Memang Kenapa Kalau Masyarakat Kota Kecil Gak Melek Teknologi?

Bismillah Assalamualaikum Wa Rahmatullahi Wa Barakatuh Tahun 2020 Ada apa? Tahun 2020 bisa dibilang bukan tahun yang baik bagi seluruh negara. Pada masyarkat konvensional, kehidupan serta ekonomi benar-benar terhambat. Terjadi pelambatan dan penurunan pada banyak sisi kehidupan kita. Tau ga si? Pada 2020 terjadi penurunan pendapatan perkapita masyarakat Indonesia. Indonesia tidak lagi masuk sebagai negara maju sebab pendapatan per kapita kita tak sampai 40 ribu USD. Menurut data BPS, pada 2020 terjadi peningkatan jumlah masyarakat miskin di Indonesia. Bahkan di Kota Blitar, terdapat 17 ribu pekerja terdampak Covid-19. Hal ini ditakutkan dapat menghampat visi Indonesia Emas. Terus apa dampaknya? Indonesia saat ini sedang mencanangkan visi Indonesia Emas 2045. Salah satu penyokong terwujudnya visi tersebut adalah implementasi sistem cerdas di Indoensia. Tanpa implementasi sistem cerdas, rasanya mustahil menggapai mimpi, Indonesia Emas 2045. Sistem cerdas merupakan sistem yang terintegras...

LeetCode (70): Permasalahan Menaiki Tangga

image source: liputan6 Seperti biasa, setiap pagi, aku mencoba untuk mengerjakan persoalan atau problem yang disediakan oleh Leetcode, sebuah website kumpulan persoalan yang biasanya diujikan pada technical test  ketika ingin melamar pekerjaan atau magang. Namun, kemarin, aku menemukan sebuah persoalan unik yang berjudul Climbing Stairs. Yang membuat persoalan ini unik bukan tingkat kesulitannya, melain sebagaimana tricky penyelesaiannya. Berikut persoalan Climbing Stairs dari LeetCode.  Seseorang bisa menaiki tangga dengan naik satu anak tangga atau langsung menaiki dua anak tangga sekaligus. dalam menaiki tangga, bisa saja dapat banyak kombinasi cara menaiki tangga. Jika terdapat tangga setinggi n anak tangga. Tentukan banyak cara menaiki anak tangga.     Bila Anda diminta untuk menyelesaikan ini, bagaimana kah cara Anda menghitungnya? Sejatinya, ada banyak cara menyelesaikan permasalahan ini. Namun, dalam komputasi, jawaban terbaik disajikan dalam cara termalas at...