Langsung ke konten utama

Trik Pandas yang Perlu Kamu Ketahui

Banyak sekali cara untuk mengolah data. Salah satu bahasa yang lazim digunakan adalah python. Dalam python, ada sebuah library yang cukup terkenal dalam pengolahan data, yakni pandas. Library pandas merupakan library standar yang rasanya sangat penting dalam pengolahan data.

Mengolah data merupakan hal yang cukup kompleks. Dalam beberapa hal, pengolahan data bisa menjadi hal yang sangat meribetkan. Kita perlu memahami beberapa trik yang mungkin akan sangat membantu dalam pengolahan data, utamanya dengan python library pandas. 

Pada artikel ini, penulis menggunakan dataset crypto.csv. Dataset ini merupakan data perubahan nilai mata uang kripto (kurs) pada tiap harisnya. Data ini cukup lengkap, karena menyimpan pula data seperti yang biasa tertera pada bank sentral, seperti markercap, nilai buka, nilai tutup, dan nilai tertinggi tiap harisnya. Tanpa berpanjang lebar, langsung cekidot beberapa trik tentang pandas yang perlu kamu ketahui:



1. Groupby

Method groupby adalah method yang cukup lazim untuk mengumpulkan data. Data yang cukup kompleks perlu dikumpulkan agar pengolahan lebih optimal. Dengan method ini kamu bisa mengumpulkan data sesuai kebutuhanmu. Untuk memudahkan tampilan, pada akhir, penulis beri method sum, maksudnya data yang telah di grup akan dijumlah berdasarkan klaster yang terbentuk, agar tabel bisa dibaca dengan mudah.


2.Stack dan Unstack

Stack dan unstack merupakan method yang lazim digunakan untuk klasifikasi data. Dalam beberapa kasus, agar memudahkan pembacaan data, data perlu diklasifikasi atau dikumpulkan penataanya. Pada dasarnya jika data yang terkumpul tidak diberi megthod .unstack maka data akan stack atau terkumpul secara otomatis, utamanya data yang telah digrup berdasarkan suatu kriteria.


data yang di unstack
data tanpa unstack(=stack)
3. Menghilangkan index dan mengannti dengan nama data
Pada beberapa kesempatan, kita perlu menghilangkan index dari tabel agar tampilan tabel yang dibaca orang lain lebih jelas. Pada beberapa kasus, keberadaan indeks justru membuat visualisasi terlihat membingungkan. Keberadaan indeks kadang membuat kita ribet, perlu menjelaskan apa makna indeks, padahal indeks kadang merupakan nomor data saja. Oleh karena itu, kita dapat mengantinya dengan kolom lain yang kita rasa bermanfaat, seperti nama dari tiap dantum. 

data yang divisualisasi tanpa menghilangkan indeks

data yang indeksnya kita ganti dengan nama mata uang
tampilan tabel dengan penghilangan indeks
4. Menganti nilai suatu data dengan nilai lain
Misalkan kamu ingin menganti nilai angka pada data menjadi string, agar orang lebih mudah membacanya kamu dapat melakukannya dengan method replace. Method ini akan mengubah data sesuai conditional yang kamu buat. Pada kasus ini misalnya, kamu ingin mengubah singkatan tiap cryptocurency dengan kepanjangannya. Kamu tak perlu ribet membuat fungsi, cukup masukkan perubah untuk tiap singkatan.
Sekian dulu tips n trik dari saya, semoga bermanfaat sampai jumpa pada lain kesempatan dan terima kasih sudah membaca. Untuk mendukung tulisanku kamu bisa share dan komen di blog ini terima kasih.
Wassalamualaikum.

Komentar

Postingan populer dari blog ini

LeetCode (70): Permasalahan Menaiki Tangga

image source: liputan6 Seperti biasa, setiap pagi, aku mencoba untuk mengerjakan persoalan atau problem yang disediakan oleh Leetcode, sebuah website kumpulan persoalan yang biasanya diujikan pada technical test  ketika ingin melamar pekerjaan atau magang. Namun, kemarin, aku menemukan sebuah persoalan unik yang berjudul Climbing Stairs. Yang membuat persoalan ini unik bukan tingkat kesulitannya, melain sebagaimana tricky penyelesaiannya. Berikut persoalan Climbing Stairs dari LeetCode.  Seseorang bisa menaiki tangga dengan naik satu anak tangga atau langsung menaiki dua anak tangga sekaligus. dalam menaiki tangga, bisa saja dapat banyak kombinasi cara menaiki tangga. Jika terdapat tangga setinggi n anak tangga. Tentukan banyak cara menaiki anak tangga.     Bila Anda diminta untuk menyelesaikan ini, bagaimana kah cara Anda menghitungnya? Sejatinya, ada banyak cara menyelesaikan permasalahan ini. Namun, dalam komputasi, jawaban terbaik disajikan dalam cara termalas at...

Solusi Mengenai Masalah Air Bersih

  Haloo semuaa, kembali lagi bersamaku, kali ini aku akan memberikan sebuah solusi untuk permasalahan pada blog ku sebelumnya yang berjudul “Masalah air bersih di daerah gunung putri”.  Sebelumnya, permasalahan air bersih di daerah gunung putri terkadang mengalami masalah, seperti air yang tiba-tiba kotor atau mati air. Keadaan air yang kotor ini kadang bisa diperparah jika terjadi banjir di daerah sekitar, karena banyak lumpur yang menumpuk. Nah, maka dari itu aku dan teman kelompokku akan memberikan solusi yang akan digunakan, tetapi lebih fokus ke dalam permasalahan air yang kotor ingin diubah menjadi bersih kembali.  Pada kali ini kami akan menawarkan sebuah solusi untuk masalah air bersih pada daerah ini. Solusi ini aku buat untuk mengatasi air kotor yang terkadang muncul. Kami menaruh solusi dengan menggunakan sensor pada setiap titik pada pipa hingga bak penampungan ketika melakukan penyaringan terhadap air. Sensor ini akan dibuat untuk bekerja secara otomatis, jad...

Machine Learning: Supervised Learning

Pada artikel sebelumnya, kita telah mempelajari bahwa supervised learning adalah jenis machine learning yang dilatih model dan akurasinya dengan dataset yang sudah diketahui ketepatan outputnya. Nah, pada post kali ini aku bakal sedikit jelasin mengenai supervised learning. Sebelum lebih jauh, mari kita bahas lagi cara penyelesaian supervised learning. Pada dasarnya, masalah pada supervised learning dibagi menjadi dua,  yakni data kontinu serta diskrit. Dari data itu lah, nantinya kita bisa menentukan metode apa yangf tepat untuk kita gunakan dalam machine learning kita. Mari kita bahas satu persatu.  1) Data Kontinu (Regression Problem) Data berjenis kontinu adalah data yang memiliki nilai kontinu. Nilai kontinu adalah nilai yang didapat dari suatu pengukuran, dan nilainya merupakan sebuah nilai antara dua titik. Ciri dari data kontinu adalah tiap nilainya memiliki kesinambungan dengan nilai lainnya. Contoh dari data kontinu adalah skor tes, harga rumah, luas rumah, luas hala...