Langsung ke konten utama

ML101: Intoduction to Machine Learning

Pengertian Machine Learning

Sebelum kita belajar tentang ML atau machine learning lebih jauh,  ada baiknya kita belajar mengenai pengertian atau terminologinya lebih jauh. Ada sebuah terminologi yang aku pelajari dari Arthur Samuel mengenai ML. Menerut beliau, Ml adalah bidang studi yang memberi jalan pada komputer untuk memiliki kemampuan belajartanpa perlu diprogram secara eksplisit.

Ada sebuah definisi dari ML yang lebih modern dari Tom Mitchell, yakni "sebuah program komputer yang dikatakan belajar dari pengalaman E dengan menghargai beberapa kelas tugas T dan perhitungan performa P. Di mana performanya dalam mengerjakan tugas T, dihitung dalam P, dan ditingkatkan melalui pengalaman E."

Agar mudah memahaminya, kuberi sebuah analogi dalam bermain catur. Misalnya pada kasus bermain catur,

E adalah pengalaman dalam bermain catur.

T adalah tugas dalam permainan catur.

P adalah propabilitas program memanangkan catur.

Lebih lanjut, secara umum machine learning diklasifikasikan ke dalam dua jenis, yakni supervised learrning dan unsupervised learning. Untuk lebih lanjut mari kita bahas satu-persatu.

Supervised Learning

Supervised learning adalah program yang pembelajarannya melalui data train atau data yang telah diketahui bagaimana output program seharusnya pada awal program dijalankan atau diuji coba, dengan tujuan terbentuknya model program yang tepat. Semisal, diberikan contoh opini setuju dan opini tak seutuju. Kewmudian program diminta menentukan posisi opini lain, setuju atau tidak.

Secara mendasar, permasalahan pada program supervised learning terbagi menjadi dua, yakni problem regresi dan klasifikasi. 

Regresi digunakan untuk memprediksi suatu nilai pada data yang nilainya kontinu. Seperti: memprediksi harga rumah berdasarkan luas tanah, berdasar datatset harga rumah dan luas tanah.

Klasifikasi digunakan untuk memprediksi output dalam bentuk diskrit. Seperti: memprediksi berdasar data harga dan luasan rumah yang ada, harga rumah akan cenderung naik atau turun.

Unsupervised Learning

Unsupervised learning adalah program yang mengizinkan kita untuk melakukan pendekatan pada suatu masalah tanpa adanya data perlatihan program. Program ini melakukan pendekatan berdasarkan kecenderungan tertentu pada input. 

Kita bisa menurunkan struktur dari data tanpa perlu mengetahui variabel-variabel terntentu. Penurunan terjadi menggunakan klasterisasi pada kecenderungan tiap data yang diberikan. Tanpa mendapat umpan balik mendasar dari hasil.

Contoh unsupervised learning adalah, saran artikel lain yang relevan ketika kita mengklik suatu web atau artikel di google. Pemisahan antara suara dan noise pada suatu lingkungan.

Komentar

Postingan populer dari blog ini

Identitas Mahsiswa dan Budaya Korupsi

  Posisi Potensi dan Peran atau yang biasa disingkat PoPoPe merupakan gambaran dari identitas mahasiswa. Popope mengambarkan bagaimana lingkungan dan tugas yang harusnya mahasiswa emban. Berisi tangung jawab dan empati, bukan sekadar omongan atau gelar kebanggan semata. Mahasiswa harus peka mengenai posisinya di masyarakat dalam bernegara. Selain itu, ia harus peka melihat potensi yang dimiliki lingkungannya, bukan malah menjadi eksklusif dan menjadi manusia yang merasa di atas. Berperan lantgsung bukan hanya sebagai mediator melainkan katalisator, bukan hanya orang yang banyak bicara tanpa aksi nyata dan mencari nama tanpa manfaat semat. Meskipun pandemi Covid melanda dunia. Namun, sungguh disayangkan, kerguian negara akibat koruipsi tak menurun. Sadisnya, justru terjadi tren pengingkatan kerugian negara akibat korupsdi sejak 2016 (ICW, 2021). Dari 444 kasus korupsi 107 di antaranya merupakan korupsi proyek Covid19, baik dpengadaan bansos, hingga proyek lainnya. Mahasiswa seba...

Need-Know-How-Solve: Problem (2) Jumlah Tukang Cukur Rambut Pria di Bandung

Halo, Bismillah Assalamualaikum wa rahmatullahi wa barakatuh. Kembali lagi dengan saya, Risqi Firdaus. Pada kesempatan kali ini, saya akan membahasa sedikit tentang penyelesaian masalah dengan Need-Know-How-Solve. Untuk memudahkan, kita akan melakukan studi kasus pada permasalahan jumlah tukang cukur rambut pria di bandung. Need: Jumlah kios cukur rambut pria di Kota Bandung. Know:  Menurut sensus penduduk tahun 2020 yang dilakukan oleh BPS, jumlah penduduk Kota Bandung pada tahun 2020 ialah 2,5 juta warga. Dalam publikasi yang sama, BPS menyatakan perbandingan penduduk berdasarkan gender berada di angka 1:1.  Menurut data Dinas Kependudukan dan Pencatatan Sipil, pada tahun 2018, terdapat 51 ribu perantau yang mengadu nasib di Kota Bandung. Peningkatan per tahunnya juga sangat kecil, yakni berkisar di angka 0,006 persen.  Menurut Elmira, rentang waktu ideal memotong rambut pendek (umumnya pria) ialah 4-6 minggu sekali.  Mengutip dari Replubika, sebuah kios barbershop...

Memilah Data Menggunakan Library Pandas

sc: makeameme.org Filtering data? Pake filter rokok? atau pake saringan tahu? Ketika mengolah data menggunakan python, khususnya library pandas, kita mungkin tidak akan menggunakan semua data ataupun kolom pada dataset yang kita miliki. Kita hanya akan memilih data mana yang akan kita gunakan agar pengolahan lebih rapi dan simpel.  Pandas menyediakan banyak cara untuk menyeleksi data. Tiap cara penyeleksi memiliki keunikan tersendiri dalam metodenya. Penggunaan method perlu memerhatikan kenyamanan dan keperluan. Sebelum menyeleksi data, salah satu method yang kiranya perlu diaplikasikan ialah ".columns". Method ini akan menampilkan list kolom-kolom dari data frame yang kita gunakan. Pada tulisan kali ini, aku pake dataset dari kaggle. Data yang aku pake berjudul HRDataset_v14.csv . Dataset bisa diakses pada link di atas. Setelah mengetahui kolom apa saja yang terdapat pada dataset kita dapat mulai menyeleksi data. Ada beberapa cara yang dapat digunakan.  1. Seleksi dengan con...