Langsung ke konten utama

ML101: Intoduction to Machine Learning

Pengertian Machine Learning

Sebelum kita belajar tentang ML atau machine learning lebih jauh,  ada baiknya kita belajar mengenai pengertian atau terminologinya lebih jauh. Ada sebuah terminologi yang aku pelajari dari Arthur Samuel mengenai ML. Menerut beliau, Ml adalah bidang studi yang memberi jalan pada komputer untuk memiliki kemampuan belajartanpa perlu diprogram secara eksplisit.

Ada sebuah definisi dari ML yang lebih modern dari Tom Mitchell, yakni "sebuah program komputer yang dikatakan belajar dari pengalaman E dengan menghargai beberapa kelas tugas T dan perhitungan performa P. Di mana performanya dalam mengerjakan tugas T, dihitung dalam P, dan ditingkatkan melalui pengalaman E."

Agar mudah memahaminya, kuberi sebuah analogi dalam bermain catur. Misalnya pada kasus bermain catur,

E adalah pengalaman dalam bermain catur.

T adalah tugas dalam permainan catur.

P adalah propabilitas program memanangkan catur.

Lebih lanjut, secara umum machine learning diklasifikasikan ke dalam dua jenis, yakni supervised learrning dan unsupervised learning. Untuk lebih lanjut mari kita bahas satu-persatu.

Supervised Learning

Supervised learning adalah program yang pembelajarannya melalui data train atau data yang telah diketahui bagaimana output program seharusnya pada awal program dijalankan atau diuji coba, dengan tujuan terbentuknya model program yang tepat. Semisal, diberikan contoh opini setuju dan opini tak seutuju. Kewmudian program diminta menentukan posisi opini lain, setuju atau tidak.

Secara mendasar, permasalahan pada program supervised learning terbagi menjadi dua, yakni problem regresi dan klasifikasi. 

Regresi digunakan untuk memprediksi suatu nilai pada data yang nilainya kontinu. Seperti: memprediksi harga rumah berdasarkan luas tanah, berdasar datatset harga rumah dan luas tanah.

Klasifikasi digunakan untuk memprediksi output dalam bentuk diskrit. Seperti: memprediksi berdasar data harga dan luasan rumah yang ada, harga rumah akan cenderung naik atau turun.

Unsupervised Learning

Unsupervised learning adalah program yang mengizinkan kita untuk melakukan pendekatan pada suatu masalah tanpa adanya data perlatihan program. Program ini melakukan pendekatan berdasarkan kecenderungan tertentu pada input. 

Kita bisa menurunkan struktur dari data tanpa perlu mengetahui variabel-variabel terntentu. Penurunan terjadi menggunakan klasterisasi pada kecenderungan tiap data yang diberikan. Tanpa mendapat umpan balik mendasar dari hasil.

Contoh unsupervised learning adalah, saran artikel lain yang relevan ketika kita mengklik suatu web atau artikel di google. Pemisahan antara suara dan noise pada suatu lingkungan.

Komentar

Postingan populer dari blog ini

Seberapa Penting Data Pribadi Kita?

sc: kliklegal.com Di era digital ini, data tidak hanya disimpan dalam bentuk kertas atau hardfile   saja, tetapi mulai beralih ke data digital. Sebut saja e-ktp, menjadi salah satu data pribadi yang diwacanakan menjadi digital. Namun, banyak dari kita masi belum menyadari penting dan berharganya data pribadi yang kita miliki. Belakangan ini, kita banyak mendengar berita tentang pembobolan data pribadi di beberapa e-commerce , bahkan kabarnya data pemilih pada pemilu tahun 2019 pun ikut raib. Namun, sejak kapan si data pribadi mulai dibahasa? Isu tentang perlindungan tentang data pribadi menjadi hangat diperbincangkan pasca kasus Cambridge Analitica yang mengolah data pribadi pengguna Facebook di awal tahun 2018. Padahal isu tentang data pribadi telah didiskusikan 38 tahun sebelumnya, yaitu dalam forum internasional OECD dalam Guidelines Governing the Protection of Privacy and Transborder Flow of Personal Data pada tahun 1980. Sebegitu concer- nya, data pribadi dibahas. Namun ...

Sumber Daya Lahan dan Manusia : Keterbergantungan dan Keberadaan

 Bismillahirahmanirrahimm Assalamulaikum warahtullahi wabarakatuh, Salam sejahtera bagi kita semua. Segala puji bagi Allah, Tuhan Yang Maha Esa, karena berkat rahmatnya tugas ini dapat saya terbiitkan. Selawat dan salam pada Rasulullah SAW.  Pada kesempatan kali ini, saya akan membagikan sedikit pandangan saya mengenai hubungan antara manusia dan sumber daya lahan. Saya melihat makin hari, jumlah lahan menurun sedangkan jumlah manusia di bumi ini terus meningkat. Tak dapat dimungkiri, peningkatan jumlah penduduk Bumi aka membuat kebutuhan akan lahan, baik untuk tempat tinggal, industri, hingga lumbung pangan meningkat. Peningkatan signifikan pada jumlah penduduk Bumi tanpa ada penangganan yang tepat justru akan menyebabkan krisis. baik dari sisi ekonomi, kemasyarakatan, bahkan teknologi. Oleh karena itu, diperlukan sebuah kajian komperehensif mengenai masalah tersebut. Pada kesempatan kali ini saya akan melampirkan sedikit pandangan saya mengenai masalah tersebut menggunakan m...

Pre-Processing, Membersihkan Dataframe pada Python

Sebagian kita mungkin mengenal python sebagai salah satu bahasa pemrograman yang dapat digunakan untuk mengolah data. Salah satu module yang cukup umum ialah Pandas. Namun, sedikit dari kita menyadari pentingnya membersihkan data sebelum digunakan.  Sebelum masuk ke Pemrosesan mari kita nikmati sebuah meme dari reddit: gambar 1.0 Data yang diolah tidak selalu bersih. Pada beberapa kasus terdapat data unknown atau data yang keluar dari batas wajar dan tidak sesuai mengikuti aturan di dunia nyata. Misal juamlah kuantitas belanja yang mencapai puluhan ribu pada sekali check out atau kuantitas yang nilainya lebih kecil dari satu. Oleh karena itu, diperlukan pembersihan dataset dari data yang rusak atau kotor. Banyak metode yang dapat dilakukan untuk menormalisasi data, di antaranya mengantinya dengan modus, rata-rata, median, atau menghapusnya. Pada kasus ini, penulis menggunakan teknik dropping atau menghapus data yang rusak atau tak sesuai denagn method .drop(). Sebelum member...