Machine learning adalah aplikasi dari disiplin ilmu kecerdasan buatan (Artificial Intelligence) yang menggunakan teknik statistika untuk menghasilkan suatu model otomatis dari sekumpulan data, dengan tujuan memberikan komputer kemampuan untuk “belajar”. Pembelajaran mesin atau machine learning memungkinkan komputer mempelajari sejumlah data (learn from data) sehingga dapat menghasilkan suatu model untuk melakukan proses input-output tanpa menggunakan kode program yang dibuat secara eksplisit. Proses belajar tersebut menggunakan algoritma khusus yang disebut machine learning algorithms. Terdapat banyak algoritma machine learning dengan efesiensi dan spesifikasi kasus yang berbeda-beda. Machine learning adalah cabang aplikasi dari Artificial Intelligence (Kecerdasan Buatan) yang focus pada pengembangan sebuah sistem yang mampu belajar "sendiri" tanpa harus berulang kali di program oleh manusia.
Aplikasi Machine learning membutuhkan Data sebagai bahan belajar (training) sebelum mengeluarkan output. Aplikasi sejenis ini juga biasanya berada dalam domain spesifik alias tidak bisa diterapkan secara general untuk semua permasalahan.
Sebagai contoh: Aplikasi Pengenalan Gambar, Aplikasi Asisten pribadi seperti Siri, Google dll, Chat Bot, Pengenal Wajah, Mobil otonom dan domain-domain spesifik lainnya.
B. Konsep Dasar dan Cara kerja Machine Learning
Secara fundamental cara kerja machine learning adalah belajar seperti manusia dengan menggunakan contoh-contoh dan setelah itu barulah dapat menjawab suatu pertanyaan terkait. Proses belajar ini menggunakan data yang disebut train dataset. Berbeda dengan program statis, machine learning diciptakan untuk membentuk program yang dapat belajar sendiri.
Secara (matematika) sederhana, rumus umum Machine learning :
Y = f(X)
Dimana:
Y = Output ,
X = Input,
f = fungsi (function)
Dimana secara singkat bisa katakan bahwa Machine Learning itu memenuhi kaidah :
Output = f(Input)
Atau dengan kata lain, Output (Y) dari machine learning adalah hasil dari pengolahan fungsi (f) terhadap Input (X)
Machine Learning meningkat karena faktor data mining dan analisis Bayesian lebih populer dari sebelumnya. Pengolahan komputasi yang lebih murah dan lebih bertenaga termasuk penyimpanan data yang terjangkau merupakan peningkatan. Semua hal ini secara cepat dan otomatis menghasilkan model yang dapat menganalisis data yang lebih besar dan lebih komplek memberikan hasil yang lebih cepat dan akurat dalam skala yang sangat besar.
Prediksi nilai tinggi bisa mengarah pada keputusan dan tindakan cerdas secara real-time tanpa campur tangan manusia. Salah satu kunci untuk menghasilkan gerakan cerdas secara real-time merupakan pembuatan model otomatis.
Bagian Machine Learning
Ketika Anda melihat situs web yang kompleks seperti Facebook, Amazon, atau Netflix, kemungkinan besar situs ini berisi beberapa model Machine Learning. Dari model yang didapatkan, kita dapat melakukan prediksi yang berbeda, tergantung pada tipenya. Jika hasil prediksi bersifat diskrit, maka dinamakan proses klasifikasi. Sistem pembelajaran mesin terdiri dari tiga bagian utama, yaitu:
- Model: sistem yang membentuk prediksi atau identifikasi.
- Parameter: sinyal atau faktor yang digunakan oleh model untuk membentuk keputusannya.
- Pemelajaran: sistem yang menyesuaikan parameter dan model dalam prediksi versus hasil aktual.
Bayangkan bahwa Anda adalah seorang guru. Anda ingin mengidentifikasi jumlah waktu belajar siswa untuk mencapai nilai terbaik dalam tes. Anda beralih lagi ke Machine learning untuk solusi tersebut. Salah satu teknik pengaplikasian machine learning adalah supervised learning. Seperti yang dibahas sebelumnya, machine learning tidak akan bekerja tanpa data. Model itu sendiri bergantung pada parameter yang digunakan untuk mengatur perhitungannya. Dalam contoh ini, parameter adalah jam yang digunakan saat belajar untuk hasil nilai tes yang diterima.
Sistem pembelajaran mesin benar-benar akan menggunakan persamaan matematis untuk mengekspresikan semuanya, secara efektif ini akan membentuk garis tren dari apa yang diharapkan. Oleh karena itu hal yang pertama kali disiapkan adalah data. Data biasanya akan dibagi menjadi 2 kelompok, yaitu data training dan data testing.
Bagaimana Machine Learning Bekerja?
Machine learning memiliki dua jenis teknik: Supervised Learning, yang melatih model pada data input dan output yang diketahui sehingga dapat memprediksi keluaran masa depan dan Unsupervised Learning, yang menemukan pola tersembunyi atau struktur intrinsik pada data masukan.
Penerapan metode Machine Learning dalam beberapa tahun terakhir telah berkembang di mana-mana dalam kehidupan sehari-hari. Machine Learning bukanlah hal baru dalam lanskap ilmu komputer. Machine Learning mengaitkan proses struktural dimana setiap bagian menciptakan versi mesin yang lebih baik.
- Supervised Learning
Pembelajaran mesin yang diawasi menciptakan model yang melancarkan prediksi berdasarkan bukti adanya ketidakpastian. Algoritma pembelajaran yang diawasi memerlukan seperangkat data masukan dan tanggapan yang diketahui terhadap data (output) dan melatih model untuk menghasilkan prediksi yang masuk akal untuk respon terhadap data baru. Gunakan pembelajaran ini jika Anda ingin mengetahui data output yang ingin Anda prediksi. Pembelajaran ini diawasi menggunakan teknik klasifikasi dan regresi untuk mengembangkan model prediktif.
Teknik klasifikasi memprediksi respons diskrit – misalnya, apakah email itu asli atau spam, atau apakah tumor itu kanker atau tidak. Model klasifikasi mengklasifikasikan data masukan ke dalam kategori tersebut. Aplikasi yang umum termasuk pencitraan medis. Misalnya aplikasi untuk pengenalan tulisan, maka anda harus menggunakan klasifikasi untuk mengenali huruf dan angka.
Jika Anda bisa melakukannya, Anda memiliki landasan yang dapat Anda gunakan pada satu dataset ke dataset yang akan dicoba lagi selanjutnya. Anda bisa mengisi waktu seperti mempersiapkan data lebih lanjut dan memperbaiki hasilnya nanti, begitu Anda lebih percaya diri. Dalam pengolahan citra dan penglihatan komputer, teknik pengenalan pola tanpa pemeriksaan digunakan untuk deteksi objek dan segmentasi. Algoritma yang umum mengadakan klasifikasi yang meliputi dukungan mesin vektor (SVM).
- Unsupervised Learning
Ini menemukan pola tersembunyi atau struktur intrinsik dalam data. Ini digunakan untuk menarik kesimpulan dari kumpulan data yang terdiri dari data masukan tanpa respon berlabel. Clustering adalah teknik belajar tanpa pengamatan yang umum. Ini digunakan untuk analisis data eksplorasi dalam menemukan pola atau pengelompokan tertutup dalam data. Aplikasi untuk analisis cluster meliputi analisis urutan gen, riset pasar dan pengenalan objek.
Misalnya, jika sebuah perusahaan telepon seluler ingin mengoptimalkan lokasi di mana mereka membangun menara telepon seluler, mereka dapat menggunakan pembelajaran mesin untuk memperkirakan jumlah kelompok orang yang bergantung pada menara mereka. Telepon hanya bisa berbicara dengan satu menara sekaligus, sehingga tim menggunakan algoritma pengelompokan untuk merancang peletakan menara seluler terbaik dalam mengoptimalkan penerimaan sinyal bagi kelompok dan dari pelanggan mereka.
Algoritma yang umum mengadakan clustering meliputi k-means dan k-medoids, hirarki clustering, model campuran Gaussian, model Markov tersembunyi, peta pengorganisasian sendiri, clustering fuzzy c-means dan clustering subtraktif.
C. Metode Algoritma Machine Learning
Supervised machine learning algorithms
Supervised machine learning adalah algoritma machine learning yang dapat menerapkan informasi yang telah ada pada data dengan memberikan label tertentu, misalnya data yang telah diklasifikasikan sebelumnya (terarah). Algoritma ini mampu memberikan target terhadap output yang dilakukan dengan membandingkan pengalaman belajar di masa lalu.Unsupervised machine learning algorithms
Unsupervised machine learning adalah algoritma machine learning yang digunakan pada data yang tidak mempunyai informasi yang dapat diterapkan secara langsung (tidak terarah). Algoritma ini diharapkan mampu menemukan struktur tersembunyi pada data yang tidak berlabel.Semi-supervised machine learning algorithms
Semi-supervised machine learning adalah algoritma yang digunakan untuk melakukan pembelajaran data berlabel dan tanpa label. Sistem yang menggunakan metode ini dapat meningkatkan efesiensi output yang dihasilkan.Reinforcement machine learning algorithms
Reinforcement machine learning adalah algoritma yang mempunyai kemampuan untuk berinteraksi dengan proses belajar yang dilakukan, algoritma ini akan memberikan poin (reward) saat model yang diberikan semakin baik atau mengurangi poin (error) saat model yang dihasilkan semakin buruk. Salah satu penerapannya adalah pada mesin pencari.
Contoh Penerapan Machine Learning
Hasil Pencarian Search Engine
Google dan mesin pencari lainnya seperti Bing dan Yandex sudah dari dulu menerapkan machine learning untuk melakukan perangkingan laman suatu website. Setiap mesin pencari mempunyai resep tersendiri pada algoritma pencarian yang digunakan. Dalam praktiknya ketika kita mengetik kata kunci, Google akan menampilkan hasil pencarian yang paling mendekati kata kunci tersebut. Apabila kita memilih suatu halaman dan menghabiskan banyak waktu pada halaman tersebut, Google akan mendeteksi bahwa halaman tersebut sesuai dengan kata kunci yang kita masukkan. Begitu pula, saat kita melihat halaman pencarian berikutnya misalnya halaman 2, 3, dan seterusnya. Google akan mendeteksi adanya ketidaksesuaian kata kunci dengan hasil pencarian yang dihasilkan. Begitulah data tersebut terkumpul dan dianalisis menggunakan machine learning oleh Google Search Engine, untuk menghasilkan hasil pencarian yang dinamis dan berkualitas.Rekomendasi Produk Marketplace
Perkembangan teknologi menyebabkan penggunaan marketplace semakin diminati baik dari sisi penjual dan pembeli. Hampir semua orang menggunakan marketplace, misalnya Tokopedia, Bukalapak, dan Shopee. Tiap detik bisa dipastikan terjadi transaksi antar pedagang dan pembeli. Untuk meningkatkan pengalaman pengguna, setiap akun perlu menampilkan rekomendasi produk yang sesuai dengan minat pembelian pembeli. Untuk melakukan ini secara otomatis dan real time, tentunya machine learning sangat menentukan keakuratan rekomendasi produk tiap pembeli di akunnya.Pengalaman Pengguna Sosial Media
Tidak bisa dipungkiri, walaupun tidak dapat mengalahkan mesin pencari sebagai situs terpopuler. Sosial media merupakan situs yang paling lama diakses oleh penggunanya berdasarkan data Alexa. Sosial media seperti Facebook dan Twitter menggunakan machine learning sehingga penggunanya betah untuk terus melihat layar gadget. Berikut beberapa peningkatan pengalaman pengguna yang merupakan aplikasi dari machine learning.Orang yang Mungkin Anda kenal
Facebook mengumpulkan informasi pengguna, baik dari informasi umum seperti tempat tinggal, alamat sekolah, alamat kerja, dan kesukaan hingga log aktivitas seperti data percakapan, posting, dan profil yang sering dilihat (stalking). Sehingga bisa dilakukan prediksi teman yang mungkin sama di dunia nyata.Pengenalan Wajah
Facebook dapat mengetahui bahwa suatu gambar yang diunggah memuat wajah orang-orang. Sehingga pengguna dapat memberikan tag wajah pada area wajah di gambar. Seiring berjalannya waktu dengan banyaknya foto yang diunggah, facebook akan mengenali wajah-wajah penggunanya. Ini memungkinkan facebook melakukan tag secara otomatis wajah orang-orang pada gambar baru yang diunggah.Pos pada Beranda
Facebook akan mengumpulkan aktivitas tiap penggunanya, orang yang sering diajak berkomunikasi, posting yang sering disukai, hingga grup yang sering dilihat. Hal ini digunakan untuk menampilkan prioritas postingan yang ditampilkan pada beranda akun penggunanya. Sehingga peluang terjadinya interaksi terhadap pos yang tampil semakin tinggi.
Konten yang Ditampilkan Periklanan Digital
Google Adword adalah media periklanan digital terpopuler di dunia. Adword menampilkan iklan-iklan pada situs web yang menjadi publisher di Google Adsense. Iklan yang ditampilkan adalah iklan yang bersifat dinamis atau berubah-ubah. Google Adword mengumpulkan data situs berdasarkan topik, kemudian menampilkan iklan-iklan yang relevan dengan topik tersebut. Disamping itu Google Adword juga menggunakan cookies, sebagai referensi aktivitas pengunjung suatu website terkait situs-situs yang dikunjungi sebelumnya. Adword melakukan akumulasi terhadap 2 faktor tersebut, sehingga dapat ditampilkan iklan yang sesuai dengan pengunjung website.Asisten Pribadi Virtual
Gadget telah dilengkapi dengan asisten pribadi virtual, baik laptop maupun smartphone, misalnya: Cortana di Microsoft Windows, Siri di Iphone, dan Google Now di Android. Asisten virtual ini dapat membantu penggunanya untuk melakukan pencarian di internet, menanyakan jalan, cuaca, melakukan panggilan telepon, hingga membuka aplikasi. Di Windows, cortana bahkan mempelajari penggunanya untuk memberikan rekomendasi perintah yang akan dilakukan.Penyaring Pesan Spam
Machine learning memegang andil yang sangat besar untuk melakukan penyaringan (filter) spam baik di email, website, hingga media komunikasi berbasis software. Algoritma pohon keputusan (decision tree) merupakan cikal bakal dari algoritma spam filtering, untuk menentukan suatu pesan termasuk spam atau bukan.Online Fraud Detection
Online fraud detection adalah metode yang digunakan untuk mendeteksi suatu transaksi digital sah atau tidak. Online fraud detection digunakan oleh semua bank baik bank umum maupun bank virtual seperti paypal. Online fraud detection menggunakan machine learning untuk melakukan perlindungan (cybersecurity) terhadap pencucian uang, pendeteksian transaksi palsu, hingga deteksi pembobolan akun bank digital.Videos Surveillance
Videos surveillance atau pengawasan video merupakan teknologi baru yang merupakan penerapan dari machine learning yang disematkan pada CCTV untuk mendeteksi suatu tindak kejahatan atau kecelakaan. Di negara-negara maju, CCTV sudah digunakan untuk melakukan pencarian penjahat yang masih buron.Diagnosa Medis
Di negara Inggris, diagnosa medis menggunakan bantuan chatbot sudah marak dilakukan. Chatbot ini bernama Babylon Health. Ini dilengkapi dengan speech recognition untuk mempermudah berbicara dengan penggunanya. Dalam perkembangan selanjutnya, analisis diagnosa medis dengan kontak fisik mulai dikembangkan dengan deep learning.Mobil Kendali Otomatis
Mobil kendali otomatis merupakan penerapan serta pengembangan dari machine learning yaitu machine vision. Mobil kendali otomatis merupakan penerapan machine learning yang kompleks dan dengan resiko langsung yang tinggi. Banyak hal yang harus dipelajari oleh mobil, mulai dari rambu-rambu lalulintas, arah dan tujuan, kondisi jalan, traffic light, kondisi manusia sekitarnya, dan sensor lainnya yang terintegrasi.
Referensi Sumber
Ralf Herbrich & Thore Graepel. 2018. INTRODUCTION TO MACHINE LEARNING with APPLICATIONS in INFORMATION SECURITY. California: CRC Press
0 komentar:
Posting Komentar
Komentarnya ya...