30 Algoritma Prediksi

 

Linear Regression

Linear Regression adalah salah satu algoritma paling sederhana dan umum digunakan dalam machine learning untuk prediksi nilai kontinu. Algoritma ini memodelkan hubungan antara variabel dependen YY dan satu atau lebih variabel independen XX dengan asumsi hubungan linear di antara mereka. Menggunakan hubungan linear antara variabel independen (X) dan variabel dependen (Y)

 Logistic Regression

Linear Regression adalah salah satu algoritma paling sederhana dan umum digunakan dalam machine learning untuk prediksi nilai kontinu. Algoritma ini memodelkan hubungan antara variabel dependen YY dan satu atau lebih variabel independen XX dengan asumsi hubungan linear di antara mereka. Menggunakan fungsi logistik untuk memodelkan probabilitas hasil biner.


Decision Tree

Menggnakan pohon keputusan untuk membagi data berdasarkan fitur yang memberikan informasi paling banyak.

Rumus: Tidak ada rumus khusus, tetapi pembagian didasarkan pada kriteria seperti Gini impurity atau Information Gain.

Support Vector Machine (SVM)

Support Vector Machine (SVM) adalah algoritma klasifikasi yang kuat yang mencari hyperplane optimal yang memisahkan kelas dengan margin maksimum. SVM dapat digunakan untuk klasifikasi linier dan non-linier.


K-Nearest Neighbors (KNN)

K-Nearest Neighbors (KNN) adalah algoritma non-parametrik yang digunakan untuk klasifikasi dan regresi. KNN mengklasifikasikan titik berdasarkan mayoritas kelas dari k tetangga terdekatnya. Mengklasifikasikan titik berdasarkan mayoritas kelas dari k tetangga terdekatnya.

 Naive Bayes

Menggunakan teorema Bayes dengan asumsi independensi antar fitur.

 Gradient Boosting Machines (GBM)

Menggabungkan model prediksi lemah secara bertahap untuk mengurangi kesalahan.

 Long Short-Term Memory (LSTM)

Varian RNN yang mengatasi masalah long-term dependency.

Rumus: Kompleks; terdiri dari gate untuk input, output, dan forget.

Transformer

Model yang menggunakan mekanisme self-attention untuk pemrosesan data sekuensial.

K-Means Clustering

Mengelompokkan data ke dalam k cluster berdasarkan jarak rata-rata.

Gaussian Mixture Model (GMM)

Mengelompokkan data berdasarkan distribusi Gaussian.

Prophet

Model untuk data time series yang mempertimbangkan tren, musiman, dan hari libur.

SVR (Support Vector Regression)

Versi regresi dari SVM yang digunakan untuk memprediksi nilai kontinu dengan memaksimalkan margin.

Ridge Regression

Varian dari regresi linear yang menggunakan regularisasi L2 untuk mengurangi overfitting dengan menambahkan penalti pada besar koefisien regresi.

Komentar

Postingan populer dari blog ini

Quiz Data Mining P5

Proses atau Tahapan Data Mining

DBMS