FAQ 01 – Regresi Spline dari Syahrul, Samarinda

Posted on 10 June 2009. Filed under: statistika | Tags: , , , |

Pertanyaan mengenai Regresi Spline ini sengaja aku Publish agar dapat juga diakses teman lain yang membutuhkan.

Bagi yang membaca tulisanku ini, aku anggap sudah mengunduh (mendownload) skripsi Regresi Spline ku di sini.
Berikut Pertanyaan-pertanyaan yang Syahrul lontarkan beserta Jawaban mungkin dapat membantu.

Apa bedanya antara regresi linear sederhana dengan regresi spline ?

Jawab:

Regresi Spline merupakan Regresi Non Parametrik. Maksud Non Parametik di sini, karena KURVA dari titik-titik amatan belum diketahui fungsinya. Apabila sudah diketahui Fungsinya, maka lebih baik menggunakan Regresi dengan Fungsi tersebut. Contoh, Regresi Eksponensial, Regresi Kuadratik, Regresi Linier dsb.

Di dalam Fungsi Spline, memungkinkan untuk berbagai macam orde sehingga dimungkinkan juga dibentuk Regresi Spline Linier, Regresi Kuadratik, dst. Selain itu, dimungkinkan juga penggunaan sampai knot sebanyak n-2 buah titik. Sehingga dikenal Regresi Spline Linier dengan 1 knot, Regresi Kuadratik dengan 2 knot, dst.

Jadi Spline adalah sebuah Fungsi Matematis. Sedang Regresi merupakan suatu usaha untuk menduga parameter Fungsi tersebut. Parameter di sini adalah Koefisien-koefisien yang ada di fungsi tersebut. Hasil dari Regresi tadi adalah sebuah persamaan matematis yang lengkap dengan penduga parameternya.

Contoh.     Fungsi Populasi Y= A + BX  è Koefisien aku tulis besar karena Koefisien sebenarnya dari Populasi.

Fungsi Sampling  y = a + b x + e    è Aku tulis huruf kecil karena dari data sampel.

Regresinya     ŷ = a + bx

Apakah tujuan dari penggunaan regresi spline ?

Jawab:

Tujuannya seperti tujuan Regresi, yakni menduga parameter fungsi Spine.

Lah, tujuan penggunaan fungsi Spline apa? Jawaban di nomer 1. Karena Pendekatan untuk fungsi KURVA belum ada (non Parametrik).

Point: Pahami alur berikut, KURVA -> FUNGSI -> REGRESI. Jelas khan?

Apa bedanya antara meramal dengan memprediksi ?

Jawab:

Meramal itu haram. J Meramal itu pekerjaan Deret Waktu. Atau ada konsep dasar seperti ini: “Menduga (memprediksi) apabila nilai X yang akan dijadikan bahan dugaan nilai Y tersebut masih berada pada rentang data X sampel. Meramal apabila nilai X yang akan dijadikan bahan ramalan nilai Y tersebut di luar rentang data X sampel.”

Jadi REGRESI itu cocoknya untuk Menduga/Memprediksi bukan Meramal.

Masih belum paham?

Begini, bayangkan aku (ADI) dapat data yang bentuk Kurvanya Kuadratik dimana nilai X nya adalah 1, 2, 3 … , 10.

Titik puncak nilai Y berada di x = 7.

Sampai sini bisa membayangkan khan? Pahami dulu. Kalo sudah paham, lanjut membacanya. Sudah… oke.

Nah, ADI tadi dapat fungsi Kuadratik yah, Anggap aja itu sesuai dengan keadaan riilnya (populasi). Artinya si ADI dah bener. He he he …

Di lain pihak, di luar pulau di sana, si ARUL juga meneliti dengan bahan yang sama. Cuma dia hanya mempunyai data dengan rentang X adalah 1, 2, 3, 4 dan 5.

Ingat! Titik puncak fungsi yang benar (ADI) berada di X = 7.

Otomatis, dengan data yang dipunyai oleh ARUL, kurva yang didapat adalah Linier. Setuju khan.

Nah, kamu bisa bayangkan khan dugaan fungsinya. Tentu Regresi Linier. Nah, setelah mendapat fungsi tersebut. ARUL melakukan pendugaan dengan nilai x=8, kira-kira sama atau enggak hasil dugaannya?

Coba dibayangkan juga jika si ARUL melakukan pendugaan dengan nilai x=3.

Oke. Dapat pointnya?

Kalo dapat, mungkin berikut bisa lebih membantu:

Seandainya ARUL menduga x = 8 dengan dugaan fungsi Liner, maka dugaannya akan jauh lebih besar dari nilai sebenarnya. Karena fungsi sebenarnya khan trend menurun. Padahal kalo fungsi linier, akan dihasilkan trend naikkkkkkkkk terus.

Nah, kalo menduga dengan x=3, mungki nilai dugaannya akan tidak berbeda jauh dengan dugaan si ADI yang menggunakan Kuadratik.

Jadi hati-hati kalo menduga dengan regresi. Karena, fungsi regresi cuman mengcover selama rentang x di dalam data X.

Dalam perhitungan-perhitungan di skripsi Mas, Mas menggunakan software apa saja, jika saya baca dan lihat Mas hanya menggunakan software Minitab..Mas menggunakan software minitab untuk mencari apa saja???Apakah Mas tidak menggunakan software lain seperti S-Plus?Jika ya bagaimana langkah-langkahnya?

Jawab:

Yang aku gunakan cuman MiniTAB dan Excel Rul.

Sama dengan S-Plus kamu, aku menggunakan miniTAB untuk menduga koef-koef fungsi Spline untuk 1 knot, 2 knot, … , (n-2) knot. Baik Linier maupun Kuadratik. Jadi memang 2 minggu khusus mlototin computer Rul. Kalo gak salah, dulu output-nya aku store di Matrik Rul. Yah, bisa dibilang manual lah.

Langkahnya:

Per Orde: 1) Linier 2) Kuadratik

Dari Fungsi Linier tersebut, aku cari untuk 1 knot, 2 knot, …, (n-2) knot. è yg ini bikin bête L

Setelah Linier habis, baru Kuadratik. Idem sama di atas, Bête pas kombinasi beberapa knot tersebut

Perhitungan kombinasi di Skripsi Mas, digunakan untuk apa???Apakah perhitungannya harus dilakukan beribu-ribu kali sesuai dengan kemungkinan kombinasinya???Sebab di skripsi, Mas hanya melakukan sampai (Tujuh Knot dengan Nilai MSE(λ), P(λ), dan GCV(λ) yang Minimum pada Model Regresi Spline Orde 2 (Linier) pada Data Pertama)

Jawab:

Ha ha ha … Semua kemungkinan Knot aku cari Rul. Lihat Lampiran 5.

Nah, yang aku tampilkan di Lampiran cuman 7 urutan minimumnya. Bahkan kalo gak salah ngeprint buat sampai 10 urutan terminimum. Cuman, beliau-beliau pembimbingku menyuruh cukup 5-7 aja.

Bagaimana cara Mas menentukan Tujuh Knot dengan Nilai MSE(λ), P(λ), dan GCV(λ) yang Minimum pada Model Regresi Spline Orde 2 (Linier) pada Data Pertama???Apakah Mas melakukan perhitungan terhadap semua kemungkinan pasangan knot dan baru memilih hanya 7 knot atau Ada cara lain yang lebih efektif untuk menentukan knot-knot yang optimal???

Idem jawabannya dengan pertanyaan 5. Ini proses yang bikin bête

Cara efektif belum ketemu Rul.

Justru aku mencari literature yang membahas Penggunaan Knot Efektif pada Regresi Spline. Ternyata belum nemu2.

Bagaimana  cara mendapatkan nilai s(b) pada skripsi Mas,,saya harus menggunakan rumus yang mana???Mohon bisa berikan saya contoh yang sederhana!!!

Kalo pake S-Plus, kamu tinggal mengeluarkan (meng-Output) kan hasil perhitungan s(b) nya aja. Coba konsul ke teman-teman lain yang paham dengan script S-Plus untuk mengeluarkan hasil perhitungannya.

Jika menggunakan data pertama skripsi Mas, bagaimana cara mendapakan nilai dari rumus dibawah ini (GCV dan PCV): (mohon penjelasan dan contohnya bagaimana cara menggunakan dan mendapatkan nilai-nilai yang berada dalam lingkaran)

tes

Jawab:

Lihat Macro S-Plus kamu ini:

splinelinear <- function(x,y,k1)

{

n <- length (y)

trun <- function (data,knots,power)

{

((data-knots)^power)*(data>=knots)

}

m <- matrix(0,ncol=3, nrow=n)

m[,1]<-1

m[,2]<-x

m[,3]<-trun(x,k1,1)

beta <- solve(t(m)%*%m)%*%t(m)%*%y

flamda <- m%*%beta

hlamda <- m%*%solve(t(m)%*%m)%*%t(m)

amse <- (t(y-flamda)%*%(y-flamda))/n

I <- diag(n)

gcv <- (n^2*amse)/(sum(diag(I-hlamda)))^2

residual<-y-flamda

ybar<-sum(y)/n

sse<-t(y-flamda)%*%(y-flamda)

syy<-t(y-ybar)%*%(y-ybar)

ssr<-t(flamda-ybar)%*%(flamda-ybar)

koef.determinasi<-ssr/syy

mse<-as.vector(sse)/(n-3)

msr<-as.vector(ssr)/2

fhitung<-msr/mse

covbeta<-solve(t(m)%*%m)*mse

seb1<-sqrt(covbeta[1,1])

seb2<-sqrt(covbeta[2,2])

seb3<-sqrt(covbeta[3,3])

tb1<-beta[1]/seb1

tb2<-beta[2]/seb2

tb3<-beta[3]/seb3

i<-seq(min(x),max(x),length=100)

fest<-beta[1]+beta[2]*i+beta[3]*trun(i,k1,1)

win.graph()

plot(x,y,xlim=c(min(x),max(x)),ylim=c(min(y),max(y)),xlab=”x”,ylab=”y”)

par(new=T)

plot(i,fest,type=”l”,

xlim=c(min(x),max(x)),ylim=c(min(y),max(y)),xlab=”x”,ylab=”y”)

return(mse)

}

Ha ha ha … Kayaknya kamu juga belum paham S-Plus kamu yang ini ScriptLinier1Knot.SSC pada baris:

ð  amse <- (t(y-flamda)%*%(y-flamda))/n

Artinya:

AMSE = MSE

ð  gcv <- (n^2*amse)/(sum(diag(I-hlamda)))^2

Artinya:

GCV = (n^2*MSE)/(sum(diag(I-hlamda)))^2

=  MSE / {(sum(diag(I-hlamda))) / n }^2

J Sama khan?

Nah, yang PCV belum inget aku. J

Sementara gitu dulu yah.

Make a Comment

Make a Comment: ( 2 so far )

blockquote and a tags work here.

2 Responses to “FAQ 01 – Regresi Spline dari Syahrul, Samarinda”

RSS Feed for docLines Stat-er Comments RSS Feed

minta dijelasin materi tentang fungsi splinenya dan kalau bisa referensinya

Spline itu seperti fungsi polinomial terpotong (truncated polynomial function). Digunakan sebagai Regresi NON PARAMETRIK karena, waktu data digambarkan pada Scater plot, Kurva yang didapat belum ada literaturnya. Misal, jika data pertumbuhan kuman bakteri, sudah pasti kurvanya akan eksponensial (Regresi Parametrik dg fungsi Eksponensial) karena kuman bakteri berkembang biak dua kali lipat. Tetapi bila ada kasus penelitian yang tidak atau belum ada literatur atau pustaka yang dapat menjelaskan kurva maka termasuk regresi non parametrik. Seumpanya kita bisa pakai fungsi Spline.
Begitu ceritanya.
Untuk literaturnya bisa dilihat di postingaku ini:
http://doclines.wordpress.com/2008/10/28/skripsi-tentang-regresi-spline/


Where's The Comment Form?

Liked it here?
Why not try sites on the blogroll...