Misalkan kita memiliki kumpulan knowledge berikut yang menunjukkan kaki persegi dan harga dari 12 rumah yang berbeda:
Kami ingin tahu apakah ada hubungan yang signifikan antara kaki persegi dan harga.
Untuk mendapatkan gambaran seperti apa knowledge itu, pertama-tama kita membuat sebar dengan kaki pada sumbu x dan harga pada sumbu y:
Kita dapat dengan jelas melihat bahwa ada korelasi positif antara kaki persegi dan harga. Saat kaki persegi meningkat, harga rumah juga cenderung meningkat.
Namun, untuk mengetahui apakah ada a signifikan secara statistik hubungan antara kaki persegi dan harga, kita perlu menjalankan regresi linier sederhana.
Jadi, kami menjalankan regresi linier sederhana menggunakan kaki sebagai prediktor dan harga sebagai respons dan dapatkan output berikut:
Apakah Anda menjalankan regresi linier sederhana di Excel, SPSS, R, atau perangkat lunak lain, Anda akan mendapatkan hasil yang serupa dengan yang ditunjukkan di atas.
Ingatlah bahwa regresi linier sederhana akan menghasilkan garis yang paling cocok, yang merupakan persamaan untuk garis yang paling “cocok” dengan knowledge di sebar kita. Baris paling cocok ini didefinisikan sebagai:
ŷ = b0 + b1X
dimana ŷ adalah nilai prediksi dari variabel respon, b0 adalah perpotongan y, b1 adalah koefisien regresi, dan x adalah nilai variabel prediktor.
Nilai untuk b0 diberikan oleh koefisien untuk intersep, yaitu 47588.70.
Nilai untuk b1 diberikan oleh koefisien untuk variabel prediktor Kakiyang 93.57.
Jadi, garis yang paling cocok dalam contoh ini adalah ŷ = 47588,70+ 93,57x
Berikut adalah cara menafsirkan garis yang paling cocok ini:
- B0: Ketika nilai untuk kaki persegi adalah nol, nilai harapan rata-rata untuk harga adalah $47.588,70. (Dalam hal ini, tidak masuk akal untuk menafsirkan intersep, karena sebuah rumah tidak akan pernah memiliki nol kaki persegi)
- B1: Untuk setiap kaki persegi tambahan, perkiraan kenaikan harga rata-rata adalah $93,57.
Jadi, sekarang kita tahu bahwa untuk setiap kaki persegi tambahan, kenaikan harga rata-rata yang diharapkan adalah $93,57.
Untuk mengetahui apakah peningkatan ini signifikan secara statistik, kita perlu melakukan uji hipotesis untuk B1 atau buat break kepercayaan untuk B1.
Catatan: Uji hipotesis dan break kepercayaan akan selalu memberikan hasil yang sama.
Membangun Pause Keyakinan untuk Lereng Regresi
Untuk membangun break kepercayaan untuk kemiringan regresi, kami menggunakan rumus berikut:
Pause Keyakinan = b1 +/- (t1-∝/2, n-2) * (kesalahan baku b1)
Di mana:
- B1 adalah koefisien kemiringan yang diberikan dalam keluaran regresi
- (T1-∝/2, n-2) adalah nilai kritis t untuk tingkat kepercayaan 1-∝ dengan n-2 derajat kebebasan dimana N adalah jumlah overall pengamatan dalam kumpulan knowledge kami
- (kesalahan baku b1) adalah kesalahan standar dari b1 diberikan dalam output regresi
Sebagai contoh kita, berikut adalah cara membuat selang kepercayaan 95% untuk B1:
- B1 adalah 93,57 dari output regresi.
- Karena kita menggunakan break kepercayaan 95%, ∝ = 0,05 dan n-2 = 12-2 = 10, maka t.975, 10 adalah 2,228 menurut tabel t-distribusi
- (kesalahan baku b1) adalah 11,45 dari output regresi
Jadi, break kepercayaan 95% untuk B1 adalah:
93,57 +/- (2,228) * (11,45) = (68.06 , 119.08)
Ini berarti kami 95% yakin bahwa kenaikan harga rata-rata sebenarnya untuk setiap kaki persegi tambahan adalah antara $68,06 dan $119,08.
Perhatikan bahwa $0 tidak ada dalam break ini, sehingga hubungan antara kaki persegi dan harga secara statistik signifikan pada tingkat kepercayaan 95%.
Melakukan Uji Hipotesis Lereng Regresi
Untuk melakukan uji hipotesis untuk kemiringan regresi, kami mengikuti lima langkah standar untuk setiap uji hipotesis:
Langkah 1. Nyatakan hipotesis.
Hipotesis nol (H0): B1 = 0
Hipotesis alternatif: (Ha): B1 ≠ 0
Langkah 2. Tentukan tingkat signifikansi yang akan digunakan.
Karena kita membuat break kepercayaan 95% pada contoh sebelumnya, kita akan menggunakan pendekatan ekuivalen di sini dan memilih untuk menggunakan tingkat signifikansi 0,05.
Langkah 3. Temukan statistik uji dan nilai p yang sesuai.
Dalam hal ini, statistik uji adalah T = koefisien b1 / kesalahan standar b1 dengan n-2 derajat kebebasan. Kita dapat menemukan nilai-nilai ini dari keluaran regresi:
Jadi, uji statistik T = 92,89 / 13,88 = 6,69.
Menggunakan Skor T ke Kalkulator Nilai P dengan skor 6,69 dengan 10 derajat kebebasan dan uji dua sisi, nilai p = 0.000.
Langkah 4. Tolak atau gagal menolak hipotesis nol.
Karena nilai-p kurang dari tingkat signifikansi kami 0,05, kami menolak hipotesis nol.
Langkah 5. Interpretasikan hasilnya.
Karena kami menolak hipotesis nol, kami memiliki bukti yang cukup untuk mengatakan bahwa kenaikan harga rata-rata sebenarnya untuk setiap kaki persegi tambahan bukanlah nol.