Spesifikasi Model dan Data
Secara spesifik model dalam ekonometrika dapat dibedakan menjadi: model ekonomi (economic model) dan model statistic (statistical model).
Model Ekonomi
biasanya dituliskan dalam bentuk persamaan sebagai berikut:
Y = b0 + b1X1 + b2 X2
Tanda b = parameter, menunjukkan ketergantungan variabel Y terhadap variabel X
b0 = intercept, menjelaskan nilai variabel terikat ketika masing-masing variabel bebasnya bernilai 0 (nol).
Model ini menggambarkan rata-rata hubungan sistemik antara variabel Y, X1, X2. Dalam model ini nilai e tidak tertera, karena nilai e diasumsikan non random. Dalam realita, model ini tidak mampu menjelaskan variabel-variabel ekonomi secara pas (clear), oleh karena itu membutuhkan regresi.
Model Statistik
Model ekonomi seperti yang dijelaskan di atas, mencerminkan nilai harapan, maka dapat pula ditulis:
E (Y) = b0 + b1X1 + b2 X2
Karena nilai harapan, maka tentu tidak akan secara pasti sesuai dengan realita. Oleh karena itu akan muncul nilai random error term (e). Nilai e sendiri merupakan selisih antara nilai kenyataan dan nilai harapan. Secara matematis dapat dituliskan sebagai berikut:
e = Y – E(Y) atau e = Y –
jadi, Y = + e
karena, = E (Y) = b0 + b1X1 + b2 X2
maka Y = b0 + b1X1 + b2 X2 + e
tanda e pada persamaan di atas mencerminkan distribusi probabilitas. Atau dapat pula dianggap sebagai pengganti variabel-variabel berpengaruh lain selain variabel yang dijelaskan dalam model. Dalam teori ekonomi, e merupakan representasi dari asumsi ceteris paribus. Pengakuan adanya variabel lain yang berpengaruh, meskipun tidak disebutkan variabel apa, cukup ditulis dengan tanda e, maka model menjadi lebih realistik. Agar terdapat gambaran yang jelas, maka nilai e harus diasumsikan. Asumsi-asumsinya adalah:
- Nilai harapan e sama dengan 0 (nol).
E(e) = 0, masing-masing random error mempunyai distribusi probabilitas = 0. Meskipun e bisa bernilai positif atau negatif, tetapi rata-rata e harus = 0.
- Variance residual sama dengan standar deviasi
Var (e) = , artinya: masing-masing random error mempunyai distribusi probabilitas variance yang sama dengan standar deviasi (). Asumsi ini menjelaskan bahwa residual bersifat homoskedastik.
- Kovarian ei dan ej mempunyai nilai nol.
Cov (ei, ej) = 0. Nilai nol dalam asumsi ini menjelaskan bahwa antara ei dan ej tidak ada korelasi serial atau tida berkorelasi (autocorrelation).
- Nilai random error mempunyai distribusi probabilitas yang normal.
Karena masing, masing observasi Y tergantung pada e, maka masing-masing Y juga memiliki varian yang random. Dengan demikian, statistik Y menjadi sebagai beriku:
- Nilai harapan Y tergantung pada nilai masing-masing variabel penjelas dan parameter-parameternya. Dengan menggunakan asumsi E(e) = 0, maka rata-rata perubahan nilai Y untuk setiap observasi ditentukan oleh fungsi regresi.
E (Y) = b0 + b1X1 + b2 X2
- Variance distribusi probabilitas Y tidak dapat berubah setiap observasi.
Var (Y) = Var (e) =
- Tidak ada kaitan langsung antara observasi satu dengan observasi lainnya.
Cov (Yi, Yj) = Cov (ei, ej) = 0
- Nilai Y secara normal terdistribusi di sekitar rata-rata.
Asumsi-asumsi di atas difokuskan pada pembahasan variabel terikat. Perlu adanya asumsi tambahan terhadap variabel penjelas, yaitu:
- Variabel independen tidak bersifat random, karena dengan jelas dapat diketahui dari data.
- Variabel independen tidak merupakan fungsi linear dari yang lain. Asumsi ini penting agar tidak terjadi redundancy, yang menyebabkan multikolinearitas.