3 Oct 2020

Penggolongan Statistika

 Statistika adalah Suatu ilmu pengetahuan yang berhubungan dengan data statistik dan fakta yang benar serta mencakup teknik-teknik pengumpulan data, pengolahan data, analisis data, menarik kesimpulan dan selanjutnya dapat digunakan untuk membuat kebijakan/keputusan. (Riduwan,2010). Analisis statistik adalah kegiatan yang dilakukan untuk mengolah data penelitian dengan mengunakan metode statistik untuk menghasilkan suatu informasi yang bermanfaat. Menurut Dergibson dan Sugiarto (2002) Statistika diklasifikasikan menjadi dua yaitu Satistika Deskriptif dan Statistika Inferensial...Baca lebih 

Klasifikasi Data

 Data dalam statistika dapat diklasifikasi berdasarkan cara memperolehnya, jenisnya, sumber, sifat, dan waktu Pengumpulan. Selengkapnya dapat dijelaskan sebagai berikut:

1. Berdasarkan Sumbernya

Berdasarkan sumbernya, data dibedakan menjadi dua yaitu data Internal  dan data Eksternal

a.  Data Internal adalah data yang menggambarkan keadaan, situasi dan kondisi dalam suatu Organisasi atau perusahaan. (Contoh : data keuangan,  pegawai, Produksi, Pemasaran, dll) 

b.      Data Eksternal adalah data yang menggambarkan suatu keadaan  situasi dan kondisi yang ada di luar suatu organisasi ( contoh : daya beli masyarakat, Perkembangan harga, konsumsi, inflasi, nilai kurs, pertumbuhan ekonomi, dll ). 

1.   2. Berdasarkan cara memperolehnya

Berdasarkan sumbernya data dibedakan menjadi dua yaitu data primer dan data sekunder.

a.  Data primer adalah data yg diperoleh atau dikumpulkan sendiri secara langsung dari obyek penelitian, misalnya dengan melakukan wawancara, menyebar kuesioner, observasi atau penelitian lapangan/laboratorium.

b. Data sekunder adalah data yang diperoleh secara tidak langsung  dari objek penelitian atau diperoleh dari pihak lain, misalnya data jumlah penduduk dari BPS, data harga saham dari BEI, data nilai Kurs dari Bank Indonesia,  data laporan keuangan dari Indonesia Capital Market Directory (ICMD) dan lain sebagainya


1.    3. Berdasarkan Jenisnya

Berdasarkan jenisnya, data dibedakan menjadi dua yaitu data Kuantitatif  dan data Kualitatif

a.  Data kuantitatif adalah data yang dinyatakan dalam besaran angka-angka. Misalnya: Data pendapatan per kapita, pengeluaran, harga, berat, jarak, penjualan, produksi, tinggi badan, dan lain sebagainya.

b. Data Kualitatif adalah data yang dinyatakan dalam kategori/kelas tertentuMisalnyajenis kelamin (pria-wanita)Agama (islam, hindu, budha, kristen, katolik), suku (dayak, jawa, madura), warna (merah, kuning, biru), perusahan besar-kecil dan lain sebagainya


1.    4. Menurut Sumber

Berdasarkan sumbernya, data dibedakan menjadi dua yaitu data Internal  dan data Eksternal

a.  Data Internal adalah data yang menggambarkan keadaan, situasi dan kondisi dalam suatu Organisasi atau perusahaan. (Contoh : data keuangan,  pegawai, Produksi, Pemasaran, dll)

b.      Data Eksternal adalah data yang menggambarkan suatu keadaan  situasi dan kondisi yang ada di luar suatu organisasi ( contoh : daya beli masyarakat, Perkembangan harga, konsumsi, inflasi, nilai kurs, pertumbuhan ekonomi, dll ).

2.    5.Menurut Sifatnya

Berdasarkan sifatnya, data dibedakan menjadi dua yaitu data diskrit dan data Kontinyu.

a.   Data Diskrit adalah data yang nilainya berupa bilangan asli. Contohnya: Berat Badan Mahasiswa, Nilai rupiah dari waktu ke waktu,

b.   Data kontinyu adalah data yang nilainya berada pada interval tertentu atau berada pada nilai satu dengan nilai lainnya, seperti menggunakan kata sekitar, kurang lebih, kira-kira, dan lain sebagainya. Contoh: Negara Indonesia mengimpor beras sekitar 400 ribu ton pada tahun 2019

6. Menurut waktu Pengumpulan

Berdasarkan waktu pengumpulannya, data dapat dibedakan menjadi tiga yaitu data crossection, timeseries dan Pool.

a. Cross Section adalah data yang dikumpulkan pada suatu waktu tertentu. Contohnya data penjualan mobil di lima kota pada tahun 2019

b. Time Series (data berkala) adalah data yang dikumpulkan secara berkala atau runtut waktu (tahunan, bulanan, mingguan, harian, jam, menit, semeseter, tri wulan). Contohnya: data penjualan PT. X selama 12 bulan, data nilai kurs, harga saham,

c. Data Pool adalah data yang dikumpulkan berdasarkan gabungan crossection  dan timeseries.  Contohnya: data penjualan beberapa merek mobil selama tahun 2017-2019

Skala Pengukuran Data

  Skala pengukuran data dikelompokkan menjadi empat yaitu Skala Nominal, Ordinal, Interval, dan Rasio atau disingkat NOIR. Penjelasannya sebagai berikut:

1.     Skala Data Nominal

Skala data Nominal merupakan skala data yang paling rendah dengan mendasarkan pada kategorisasi. Apabila diberikan angka, hanya sebagai label saja dan memiliki kedudukan yang setara. Sifat-sifat skala nominal: Skala data paling sederhana, berupa kategori, tidak dapat diurutkan, tidak dapat dilakukan operasi matematika. Contohnya:

-        Jenis Kelamin (1. Pria, 2. Wanita)

-        Warna (1.merah, 2.kuning, 3.biru)

-        Agama (1.islam, 2. Kristen, 3.Katolik, 4.Hindu, 5 Budha)

2.     Skala Data Ordinal

Skala data ordinal adalah Skala yang disusun secara runtut dari tertinggi ke terendah atau sebaliknya. Ciri skala Ordinal: Jarak atau rentang tidak harus sama, angka mengandung pengertian tingkatan, nilai angka tidak setara, tidak dapat operasi matematika. Contohnya:

-   Rangking 1,2 dan 3 (rangking 1 menunjukkan lebih tinggi dari rangking 2, dan 3)

-   Tingkat pendidikan  (1.SD, 2 SMP, 3 SMA, 4 Sarjana)

 

3.     Skala Data Interval

Skala interval merupakan skala pengukuran dimana jarak satu tingkat dengan yang lain sama. Cirinya: memiliki semua ciri skala ordinal, memiliki nilai jarak yang sama, data dapat diurutkan, jarak antar data diketahui ukurannya, nilai angka 0 (nol) tidak mutlak dan dapat dilakukan operasi matematika. Contohnya:

a)   Temperatur ruangan. Bisa diukur dalam Derajat Celsius (0C), atau Derajat Fahrenheit (0F), dengan masing-masing punya skala sendiri. Untuk air membeku dan mendidih:

·  Celcius pada 0° C sampai 100° C. Skala ini jelas jaraknya adalah 100-0=100 

·   Fahreinheit pada 32° F sampai 212°F. Skala ini jelas jaraknya adalah 212-32=180

b)  Dalam Indeks Prestasi Kumulatif (IPK) mahasiswa dikenal standar-standar penilaian sebagai berikut:

A = 4, B = 3, C = 2, dan D = 1.

Interval antara A dengan B = 4 - 3 = 1

Interval antara B dengan C = 3 - 2 = 1

Interval antara C dengan D = 2 - 1 = 1

Interval antara B dengan D = 3 - 1 = 2

Interval A sampai C adalah 4 - 2 =2, kedua interval dapat dijumlahkan. Pada data ini yang dijumlahkan bukan kuantitas atau besaran, melainkan intervalnya, pada data ini tidak terdapat titik nol absolut.

 

4.     Skala Data Rasio

Skala ratio merupakan skala yang paling tinggi dan memiliki semua sifat skala interval, memiliki nilai nol absolut (mutlak), dapat operasi matematika, Contohnya:

-   saldo yang dimiliki Amir  di bank BRI bernilai Rp 1.000.000,00. Angka 1.000.000 benar-benar real bahwa Amir mempunyai uang sebesar Rp 1.000.000,00.

-   Data penjualan Perusahaan X

- Berat Badan Amir

Pengertian Regresi


Istilah ‘regresi’ pertama kali diperkenalkan oleh sir Francis Galton pada tahun 1886. Galton menemukan adanya tendensi bahwa orang tua yang memiliki tubuh tinggi memiliki anak-anak yang tinggi, orang tua yang pendek memiliki anak-anak yang pendek pula. Kendati demikian, ia mengamati bahwa ada kecenderungan tinggi anak cenderung bergerak menuju rata-rata tinggi populasi secara keseluruhan. Dengan kata lain, ketinggian anak yang amat tinggi atau orang tua yang amat pendek cenderung bergerak ke arah rata-rata tinggi populasi. Inilah yang disebut hukum Galton mengenai regresi universal. Dalam bahasa Galton ia menyebutnya sebagai regresi menuju Medikritas (Maddala, 1992:60)
Interpretrasi modern mengenai regresi agak berlainan dengan regresi versi Galton. Secara umum, analisis regresi pada dasarnya adalah studi mengenai ketergantungan variabel dependen (terikat) dengan satu atau lebih variabel independen (variabel penjelas/bebas), dengan tujuan untuk mengestimasi dan/atau memprediksi rata-rata populasi atau nilai rata-rata variabel dependen berdasarkan nilai variabel nilai variabel independen yang diketahui (Gujarati, 2015). Pusat perhatian adalah pada upaya menjelaskan dan mengevaluasi hubungan antara suatu variabel dengan satu atau lebih variabel independen.
Hasil analisis regresi adalah berupa koefisisen untuk masing-masing variabel independen. Koefisien ini diperoleh dengan cara memprediksi nilai variabel dependen dengan suatu persamaan. Koefisien regresi dihitung dengan tujuan yaitu meminimumkan penyimpangan antara nilai aktual dan nilai estimasi variabel dependen berdasarkan data yang ada (Tabachnick, 1996: 128). Dalam analisis regresi, selain mengukur kekuatan hubungan antara dua hubungan atau lebih, juga menunjukan arah hubungan antara variabel dependen dengan variabel independen. Variabel dependen diasumsikan random/stokastik, yang berarti mempunyai distribusi probabilistik. Variabel independen/bebas diasumsikan memiliki nilai tetap (dalam pengambilan sampel yang berulang).


Istilah dan Notasi dalam Regresi

Notasi Y
  • Varaibel tergantung (Dependent Variable)
  • Variabel yang dijelaskan (Explained Variable)
  • Variabel yang diramalkan (Predictand)
  • Variabel yang diregresi (Regressand)
  • Variabel Tanggapan (Response)
Notasi X
  • Varaibel bebas (Independent Variable)
  • Variabel yang menjelaskan (Explanatory Variable)
  • Variabel peramal (Predictor)
  • Variabel yang meregresi (Regressor)
  • Variabel perangsang atau kendali (Stimulus or control variable)

Model Regresi

Analisis Regresi Linier
    Analisis Regresi Linier digunakan untuk menganalisis atau mengauji pengaruh variabel bebas terhadap variabel terikat. Analisis regresi linier hanya dapat dilakukan untuk skala data interval dan rasio. Secara garis besar regresi linier dibedan menjadi regresi linier sederhana dan regresi linier berganda, yang dijelaskan sebagai berikut:

Regresi Linier Sederhana (Simple Linier Regresssion)
    Analisis Regresi linier sederhana  atau Simple Linier Regression  adalah analisis regresi yang menguji pengaruh variabel bebas dengan hanya menggunakan satu variabel bebas (X) terhadap satu variabel terikat (Y). Hubungan tersebut secara matematis dapat dituliskan sebagai berikut:

                Y = a + b X + e

dimana Y adalah variabel terikat dan X variabel bebas. Koefisien  a  adalah konstanta (merupakan nilai rata-rata dari Y pada saat nilai X nya nol atau konstan). b adalah koefisien regresi yang akan diestimasi (dicari nilainya). sedangkan e merupakan nilai residual atau selisih antaran nilai prediksi dengan nilai yang sesungguhnya.

Contoh:
  •  Menganalisis pengaruh motivasi kerja terhadap kinerja karyawan. Berarti sebagai variabel bebas (X) adalah motivasi kerja dan variabel terikatnya (Y) adalah motivasi kerja
  • Menganalisis pengaruh promosi terhadap penjualatan prduk. 
  • Menganalisis pengaruh tingkat pengangguran terhadap pertumbuhan Ekonomi


Regresi Linier Berganda (Multiple Linier Regression) 
    Analisis regresi linier berganda atau Multiple Linier Regression adalah analisis regresi yang digunakan untuk menguji pengaruh lebih dari satu variabel bebas (X) terhadap variabel terikat (Y). Hubungan tersebut dapat dituliskan sebagai berikut:

            Y = b0 + b1X1 + b2X2 + …… bnXk + e

dimana Y adalah variabel terikat dan X variabel bebas. Koefisien  b0   adalah konstanta (merupakan nilai rata-rata dari Y pada saat nilai X nya nol atau konstan). b1,2..n  adalah koefisien regresi yang akan diestimasi (dicari nilainya), sedangkan e merupakan nilai residual atau selisih antaran nilai prediksi dengan nilai yang sesungguhnya.

Contoh
  • Menganalisis pengaruh lingkungan kerja, budaya organisasi dan motivasi kerja terhadap kinerja karyawan
  • Menganalisis pengaruh biaya promosi dan jumlah cabang terhadap penjualan
  • Menganalisis pengaruh harga PER dan ROI terhadap harga saham
  • Menganalisis pengaruh ROA, NPM dan Size terhadap Return Saham di Bursa Efek Indonesia
  • pengaruh ROA, NPM dan Size Terhadap Return Saham
  • Menganalisis Pengaruh  kemudahan, kepercayaan, keamanan, dan biaya terhadap minat menggunakan mobile banking

Teknik Estimasi
Salah satu teknik estimasi regresi adalah dengan Ordinariy Least Squares (pangkat kuadrat terkecil). Metode pangkat kuadrat terkecil (OLS) diperkenalkan pertama kali oleh Carl Friederich Gauss, seorang ahli matematika dari Jerman. Inti dari metode OLS adalah mengestimasi suatu garis regresi dengan jalan meminimalkan jumlah dari kuadrat kesalaan setiap observasi terhadap garis tersebut. Missal persamaan reg populasi


E (Y | Xi ) = b0 + b1X1  + e

Karena populasi sering tidak dapat diperoleh secara langsung maka digunakan fungsi regresi sample (FRS)

         Yi = b0 + b1X1 + b2X2 + ……… bnXk+ e

Dimana yi dibaca “y topi atau y estimate, karena yi = penduga E (Y|xi). Metode OLS bertujuan untuk meminimalkah jumlah kesalahan (SSE = sum of square Error)

SEE = S (Yi – Yi)2

Dengan demikian,

Yi = Yi + ui atau ui = Y1 – Yi

 
 



Dimana diasumsikan kesalahan random(ui) memiliki probabilitas yang normal dengan rata-rata = 0 dan varians sama dengan s2



7 Apr 2020

Cara Mengolah Data

Mengolah data merupakan salah satu dari kegiatan penelitian untuk menghasilkan informasi terkait dengan penelitian yang dilakukan. Sebelum melakukan pengolahan data maka perlu disiapkan dahulu data/informasi yang akan diolah. 

Ada beberapa hal yang perlu di perhatikan dalam mengolah data kuantitatif diantaranya adalah sebagai berikut:
1. Instrumen Penelitian (misalnya: menggunakan kuesioner
2. Skala pengukuran data (Ratio, interval, ordinal, nominal)
3. Tipe data (skala likert, skala Gutman, dll)  
3. Variabel 
4. Validitas dan Reliabilitas Instrumen (data persepsi)

Dalam proses mengolah atau menganalisis data, ada beberapa langkah ilmiah yang perlu dilakukan untuk mempermudah dalam proses mengolah data yaitu:

Editing, pada tahapan ini dilakukan pengecekan terhadap kelengkapan data untuk memastikan tidak ada yang kosong. Memastikan data yang akan diolah sesuai dengan model penelitian yang digunakan. Beberapa hal yang perlu diperhatikan dalam pengeditan data antara lain sebagai berikut:
  1. Kelengkapan Data. Pastikan semua data lengkap sesuai dengan model penelitian yang akan digunakan dan jika menggunakan kuesioner maka pastikan semua pertanyaan dijawab dengan lengkap dan baik sesuai dengan pertanyaan.
  2. Kejelasan tulisan. Pastikan data dapat terbaca dengan baik dan jelas serta tulisan dalam kuesioner juga terbaca dengan jelas
  3. Kejelasan makna jawaban. Jika menggunakan kuesioner maka enumerator harus menuliskan jawaban responden sesuai dengan pertanyaan yang diajukan.
  4. Kesesuaian satuan yang digunakan dalam data. hal ini dilakukan untuk menghindari kesalahan dalam proses pengolahan data. Misalnya menggunakan satuan kilogram dalam pengukuran berat. jika ada pengkuran lain untuk berat, maka harus diseragamkan terlebih dahulu menjadi Kg sebelum masuk dalam proses analisis.
  5. Kesesuaian jawaban. Pasatikan jawaban yang diberikan sesuai dengan pertanyaan dan persoalan yang diteliti.
Kodifikasi DataSetelah tahap editing dilakukan, maka data yang telah dikumpulkan perlu diberi kode untuk memudahkan dalam menganalisis data. Data yang dikumpulkan dapat berupa angka, kalimat pendek atau panjang, atau berupa“ya” atau “tidak” sehingga perlu diberikan kode tertentu. Pemberian kode kepada jawaban sangat penting artinya, jika pengolahan data dilakukan dengan komputer. Mengkode jawaban adalah menaruh angka pada tiap jawaban.
  1. Kode dan Jenis Pertanyaan. Pemberian kode dapat dilakukan dengan melihat jenis pertanyaan atau jawaban. Dalam hal ini dapat dibedakan atas Jawaban yang berupa angka, Jawaban dari pertanyaan tertutup, Jawaban dari pertanyaan semi terbuka, Jawaban pertanyaan terbuka, dan Jawaban pertanyaan kombinasi.
  2. Tempat Kode. Kode dapat dibuat pada tabulasi ataupun pada daftar pertanyaan itu sendiri. Jika data ingin diolah dengan komputer, maka kode harus dibuat pada coding sheet.
Tabulasi Data. Tabulasi data merupakan proses memasukkan data ke dalam komputer menggunakan aplikasi seperti excel, spss, dan lain sebagainya. Atau dapat dikatakan bahwa tabulasi data adalah penyajian data dalam bentuk tabel atau daftar untuk memudahkan dalam pengamatan dan evaluasi. Hasil tabulasi data ini dapat langsung memberikan informasi karena sudah tersusun dan terangkum dalam tabel-tabel yang mudah dipahami maknanya. 

Analisis Data. Setelah data ditabulasi peneliti dapat melakukan analisis data atau mengolah data sesuai dengan model penelitian untuk mendapatkan hasil yang lebih komprehensif dan pengambilan keputusan statistik.