Mungkin kita sering mendengar kata-kata data warehouse. Namun, kita tidak tahu apa yang dimaksud dengan data warehouse, fungsinya dari data warehouse, dan bagaimana arsitekturnya. Yuk kita simak artikel di bawah ini untuk mengenal data warehouse. Jika kita artikan ke dalam bahasa Indonesia memiliki arti gudang data. Jika kita telaah lebih dalam lagi, sesuai dengan arti tersebut data warehouse pada dasarnya adalah database dan merupakan kumpulan data yang dibentuk dari hasil penggabungan dan pengolahan data. Kumpulan data tersebut berasal dari berbagai sumber yang disimpan dalam suatu repository (tempat penyimpanan) dalam kapasitas besar. Penyimpanan ini layaknya gudang dan digunakan untuk proses pengambilan keputusan seperti analisis data dan pelaporan. Adapun data yang disimpan adalah data historis dari sebuah perusahaan atau organisasi, yang mana data tersebut tersimpan secara terperinci. Sehingga, membuat data dapat bertahan lebih lama dibandingkan dengan database OLTP (Online Transactional Processing). OLTP hanya dapat menyimpan data selama beberapa minggu atau beberapa bulan.
Pengertian Data Warehouse
Menurut William Inmon (2005), data warehouse adalah kumpulan data yang berorientasi subjek, terintegrasi, bervariasi waktu, dan non-volatile, yang mendukung manajemen pengambilan keputusan. Sedangkan menurut Kimball dan Caserta (2004), data warehouse merupakan basis data relasional yang didesain lebih kepada analisa dan query daripada proses transaksi. Dan biasanya mengandung data historis dari proses transaksi dan dari sumber lainnya untuk tujuan pengambilan keputusan. Terdapat empat karakteristik dari data warehouse: subject oriented, integrated, time-variant, dan non-volatile. Setelah sama-sama kita ketahui apa yang dimaksud dengan data warehouse, selanjutnya dibawah ini terdapat sebuah gambar yang merupakan arsitektur dari data warehouse.



Pada gambar di atas, arsitektur terbagi menjadi empat bagian yaitu, data source, back-end tier, data warehouse tier dan front-end tier. Data source merupakan kumpulan sumber data yang akan diolah untuk pengambilan keputusan dan akan dimasukan ke dalam data warehouse, yang mana data source ini terdiri dari berbagai macam sumber data, baik itu dari database, file CSV, aplikasi, ataupun yang lainnya. Adapula bagian back-end tier, yang mana pada bagian ini terdapat suatu proses, yang mana prosesnya disebut dengan proses ETL (Extract, Transform, dan Loading). Pada proses ETL tersebut, data source yang sebelumnya sudah kita pilih diolah ke dalam suatu format yang sama atau konsisten. Dan data source yang sebelumnya dipilih harus saling terintegrasi satu sama lain. Yang mana setelah itu data tersebut dimasukkan ke dalam data warehouse.
Pada bagian data warehouse tier ini, data-data yang berasal dari berbagai sumber data tersebut sudah menjadi data yang memiliki format yang sama. Data tersebut pun konsisten dan saling terintegrasi satu dengan yang lainnya. Data yang terdapat pada bagian data warehouse tier ini lah yang dikatakan dengan data warehouse. Pada bagian terakhir atau front-end tier, data yang terdapat pada data warehouse ditampilkan dalam bentuk reporting. Selain itu, dapat ditampilkan dalam bentuk dashboard atau pun analytics. Reporting tersebut ditampilkan dengan bantuan beberapa tools sesuai dengan keinginan dari masing-masing perusahaan atau organisasi tersebut.
Demikian artikel singkat mengenal data warehouse, semoga bermanfaat.