Dalam pengelolaan database organisasi baik organisasi bisnis maupun organisasi non profit terdapat istilah bahwa “organisasi kaya akan data, tetapi miskin akan informasi” atau “businesses have been rich in data and poor in information”. Dengan perancangan dan mengembangan suatu Sistem Manajemen Informasi berdasarkan pada suatu data warehouse. Suatu data warehouse bukan hanya suatu arsip atau fasilitas penyimpanan data. Data warehouse harus dengan cerdas dirancang untuk berisi informasi dan data yang penting untuk mendukung memecahkan masalah secara aktif.
Sejarah data warehouse menjadi suatu jenis berbeda dari database komputer sepanjang akhir 1980 dan awal 1990. Telah dikembangkan untuk mempertemukan suatu pertumbuhan permintaan bagi Manajemen Informasi dan Analisa yang tidak bisa dijumpai oleh sistem operasional (program aplikasi). Sistem operasional (program aplikasi) tidak mampu untuk mempertemukan kebutuhan ini untuk beberapa pertimbangan:
- Pengolahan pelaporan data yang banyak/besar dapat mengurangi waktu tanggap sistem operasional (program aplikasi).
- Perancangan database sistem operasional (program aplikasi) tidaklah dioptimalkan untuk Analisa Informasi dan Pelaporan.
- Kebanyakan organisasi mempunyai lebih dari satu sistem operasional (program aplikasi), maka pelaporan secara keseluruhan organisasi tidak bisa didukung dari sistem tunggal.
- Pengembangan laporan sistem operasional (program aplikasi) sering memerlukan program komputer spesifik yang mahal dan lambat.
Menurut Adi Nugroho, ST., MMSI (2004):
Data warehouse adalah data-data yang beorientasi subjek, terintegrasi, memiliki dimensi waktu, serta merupakan koleksi tetap (non-volatile), yang digunakan dalam mendukung proses pengambilan keputusan oleh para manajer di setiap jenjang (namun terutama pada jenjang majanerial yang memiliki peringkat tinggi).
Arti setiap kata kunci yang telah disebutkan adalah sebagai berikut:
- Berorientasi subjek. Data warehouse terorganisasi di seputar subjek kunci (atau entitas-entitas peringkat tinggi) dalam perusahaan. Subjek utama mungkin adalah pelanggan, pasien, mahasiswa, serta produk.
- Terintegrasi. Data yang tersimpan dalam data warehouse didefinisikan menggunakan konversi penamaan yang konsisten, format-format, struktur terkodekan, serta karakteristik-karakteristik yang berhubungan.
- Memiliki dimensi waktu. Data yang tersimpan dalam warehouse mengandung dimensi waktu yang mungkin digunakan sebagai rekaman bisnis untuk tiap waktu tertentu (bersejarah).
- Non-volatile. Data yang tersimpan dalam data warehouse diambil dari sistem operasional yang sedang berjalan, tetapi tidak dapat diperbaharui (di-update) oleh pengguna (bersifat “hanya baca”).
Data warehouse sebagai berikut 1). Subject-oriented, maksudnya adalah bahwa data di dalam database diorganisir sedemikian sehingga semua elemen data yang berkenaan dengan obyek atau peristiwa dunia nyata yang sama dihubungkan bersama-sama; 2).Time-variant, maksudnya adalah bahwa perubahan pada data di dalam database adalah direkam dan track sedemikian sehingga laporan dapat dihasilkan menurut perubahan waktu; 3).Non-volatile, maksudnya adalah data di dalam database tidak pernah over-written atau dihapus, hanya sekali commit, data adalah statis, read-only, tetapi diperlukan untuk laporan dimasa mendatang; 4).Integrated, maksudnya adalah database berisi data dari semua data aplikasi operasional organisasi, dan bahwa data dibuat konsisten.
Menurut Ralph Kimball's (terjemahan dari http://www.dwinfocenter.org : 2007):
Data warehouse adalah "suatu salinan data transaksi yang khusus disusun untuk query dan analisa".
Menurut terjemahan dari http://www.dwinfocenter.org (2007):
Dua penolakan terhadap definisi Ralph's adalah: 1.)Kadang-Kadang data bukan transaksi disimpan pada suatu data warehouse meskipun demikian mungkin 95-99% data pada umumnya adalah data transaksi. 2.)"query dan report" bukannya "query and analysis" sebab keluaran yang utama dari sistem data warehouse adalah berupa daftar bentuk tabel (query) dengan pengaturan minimal atau laporan “formal” sangat formatted. Query dan report diturunkan dari data menyimpan dalam suatu data warehouse mungkin atau tidak mungkin digunakan untuk analisa.
Menurut Bambang Hariyanto (2004):
Data Warehouse adalah repository (arsip) informasi yang dikumpulkan dari banyak sumber disimpan pada skema yang disatukan di satu situs tunggal. Begitu dikumpulkan, data disimpan selama waktu yang lama. Data warehouse menyediakan satu antarmuka terkonsolidasi tunggal, mempermudah pembuatan query yang mendukung pembuatan keputusan.
Karakteristik data warehouse adalah:
- Data dikumpulkan dari sumber-sumber lain seperti sistem lama ataupun sistem OLTP.
- Data dibuat konsisten dengan penyimpanan di data warehouse.
- Data diringkas. Data warehouse umumnya tidak menyimpan serinci sistem berorientasi transaksi.
- Data berumur lebih lama. Sistem transaksi dapat mempertahankan data hanya sampai selesainya transaksi, sedangkan data warehouse dapat mem-pertahankan data sampai bertahun-tahun.
- Data disimpan dalam suatu format yang nyaman untuk melakukan query dan analisis.
- Data biasanya read-only.
Data Warehouse merupakan database yang ditujukan untuk keperluan pengambilan data dan penganalisaan data.
Karakterisrtik data warehouse adalah:
- Data konsisten dan terkonsolidasi, yang berarti data yang berasal dari berbagai sumber sudah disusun dengan konversi bersama sehingga satu nama dalam data warehouse memiliki arti dan format yang sama pada semua database sumber.
- Data berorientasi pada subjek yang khusus, yang berarti data yang dimasukkan dalam data warehouse adalah data yang benar-benar diperlukan dalam proses pengambilan dan penganalisaan data dalam suatu subjek.
- Data historis, yang berarti data warehouse berisi data masa lampau yang mungkin berasal dari periode yang sudah lama sekali.
- Data hanya boleh dibaca, yang berarti tidak akan ada proses pengubahan apalagi penghapusan terhadap data yang sudah masuk ke dalam data warehouse.