Minggu, 30 Oktober 2011

Data Ware House



Dublin Core
Dublin Core  merupakan salah satu skema metadata yang digunakan untuk web resource description and discovery. Gagasan membuat standar baru agaknya dipengaruhi oleh rasa kurang puas dengan standar MARC yang dianggap terlalu banyak unsurnya dan beberapa istilah yang hanya dimengerti oleh pustakawan serta kurang bisa digunakan untuk sumber informasi dalam web. Elemen Dublin Core dan MARC intinya bisa saling dikonversi.
Metadata Dublin Core memiliki beberapa kekhususan  sebagai berikut:
a. Memiliki deskripsi yang sangat sederhana
b. Semantik atau arti kata yang mudah dikenali secara umum.
c.  Expandable memiliki potensi untuk dikembangkan lebih lanjut.


Dublin Core terdiri dari 15 unsur yaitu :
1.    Title : judul dari sumber informasi
2.    Creator : pencipta sumber informasi
3.    Subject : pokok bahasan sumber informasi, biasanya dinyatakan dalam bentuk kata kunci atau nomor klasifikasi
4.    Description : keterangan suatu isi dari sumber informasi, misalnya berupa abstrak, daftar isi atau uraian
5.    Publisher : orang atau badan  yang mempublikasikan sumber informasi
6.    Contributor : orang atau badan yang ikut menciptakan sumber informasi
7.    Date : tanggal penciptaan sumber informasi
8.    Type : jenis sumber informasi, nover, laporan, peta dan sebagainya
9.    Format : bentuk fisik sumber informasi, format, ukuran, durasi, sumber informasi
10.  Identifier : nomor atau serangkaian angka dan huruf yang mengidentifikasian sumber informasi. Contoh URL, alamat situs
11. Source : rujukan ke sumber asal suatu sumber informasi
12.  Language : bahasa yang intelektual yang digunakan sumber informasi
13.  Relation : hubungan antara satu sumber informasi dengan sumber informasi lainnya.
14.  Coverage : cakupan isi ditinjau dari segi geografis atau periode waktu
15.  Rights : pemilik hak cipta sumber informasi



Meta Data

Meta data adalah Informasi tentang logical  struktur data, file dan alamatnya dan index. Contoh software meta data meliputi SmartMart (IBM), Visual Warehouse (IBM), dan PowerMart (Informatica).
-          Tipe-tipe meta data
1.      Operasi meta data : Terdiri dari semua informasi tentang data sumber
2.      Ekstraksi dan transformasi meta data : Terdiri dari data dari data extraksi data dari sistem sumber, yaitu : Extraction frequencies, Extraction method, dan Business rules untuk data extraction.
3.      End – User meta data : Adalah Peta Navigasi pada data warehouse.
-          Fungsi meta data
  1. Menggabungkan semua bagian pada data warehouse.
  2. Menyediakan informasi tentang isi dan struktur pada pengembang.
  3. Membuka pintu bagi end - user dan membuat isi yang dapat dikenal oleh mereka.


Model Fisik Data (Physical Data Model), yaitu konsep bagaimana data disimpan pada media penyimpanan (storage) dalam suatu susunan secara fisik.
Data Non- Volatile adalah data yang disimpan kedalam memory dan jika sistemnya dimatikan, data tersebut tetap ada dan bisa dipanggil kembali.


Karakteristik Data Warehouse

1.   Subject oriented - Data warehouse diorganisasikan  dalam lingkup subjek (Penjualan,dll), Berfokus ke dalam pemodelan dan analisis data untuk pihak- pihak pembuat keputusan.
2.   Integrated - Data warehouse dikonstruksikan  dengan cara mengintegrasikan sejumlah sumber data yang berbeda. Data preprocessing diaplikasikan untuk meyakinkan kekonsistensian data.
3.   Time variant - Menghasilkan informasi dari sudut pandang historical  (misal: 5-10 tahun yang lalu).  Setiap struktur kunci mengandung elemen waktu.
4.   Non-volatile - Sekali data direkam maka data tidak bisa diupdate. Data warehouse membutuhkan dua operasi pengaksesan data, yaitu: Initial loading of data dan akses data.


Ø  Jenis Data Warehouse
1.       Functional Data Warehouse (Data Warehouse Fungsional)
Kata operasional disini merupakan database yang diperoleh dari kegiatan sehari-hari. Data warehouse dibuat lebih dari satu     dan dikelompokkan berdasar fungsi-fungsi yang ada di dalam perusahaan seperti fungsi keuangan(financial),marketing,personalia dan lain-lain. Keuntungan dari bentuk data warehouse seperti ini adalah, sistem mudah dibangun dengan biaya relatif murah sedangkan kerugiannya adalah resiko kehilangan konsistensi data dan terbatasnya kemampuan dalam pengumpulan data bagi pengguna.
2.       Centralized Datawarehouse (Data Warehouse Terpusat)
Bentuk ini terlihat seperti bentuk data warehouse fungsional, namun terlebih dahulu sumber data dikumpulkan dalam satu tempat terpusat, kemudian data disebar ke dalam fungsinya masing-masing, sesuai kebutuhan persuhaan. Data warehouse terpusat ini, biasa digunakan oleh perusahaan yang belum memiliki jaringan eksternal.
Keuntungan dari bentuk ini adalah data benar-benar terpadu karena konsistensinya yang tinggi sedang kerugiannya adalah biaya yang mahal serta memerlukan waktu yang cukup lama untuk membangunnya.
3.       Distributed Data Warehouse (Data Warehouse terdistribusi)
Pada data warehouse terdistribusi ini, digunakan gateway yang berfungsi sebagai jembatan penghubung antara data warehouse dengan workstation yang menggunakan sistem beraneka ragam. Dengan sistem terdistribusi seperti ini memungkinkan perusahaan dapat mengakses sumber data yang berada diluar lokasi perusahaan(eksternal).
Keuntungannya adalah data tetap konsisten karena sebelum data digunakan data terlebih dahulu di sesuaikan atau mengalami proses sinkronisasi. Sedangkan kerugiannya adalah lebih kompleks untuk diterapkan karena sistem operasi dikelola secara terpisah juga biaya nya yang paling mahal dibandingkan dengan dua bentuk data warehouse lainnya


Functional
Centralized
Distributed
sistem mudah dibangun dengan biaya relatif murah
biaya yang mahal serta memerlukan waktu yang cukup lama untuk membangunnya
biaya nya yang paling mahal dibandingkan dengan Functional dan Centralized

resiko kehilangan konsistensi data dan terbatasnya kemampuan dalam pengumpulan data bagi pengguna
data benar-benar terpadu karena konsistensinya yang tinggi
data tetap konsisten karena sebelum data digunakan data terlebih dahulu di sesuaikan atau mengalami proses sinkronisasi

biasa digunakan oleh perusahaan yang belum memiliki jaringan eksternal.
biasa digunakan oleh perusahaan memiliki jaringan eksternal.


Ø  Arsitektur DW dengan staging area dan data mart
Staging area menyederhanakan proses pembuatan summary dan management warehouse secara umum.
Dalam menggunakan data warehouse anda dapat mengkustomisasi arsitekturnya yang disesuaikan dengan kebutuhan organisasi. Hal ini dimungkinkan dengan menambahkan data mart. Data mart merupakan subset dari data resource, biasanya berorientasi untuk suatu tujuan yang spesifik atau subjek data yang didistribusikan untuk mendukung kebutuhan bisnis. Sebagai contoh data purchasing, sales, dan inventory dapat di pisahkan dalam masing-masing cube. Dalam contoh ini seorang analis keuangan dapat menganalisa histori data untuk purchases dan sales.


0 komentar:

Posting Komentar