BASIS DATA TERDISTRIBUSI


Untuk membahas mengenai DBMS terdistribusi , terlebih dahulu mengetahui apa yang di maksud dengan basis data terdistribusi  dan DBMS terdistribusi.

Basis data terdistribusi ;       Secara logik keterhubungan dari kumpulan-kumpulan  data yang digunakan bersama-sama, dan didistribusikan melalui suatu jaringan komputer.

DBMS Terdistribusi          ;  Sebuah sistem perangkat lunak yang mengatur basis
                                                data terdistribusi dan membuat pendistribusian data
                                                secara transparan.
DDBMS memiliki satu logikal basis data yang dibagi ke dalam beberapa fragment. Dimana setiap fragment disimpan pada satu atau lebih komputer dibawah kontrol dari DBMS yang terpisah , dengan mengkoneksi komputer menggunakan jaringan komunikasi.
Masing- masing site memiliki kemampuan untuk mengakses permintaan pengguna pada data lokal dan juga mampu untuk memproses data yang disimpan pada komputer lain yang terhubung dengan jaringan.
Pengguna mengakses basis data terdistribusi dengan menggunakan dua aplikasi yaitu aplikasi lokal dan aplikasi global, sehingga DDBMS memiliki karakteristik yaitu :
·                     Kumpulan dari data logik yang digunakan bersama-sama
·                     Data di bagi menjadi beberapa fragment
·                     Fragment mungkin mempunyai copy ( replika )
·                     Fragment / replika nya di alokasikan pada yang digunakan
·                     Setiap site berhubungan dengan jaringan komunikasi
·                     Data pada masing-masing site dibawah pengawasan DBMS
·                     DBMS pada masing-masing site dapat mengatasi aplikasi lokal, secara otonomi
·                     Masing-masing DBMS berpastisipasi paling tidak satu global aplikasi.

DATA BASE TERDISTRIBUSI
 
 Dari definisi tersebut , sistem diharapkan membuat suatu distribusi yang transparan. Basis data terdistribusi terbagi menjadi beberapa fragment yang disimpan di beberapa komputer dan mungkin di replikasi, dan alokasi penyimpanan tidak diketahui pengguna .Adanya  Transparansi di dalam basis data terdistribusi agar terlihat sistem ini seperti basis data tersentralisasi. Hal Ini mengacu pada prinsip dasar dari DBMS (Date,1987b).  Transparansi memberikan fungsional yang baik untuk pengguna tetapi sayangnya mengakibatkan banyak permasalahan yang timbul dan harus diatasi oleh DDBMS.
   Pemrosesan Distribusi :Basis data tersentralisasi yang dapat diakses di semua jaringan computer.
Point utama dari definisi basis data terdistribusi adalah sistem terdiri dari data yang secara fisik di   distribusikan pada beberapa site yang terhubung dengan  jaringan.
Jika data nya tersentralisasi  walaupun ada pengguna lain yang mengakses data melewati jaringan , hal ini bukan disebut dengan DDBMS  melainkan pemrosesan secara distribusi.


data base terdistribusi
 
Paralel DBMS
DDBMS memiliki perbedaan dengan paralel DBMS.
Paralel DBMS:Sistem manajemen basis data  ini   menggunakan beberapa prosesor dan diskyang dirancang untuk dijalankan secara paralel , apabila di mungkinkan, selama hal tersebut digunakan untuk memperbaiki kinerja dari DBMS
Sistem DBMS berbasis pada sistem prosesor tunggal dimana sistem prosesor tunggal tidak memiliki kemampuan untuk berkembang, untuk menghitung skala efektifitas dan biaya, keandalan dan kinerja dari sistem.  Paralel DBMS di jalankan oleh  berbagai multi prosesor  . Paralel DBMS menghubungkan beberapa mesin yang berukuran kecil untuk menghasilkan 
keluaran sebuah mesin yang berukuran besar dengan skalabilitas yang lebih besar dan keandalan dari basis datanya.
Untuk menopang beberapa prosesor dengan akses yang sama pada satu basis data, DBMS paralel harus menyediakan manajemen sumber daya yang dapat diakses bersama. Sumber daya apa yang dapat digunakan bersama, dan bagaimana sumber daya tersebut di implementasikan, mempunyai efek langsung pada kinerja dan skalabilitas dari sistem , hal ini tergantung dari aplikasi atau lingkungan yang digunakan.
Ada tiga arsitektur yang digunakan pada paralel DBMS yaitu :
a.       Penggunaan memory bersama ( share memory )
b.      Penggunaan disk bersama ( share disk )
c.       Penggunaan secara sendiri-sendiri ( share nothing )
Arsitektur pada penggunaan secara sendiri – sendiri ( share nothing )  hampir sama dengan  DBMS terdistribusi,  namun pendistribusian data pada paralel DBMS hanya berbasis pada  kinerja nya saja. Node pada DDBMS adalah merupakan pendistribusian secara geographic, administrasi yang terpisah , dan jaringan komunikasi yang lambat, sedangkan  node pada paralel DBMS  adalah hubungan dengan komputer yang sama atau site yang sama
Penggunaan Memori Bersama ( Share Memory ) adalah sebuah arsitektur  yang menghubungkan beberapa prosesor di dalam sistem tunggal yang menggunakan memori secara bersama – sama ( gbr 1.3 ). Dikenal dengan SMP (Symmetric Multiprocessing ), metode ini sering digunakan dalam bentuk workstation personal yang mensupport beberapa mikroprosesor dalam paralel dbms,  RISC ( Reduced Instruction Set Computer ) yang besar berbasis mesin sampai bentuk mainframe yang besar. Arsitektur ini menghasilkan pengaksesan data yang sangat cepat  yang dibatasi oleh beberapa prosesor , tetapi tidak dapat digunakan untuk  64 prosesor dimana jaringan komunikasi menjadi masalah ( terjadinya bottleneck).
Penggunaan Disk Bersama ( Share Disk ) adalah sebuah arsitektur yang mengoptimalkan jalannya suatu aplikasi yang tersentrallisasi dan membutuhkan keberadaan data  dan kinerja yang tinggi ( Gbr 1.4 ).  Setiap prosesor dapat mengakses langsung semua disk , tetapi prosesor tersebut memiliki memorinya sendiri – sendiri. Seperti halnya penggunaan secara sendiri – sendiri  arsitektur ini menghapus masalah pada penggunaan memori bersama tanpa harus mengetahui sebuah basis data di partisi. Arsitektur ini di kenal dengan cluster
data base terdistribusi


 Penggunaan Secara sendiri – sendiri ( Share nothing ) ;  sering di kenal dengan Massively parallel processing ( MPP ) yaitu arsitektur dari beberapa prosesor di mana setiap prosesor adalah bagian dari sistem yang lengkap , yang memiliki memori dan disk ( Gbr 1.5 ).  Basis data ini di partisi untuk semua disk pada masing – masing sistem yang berhubungan dengan basis data  dan data  di berikan secara transparan untuk semua pengguna yang menggunakan sistem . Arsitektur ini lebih dapat di hitung skalabilitasnya dibandingkan dengan share memory dan dapat dengan mudah mensupport prosesor yang berukuran besar. Kinerja dapat optimal jika data di simpan di lokal dbms
teknologi ini biasanya digunakan untuk basis data yang berukuran sangat besar ( terabites ) atau sistem yang memproses ribuan transaksi perdetik. Paralel DBMS dapat menggunakan arsitektur yang diinginkan untuk memperbaiki kinerja yang kompleks untuk mengeksekusi kueri dengan menggunakan paralel scan, join dan teknik sort yang memperbolehkan node dari banyak prosesor  untuk menggunakan bersama pemrosesan kerja yang di gunakan.



        TIPE BASIS DATA TERDISTRIBUSI

HOMOGEN DAN HETEROGEN
Sebuah DDBMS dapat di klasifikasikan menjadi homogen dan heterogen. Dalam sistem yang homogen, semua site menggunakan product DBMS yang sama. Dalam sistem heterogen , product DBMS yang digunakan tidak sama, begitu juga dengan model datanya sehingga sistem dapat terdiri dari beberapa model data seperti relasional, jaringan, hirarki dan obyek oriented DBMS.
Sistem homogen lebih mudah di rancang dan di atur. Pendekatan ini memberikan perkembangan yang baik, tidak mengalami kesulitan dalam  membuat sebuah site baru pada DDBMS , dan meningkatkan kinerja dengan mengeksploitasikan kemampuan dalam pemrosesan paralel di beberapa site yang berbeda.
Sistem heterogen, menghasilkan beberapa site yang individual  dimana mereka mengimplementasikan basis data mereka dan penyatuan data nya di lakukan di tahap berikutnya. Pada sistem ini penterjemahan di perlukan untuk mengkomunikasikan diantara beberapa DBMS yang berbeda.Untuk menghasilkan transparansi DBMS, pengguna harus dapat menggunakan bahasa pemrograman yang digunakan oleh DBMS pada lokal site. Sistem akan mencari lokasi data dan menampilkan sesuai dengan yang diinginkan.
Data yang dibutuhkan dari site lain kemungkinan :
·                     Memiliki hardware yang berbeda
·                     Memiliki product DBMS yang berbeda
·                     Memiliki hardware dan produk DBMS yang berbeda

Jika hardwarenya yang berbeda tetapi produk DBMS nya sama , maka yang akan di ubah adalah kode dan panjang katanya. Jika yang berbeda produk DBMSnya maka akan lebih kompleks lagi karena yang akan di ubah adalah proses pemetaan dari struktur data dalam satu model data yang sama dengan struktur data pada model data yang lain. Sebagai contoh : relasional pada model data relasional di petakan ke dalam beberapa rekord dan set di model data jaringan . Juga diperlukan perubahan pada bahasa queri yang digunakan ( Contoh pada SQL Perintah SELECT di petakan kedalam model jaringan menjadi FIND atau GET ). Jika keduanya yang berbeda, maka dua tipe perubahan ini diperlukan sehingga pemrosesan menjadi lebih kompleks.

Kompleksitas lainnya adalah memiliki skema konseptual yang sama, dimana hal ini di bentuk dari penyatuan data dari skema individual  pada konseptual lokal. Untuk mengatasi hal tersebut di gunakan GATEWAY , dimana metode ini di gunakan untuk mengkonversi bahasa pemrograman dan model data di setiap DBMS yang berbeda ke dalam bahasa dan model data relasional .  Tetapi metode ini juga memiliki keterbatasan , yang pertama tidak mensupport manjemen transaksi, bahkan untuk sistem yang sepasang. Dengan kata lain metode ini di antara dua buah sistem hanya merupakan penterjemah query. Sebagai contoh , sebuah sistem tidak dapat mengkoordinasikan kontrol konkurensi dan transaksi pemulihan data yang melibatkan pengupdatean pada basis data yang berhubungan. Kedua, metode ini hanya dapat mengatasi masalah penterjemahan query  yang di ta
tampilkan dalam satu bahasa ke bahasa lainnya yang sama.

A.    KEUNTUNGAN & KERUGIAN DATABASE TERDISTRIBUSI

Data dan aplikasi terdistribusi mempunyai kelebihan di bandingkan dengan sistem sentralisasi basis data.Sayangnya , DDBMS ini juga memiliki  kelemahan.

KEUNTUNGAN
  1. Pengawasan distribusi dan pengambilan data.
Jika beberpa site yang berbeda dihubungkan, seorang pemakai yang berada pada satu site dapat mengakses data pada site lain. Contoh : sistem distribusi pada  sebuah bank memungkinkan seorang pemakai pada salah satu cabang dapat mengakses data cabang lain.
  1. Reliability dan availability
Sistem distribusi dapat terus menerus berfungsi dalam menghadapi kegagalan dari site sendiri atau mata rantai komunikasi antar site.
  1. Kecepatan pemrosesan query
Contoh : jika site-site gagal dalam sebuah  sistem terdistribusi, site lainnya
dapat melanjutkan operasi jika data telah direplikasi pada beberapa site.
  1. Otonomi lokal
Pendistribusian sistem mengijinkan  sekelompok individu dalam sebuah perusahaan untuk melatih pengawasan lokal melalui data mereka sendiri. Dengan kemampuan ini dapat mengurangi ketergantungan pada pusat pemrosesan.
  1. Efisiensi dan fleksibel
Data dalam sistem distribusi dapat  disimpan dekat dengan titik diman data tersebut dipergunakan. Data dapat secara dinamik bergerak atau disain, atau salinannya dapat dihapus.

KERUGIAN
1. Harga software mahal
Hal ini disebabkan sangat sulit untuk membuat sistem database distribusi.
2. Kompleksitas
Site-site beroperasi secara paralel sehingga lebih sulit untuk menjamin kebenaran dan algoritma. Adanya kesalahan mungkin tak dapat diketahui.
3. Biaya pemrosesan tinggi
Perubahan pesan dan penambahan perhitungan dibutuhkan untuk mencapai koordinasi antar site.
4. Sulit menjaga keutuhan data
Banyaknya pengaksesan data membuat kurangnya sekuritas terhadap data yang telah terdistribusi.
5. Kurangnya standar
Tidak ada tool atau metodologi untuk membantu user mengubah database terpusat ke database terdistribusi. 
6. Kurang pengalaman
Sistem DB terdistribusi bertujuan  umum (generalpurpose) tidak sering digunakan. Yang digunakan adalah sistem prototype yang dibuat untuk satu aplikasi (misal : reservasi pesawat)
7. Perancangan basis data lebih kompleks
Sebelumnya menjadi keuntungan. Tetapi karena  distribusi menyebabkan masalah sinkronisasi dan koordinasi, kontrol terdistribusi menjadi kerugian atau kekurangan di masalah ini.
Komponen Sistem Terdistribusi
Komponen DDBMS adalah pengendalian unit di semua sistem. Berikut adalah gambar komponen dasar sistem terdistribusi.




 

0 komentar "BASIS DATA TERDISTRIBUSI", Baca atau Masukkan Komentar

Posting Komentar