Di era digitalisasi seperti sekarang ini, kebutuhan terhadap data menjadi hal yang penting bagi banyak orang, juga bagi perusahaan dalam skala besar maupun kecil. Menurut Forbes, data disebut juga sebagai ‘new oil’ karena harganya yang fantastis. Tetapi data tersebut terkadang masih memiliki nilai yang tidak valid, seperti typo, data tidak lengkap, data yang tidak konsisten, hingga keamanan data yang terbilang buruk.
Maka dari itu, dibutuhkan data quality untuk memastikan agar data yang diproses sesuai dengan yang seharusnya sehingga dapat digunakan untuk kebutuhan spesifik perusahaan dalam konteks tertentu. Data quality juga termasuk dari bagian Data Governance yang artinya proses untuk memastikan bahwa data tersebut dikelola dengan baik. Apabila data memiliki kualitas yang buruk, maka akan berdampak pada kerugian pada perusahaan dan bisnis.
Data quality memiliki tujuan antara lain:
- Menyusun pendekatan yang dikelola dengan tepat untuk membuat data “fit for purpose” berdasarkan kebutuhan data customer.
- Mendefinisikan standar, kebutuhan, dan spesifikasi untuk tujuan quality control sebagai bagian dari data lifecycle.
- Mendefinisikan dan mengimplementasikan proses untuk mengukur, memantau, dan melaporkan level dari kualitas data.
- Mengidentifikasi opportunity untuk meningkatkan kualitas data melalui peningkatan proses dan sistem.
Berikut ini gambaran terkait input, activites, dan output pada data quality berdasarkan DAMA (Data Management Association).
Dalam proses tersebut, kita mengetahui bahwa proses pertama dari Data quality adalah menentukan Business Driver seperti mengurangi resiko, meningkatkan efisiensi dan produktivitas, menjaga reputasi organisasi, hingga meningkatkan nilai dengan cara memanfaatkan pengolahan data yang tepat. Organisasi atau perusahaan pun harus memahami dari “high quality data”, yang berarti data yang memiliki value pada perusahaan berdasarkan scorecard.
Dalam menilai data quality, terdapat beberapa dimensi yang dipertimbangkan yaitu:
- Accuracy (ketepatan)
Sesuai namanya, accuracy berarti informasi yang benar pada data. Untuk menentukan apakah data akurat atau tidak, data harus sesuai dengan realita. Akurasi adalah karakteristik kualitas data yang penting karena informasi yang tidak akurat dapat menyebabkan konsekuensi dan masalah signifikan.
- Completeness (kelengkapan)
Kelengkapan mengacu pada seberapa komprehensif informasi yang Anda miliki. Faktor penting dalam kelengkapan data adalah memastikan semua data yang Anda butuhkan tersedia. Nah, dimensi completeness menjadi penting karena jika informasi tidak lengkap, data mungkin menjadi tidak dapat digunakan.
- Reliability (keandalan)
Keandalan berarti bahwa suatu informasi tidak bertentangan dengan informasi lain dalam sumber atau sistem yang berbeda. Sebagai karakteristik data quality yang vital, saat potongan informasi bertentangan, maka Anda tidak dapat mempercayai data tersebut. Menggunakannya dapat membuat kesalahan yang merugikan dan merusak reputasi perusahaan.
- Relevance (relevansi)
Relevansi ikut berperan karena harus ada alasan bagus mengapa Anda mengumpulkan informasi tertentu sejak awal. Pertimbangkan apakah Anda benar-benar membutuhkan informasi tersebut. Relevansi penting karena jika Anda mengumpulkan informasi yang tidak relevan, Anda hanya akan membuang waktu dan juga uang. Analisis data pun akan menjadi tidak berharga.
- Timeliness (Ketepatan waktu)
Ketepatan waktu mengacu pada seberapa up to date informasi yang Anda punya. Ketepatan waktu informasi merupakan salah satu dimensi data quality yang penting karena informasi yang tidak tepat waktu dapat menyebabkan orang mengambil keputusan yang salah. Dampaknya adalah menghabiskan waktu, uang, dan merusak reputasi perusahaan.
DAMA mengkategorikan 15 dimensi dari Data quality menjadi 4 jenis, yaitu:
- Intrinsic DQ : Menentukan data tersebut memiliki kualitas data yang baik.
- Accessibility DQ : Mempermudah dalam menerima informasi.
- Contextual DQ : Berdasarkan source data yang belum diolah.
- Representational DQ : Gambaran terhadap tujuan dari data yang akan diolah.
Yang dimana kategori tersebut memiliki setiap dimensi, dapat terlihat pada tabel dibawah ini :
Gambar berikut ini menunjukkan tumpang tindih yang signifikan antara konsep dan juga menunjukan tidak adanya kesepakatan antara set tertentu. Sebagai contoh, dimensi Accuracy dikaitkan dengan ‘agrees with real world’ dan ‘match to agreed source’ serta berhubungan dengan konsep dari dimensi validity seperti ‘derivation correct’, ‘valid value control’, dan lain sebagainya.
Memiliki data quality yang baik dapat memastikan perusahaan atau organisasi mendapatkan hasil maksimal dari informasi yang dimiliki. Jika suatu data tidak memenuhi standar yang sudah ditetapkan, maka data tersebut menjadi data yang tidak berguna. Dengan menggunakan data quality, perusahaan bisa mendapatkan data yang akurat, lengkap dan membantu perusahaan dapat terus maju dan berkembang.
Dalam pembuatan data quality tersebut, Informatica Data Quality dapat membantu perusahaan dengan pembuatan:
1. Rules
Melakukan aturan atau pattern logic pada kolom di table source, yang apabila isi dari kolom tersebut tidak sesuai dengan rules yang berlaku, maka data tersebut tidak valid.
2. Scorecards
Menampilkan grafik representative nilai data yang valid untuk output dari suatu rules pada profile. Scorecards juga digunakan sebagai ukuran dan memonitor progress data quality secara over time.
3. Profile
Merupakan pengolahan, analisis, serta menarik kesimpulan dari data yang tersedia untuk memperoleh informasi yang bermanfaat bagi pemproses data.
Memiliki data quality yang baik dapat memastikan perusahaan atau organisasi mendapatkan hasil maksimal dari informasi yang dimiliki. Jika suatu data tidak memenuhi standar yang sudah ditetapkan, maka data tersebut menjadi data yang tidak berguna. Dengan menggunakan data quality, perusahaan dapat mendapatkan data yang akurat, lengkap dan membantu perusahaan dapat terus maju dan berkembang. Jika anda membutuhkan solusi terhadap data quality, silahkan diskusi lebih jauh dengan menghubungi Email: contact@npp-asia.com | Phone: +6221 2788 3570 | www.npp-asia.com
Source:
https://knowledge.informatica.com/ (Informatica, n.d.)
https://docs.informatica.com/
DAMA-DMBOK v2
Penulis :
Rifqi Irawan
Technical Consultant – PT Niagaprima Paramitra