Perkembangan teknologi semakin pesat di hampir seluruh lini kehidupan manusia. Kini hampir setiap kegiatan manusia melibatkan teknologi didalamnya. Bahkan setiap individu tidak terpisahkan dengan teknologi. Di era teknologi yang semakin maju, data menjadi salah satu aset yang paling bagi organisasi maupun individu. 

Terlebih di era Artificial Intelligence atau AI, data menjadi bahan bakar AI yang sangat penting. Tanpa data, AI tidak akan bisa melakukan apa-apa. Maka perlu pengelolaan data dengan baik dan tepat.

Dalam konteks teknologi, ada satu prinsip yang sangat penting yaitu “Garbage In, Garbage Out” atau GIGO. Prinsip ini menyoroti pentingnya kualitas data yang digunakan dalam berbagai sistem teknologi. Jika data yang digunakan tidak berkualitas atau tidak akurat, maka hasilnya juga tidak akan berguna atau bahkan merugikan.

Prinsip “Garbage In, Garbage Out” merupakan prinsip fundamental dalam dunia teknologi informasi, pemrograman, dan pengolahan data. Konsep ini menegaskan bahwa kualitas output yang dihasilkan oleh suatu sistem atau proses analitik sangat bergantung pada kualitas input yang diberikan.

Ilustrasi

Apa Itu GIGO atau “Garbage In, Garbage Out”

Secara harfiah, “Garbage In” berarti sampah yang masuk, sementara “Garbage Out” berarti sampah keluar. Hal ini menggambarkan bahwa sebuah sistem komputer tidak memiliki kemampuan bawaan untuk memperbaiki data dengan kualitas yang buruk .Sistem hanya memproses data sesuai dengan apa yang diterimanya, terlepas dari kualitas data yang ada.

Berdasarkan Computer History Museum, prinsip GIGO ini pertama kali diperkenalkan pada awal perkembangan komputasi digital pada tahun 1950-an. Istilah ini diasosiasikan dengan ilmuwan data yang menyadari bahwa komputer dengan kemampuan pemrosesan data yang cepat tidak mampu membetulkan data yang buruk.

Seorang ahli komputer Amerika bernama George Fuechsel sering dikreditkan sebagai orang yang mempopulerkan istilah ini. Dia memperingatkan pengguna komputer bahwa mesin hanya akan menghasilkan keluaran yang berguna jika data yang dimasukkan juga berguna dan benar. Sejak itu, prinsip GIGO menjadi pelajaran penting dalam pelatihan teknologi informasi dan pengembangan perangkat lunak.

GIGO dalam pengembangan Artificial Intelligence

Dalam konteks Artificial Intelligence (AI), prinsip GIGO menjadi sangat relevan. AI bergantung pada data dalam jumlah besar untuk melatih modelnya. Jika data yang digunakan untuk melatih model AI mengandung kesalahan, bias, atau data yang tidak representatif, maka hasil yang dihasilkan juga akan bermasalah.

Sejumlah penelitian menyoroti bagaimana data yang berkualitas rendah dapat menyebabkan hasil yang tidak akurat, bias, dan bahkan merugikan. 

Berdasarkan penelitian dari IEEE Xplore yang bertajuk Generative AI: A Review on Models and Applications menemukan bahwa model AI seperti transformers memerlukan data bersih dan terstruktur untuk menghasilkan output yang akurat.

Selain itu, sebuah studi tentang privasi dan keamanan dalam AI menemukan bahwa data yang tidak dikurasi dengan baik dapat membuka celah keamanan serius dalam AI generatif seperti ChatGPT.

Untuk menghindari berbagai permasalahan tersebut, perlu dilakukan pembersihan data, penghapusan bias, dan pengawasan model AI secara berkala agar output yang dihasilkan tetap akurat.

Ilustrasi

Kualitas Data adalah Kunci

Kualitas Data memegang peran utama dalam menghindari GIGO, terlebih untuk pengembangan AI. Sebab, jika data tidak berkualitas, AI menjadi tidak berguna atau bahkan merugikan.

Data berkualitas juga berperan besar dalam meningkatkan akurasi dan keandalan model AI. Data yang lengkap, konsisten, dan relevan memungkinkan model AI untuk belajar dengan lebih baik dan menghasilkan prediksi yang lebih tepat. 

Sebaliknya, data yang penuh dengan noise atau inkonsistensi akan membuat model AI sulit untuk belajar dengan benar, sehingga hasilnya bisa tidak dapat diandalkan. Menurut MIT Technology Review, data yang berkualitas tinggi dapat meningkatkan akurasi dan keandalan model AI, sementara data yang buruk dapat merusak kinerja sistem.

McKinsey & Company mengungkapkan bahwa salah satu tantangan terbesar dalam adopsi AI adalah kualitas data. tanpa data yang terstruktur dengan baik dan bersih, perusahaan akan menghadapi kesulitan dalam memanfaatkan potensi penuh dari teknologi AI.

Forbes juga menyoroti pentingnya data berkualitas dalam AI. Dalam laporannya menyatakan bahwa AI sangat bergantung pada data yang akurat, relevan, dan tepat waktu untuk menghasilkan wawasan yang dapat diandalkan. Tanpa data berkualitas, model AI tidak akan dapat berfungsi sebagaimana mestinya.

Peran Data Governance

Data Governance dan kualitas data memiliki hubungan yang sangat erat dalam memastikan bahwa data yang digunakan dalam organisasi adalah valid, akurat, dan dapat diandalkan. 

Data governance menciptakan struktur dan kebijakan yang memastikan pengelolaan data yang efektif, sementara kualitas data memastikan bahwa data yang digunakan untuk analisis, pengambilan keputusan, dan pengembangan teknologi seperti AI adalah berkualitas tinggi. Berikut adalah penjelasan tentang peran data governance dalam memastikan kualitas data:

Menetapkan Kebijakan dan Standar Kualitas Data

Data governance bertanggung jawab untuk menetapkan kebijakan dan standar yang mengatur kualitas data di seluruh organisasi. Hal ini mencakup definisi yang jelas tentang apa yang dianggap sebagai data berkualitas tinggi. 

Misalnya, kebijakan data governance akan mencakup standar untuk akurasi, konsistensi, kelengkapan, dan keterkinian data. Dengan adanya standar ini, organisasi dapat memastikan bahwa data yang dikumpulkan dan digunakan memenuhi kriteria kualitas yang diperlukan untuk menghasilkan wawasan yang akurat dan andal.

Pengelolaan dan Pemantauan Kualitas Data

Salah satu komponen utama dari data governance adalah pengelolaan kualitas data secara berkelanjutan. Ini melibatkan proses-proses yang memastikan data tetap bersih, bebas dari duplikasi, dan diperbarui secara berkala. 

Data governance memastikan bahwa ada prosedur pemantauan dan pengukuran kualitas data secara teratur. Dengan adanya mekanisme untuk memantau dan memperbaiki kualitas data, organisasi dapat mengurangi risiko kesalahan data yang dapat mempengaruhi keputusan bisnis atau hasil dari sistem AI dan analitik.

Peningkatan Kualitas Data melalui Pengelolaan Metadata

Pengelolaan metadata adalah bagian penting dari data governance yang mendukung kualitas data. Metadata menyediakan informasi tentang asal-usul, struktur, dan penggunaan data.

Dengan pengelolaan metadata yang baik, organisasi dapat memastikan bahwa data yang digunakan untuk analisis dan pemodelan adalah data yang sah dan memiliki konteks yang benar. Hal ini memungkinkan pengambilan keputusan yang lebih baik dan meningkatkan akurasi hasil dari model AI atau analitik.

Next Upcoming Event

Executive Class – Data Management with DAMA-DMBOK & AI Data Governance

18 February 2025
  • 00

    days

  • 00

    hours

  • 00

    minutes

  • 00

    seconds

Author

Eduparx adalah platform pembelajaran IT online nomor 1 di Indonesia yang menyediakan pelatihan berkualitas dan bersertifikat. Eduparx hadir sebagai solusi untuk meningkatkan kompetensi masyarakat dalam mempelajari teknologi informasi dengan pelatihan dan produk online yang berkualitas dan dapat diakses dimana saja dan kapan saja.

Write A Comment