Pada tahun 2026, lebih dari 80% perusahaan akan menerapkan API Kecerdasan Buatan atau aplikasi generatif Kecerdasan Buatan. Model-model AI dan data yang digunakan untuk pelatihan dan penyesuaian halusnya dapat meningkatkan aplikasi dari yang umum menjadi berdampak, menawarkan nilai nyata kepada pelanggan dan bisnis.
Sebagai contoh, pengalaman penggemar golf yang didorong AI generatif Master menggunakan data real-time dan historis untuk memberikan wawasan dan komentar untuk lebih dari 20.000 klip video. Kualitas dan jumlah data dapat membuat atau menghancurkan kesuksesan AI, dan organisasi yang efektif memanfaatkan dan mengelola data mereka akan memperoleh manfaat terbesar. Namun, hal ini tidak semudah itu. Data berkembang pesat, baik dari segi volume maupun variasi.
Menurut International Data Corporation (IDC), pada tahun 2025, data yang disimpan akan tumbuh 250% di seluruh platform on-prem dan cloud. Dengan pertumbuhan datang kompleksitas. Berbagai aplikasi data dan format membuat lebih sulit bagi organisasi untuk mengakses, mengatur, mengelola, dan menggunakan semua data mereka untuk AI secara efektif. Para pemimpin harus memikir ulang penggunaan pendekatan on-prem yang menghambat dan ekosistem data monolitik sambil mengurangi biaya dan memastikan tata kelola data yang tepat serta akses self-service ke lebih banyak data melintasi sumber data yang berbeda.
Memperluas skala data dan AI dengan teknologi, orang, dan proses
Mengaktifkan data sebagai pembeda untuk AI membutuhkan keseimbangan antara teknologi, orang, dan proses. Untuk memperluas kasus penggunaan AI, Anda perlu memahami tujuan strategis data Anda, yang kemungkinan telah berubah karena AI generatif. Sesuaikan strategi data Anda dengan arsitektur yang akan datang, dengan mempertimbangkan investasi teknologi yang ada, tata kelola, dan manajemen otomatis yang terintegrasi. Manfaatkan AI untuk membantu otomatisasi tugas-tugas seperti onboarding data, klasifikasi data, organisasi, dan tagging. Hal ini akan memerlukan evolusi dalam proses manajemen data dan pembaruan jalur pembelajaran.
Membangun dasar data yang terbuka dan terpercaya
Organisasi harus berfokus pada membangun dasar data yang terbuka dan terpercaya untuk mengakses data yang dapat dipercaya untuk AI. Terbuka menciptakan dasar untuk menyimpan, mengelola, mengintegrasikan, dan mengakses data yang dibangun dengan kapabilitas terbuka dan interoperabel yang meliputi implementasi hibrid cloud, penyimpanan data, format data, mesin kueri, tata kelola, dan metadata. Hal ini memungkinkan integrasi yang lebih mudah dengan investasi teknologi yang sudah ada sambil menghilangkan silo data dan mempercepat transformasi berbasis data.
Menciptakan dasar data yang terpercaya memungkinkan manajemen data dan metadata berkualitas tinggi, andal, aman, dan diatur sehingga dapat disampaikan untuk aplikasi analitik dan AI sambil memenuhi kebutuhan privasi data dan kepatuhan regulasi. Empat komponen berikut membantu membangun dasar data yang terbuka dan terpercaya.
- Memodernisasi infrastruktur data Anda menuju cloud hibrid untuk aplikasi, analitika, dan AI generatif.
Mengadopsi strategi multicloud dan hibrid menjadi keharusan, yang memerlukan database yang mendukung implementasi fleksibel di seluruh cloud hibrid. Gartner memprediksi bahwa 95% inisiatif digital baru akan dikembangkan pada platform native cloud, yang penting untuk teknologi AI yang membutuhkan penyimpanan data massal dan skalabilitas.
- Mendorong aplikasi berbasis data, analitika, dan AI dengan database yang tepat dan strategi data lakehouse yang terbuka
Untuk menyimpan dan menganalisis data, Anda harus menggunakan database yang sesuai dengan beban kerja, jenis data, dan kinerja harga yang tepat. Hal ini memastikan bahwa Anda memiliki dasar data yang dapat berkembang seiring dengan kebutuhan data Anda, di mana pun lokasi data Anda berada. Strategi data Anda harus mencakup penggunaan database yang dirancang dengan komponen terbuka dan terintegrasi, memungkinkan unifikasi dan akses data yang lancar untuk analitika lanjutan dan aplikasi AI dalam platform data. Ini memungkinkan organisasi Anda untuk mengambil wawasan berharga dan mendukung pengambilan keputusan yang berbasis informasi.
Sebagai contoh, organisasi memerlukan database transaksional yang aman, andal, dan tahan lama untuk mengelola data operasional yang paling kritis. Dengan ketersediaan cloud hibrid, organisasi dapat menggunakan database mereka untuk memodernisasi aplikasi warisan, membangun aplikasi baru yang native cloud, dan mendukung asisten AI serta aplikasi perusahaan.
Seiring dengan evolusi jenis data dan aplikasi, Anda mungkin memerlukan database NoSQL khusus untuk mengelola struktur data yang beragam dan memenuhi persyaratan aplikasi tertentu. Ini termasuk database time series, dokumen, pesan, nilai-kunci, pencarian teks penuh, dan in-memory, yang memenuhi berbagai kebutuhan seperti IoT, manajemen konten, dan aplikasi geospasial.
Untuk mendukung beban kerja AI dan analitika di seluruh database transaksional dan khusus, Anda harus memastikan bahwa mereka dapat terintegrasi dengan lancar dengan arsitektur open data lakehouse tanpa duplikasi atau proses extract, transform, load (ETL) tambahan. Dengan data lakehouse terbuka, Anda dapat mengakses satu salinan data di mana pun lokasi data Anda berada.
Data lakehouse terbuka menangani berbagai format terbuka (seperti Apache Iceberg di atas penyimpanan objek cloud) dan menggabungkan data dari berbagai sumber dan repositori yang ada di seluruh cloud hibrid. Data lakehouse yang paling efisien dari segi harga juga memungkinkan pemisahan penyimpanan dan komputasi dengan beberapa mesin kueri open source dan integrasi dengan mesin analitika lainnya untuk mengoptimalkan beban kerja demi kinerja harga yang lebih baik.
Ini termasuk integrasi dengan mesin data warehouse Anda, yang sekarang harus seimbang antara pemrosesan data real-time dan pengambilan keputusan dengan penyimpanan objek yang efektif secara biaya, teknologi open source, dan lapisan metadata bersama untuk berbagi data dengan data lakehouse Anda. Dengan arsitektur data lakehouse terbuka, Anda sekarang dapat mengoptimalkan beban kerja data warehouse Anda untuk kinerja harga dan memodernisasi data lake tradisional dengan kinerja dan tata kelola yang lebih baik untuk AI.
Perusahaan mungkin juga memiliki petabyte, bahkan eksabyte, data properti berharga yang disimpan di mainframe mereka yang perlu dibuka untuk wawasan baru dan model ML/AI. Dengan data lakehouse terbuka yang mendukung sinkronisasi data antara mainframe dan format terbuka seperti Iceberg, organisasi dapat lebih baik mengidentifikasi penipuan, memahami perilaku konstituen, dan membangun model AI prediktif untuk memahami, memprediksi, dan mempengaruhi hasil bisnis lanjutan.
Sebelum membangun AI generatif yang terpercaya untuk bisnis Anda, Anda memerlukan arsitektur data yang tepat untuk mempersiapkan dan mentransformasi data yang berbeda menjadi data berkualitas. Untuk AI generatif, dasar data yang tepat mungkin mencakup berbagai pengetahuan yang mencakup database NoSQL untuk percakapan, database transaksional untuk data kontekstual, arsitektur data lakehouse untuk mengakses dan mempersiapkan data Anda untuk AI dan analitika, serta kemampuan vector-embedding untuk menyimpan dan mengambil embedding untuk generasi augmented retrieval (RAG). Lapisan metadata bersama, tata kelola untuk mengkatalogkan data Anda, dan data lineage memungkinkan keluaran AI yang dapat dipercaya.
- Membangun dasar kepercayaan: Kualitas data dan tata kelola untuk AI perusahaan
Seiring organisasi semakin mengandalkan kecerdasan buatan (AI) untuk mengambil keputusan kritis, pentingnya kualitas data dan tata kelola tidak bisa dianggap remeh. Menurut Gartner, 30% proyek AI generatif diperkirakan akan ditinggalkan pada tahun 2025 karena kualitas data yang buruk, kontrol risiko yang tidak memadai, biaya yang meningkat, atau nilai bisnis yang tidak jelas. Konsekuensi penggunaan data berkualitas rendah sangat luas, termasuk pengikisan kepercayaan pelanggan, ketidakpatuhan regulasi, dan kerusakan finansial serta reputasi.
Manajemen kualitas data yang efektif sangat penting untuk mengurangi risiko ini. Strategi arsitektur data yang dirancang dengan baik menjadi kunci dalam mencapai tujuan ini. Data fabric menyediakan kerangka kerja yang kokoh bagi para pemimpin data untuk melakukan profil data, merancang dan menerapkan aturan kualitas data, menemukan pelanggaran kualitas data, membersihkan data, dan memperkaya data. Pendekatan ini memastikan bahwa inisiatif kualitas data memberikan akurasi, aksesibilitas, ketepatan waktu, dan relevansi.
Selain itu, data fabric memungkinkan pemantauan terus-menerus terhadap tingkat kualitas data melalui kemampuan observabilitas data, sehingga organisasi dapat mengidentifikasi masalah data sebelum mereka menjadi masalah besar. Transparansi ini terhadap aliran data juga memungkinkan para pemimpin data dan AI untuk mengidentifikasi potensi masalah, memastikan bahwa data yang tepat digunakan untuk pengambilan keputusan.
Dengan memprioritaskan kualitas data dan tata kelola, organisasi dapat membangun kepercayaan pada sistem AI mereka, meminimalkan risiko, dan memaksimalkan nilai dari data mereka. Penting untuk diakui bahwa kualitas data bukan hanya masalah teknis, tetapi merupakan imperatif bisnis kritis yang membutuhkan perhatian dan investasi. Dengan mengadopsi strategi arsitektur data yang tepat, organisasi dapat membuka potensi penuh dari inisiatif AI mereka dan mendorong kesuksesan bisnis.
- Mengelola dan menyampaikan data untuk AI
Data adalah hal mendasar dalam AI, mulai dari membangun model AI dengan kumpulan data yang tepat hingga menyetel model AI dengan data perusahaan yang khusus untuk industri serta menggunakan embedding vektor untuk membangun aplikasi AI RAG (termasuk chatbot, sistem rekomendasi personal, dan pencarian kemiripan gambar).
Data yang terpercaya dan diatur dengan baik sangat penting untuk memastikan akurasi, relevansi, dan ketepatan AI. Untuk mengungkapkan nilai penuh data untuk AI, perusahaan harus dapat mengelola lanskap IT kompleks mereka untuk memecah silo data, menyatukan data mereka, serta mempersiapkan dan menyampaikan data yang terpercaya dan diatur untuk model dan aplikasi AI mereka.
Dengan arsitektur data lakehouse terbuka yang didukung oleh format terbuka untuk terhubung dan mengakses data kritis dari estate data yang ada (termasuk gudang data, danau data, dan lingkungan mainframe), Anda dapat menggunakan satu salinan data perusahaan untuk membangun dan menyetel model AI serta aplikasi.
Dengan lapisan semantik, Anda dapat menghasilkan pengayaan data yang memungkinkan klien untuk menemukan dan memahami data yang sebelumnya rumit dan terstruktur secara efektif di seluruh estate data Anda dalam bahasa alami melalui pencarian semantik untuk mempercepat penemuan data dan mengungkap wawasan data lebih cepat, tanpa memerlukan SQL.
Dengan menggunakan basis data vektor yang tertanam langsung di dalam lakehouse Anda, Anda dapat menyimpan dan mengquery data Anda sebagai embedding vektor untuk kasus penggunaan RAG, meningkatkan relevansi dan ketepatan keluaran AI Anda.
Bangun dan ciptakan nilai dengan produk data, asisten AI, aplikasi AI, dan intelijen bisnis.
Dengan fondasi data yang terbuka dan terpercaya, Anda dapat membuka potensi penuh dari data Anda dan menciptakan nilai darinya. Ini dapat dicapai dengan membangun produk data, asisten AI, aplikasi AI, dan solusi intelijen bisnis yang didukung oleh platform AI dan data yang menggunakan data yang terpercaya.
Produk data, misalnya, adalah aset data yang dapat digunakan ulang dan dikemas yang dapat digunakan untuk menghasilkan nilai bisnis, seperti model prediktif, visualisasi data, atau API data. Asisten AI, aplikasi, dan intelijen bisnis yang didukung oleh AI dapat membantu pengguna membuat keputusan yang lebih baik dengan menyediakan wawasan, rekomendasi, dan prediksi. Dengan data yang tepat, Anda dapat menciptakan organisasi yang didorong oleh data yang menghasilkan nilai bisnis dan inovasi.
Untuk memulai membangun fondasi data Anda untuk AI, jelajahi solusi manajemen data kami dengan basis data IBM®, watsonx.data™, dan data fabric serta skala AI dengan data yang terpercaya.
Cari tau dan konsultasikan dengan kami, hubungi [email protected]