Agentic AI memiliki masalah data tidak terstruktur: IBM meluncurkan solusinya

IBM Menyederhanakan Tumpukan Data untuk AI Secara Radikal di Think Week

Pada acara Think minggu ini, IBM memperkenalkan penyederhanaan besar-besaran pada tumpukan data untuk AI, dengan menampilkan pratinjau evolusi besar dari watsonx.data.

Watsonx.data dirancang untuk membantu organisasi membuat data mereka siap digunakan untuk AI, dengan menyediakan fondasi data yang terbuka, hybrid, serta pengelolaan data terstruktur dan tidak terstruktur yang siap digunakan di lingkungan perusahaan.

Hasilnya?

Menurut pengujian internal IBM dengan watsonx.data, AI yang dihasilkan 40% lebih akurat dibandingkan pendekatan RAG (Retrieval-Augmented Generation) konvensional.¹

Produk dan Fitur Baru (Akan Diluncurkan Juni 2025):

  • Watsonx.data Integration
    Perangkat lunak untuk mengatur akses dan rekayasa data lintas berbagai gaya dan format integrasi dalam satu antarmuka tunggal. Dirancang dengan fleksibilitas dan skalabilitas sebagai inti.
  • Watsonx.data Intelligence
    Perangkat lunak untuk mengubah cara organisasi mengkurasi, mengelola, dan memanfaatkan data yang bernilai, dengan memanfaatkan kekuatan AI untuk menyederhanakan tata kelola data.
  • Integrasi watsonx ke dalam Llama Stack milik Meta
    Menjadikan watsonx sebagai penyedia API dalam Llama Stack, memungkinkan perusahaan menerapkan AI generatif secara terbuka dan skala besar.

Produk watsonx.data integration dan watsonx.data intelligence akan tersedia sebagai produk mandiri, namun beberapa kemampuan tertentu juga akan terintegrasi ke dalam watsonx.data—memaksimalkan fleksibilitas dan pilihan untuk klien.

🧠 Akuisisi Strategis: IBM + DataStax

IBM juga baru-baru ini mengumumkan niat untuk mengakuisisi DataStax, perusahaan yang unggul dalam pemrosesan data tidak terstruktur untuk kebutuhan AI generatif. Dengan DataStax, pelanggan IBM akan memiliki akses ke fitur pencarian vektor yang lebih canggih, memperluas kemampuan pencarian dan pengambilan informasi dari data tidak terstruktur.

Konteks Evolusi Besar Ini

Organisasi saat ini menghadapi hambatan besar dalam menerapkan AI generatif yang akurat dan berkinerja tinggi—terutama AI berbasis agen (agentic AI). Namun, hambatan utama bukanlah biaya inferensi atau model AI yang “sempurna” seperti yang banyak pemimpin bisnis pikirkan.

Hambatan utamanya adalah: DATA.

Organisasi membutuhkan data terpercaya dan spesifik milik perusahaan agar AI berbasis agen benar-benar memberikan nilai. Data ini biasanya berupa data tidak terstruktur, seperti:

  • Email
  • Dokumen
  • Presentasi
  • Video

Menurut estimasi, pada tahun 2022, 90% data yang dihasilkan oleh perusahaan adalah tidak terstruktur, tetapi hanya 1% yang dimasukkan ke dalam model bahasa besar (LLM).

Masalahnya, data tidak terstruktur sangat sulit untuk dimanfaatkan karena:

  • Sangat tersebar dan terus berubah
  • Terkunci dalam berbagai format
  • Tidak memiliki label yang jelas
  • Sering kali memerlukan konteks tambahan agar bisa ditafsirkan dengan benar

RAG konvensional tidak mampu mengekstrak nilai secara efektif dan tidak dapat menggabungkan data tidak terstruktur dan terstruktur dengan baik.

Sementara itu, banyak organisasi masih menggunakan alat-alat yang terpisah-pisah: data warehouse, data lake, alat integrasi data, dan tata kelola data. Akibatnya, tumpukan data untuk AI justru menjadi kompleks dan membingungkan—seperti data tidak terstruktur yang ingin mereka kelola.

Mengatasi Akar Permasalahan: Bangun Fondasi Data yang Siap untuk AI

Banyak organisasi masih terfokus pada lapisan aplikasi AI generatif, padahal yang seharusnya dibenahi adalah lapisan data di bawahnya. Tanpa fondasi data yang kuat, AI berbasis agen dan inisiatif AI generatif lainnya tidak akan mencapai potensi maksimalnya.

Solusi IBM: Membantu Organisasi Menjadikan Data Mereka Siap untuk AI

Dengan kemampuan baru ini, IBM membantu organisasi untuk:

  • Mengambil (ingest) data
  • Mengatur (govern) data
  • Mengambil kembali (retrieve) data—baik terstruktur maupun tidak terstruktur

Dari situ, organisasi dapat meningkatkan akurasi dan performa AI generatif mereka secara signifikan.

¹ Berdasarkan pengujian internal IBM yang membandingkan akurasi jawaban model AI menggunakan lapisan retrieval watsonx.data Premium Edition dengan RAG berbasis vektor pada tiga kasus penggunaan umum, menggunakan dataset milik IBM dan model open-source yang sama. Hasil bisa bervariasi.

Infrastruktur IT yang kuat adalah kunci produktivitas perusahaan. Dengan ibm indonesia, Anda bisa mendapatkan solusi IT lengkap yang sesuai dengan kebutuhan Anda. iLogo Indonesia sebagai mitra terpercaya siap mengintegrasikan semuanya agar bisnis Anda tetap berjalan lancar dan aman.
Hubungi kami sekarang atau kunjungi ibm.ilogoindonesia.id untuk informasi lebih lanjut!