{"id":1617,"date":"2025-08-07T14:00:34","date_gmt":"2025-08-07T07:00:34","guid":{"rendered":"https:\/\/dazo.id\/blog\/?p=1617"},"modified":"2025-09-26T10:51:41","modified_gmt":"2025-09-26T03:51:41","slug":"dataset-ai","status":"publish","type":"post","link":"https:\/\/dazo.id\/blog\/digital-transformation\/dataset-ai\/","title":{"rendered":"Apa Itu Dataset AI dan Mengapa Penting untuk Bisnis?"},"content":{"rendered":"<p>Ketika mendengar istilah <strong>kecerdasan buatan (AI)<\/strong>, mungkin yang terlintas di benak adalah chatbot, mobil otonom, atau rekomendasi belanja online. Tapi, dibalik semua itu, ada satu elemen penting yang menjadi fondasi dari AI: <strong>dataset<\/strong>.<\/p>\n<p><strong>Dataset AI<\/strong> adalah kumpulan data yang digunakan untuk melatih model kecerdasan buatan agar dapat memahami pola, mengenali objek, menjawab pertanyaan, atau membuat prediksi. Tanpa dataset yang relevan dan berkualitas, AI hanyalah mesin kosong tanpa kemampuan berpikir.<\/p>\n<h2><strong>Mengapa Dataset AI Krusial?<\/strong><\/h2>\n<p>AI bekerja dengan cara belajar dari data. Semakin baik datanya, semakin akurat pula hasil prediksinya. Misalnya, <a href=\"https:\/\/dazo.id\/blog\/bisnis\/chatbot-whatsapp-untuk-umkm\/\"><strong>chatbot yang digunakan untuk melayani pelanggan<\/strong><\/a> hanya akan efektif jika ia \u201cdilatih\u201d dengan dataset berisi percakapan pelanggan, pertanyaan umum, keluhan, hingga cara menyelesaikan masalah tersebut. Berikut beberapa alasan mengapa dataset AI sangat penting:<\/p>\n<h3><strong>Meningkatkan akurasi model AI<\/strong><\/h3>\n<p>Dataset yang baik membantu AI memahami konteks dan menjawab dengan tepat.<\/p>\n<h3><strong>Menyesuaikan AI dengan kebutuhan bisnis<\/strong><\/h3>\n<p>Dataset bisa disesuaikan berdasarkan industri, bahasa pelanggan, hingga gaya komunikasi bisnis.<\/p>\n<h3><strong>Mengurangi bias dan kesalahan<\/strong><\/h3>\n<p>Data yang beragam dan seimbang mencegah model AI menghasilkan output yang tidak akurat atau bias.<\/p>\n<h2><strong>Jenis-Jenis Dataset AI<\/strong><\/h2>\n<p data-start=\"0\" data-end=\"128\">Berikut adalah beberapa<a href=\"https:\/\/dazo.id\/blog\/teknologi\/jenis-jenis-ai\/\"> <strong data-start=\"24\" data-end=\"50\">jenis-jenis <\/strong><\/a>\u00a0yang umum digunakan, tergantung pada jenis model dan tugas yang akan dilatih:<\/p>\n<h3><strong>Dataset Teks<\/strong><\/h3>\n<p>Digunakan untuk model NLP (Natural Language Processing) seperti chatbot, virtual assistant, dan sistem rekomendasi. Contohnya seperti dataset percakapan WhatsApp, ulasan pelanggan, atau email. Untuk bentuk umum lainnya seperti:<\/p>\n<ul>\n<li style=\"list-style-type: none;\">\n<ul>\n<li style=\"list-style-type: none;\">\n<ul>\n<li data-start=\"286\" data-end=\"318\">IMDb Reviews (analisis sentimen)<\/li>\n<li data-start=\"286\" data-end=\"318\">Wikipedia Dump (language modeling)<\/li>\n<li data-start=\"286\" data-end=\"318\">Common Crawl (web scraping data)<\/li>\n<\/ul>\n<\/li>\n<\/ul>\n<\/li>\n<\/ul>\n<h3><strong>Dataset Gambar<\/strong><\/h3>\n<p>Penting untuk AI dalam pengenalan visual seperti deteksi wajah atau klasifikasi produk. Contohnya seperti foto produk, gambar menu makanan, foto kendaraan lebih spesifiknya berupa:<\/p>\n<ul>\n<li style=\"list-style-type: none;\">\n<ul>\n<li style=\"list-style-type: none;\">\n<ul>\n<li data-start=\"486\" data-end=\"515\">ImageNet (klasifikasi gambar)<\/li>\n<li data-start=\"486\" data-end=\"515\">COCO (pengenalan objek)<\/li>\n<li data-start=\"486\" data-end=\"515\">MNIST (digit tulisan tangan)<\/li>\n<\/ul>\n<\/li>\n<\/ul>\n<\/li>\n<\/ul>\n<h3><strong>Dataset Audio<\/strong><\/h3>\n<p>Diperlukan untuk speech recognition atau voice command. Contoh: rekaman suara pelanggan, call center, voice notes,atau UrbanSound8K (klasifikasi suara lingkungan)<\/p>\n<h3><strong>Dataset Video<\/strong><\/h3>\n<p>Berguna untuk sistem keamanan, analisis gerak, atau konten otomatis. Seperti UCF101 (klasifikasi aksi), Kinetics-700 (aksi dalam video), atau mungkin bentuk lebih umumnya seperti CCTV toko, video unboxing produk.<\/p>\n<h3><strong>Dataset Numerik &amp; Transaksional<\/strong><\/h3>\n<p>Biasanya digunakan untuk model prediktif, seperti analisis perilaku pelanggan dan forecasting penjualan. Contoh: data penjualan harian, data klik iklan, dan data kunjungan website.<\/p>\n<h3 data-start=\"929\" data-end=\"959\"><strong data-start=\"937\" data-end=\"959\">Dataset Multimodal<\/strong><\/h3>\n<p data-start=\"960\" data-end=\"1025\">Menggabungkan beberapa jenis data: teks, gambar, audio. Seperti\u00a0 VisualQA (gambar + teks) atau CLIP Dataset (OpenAI) dengan menghubungkan teks dan gambar.<\/p>\n<h2><strong>Sumber Dataset AI: Gratis vs Berbayar<\/strong><\/h2>\n<p>Ada banyak sumber dataset AI yang bisa diakses secara gratis, terutama untuk pengembangan awal. Namun, untuk kebutuhan bisnis yang lebih serius, menggunakan <strong>dataset yang relevan, bersih, dan legal<\/strong> sangat disarankan, meskipun berbayar.<\/p>\n<h3><strong>Beberapa sumber dataset gratis:<\/strong><\/h3>\n<ul>\n<li style=\"list-style-type: none;\">\n<ul>\n<li style=\"list-style-type: none;\">\n<ul>\n<li>Google Dataset Search<\/li>\n<li>Kaggle Datasets<\/li>\n<li>Common Crawl (untuk data teks)<\/li>\n<li>Open Images Dataset (untuk data visual<\/li>\n<li>AudioSet dari Google (untuk data audio)<\/li>\n<\/ul>\n<\/li>\n<\/ul>\n<\/li>\n<\/ul>\n<h3><strong>Kapan butuh dataset berbayar?<\/strong><\/h3>\n<ul>\n<li style=\"list-style-type: none;\">\n<ul>\n<li style=\"list-style-type: none;\">\n<ul>\n<li>Ketika data perlu spesifik untuk industri tertentu (misal: percakapan pelanggan untuk bisnis kuliner)<\/li>\n<li>Saat ingin menghindari data noise atau tidak relevan<\/li>\n<li>Bila memerlukan data terstruktur dan siap pakai<\/li>\n<\/ul>\n<\/li>\n<\/ul>\n<\/li>\n<\/ul>\n<h2><strong>Apa Bedanya <\/strong><strong>Dataset AI vs Data Biasa?<\/strong><\/h2>\n<p>Tidak semua data langsung bisa digunakan untuk melatih AI. Dataset AI harus:<\/p>\n<h3><strong>Terstruktur atau telah melalui proses labeling (pemberian tag)<\/strong><\/h3>\n<p>Misalnya: chatbot bisa mengenali bahwa kalimat \u201cSaya mau pesan ayam geprek\u201d adalah <em>intent<\/em> \u201corder\u201d.<\/p>\n<h3><strong>Relevan dengan konteks yang ingin dipelajari<\/strong><\/h3>\n<p>Dataset untuk AI toko fashion tentu berbeda dengan AI untuk layanan bengkel.<\/p>\n<p><strong>Telah dibersihkan dari data tidak konsisten, spam, atau duplikasi<\/strong><\/p>\n<h2><strong>Campur Tangan Manusia Dalam Pembuatan Dataset AI<\/strong><\/h2>\n<p data-start=\"3865\" data-end=\"4102\">Mesin tidak akan belajar tanpa campur tangan manusia. Mulai dari memilih data, memberi makna (label), sampai menjaga etika dan kualitas data manusia tetap memegang peran kunci dalam menciptakan AI yang cerdas dan bertanggung jawab. Berikut beberapa tahapan manusia ketika meracik kumpulan data untuk dijadikan sebagai bahan bakar AI bekerja:<\/p>\n<h3 data-start=\"3865\" data-end=\"4102\"><em><strong>Data Collection<\/strong><\/em><\/h3>\n<p data-start=\"3865\" data-end=\"4102\">Tahap ini manusia mengumpulkan data dari berbagai sumber yang relevan dan legal. Contohnya seperti\u00a0 mengunduh data dari web, API, formulir survei, atau mengambil log chat dari WhatsApp bisnis.<\/p>\n<h3 data-start=\"3865\" data-end=\"4102\"><em><strong>Data Cleaning<\/strong><\/em><\/h3>\n<p>untuk kemudian dilakukan penyaringan dan pembersihan data terutama terkait data dari duplikasi, noise, data kosong, atau kesalahan penulisan. Seperti menghapus entri spam, memperbaiki ejaan, menghapus emoji tidak penting.<\/p>\n<h3><em><strong>Data Labeling\/Anotasi<\/strong><\/em><\/h3>\n<p>Dengan\u00a0memberi label pada data, AI bisa memahami\u00a0 model yang perlu dianalisa dan ditampilkan. Tahap ini merupakan bagian paling krusial dan biasanya dilakukan oleh tenaga manusia (annotator). Karena hingga saat ini AI masih belum optimal dalam\u00a0 melakukan filter terhadap data-data penting seperti menandai niat pengguna dalam chatbot (\u201ctanya harga\u201d, \u201ckomplain\u201d, dll), tagging gambar dengan nama objek.<\/p>\n<h3><em><strong>Data Validation<\/strong><\/em><\/h3>\n<p>Tahap ini, manusia akan melakukan pengecekan apakah label yang diberikan sudah akurat dan konsisten, perlu dilakukan oleh manusia dengan pengalaman lebih tinggi. Karena terkait dengan masalah quality control, revisi anotasi yang salah, validasi label secara manual. Agar data yang tersaji validitas dan realibitasnya terjamin sehingga bisa dijadikan acuan untuk kedepan.<\/p>\n<h3><em><strong>Data Structuring<\/strong><\/em><\/h3>\n<p>Untuk keperluan tertentu manusia memiliki peran dalam menyusun dataset dalam format yang sesuai dengan kebutuhan pelatihan model AI (CSV, JSON, XML, dll). Tidak semua hasil data otomatis memiliki format yang sama, maka dalam hal ini penting untuk mengorganisasi data seperti menjadi tabel (contoh: user_id, pesan, label intent) sesuai dengan keperluan tiap-tiap kelompok.<\/p>\n<h3><em><strong>Data Balancing<\/strong><\/em><\/h3>\n<p>Mengidentifikasi ketimpangan kelas data dan menyeimbangkannya untuk menghindari bias pada model. Menambah data minoritas secara manual atau dengan augmentasi (misalnya intent \u201crefund\u201d yang masih sedikit).<\/p>\n<h3><em><strong>Prompt Engineering<\/strong><\/em><\/h3>\n<p>Membuat prompt atau instruksi untuk pelatihan dan pengujian model berbasis generatif seperti ChatGPT, Bard, Claude, dll. Menulis contoh percakapan atau pertanyaan-respons untuk digunakan sebagai fine-tuning dataset.<\/p>\n<h3><em><strong>Ethical Review &amp;Filtering<\/strong><\/em><\/h3>\n<p>Memastikan bahwa data yang digunakan tidak mengandung SARA, bias, atau pelanggaran privasi. Meninjau ulang isi dataset, menyensor informasi sensitif (PII), memastikan inklusivitas data.<\/p>\n<h3><em><strong>Model Evaluation Support<\/strong><\/em><\/h3>\n<p>Membuat set data pengujian manual untuk mengevaluasi performa model dan melihat bagaimana AI bereaksi terhadap data baru. Menyiapkan<em> test case<\/em> dan <em>gold standard<\/em> untuk mengukur akurasi, <em>precision, recall<\/em> model AI.<\/p>\n<h3><em><strong>Feedback Loop<\/strong><\/em><\/h3>\n<p>Memberikan masukan setelah model digunakan, agar dataset bisa diperbarui dan model bisa terus belajar.\u00a0 Memberi label baru berdasarkan kesalahan chatbot, menambahkan contoh pertanyaan baru dari user nyata<\/p>\n<h2><strong>Penggunaan Dataset AI Berdasarkan Industri dan Penggunaannya<\/strong><\/h2>\n<table>\n<thead>\n<tr>\n<th><strong>Industri \/ Use Case<\/strong><\/th>\n<th><strong>Jenis Dataset<\/strong><\/th>\n<th><strong>Contoh Penggunaan<\/strong><\/th>\n<th><strong>Contoh Dataset Populer<\/strong><\/th>\n<\/tr>\n<\/thead>\n<tbody>\n<tr>\n<td><strong>E-Commerce \/ Toko Digital<\/strong><\/td>\n<td>Teks (transaksi &amp; ulasan)<\/td>\n<td>Analisis sentimen, rekomendasi produk<\/td>\n<td>Amazon Reviews, Yelp Dataset<\/td>\n<\/tr>\n<tr>\n<td><\/td>\n<td>Gambar produk<\/td>\n<td>Klasifikasi, pencarian visual mirip<\/td>\n<td>DeepFashion, Product-10K<\/td>\n<\/tr>\n<tr>\n<td><\/td>\n<td>Klik &amp; interaksi pengguna<\/td>\n<td>Sistem rekomendasi, personalisasi<\/td>\n<td>RetailRocket Dataset, Criteo Click Logs<\/td>\n<\/tr>\n<tr>\n<td><\/td>\n<td>Percakapan pelanggan<\/td>\n<td>Chatbot, auto-reply, intent classification<\/td>\n<td>eCommerce Customer Service Dataset<\/td>\n<\/tr>\n<tr>\n<td><strong>Customer Service<\/strong><\/td>\n<td>Chat \/ Log chat WhatsApp<\/td>\n<td>Chatbot AI, pengelompokan intent, auto-response<\/td>\n<td>Customer Support on Twitter, DSTC Dataset<\/td>\n<\/tr>\n<tr>\n<td><\/td>\n<td>Audio (voice to text)<\/td>\n<td>Call center automation, speech-to-text<\/td>\n<td>LibriSpeech, CommonVoice<\/td>\n<\/tr>\n<tr>\n<td><strong>Logistik &amp; Order Management<\/strong><\/td>\n<td>Data pesanan (struktur)<\/td>\n<td>Order prediction, automasi invoice, manajemen stok<\/td>\n<td>Instacart Orders Dataset, Order Management Logs<\/td>\n<\/tr>\n<tr>\n<td><\/td>\n<td>Time series (waktu &amp; volume)<\/td>\n<td>Prediksi lonjakan order, optimasi pengiriman<\/td>\n<td>UCI Retail Dataset, Walmart Sales Forecast<\/td>\n<\/tr>\n<tr>\n<td><strong>Kesehatan<\/strong><\/td>\n<td>Gambar medis<\/td>\n<td>Deteksi penyakit, segmentasi organ<\/td>\n<td>ChestX-ray14, LUNA16<\/td>\n<\/tr>\n<tr>\n<td><\/td>\n<td>Teks medis<\/td>\n<td>Ekstraksi diagnosis, chatbot medis<\/td>\n<td>MIMIC-III, PubMed QA<\/td>\n<\/tr>\n<tr>\n<td><strong>Keuangan<\/strong><\/td>\n<td>Transaksi dan laporan<\/td>\n<td>Deteksi fraud, scoring kredit<\/td>\n<td>Credit Card Fraud Detection, LendingClub Dataset<\/td>\n<\/tr>\n<tr>\n<td><\/td>\n<td>Chat nasabah<\/td>\n<td>Chatbot bank, asisten virtual<\/td>\n<td>Financial QnA Dataset<\/td>\n<\/tr>\n<tr>\n<td><strong>Pendidikan \/ EdTech<\/strong><\/td>\n<td>Chat belajar<\/td>\n<td>Chatbot tutor, QnA siswa<\/td>\n<td>DuoLingo Dataset, SQuAD<\/td>\n<\/tr>\n<tr>\n<td><\/td>\n<td>Teks kurikulum &amp; soal<\/td>\n<td>Generasi soal, sistem evaluasi<\/td>\n<td>AI2 Science Questions<\/td>\n<\/tr>\n<tr>\n<td><strong>Multimodal (Teks + Gambar)<\/strong><\/td>\n<td>Captioning, Visual QnA<\/td>\n<td>Bot penjelas produk, AI toko digital<\/td>\n<td>VisualQA (VQA), CLIP Dataset (OpenAI)<\/td>\n<\/tr>\n<tr>\n<td><strong>Umum (Pretraining)<\/strong><\/td>\n<td>Data web berskala besar<\/td>\n<td>Pretraining chatbot GPT, summarizer<\/td>\n<td>Common Crawl, The Pile, Wikipedia Dump<\/td>\n<\/tr>\n<\/tbody>\n<\/table>\n<h2><strong>Tantangan dalam Mengelola Dataset AI<\/strong><\/h2>\n<p>Meskipun penting, mengelola dataset AI bukan tanpa tantangan:<\/p>\n<ul>\n<li style=\"list-style-type: none;\">\n<ul>\n<li style=\"list-style-type: none;\">\n<ul>\n<li><strong>Volume besar<\/strong>: Data pelanggan bisa mencapai ribuan interaksi per hari.<\/li>\n<li><strong>Privasi &amp; legalitas<\/strong>: Mengelola data pelanggan harus patuh terhadap regulasi seperti GDPR atau UU PDP.<\/li>\n<li><strong>Labeling manual yang memakan waktu<\/strong>: Proses memberi tag pada data sering kali masih dilakukan manusia.<\/li>\n<li><strong>Kualitas data rendah<\/strong>: Banyak data mentah yang tidak bisa langsung digunakan.<\/li>\n<\/ul>\n<\/li>\n<\/ul>\n<\/li>\n<\/ul>\n<p>Solusinya? Gunakan tools otomatis dan integrasi yang bisa membantu bisnis mengelola data pelanggan secara lebih efektif dan legal.<\/p>\n<h2><strong>AI Chatbot &amp; Dataset Pelanggan: Kombinasi Cerdas untuk Bisnis<\/strong><\/h2>\n<p>Salah satu penerapan terbaik dari dataset AI adalah pada<a href=\"https:\/\/dazo.id\/blog\/digital-transformation\/software-ai-customer-service-terbaik\/\"> <strong>chatbot manajemen pelanggan<\/strong><\/a>. Dengan memanfaatkan data dari interaksi pelanggan sebelumnya seperti pertanyaan, komplain, hingga pola pembelian chatbot bisa merespons lebih cepat dan tepat sasaran.<\/p>\n<p>Contohnya:<\/p>\n<ul>\n<li style=\"list-style-type: none;\">\n<ul>\n<li style=\"list-style-type: none;\">\n<ul>\n<li>Pelanggan menanyakan promo \u2192 chatbot langsung kirim info diskon terbaru<\/li>\n<li>Pelanggan sering beli makanan pedas \u2192 chatbot tawarkan menu serupa saat launching produk baru<\/li>\n<li>Pelanggan batal beli \u2192 chatbot follow-up dengan penawaran eksklusif<\/li>\n<\/ul>\n<\/li>\n<\/ul>\n<\/li>\n<\/ul>\n<p>Semua ini bisa terjadi jika dataset yang dimiliki bersih, lengkap, dan terus diperbarui.<\/p>\n<p><a href=\"https:\/\/dazo.id\/pricing\/\"><img fetchpriority=\"high\" decoding=\"async\" class=\"aligncenter wp-image-402 size-full\" src=\"https:\/\/dazo.id\/blog\/wp-content\/uploads\/2025\/04\/1.png\" alt=\"banner promosi dazo 3\" width=\"2797\" height=\"394\" \/><\/a><\/p>\n<h2><strong>Kesimpulan<\/strong><\/h2>\n<p>Mengelola dan memanfaatkan dataset AI bukan hanya untuk perusahaan besar. UMKM pun bisa memulainya secara bertahap\u00a0 dari menyimpan data pelanggan, mencatat pola transaksi, hingga menggunakan chatbot berbasis AI yang belajar dari interaksi tersebut.<\/p>\n<p>Jika kamu sedang mencari cara praktis untuk memulai, <a href=\"https:\/\/dazo.id\/\"><strong>Dazo<\/strong><\/a> bisa jadi pilihan tepat. Dengan teknologi <a href=\"https:\/\/dazo.id\/ai-chat\/\"><strong>Chatbot AI<\/strong><\/a>, <strong>Dazo<\/strong> membantu UMKM mengelola interaksi pelanggan, CRM, hingga penjualan secara otomatis dan efisien.<\/p>\n<p>Jadi, daripada data pelanggan hanya jadi tumpukan chat di WhatsApp, kenapa tidak dimanfaatkan untuk mendorong konversi penjualan? Ingin tahu bagaimana <strong>Dazo<\/strong> bisa membantu bisnismu berkembang lewat AI?<\/p>\n<p><strong><a href=\"https:\/\/app.dazo.id\/register?trial=true\">Coba sekarang<\/a> dan rasakan manfaatnya!<\/strong><\/p>\n<p><!-- notionvc: 83f7074f-f60e-4bc8-8c71-ac4751c1dca5 --><\/p>\n","protected":false},"excerpt":{"rendered":"<p>Ketika mendengar istilah kecerdasan buatan (AI), mungkin yang terlintas di benak adalah chatbot, mobil otonom, atau rekomendasi belanja online. Tapi, dibalik semua itu, ada satu elemen penting yang menjadi fondasi dari AI: dataset. Dataset AI adalah kumpulan data yang digunakan untuk melatih model kecerdasan buatan agar dapat memahami pola, mengenali objek, menjawab pertanyaan, atau membuat &hellip; <\/p>\n<p class=\"link-more\"><a href=\"https:\/\/dazo.id\/blog\/digital-transformation\/dataset-ai\/\" class=\"more-link\">Continue reading<span class=\"screen-reader-text\"> &#8220;Apa Itu Dataset AI dan Mengapa Penting untuk Bisnis?&#8221;<\/span><\/a><\/p>\n","protected":false},"author":3,"featured_media":1618,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[4],"tags":[479,287,483,286,481,482,480],"class_list":["post-1617","post","type-post","status-publish","format-standard","has-post-thumbnail","hentry","category-digital-transformation","tag-data-untuk-kecerdasan-buatan","tag-dataset-multimodal","tag-dataset-untuk-umkm","tag-jenis-dataset-ai","tag-machine-learning-dataset","tag-manajemen-data-bisnis","tag-pengolahan-data-ai"],"rttpg_featured_image_url":{"full":["https:\/\/dazo.id\/blog\/wp-content\/uploads\/2025\/08\/96-scaled.webp",2560,1067,false],"landscape":["https:\/\/dazo.id\/blog\/wp-content\/uploads\/2025\/08\/96-scaled.webp",2560,1067,false],"portraits":["https:\/\/dazo.id\/blog\/wp-content\/uploads\/2025\/08\/96-scaled.webp",2560,1067,false],"thumbnail":["https:\/\/dazo.id\/blog\/wp-content\/uploads\/2025\/08\/96-150x150.webp",150,150,true],"medium":["https:\/\/dazo.id\/blog\/wp-content\/uploads\/2025\/08\/96-300x125.webp",300,125,true],"large":["https:\/\/dazo.id\/blog\/wp-content\/uploads\/2025\/08\/96-1024x427.webp",525,219,true],"1536x1536":["https:\/\/dazo.id\/blog\/wp-content\/uploads\/2025\/08\/96-1536x640.webp",1536,640,true],"2048x2048":["https:\/\/dazo.id\/blog\/wp-content\/uploads\/2025\/08\/96-2048x853.webp",2048,853,true],"twentyseventeen-featured-image":["https:\/\/dazo.id\/blog\/wp-content\/uploads\/2025\/08\/96-2000x1200.webp",2000,1200,true],"twentyseventeen-thumbnail-avatar":["https:\/\/dazo.id\/blog\/wp-content\/uploads\/2025\/08\/96-100x100.webp",100,100,true]},"rttpg_author":{"display_name":"Kanya T","author_link":"https:\/\/dazo.id\/blog\/author\/kanya\/"},"rttpg_comment":2,"rttpg_category":"<a href=\"https:\/\/dazo.id\/blog\/digital-transformation\/\" rel=\"category tag\">Digital Transformation<\/a>","rttpg_excerpt":"Ketika mendengar istilah kecerdasan buatan (AI), mungkin yang terlintas di benak adalah chatbot, mobil otonom, atau rekomendasi belanja online. Tapi, dibalik semua itu, ada satu elemen penting yang menjadi fondasi dari AI: dataset. Dataset AI adalah kumpulan data yang digunakan untuk melatih model kecerdasan buatan agar dapat memahami pola, mengenali objek, menjawab pertanyaan, atau membuat&hellip;","_links":{"self":[{"href":"https:\/\/dazo.id\/blog\/wp-json\/wp\/v2\/posts\/1617","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/dazo.id\/blog\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/dazo.id\/blog\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/dazo.id\/blog\/wp-json\/wp\/v2\/users\/3"}],"replies":[{"embeddable":true,"href":"https:\/\/dazo.id\/blog\/wp-json\/wp\/v2\/comments?post=1617"}],"version-history":[{"count":4,"href":"https:\/\/dazo.id\/blog\/wp-json\/wp\/v2\/posts\/1617\/revisions"}],"predecessor-version":[{"id":2496,"href":"https:\/\/dazo.id\/blog\/wp-json\/wp\/v2\/posts\/1617\/revisions\/2496"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/dazo.id\/blog\/wp-json\/wp\/v2\/media\/1618"}],"wp:attachment":[{"href":"https:\/\/dazo.id\/blog\/wp-json\/wp\/v2\/media?parent=1617"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/dazo.id\/blog\/wp-json\/wp\/v2\/categories?post=1617"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/dazo.id\/blog\/wp-json\/wp\/v2\/tags?post=1617"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}