Dukungan format data baru yang diperluas di Amazon Kendra

Dukungan format data baru yang diperluas di Amazon Kendra

Perusahaan di seluruh dunia ingin memanfaatkan berbagai sumber data untuk menerapkan pengalaman penelusuran terpadu bagi karyawan dan pelanggan akhir mereka. Mempertimbangkan besarnya volume data yang perlu diperiksa dan diindeks, kecepatan pengambilan, skalabilitas solusi, dan performa pencarian menjadi faktor kunci untuk dipertimbangkan saat memilih solusi pencarian cerdas perusahaan. Selain itu, sumber data unik ini terdiri dari repositori konten terstruktur dan tidak terstrukturโ€”termasuk berbagai jenis fileโ€”yang dapat menyebabkan masalah kompatibilitas.

AmazonKendra adalah layanan pencarian yang sangat akurat dan cerdas yang memungkinkan pengguna untuk mencari jawaban atas pertanyaan mereka dari data Anda yang tidak terstruktur dan terstruktur menggunakan pemrosesan bahasa alami dan algoritme pencarian lanjutan. Ini mengembalikan jawaban spesifik atas pertanyaan, memberi pengguna pengalaman yang mirip dengan berinteraksi dengan pakar manusia.

Hari ini, Amazon Kendra meluncurkan tujuh opsi dukungan format data tambahan untuk Anda gunakan. Hal ini memungkinkan Anda untuk dengan mudah mengintegrasikan sumber data yang ada dan melakukan pencarian cerdas di beberapa repositori konten.

Dalam posting ini, kami membahas format data baru yang didukung dan cara menggunakannya.

Format data baru yang didukung

Sebelumnya, Amazon Kendra dokumen pendukung yang meliputi teks terstruktur dalam bentuk tanya jawab, serta teks tidak terstruktur dalam bentuk file HTML, presentasi Microsoft PowerPoint, dokumen Microsoft Word, dokumen teks biasa, dan PDF.

Dengan peluncuran ini, Amazon Kendra kini menawarkan dukungan untuk tujuh format data tambahan:

  • Format Teks Kaya (RTF)
  • Notasi Objek JavaScript (JSON)
  • Penurunan harga (MD)
  • Nilai yang dipisahkan koma (CSV)
  • Microsoft Excel (MS Excel)
  • Bahasa Markup yang Dapat Diperluas (XML)
  • Transformasi Bahasa Stylesheet yang Dapat Diperluas (XSLT)

Pengguna Amazon Kendra dapat mencerna dokumen ini dengan format data berbeda ke indeks mereka dengan dua cara berikut:

Ikhtisar solusi

Di bagian berikut, kami menelusuri langkah-langkah untuk menambahkan dokumen dari sumber data dan melakukan pencarian pada dokumen tersebut.

Diagram berikut menunjukkan arsitektur solusi kami.

Dukungan format data baru yang diperluas di Amazon Kendra PlatoBlockchain Data Intelligence. Pencarian Vertikal. Ai.

Untuk menguji solusi ini untuk salah satu format yang didukung, Anda perlu menggunakan data Anda sendiri. Anda dapat menguji dengan mengunggah dokumen dengan format yang sama atau berbeda ke bucket S3.

Buat indeks Amazon Kendra

Untuk petunjuk pembuatan indeks Amazon Kendra, lihat Membuat indeks.

Anda dapat melewati langkah ini jika Anda memiliki indeks yang sudah ada untuk digunakan pada demo ini.

Unggah dokumen ke bucket S3 dan serap ke indeks menggunakan konektor S3

Selesaikan langkah-langkah berikut untuk menyambungkan bucket S3 ke indeks Anda:

  1. Buat ember S3 untuk menyimpan dokumen Anda.
  2. Buat folder bernama sampel-data.
  3. Unggah dokumen yang ingin Anda uji ke folder tersebut.
  4. Di konsol Amazon Kendra, buka indeks Anda dan pilih Sumber data.
  5. Pilih Tambahkan sumber data.
  6. Bawah Sumber data yang tersedia, pilih S3 Dan pilihlah Tambahkan Konektor.
  7. Masukkan nama untuk konektor Anda (seperti Demo_S3_connector) dan pilih Selanjutnya.
  8. Pilih Jelajahi S3 dan pilih bucket S3 tempat Anda mengunggah dokumen.
  9. Untuk Peran IAM, buat peran baru.
  10. Untuk Atur jadwal jalankan sinkronisasi, pilih Jalankan sesuai permintaan.
  11. Pilih Selanjutnya.
  12. pada Tinjau dan buat halaman, pilih Tambahkan sumber data.
  13. Setelah proses pembuatan selesai, pilih Sinkronkan Sekarang.

Sekarang setelah Anda menyerap beberapa dokumen, Anda dapat menavigasi ke konsol pencarian bawaan untuk menguji kueri.

Cari dokumen Anda dengan konsol pencarian Amazon Kendra

Di konsol Amazon Kendra, pilih Cari konten yang diindeks di panel navigasi.

Berikut adalah contoh hasil dari pencarian berbagai jenis dokumen:

  • RTF โ€“ Masukkan data dalam format RTF yang diunggah ke bucket S3 dan sinkronkan sumber data:

Dukungan format data baru yang diperluas di Amazon Kendra PlatoBlockchain Data Intelligence. Pencarian Vertikal. Ai.

Tangkapan layar berikut menunjukkan hasil pencarian.

Dukungan format data baru yang diperluas di Amazon Kendra PlatoBlockchain Data Intelligence. Pencarian Vertikal. Ai.

  • JSON โ€“ Masukkan data dalam format JSON yang diunggah ke bucket S3 dan sinkronkan sumber data:

Dukungan format data baru yang diperluas di Amazon Kendra PlatoBlockchain Data Intelligence. Pencarian Vertikal. Ai.

Tangkapan layar berikut menunjukkan hasil pencarian.

Dukungan format data baru yang diperluas di Amazon Kendra PlatoBlockchain Data Intelligence. Pencarian Vertikal. Ai.

  • Penurunan harga โ€“ Masukkan data dalam format MD yang diunggah ke bucket S3 dan sinkronkan sumber data:

Dukungan format data baru yang diperluas di Amazon Kendra PlatoBlockchain Data Intelligence. Pencarian Vertikal. Ai.

Tangkapan layar berikut menunjukkan hasil pencarian.

Dukungan format data baru yang diperluas di Amazon Kendra PlatoBlockchain Data Intelligence. Pencarian Vertikal. Ai.

  • CSV โ€“ Masukkan data dalam format CSV yang diunggah ke bucket S3 dan sinkronkan sumber data:

Dukungan format data baru yang diperluas di Amazon Kendra PlatoBlockchain Data Intelligence. Pencarian Vertikal. Ai.

Tangkapan layar berikut menunjukkan hasil pencarian.

Dukungan format data baru yang diperluas di Amazon Kendra PlatoBlockchain Data Intelligence. Pencarian Vertikal. Ai.

  • Excel โ€“ Masukkan data dalam format Excel yang diunggah ke bucket S3 dan sinkronkan sumber data:

Dukungan format data baru yang diperluas di Amazon Kendra PlatoBlockchain Data Intelligence. Pencarian Vertikal. Ai.

Tangkapan layar berikut menunjukkan hasil pencarian.

Dukungan format data baru yang diperluas di Amazon Kendra PlatoBlockchain Data Intelligence. Pencarian Vertikal. Ai.

  • XML โ€“ Masukkan data dalam format XML yang diunggah ke bucket S3 dan sinkronkan sumber data:

Dukungan format data baru yang diperluas di Amazon Kendra PlatoBlockchain Data Intelligence. Pencarian Vertikal. Ai.

Tangkapan layar berikut menunjukkan hasil pencarian.

Dukungan format data baru yang diperluas di Amazon Kendra PlatoBlockchain Data Intelligence. Pencarian Vertikal. Ai.

  • XSLT โ€“ Masukkan data dalam format XSLT yang diunggah ke bucket S3 dan sinkronkan sumber data:

Dukungan format data baru yang diperluas di Amazon Kendra PlatoBlockchain Data Intelligence. Pencarian Vertikal. Ai.

Tangkapan layar berikut menunjukkan hasil pencarian.

Dukungan format data baru yang diperluas di Amazon Kendra PlatoBlockchain Data Intelligence. Pencarian Vertikal. Ai.

Membersihkan

Untuk menghindari timbulnya biaya di masa mendatang, bersihkan sumber daya yang Anda buat sebagai bagian dari solusi ini menggunakan langkah-langkah berikut:

  1. Di konsol Amazon Kendra, pilih Indeks di panel navigasi.
  2. Pilih indeks yang berisi sumber data yang akan dihapus.
  3. Di panel navigasi, pilih Sumber data.
  4. Pilih sumber data yang akan dihapus, lalu pilih Delete.

Saat Anda menghapus sumber data, Amazon Kendra menghapus semua informasi yang tersimpan tentang sumber data. Amazon Kendra menghapus semua data dokumen yang disimpan dalam indeks, dan semua riwayat dan metrik yang dijalankan terkait dengan sumber data. Menghapus sumber data tidak menghapus dokumen asli dari penyimpanan Anda.

  1. Di konsol Amazon Kendra, pilih Indeks di panel navigasi.
  2. Pilih indeks yang akan dihapus, lalu pilih Delete.

Lihat Menghapus indeks dan sumber data lebih lanjut.

  1. Pada konsol Amazon S3, pilih Ember di panel navigasi.
  2. Pilih keranjang yang ingin Anda hapus, lalu pilih Delete.
  3. Masukkan nama bucket untuk mengonfirmasi penghapusan, lalu pilih Hapus ember.

Jika keranjang berisi objek apa pun, Anda akan menerima peringatan kesalahan. Kosongkan keranjang sebelum menghapusnya dengan memilih tautan di pesan kesalahan dan ikuti petunjuk di Ember kosong halaman. Kemudian kembali ke Hapus ember halaman dan hapus keranjang.

  1. Untuk memverifikasi bahwa Anda telah menghapus keranjang, buka Ember halaman dan masukkan nama keranjang yang Anda hapus. Jika keranjang tidak dapat ditemukan, penghapusan Anda berhasil.

Lihat Menghapus halaman keranjang lebih lanjut.

Kesimpulan

Dalam postingan ini, kami membahas format data baru yang sekarang didukung oleh Amazon Kendra. Selain itu, kami membahas cara menggunakan Amazon Kendra untuk mencerna dan melakukan pencarian pada jenis dokumen baru yang disimpan di bucket S3 ini. Untuk mempelajari lebih lanjut tentang berbagai format data yang didukung, lihat Jenis dokumen.

Kami telah memperkenalkan Anda pada dasar-dasarnya, tetapi ada banyak fitur tambahan yang tidak kami bahas dalam postingan ini, seperti berikut ini:

  • Anda dapat mengaktifkan kontrol akses berbasis pengguna untuk indeks Amazon Kendra Anda dan membatasi akses ke pengguna dan grup yang Anda konfigurasikan.
  • Anda dapat memetakan bidang tambahan ke atribut indeks Amazon Kendra dan mengaktifkannya untuk faceting, pencarian, dan tampilan di hasil pencarian.
  • Anda dapat mengintegrasikan berbagai konektor sumber data pihak ketiga seperti Service Now dan Salesforce dengan kemampuan Custom Document Enrichment (CDE) di Amazon Kendra untuk melakukan logika pemetaan atribut tambahan dan bahkan transformasi konten khusus selama penyerapan. Untuk daftar lengkap konektor yang didukung, lihat konektor.

Untuk mempelajari tentang kemungkinan ini dan lebih banyak lagi, lihat Panduan Pengembang Amazon Kendra.


Tentang penulis

Dukungan format data baru yang diperluas di Amazon Kendra PlatoBlockchain Data Intelligence. Pencarian Vertikal. Ai.Rishabh Yadav adalah arsitek Solusi Mitra di AWS dengan latar belakang luas dalam penawaran DevOps dan Keamanan di AWS. Dia bekerja dengan mitra ASEAN untuk memberikan panduan tentang adopsi cloud perusahaan dan ulasan arsitektur bersama dengan membangun praktik AWS melalui penerapan Kerangka Kerja Arsitektur Baik. Di luar pekerjaan, ia suka menghabiskan waktunya di lapangan olah raga dan bermain game FPS.

Dukungan format data baru yang diperluas di Amazon Kendra PlatoBlockchain Data Intelligence. Pencarian Vertikal. Ai.Kruthi Jayasimha Rao adalah Arsitek Solusi Mitra dengan fokus pada AI dan ML. Dia memberikan panduan teknis kepada Mitra AWS dalam mengikuti praktik terbaik untuk membangun solusi yang aman, tangguh, dan sangat tersedia di AWS Cloud.

Dukungan format data baru yang diperluas di Amazon Kendra PlatoBlockchain Data Intelligence. Pencarian Vertikal. Ai.Keerthi Kumar Kallur adalah Insinyur Pengembangan Perangkat Lunak di AWS. Dia telah bersama tim AWS Kendra sejak 2 tahun terakhir dan mengerjakan berbagai fitur serta pelanggan. Di waktu luangnya, ia suka melakukan kegiatan outdoor seperti hiking, olahraga seperti voli.

Stempel Waktu:

Lebih dari Pembelajaran Mesin AWS