Amazon Kendrası kullanıcıların aşağıdakiler gibi veri kaynaklarında saklanan bilgileri bulabilmesi için arama özelliklerini uygulamalarınızla entegre etmenize olanak tanıyan, kullanımı kolay bir akıllı arama hizmetidir. Amazon Basit Depolama Hizmeti , OneDrive ve Google Drive; SalesForce, SharePoint ve Service Now gibi uygulamalar; ve ilişkisel veritabanları gibi Amazon İlişkisel Veritabanı Hizmeti (Amazon RDS'si). Amazon Kendra bağlayıcılarını kullanmak, birden çok içerik deposundaki verileri Amazon Kendra dizininizle senkronize etmenize olanak tanır. Son kullanıcılar doğal dilde sorular sorduğunda Amazon Kendra, bağlamı anlamak ve en alakalı yanıtları döndürmek için makine öğrenimi (ML) algoritmalarını kullanır.
Amazon Kendra'nın S3 bağlayıcısı, bir S3 klasöründe depolanan belgelerin ve bunlarla ilişkili meta verilerin dizine eklenmesini destekler. Çoğu durumda, bir VPC içinde çalışan uygulamaların yalnızca belirli S3 klasörlerine erişimi olduğundan ve çoğu durumda bağlantının genel uç noktalara ulaşmak için internetten geçmemesi gerektiğinden emin olmak istersiniz. Bununla birlikte, birçok müşteri birden çok S3 klasörüne sahiptir ve bunlardan bazılarına Amazon S3 için VPC uç noktaları. Bu gönderide, VPC uç noktalarını kullanmak için güncellenmiş Amazon Kendra S3 bağlayıcısının VPC desteğiyle nasıl kullanılacağını açıklıyoruz.
Bu gönderi, yalnızca bir VPC içinden erişilebilen bir S3 klasöründe saklanan belgeleri birbirine bağlayarak Amazon Kendra kullanarak AWS'de bir kurumsal arama motoru oluşturmanıza yardımcı olacak adımları sağlar. Daha fazla bilgi için bakınız Amazon Kendra ile kurumsal aramayı geliştirme. Gönderi ayrıca Amazon S3 için bağlayıcınızı nasıl yapılandıracağınızı ve veri kaynağı içeriğiniz değiştiğinde dizininizin veri kaynağınızla nasıl eşitleneceğini yapılandıracağınızı gösterir.
Çözüme genel bakış
için üç ana iyileştirme vardır. Amazon Kendra S3 konektörü :
- VPC desteği – Konektör artık cihazınızın kullanılmasını destekliyor. Amazon Sanal Özel Bulut (Amazon VPC) ağları. Artık kullanarak Amazon S3'e güvenli bir şekilde bağlanabilirsiniz. Amazon S3 için VPC uç noktaları VPC bağlantısı, alt ağ ve güvenlik gruplarını belirterek.
- İki senkronizasyon modu – Amazon S3'teki bir veri kaynağının bir Amazon Kendra dizinine eşitlenmesini planladığınızda, artık Tam eşitleme modunda veya Yeni, değiştirilmiş ve silinmiş belge eşitleme modunda çalıştırmayı seçebilirsiniz. Tam eşitleme modunda, eşitleme her çalıştırıldığında, taramak üzere yapılandırıldığı kök yol altındaki her klasördeki nesneleri tarar ve tüm belgeleri yeniden alır. Tam yenileme, silmenize ve yeni bir veri kaynağı oluşturmanıza gerek kalmadan dizini sıfırlamanıza olanak tanır. Yeni, değiştirilmiş ve silinmiş belge eşitleme modunda, eşitleme işi her çalıştırıldığında, yalnızca son taramadan bu yana eklenen, değiştirilen veya silinen nesneleri işler. Artımlı taramalar, mevcut veri kaynaklarına düzenli olarak yeni nesneler ekleyen veri kümeleriyle kullanıldığında çalışma süresini ve maliyeti azaltabilir.
- Belgeler için ek dahil etme ve hariç tutma kalıpları: Ön eklere ek olarak, dokümanların indeksinizden dahil edilmesi veya hariç tutulması için kalıplar sunuyoruz. Desteklenen iki kalıp türü, Unix stili glob veya dosya türleridir. Artık belirli klasörleri dahil etmek veya klasörleri, dosya türlerini veya belirli dosyaları veri kaynağınızdan hariç tutmak için bir normal ifade kalıbı ekleyebilirsiniz. Bu, farklı kategorilere, sınıflandırmalara ve dosya türlerine ait içerik içeren paylaşılan veri havuzları için yararlı olabilir.
Önkoşullar
Bu izlenecek yol için aşağıdaki ön koşullara sahip olmalısınız:
Belge havuzunuzu oluşturun ve yapılandırın
Amazon Kendra'da dizin oluşturmadan önce belgeleri bir S3 klasörüne yüklemeniz gerekir. Bu bölüm, bir S3 klasörü oluşturmak, dosyaları almak ve klasöre yüklemek için talimatlar içerir. Bu bölümdeki tüm adımları tamamladıktan sonra Amazon Kendra'nın kullanabileceği bir veri kaynağına sahip olursunuz.
- Üzerinde AWS Yönetim Konsolu, Bölge listesinde, ABD Doğu (K. Virginia) veya istediğiniz herhangi bir Bölgeyi seçin. Amazon Kendra şurada mevcuttur:.
- Klinik Hizmetler.
- Altında Depolama, seçmek S3.
- Amazon S3 konsolunda şunu seçin: Grup oluştur.
- Altında Genel yapılandırma, Aşağıdaki bilgileri sağlayın:
- Paket adı için, girmek
kendrapost-{your account id}.
- Bölge için, Amazon Kendra dizininizi dağıtmak için kullandığınız Bölgeyi seçin (bu gönderi
us-east-1
). - Altında Kova ayarları, için Genel Erişimi Engelle, her şeyi varsayılan değerlerle bırakın.
- Paket adı için, girmek
- Altında Gelişmiş ayarlar, her şeyi varsayılan değerlerle bırakın.
- Klinik Grup oluştur.
- İndir AWS_Whitepapers.zip ve dosyaları sıkıştırın.
- Amazon S3 konsolunda az önce oluşturduğunuz klasörü seçin ve Foto Yükle.
- Klasörleri yükleyin
Best Practices
,Databases
,General
, veMachine Learning
sıkıştırılmış dosyadan.
Kovanızın içinde şimdi dört klasör görmelisiniz.
Veri kaynağı ekle
A veri kaynağı indeksleme için belgeleri saklayan bir konumdur. Aramaların kaynak havuzlardaki yeni, güncellenmiş veya silinmiş belgeleri doğru şekilde yansıttığından emin olmak için veri kaynaklarını bir Amazon Kendra dizini ile otomatik olarak senkronize edebilirsiniz.
Bu bölümdeki tüm adımları tamamladıktan sonra, Amazon Kendra'ya bağlı bir veri kaynağınız olacaktır. Daha fazla bilgi için bakınız Bir veri kaynağından belge ekleme.
Devam etmeden önce dizin oluşturmanın tamamlandığından ve dizinin şu şekilde göründüğünden emin olun: Aktif. Daha fazla bilgi için bakınız Dizin Oluşturma.
- Amazon Kendra konsolunda dizininize gidin (bu gönderi için,
kendra-blog-index
). - Üzerinde
kendra-blog-index
sayfasını seçin Veri kaynakları ekle. - Amazon S3 altında, Bağlayıcı ekle.
Amazon Kendra'nın desteklediği farklı veri kaynakları hakkında daha fazla bilgi için bkz. Bir veri kaynağından belge ekleme.
- içinde Veri kaynağı ayrıntılarını belirtin bölümü Veri kaynağı adı, girmek
aws_white_paper
. - İçin Açıklama, girmek
AWS White Paper documentation
. - Klinik Sonraki.
Şimdi bir oluştur AWS Kimlik ve Erişim Yönetimi Amazon Kendra için (IAM) rolü.
- içinde Erişim ve güvenliği tanımlayın sayfası, için IAM rolü bölümü, seçim Yeni bir rol oluştur.
- Rol adı için girin
source-role
(rol adınız ön eklidirAmazonKendra-
). - içinde VPC'yi ve güvenliği yapılandırın bölümünü seçin VPC, ve girin Alt ağlar ve VPC güvenlik grupları.
Amazon Kendra'nızı Amazon Sanal Özel Bulutunuza bağlama hakkında daha fazla bilgi için bkz. Amazon Kendra'yı VPC kullanacak şekilde yapılandırma.
- Klinik Sonraki.
- içinde Senkronizasyon ayarlarını yapılandırın sayfası, için Veri kaynağı konumunu girin, oluşturduğunuz S3 klasörünü girin:
kendrapost-{your account id}
. - Ayrılmak Meta veri dosyaları öneki klasör konumu boş.
Varsayılan olarak, meta veri dosyaları belgelerle aynı dizinde saklanır. Bu dosyaları farklı bir klasöre yerleştirmek isterseniz önek ekleyebilirsiniz. Daha fazla bilgi için, bkz Amazon S3 belge meta verileri.
- İçin şifre çözme anahtarı seçin, seçimini kaldırın.
- İçin Ek yapılandırma, belirli klasörleri veya dosyaları dahil etmek veya hariç tutmak için bir model ekleyebilirsiniz. Bu gönderi için varsayılan değerleri koruyun.
- İçin Senkronizasyon modu seçmek Yeni, değiştirilmiş veya silinmiş belgeler senkronizasyonu.
- İçin Sıklık, seçmek Talep üzerine çalıştırın.
Bu adım, veri kaynağının Amazon Kendra dizini ile eşitlenme sıklığını tanımlar.
- Klinik Sonraki.
- içinde Alan eşlemelerini ayarla sayfasında, varsayılan değerleri koruyun.
- Klinik Sonraki.
- Üzerinde İnceleyin ve oluşturun sayfasını seçin Veri kaynağı ekleyin.
- Kendra dizininize geri dönün.
- Lütfen seçin Veri kaynağı, Daha sonra seçmek Şimdi senkronize et belgeleri Amazon Kendra dizini ile senkronize etmek için.
Bu işlemin süresi dizine eklediğiniz belge sayısına bağlıdır. Bu kullanım durumunda, 15 dakika sürebilir ve ardından senkronizasyonun başarılı olduğunu belirten bir mesaj görmelisiniz. Senkronizasyon çalıştırma geçmişi bölümünde, 40 belgenin senkronize edildiğini görebilirsiniz.
Amazon Kendra dizininiz artık doğal dil sorguları için hazır. Dizininizi aradığınızda Amazon Kendra, arama sorgunuza en doğru yanıtları vermek için sağlanan tüm verileri ve meta verileri kullanır. Amazon Kendra konsolunda, Dizine eklenen içeriği ara. Sorgu alanında "Hangi AWS hizmetinin 11 dokuz dayanıklılığı var?" gibi bir sorguyla başlayın.
Dizini sorgulama hakkında daha fazla bilgi için bkz. Dizin Sorgulama
Dizini aramak için veri kaynağı değişikliklerini senkronize edin
Veri kaynağınız tüm yeni, değiştirilmiş veya silinmiş verileri senkronize edecek şekilde ayarlanmıştır. Veri kaynağınızı Amazon Kendra'daki bir dizinle artımlı olarak senkronize etmeden önce yeni belgeleri bir S3 klasörüne yüklemeniz gerekir.
- Amazon S3 konsolunda az önce oluşturduğunuz klasörü seçin ve Foto Yükle.
- Klasörleri yükleyin
Security
veWell_Architected
sıkıştırılmış dosyadan.
Artık S3 grubuna eklenen yeni belgeleri senkronize edebilirsiniz:
- Amazon Kendra konsolunda şunu seçin: Veri kaynakları ve ardından S3 veri kaynağınızı seçin.
- Klinik Şimdi senkronize et.
Bu işlemin süresi dizine eklediğiniz belge sayısına bağlıdır. Bu kullanım durumunda, 15 dakika sürebilir ve ardından senkronizasyonun başarılı olduğunu belirten bir mesaj görmelisiniz.
içinde Senkronizasyon çalıştırma geçmişi bölümünde 20 belgenin senkronize edildiğini görebilirsiniz.
Veri kaynağını yeniden dizinle
Veri kaynağının eski bilgilere sahip olduğu bir senaryoda, artık veri kaynağını silip yeni bir veri kaynağı oluşturmak zorunda kalmadan yeniden endeksleyebilirsiniz. Eşitleme modunu değiştirmek ve veri kaynağını yeniden dizine eklemek için aşağıdaki adımları tamamlayın:
- Amazon Kendra konsolunda, Veri kaynakları ve ardından S3 veri kaynağınızı seçin.
- Üzerinde İşlemler menü seç Düzen.
- Klinik Sonraki taşınmak 3. Adım – Senkronizasyon ayarları sayfasını yapılandırın.
- Senkronizasyon modu için seçin Tam Senkronizasyon
- İçin Sıklık, seçmek Talep üzerine çalıştırın.
- Klinik Sonraki.
- içinde Alan eşlemelerini ayarla sayfasında, varsayılan değerleri koruyun.
- Klinik Sonraki.
- Üzerinde İnceleyin ve oluşturun sayfasını seçin Güncelleme.
Artık S3 grubuna eklenen yeni belgeleri senkronize edebilirsiniz.
- Amazon Kendra konsolunda şunu seçin: Veri kaynakları ve ardından S3 veri kaynağınızı seçin.
- Klinik Şimdi senkronize et.
içinde Senkronizasyon çalıştırma geçmişi bölümünde, değiştirilen sütunun altında önceki eşitleme durumundan bağımsız olarak tüm belgelerin eşitlendiğini görebilirsiniz.
Temizlemek
İleride ücret ödemekten kaçınmak ve kullanılmayan rolleri ve ilkeleri temizlemek için oluşturduğunuz kaynakları silin:
- Amazon Kendra dizininde şunu seçin: Dizinler Gezinti bölmesinde.
- Oluşturduğunuz dizini seçin ve İşlemler menü seç Sil.
- Silme işlemini onaylamak için istendiğinde Sil'i girin ve seçin. Sil.
Onay mesajını alana kadar bekleyin; işlem 15 dakika kadar sürebilir.
- Amazon S3 konsolunda, S3 grubunu sil.
- IAM konsolunda, karşılık gelen IAM rollerini silin.
Sonuç
Bu gönderide, bir internet ağ geçidi veya Ağ Adres Çevirisi (NAT) cihazı gerektirmeyen güvenli bir Amazon S3 bağlantısı kullanarak bir kurumsal arama hizmetini devreye almak için Amazon Kendra'yı nasıl kullanacağınızı öğrendiniz. Senkronizasyon modunu kullanarak belgeleriniz için daha hızlı senkronizasyonları etkinleştirebilirsiniz.
Bahsetmediğimiz birçok ek özellik var. Örneğin:
- Amazon Kendra dizininiz için kullanıcı tabanlı erişim denetimini etkinleştirebilir ve önceden yapılandırmış olduğunuz erişim denetimlerine göre belgelere erişimi kısıtlayabilirsiniz.
- Nesne özniteliklerini Amazon Kendra dizini öznitelikleriyle eşleyebilir ve bunları özellik, arama ve arama sonuçlarında görüntüleme için etkinleştirebilirsiniz.
- Amazon Kendra sekmeli aramayı kullanarak web sayfalarından (HTML tabloları) hızlı bir şekilde bilgi bulabilirsiniz.
Amazon Kendra hakkında daha fazla bilgi edinmek için bkz. Amazon Kendra Geliştirici Kılavuzu.
Yazarlar Hakkında
Maran Chandrasekaran Amazon Web Services'ta kurumsal müşterilerimizle birlikte çalışan bir Kıdemli Çözüm Mimarıdır. İş dışında seyahat etmeyi çok seviyor.
Arjun Agrawal AWS'de Yazılım Mühendisi, şu anda kurumsal bir arama motorunda bir Amazon Kendra ekibiyle çalışıyor. Yeni teknoloji ve gerçek dünya problemlerini çözme konusunda tutkulu. İş dışında yürüyüş yapmayı ve seyahat etmeyi sever.
- SEO Destekli İçerik ve Halkla İlişkiler Dağıtımı. Bugün Gücünüzü Artırın.
- Plato blok zinciri. Web3 Metaverse Zekası. Bilgi Güçlendirildi. Buradan Erişin.
- Kaynak: https://aws.amazon.com/blogs/machine-learning/search-for-answers-accurately-using-amazon-kendra-s3-connector-with-vpc-support/
- 10
- 100
- 11
- 7
- a
- Hakkımızda
- erişim
- ulaşılabilir
- Hesap
- doğru
- tam olarak
- karşısında
- katma
- ilave
- Ek
- adres
- Sonra
- algoritmalar
- Türkiye
- veriyor
- zaten
- Amazon
- Amazon Kendrası
- Amazon RDS'si
- Amazon Web Servisleri
- ve
- cevaplar
- uygulamaları
- ilişkili
- öznitelikleri
- otomatik olarak
- mevcut
- AWS
- Arka
- merkezli
- temel
- önce
- yetenekleri
- dava
- durumlarda
- kategoriler
- belli
- değişiklikler
- yükler
- seçim
- Klinik
- sınıflandırma
- bulut
- Sütun
- tamamlamak
- tamamladıktan
- Onaylamak
- Sosyal medya
- bağlantı
- bağ
- konsolos
- içermek
- içeren
- içerik
- bağlam
- devam eden
- kontrol
- kontroller
- uyan
- Ücret
- kapak
- yaratmak
- çevrimiçi kurslar düzenliyorlar.
- oluşturma
- Şu anda
- Müşteriler
- veri
- veritabanı
- veritabanları
- veri kümeleri
- Varsayılan
- tanımlar
- gösteriyor
- bağlıdır
- dağıtmak
- tanımlamak
- Geliştirici
- cihaz
- farklı
- ekran
- belge
- evraklar
- Değil
- sürücü
- dayanıklılık
- Doğu
- kolay kullanımlı
- etkinleştirmek
- sağlar
- Motor
- mühendis
- Keşfet
- kuruluş
- Her
- her şey
- örnek
- mevcut
- Özellikler
- alan
- fileto
- dosyalar
- bulmak
- takip etme
- Sıklık
- itibaren
- tam
- gelecek
- geçit
- almak
- Grubun
- sahip olan
- yardım et
- Yürüyüş
- tarih
- Ne kadar
- Nasıl Yapılır
- Ancak
- HTML
- HTTPS
- Kimlik
- iyileştirmeler
- in
- dahil
- içerme
- indeks
- bilgi
- talimatlar
- entegre
- Akıllı
- Internet
- tanıtım
- bakılmaksızın
- IT
- İş
- tutmak
- dil
- Soyad
- ÖĞRENİN
- öğrendim
- öğrenme
- Ayrılmak
- bağlantılı
- Liste
- yük
- yer
- makine
- makine öğrenme
- Ana
- yapmak
- yönetim
- çok
- harita
- Menü
- mesaj
- Metadata
- dakika
- ML
- Moda
- modları
- değiştirilmiş
- değiştirmek
- Daha
- çoğu
- hareket
- çoklu
- isim
- Doğal (Madenden)
- Gezin
- Navigasyon
- gerek
- ağ
- ağlar
- yeni
- numara
- nesne
- nesneler
- dışında
- kendi
- bölmesi
- kâğıt
- tutkulu
- yol
- model
- desen
- yer
- Platon
- Plato Veri Zekası
- PlatoVeri
- politikaları
- Çivi
- önkoşullar
- önceki
- özel
- sorunlar
- süreç
- Süreçler
- sağlamak
- sağlanan
- sağlar
- halka açık
- Sorular
- hızlı
- hızla
- ulaşmak
- hazır
- Gerçek dünya
- azaltmak
- yansıtmak
- bölge
- düzenli
- uygun
- gerektirir
- Kaynaklar
- kısıtlamak
- Sonuçlar
- dönüş
- Rol
- rolleri
- kök
- koşmak
- koşu
- satış ekibi
- aynı
- senaryo
- program
- Ara
- arama motoru
- Bölüm
- güvenli
- Güvenli
- güvenlik
- kıdemli
- hizmet
- Hizmetler
- set
- ayarlar
- Paylaşılan
- meli
- Gösteriler
- Basit
- beri
- So
- Yazılım
- Yazılım Mühendisi
- Çözümler
- Çözme
- biraz
- Kaynak
- kaynaklar
- özel
- başlama
- Durum
- adım
- Basamaklar
- hafızası
- saklı
- mağaza
- stil
- alt
- altağlar
- başarılı
- böyle
- destek
- destekli
- Destekler
- senkronizasyon
- Bizi daha iyi tanımak için
- takım
- Teknoloji
- The
- Kaynak
- ve bazı Asya
- üç
- zaman
- için
- Çeviri
- seyahat
- türleri
- altında
- anlamak
- unix
- kullanılmayan
- güncellenmiş
- us
- kullanım
- kullanım durumu
- kullanıcılar
- Değerler
- Virjinya
- Sanal
- örneklerde
- ağ
- web hizmetleri
- hangi
- beyaz
- Beyaz kağıt
- içinde
- olmadan
- İş
- çalışma
- Sen
- zefirnet
- zip