Amazon Kendra este un serviciu de căutare inteligentă ușor de utilizat, care vă permite să integrați capabilitățile de căutare cu aplicațiile dvs., astfel încât utilizatorii să poată găsi informații stocate în surse de date precum Serviciul Amazon de stocare simplă , OneDrive și Google Drive; aplicații precum SalesForce, SharePoint și Service Now; și baze de date relaționale precum Serviciul de baze de date relaționale Amazon (Amazon RDS). Utilizarea conectorilor Amazon Kendra vă permite să sincronizați datele din mai multe depozite de conținut cu indexul dvs. Amazon Kendra. Când utilizatorii finali pun întrebări în limbaj natural, Amazon Kendra utilizează algoritmi de învățare automată (ML) pentru a înțelege contextul și pentru a returna cele mai relevante răspunsuri.
Conectorul S3 al Amazon Kendra acceptă documentele de indexare și metadatele asociate acestora stocate într-o găleată S3. Este adesea cazul în care doriți să vă asigurați că aplicațiile care rulează într-un VPC au acces doar la anumite compartimente S3 și, în multe cazuri, conexiunea nu trebuie să traverseze internetul pentru a ajunge la punctele finale publice. Cu toate acestea, mulți clienți dețin mai multe găleți S3, dintre care unele sunt accesibile prin Puncte finale VPC pentru Amazon S3. În această postare, descriem cum să utilizați conectorul Amazon Kendra S3 actualizat cu suport VPC pentru utilizarea punctelor finale VPC.
Această postare oferă pașii pentru a vă ajuta să creați un motor de căutare pentru întreprinderi pe AWS utilizând Amazon Kendra prin conectarea documentelor stocate într-o găleată S3, accesibilă numai dintr-un VPC. Pentru mai multe informații, vezi îmbunătățirea căutării întreprinderilor cu Amazon Kendra. Postarea demonstrează, de asemenea, cum să vă configurați conectorul pentru Amazon S3 și să configurați modul în care indexul se sincronizează cu sursa de date atunci când conținutul sursei de date se modifică.
Prezentare generală a soluției
Există trei îmbunătățiri principale ale Conector Amazon Kendra S3 :
- Suport VPC – Acum conectorul acceptă utilizarea dvs Cloud virtual virtual Amazon rețele (Amazon VPC). Acum vă puteți conecta în siguranță la Amazon S3 folosind Puncte finale VPC pentru Amazon S3 prin specificarea conexiunii VPC, a subrețelei și a grupurilor de securitate.
- Două moduri de sincronizare - Când programați sincronizarea unei surse de date în Amazon S3 cu un index Amazon Kendra, acum puteți alege să rulați în modul Sincronizare completă sau în modul Sincronizare document nou, modificat și șters. În modul de sincronizare completă, de fiecare dată când se execută sincronizarea, scanează obiectele din fiecare folder din calea rădăcină pentru care a fost configurată să acceseze cu crawlere și reingerează toate documentele . Actualizarea completă vă permite să resetați indexul fără a fi nevoie să ștergeți și să creați o nouă sursă de date. În modul de sincronizare a documentelor noi, modificate și șterse, de fiecare dată când se execută lucrarea de sincronizare, procesează numai obiectele care au fost adăugate, modificate sau șterse de la ultima accesare cu crawlere. Explorările incrementale cu crawlere pot reduce timpul de rulare și costurile atunci când sunt utilizate cu seturi de date care atașează în mod regulat obiecte noi la sursele de date existente.
- Modele suplimentare de includere și excludere pentru documente: Pe lângă prefixe, introducem modele pentru includerea sau excluderea documentelor din indexul dvs. Două tipuri de modele acceptate sunt tipurile de fișiere sau glob în stil Unix. Acum puteți adăuga un model de expresie regulată pentru a include anumite foldere sau pentru a exclude dosare, tipuri de fișiere sau anumite fișiere din sursa dvs. de date. Acest lucru poate fi util pentru depozitele de date partajate care conțin conținut care aparține diferitelor categorii, clasificări și tipuri de fișiere.
Cerințe preliminare
Pentru această prezentare generală, ar trebui să aveți următoarele condiții prealabile:
Creați și configurați depozitul de documente
Înainte de a putea crea un index în Amazon Kendra, trebuie să încărcați documente într-o găleată S3. Această secțiune conține instrucțiuni pentru a crea o găleată S3, a obține fișierele și a le încărca în găleată. După parcurgerea tuturor pașilor din această secțiune, aveți o sursă de date pe care Amazon Kendra o poate folosi.
- Pe Consola de administrare AWS, în lista Regiune, alegeți Statele Unite ale Americii de Est (N. Virginia) sau orice regiune la alegere Amazon Kendra este disponibil în.
- Alege Servicii.
- În Depozitare, alege S3.
- În consola Amazon S3, alegeți Creați găleată.
- În Configurație generală, Furnizati urmatoarele informatii:
- Pentru numele găleții, introduce
kendrapost-{your account id}.
- Pentru Regiune, alegeți aceeași regiune pe care o utilizați pentru a vă implementa indexul Amazon Kendra (această postare folosește
us-east-1
). - În Setări găleată, pentru Blocați accesul public, lăsați totul cu valorile implicite.
- Pentru numele găleții, introduce
- În setările avansate, lăsați totul cu valorile implicite.
- Alege Creați găleată.
- Descarcă AWS_Whitepapers.zip și dezarhivați fișierele.
- Pe consola Amazon S3, selectați găleata pe care tocmai ați creat-o și alegeți Încărcați.
- Încărcați folderele
Best Practices
,Databases
,General
, șiMachine Learning
din fișierul dezarhivat.
În interiorul găleții dvs., ar trebui să vedeți acum patru dosare.
Adăugați o sursă de date
A sursă de date este o locație care stochează documentele pentru indexare. Puteți sincroniza automat sursele de date cu un index Amazon Kendra pentru a vă asigura că căutările reflectă corect documentele noi, actualizate sau șterse din arhivele sursă.
După ce parcurgeți toți pașii din această secțiune, veți avea o sursă de date conectată la Amazon Kendra. Pentru mai multe informații, vezi Adăugarea de documente dintr-o sursă de date.
Înainte de a continua, asigurați-vă că crearea indexului este completă și că indexul arată ca Activ. Pentru mai multe informații, vedeți Crearea unui index.
- Pe consola Amazon Kendra, navigați la indexul dvs. (pentru această postare,
kendra-blog-index
). - Pe
kendra-blog-index
pagina, alege Adăugați surse de date. - Sub Amazon S3, alegeți Adăugați conector.
Pentru mai multe informații despre diferitele surse de date acceptate de Amazon Kendra, consultați Adăugarea de documente dintr-o sursă de date.
- În Specificați detaliile sursei de date secțiune, pt Numele sursei de date, introduce
aws_white_paper
. - Pentru Descriere, introduce
AWS White Paper documentation
. - Alege Pagina Următoare →.
Acum creați un Gestionarea identității și accesului AWS (IAM) pentru Amazon Kendra.
- În Definiți accesul și securitatea pagina, pt Rolul IAM secțiune, pentru a alege Creați un nou rol.
- Pentru Nume rol, introduceți
source-role
(numele rolului tău este prefixat cuAmazonKendra-
). - În Configurați VPC și securitatea secțiunea, alegeți VPC, și introduceți-vă Subrețele și grupuri de securitate VPC.
Pentru mai multe informații despre conectarea Amazon Kendra la Amazon Virtual Private Cloud, consultați Configurarea Amazon Kendra pentru a utiliza un VPC.
- Alege Pagina Următoare →.
- În Configurați setările de sincronizare pagina, pt Introduceți locația sursei de date, introduceți compartimentul S3 pe care l-ați creat:
kendrapost-{your account id}
. - Părăsi Fișierele metadate prefix locația folderului gol.
În mod implicit, fișierele cu metadate sunt stocate în același director ca și documentele. Dacă doriți să plasați aceste fișiere într-un folder diferit, puteți adăuga un prefix. Pentru mai multe informații, vezi Metadatele documentului Amazon S3.
- Pentru Selectați cheia de decriptare, lăsați-l deselectat.
- Pentru Configurație suplimentară, puteți adăuga un model pentru a include sau a exclude anumite foldere sau fișiere. Pentru această postare, păstrați valorile implicite.
- Pentru Mod sincronizare alege Sincronizarea documentelor noi, modificate sau șterse.
- Pentru Frecvență, alege Fugi la cerere.
Acest pas definește frecvența cu care sursa de date este sincronizată cu indexul Amazon Kendra.
- Alege Pagina Următoare →.
- În Setați mapările câmpurilor pagina, păstrați valorile implicite.
- Alege Pagina Următoare →.
- Pe Examinați și creați pagina, alege Adăugați o sursă de date.
- Navigați înapoi la indexul Kendra.
- Alege momentul oportun în care să interveniți. Ținta ta sigur îți va oferi multe! Poate să fie un discurs, o conferință, o cascadorie publicitară sau alte evenimente importante. Informează-te (de exemplu pe site-ul companiei, pe Facebook sau pe mass-media, generalizat sau specializat) și află când sunt aceste evenimente programate și unde. Poți să le spargi/distrugi petrecerea prin a apărea acolo cu un afiș sau mesajul principal al discursului poate fi modificat prin punerea de întrebări arzătoare.
Sursă de date, Apoi alegeți Sincronizează acum pentru a sincroniza documentele cu indexul Amazon Kendra.
Durata acestui proces depinde de numărul de documente pe care le indexați. Pentru acest caz de utilizare, poate dura 15 minute, după care ar trebui să vedeți un mesaj că sincronizarea a avut succes. În secțiunea Sincronizare a istoricului rulării, puteți vedea că 40 de documente au fost sincronizate.
Indexul tău Amazon Kendra este acum pregătit pentru interogări în limbaj natural. Când căutați în index, Amazon Kendra utilizează toate datele și metadatele furnizate pentru a returna cele mai precise răspunsuri la interogarea dvs. de căutare. Pe consola Amazon Kendra, alegeți Căutați conținut indexat. În câmpul de interogare, începeți cu o interogare precum „Care serviciu AWS are 11 nouă durabilitate?”
Pentru mai multe informații despre interogarea indexului, consultați Interogarea unui index
Sincronizați modificările sursei de date pentru a căuta în index
Sursa dvs. de date este configurată pentru a sincroniza orice date noi, modificate sau șterse. Înainte de a vă putea sincroniza sursa de date în mod incremental cu un index în Amazon Kendra, trebuie să încărcați documente noi într-un compartiment S3.
- Pe consola Amazon S3, selectați găleata pe care tocmai ați creat-o și alegeți Încărcați.
- Încărcați folderele
Security
șiWell_Architected
din fișierul dezarhivat.
Acum puteți sincroniza noile documente adăugate în compartimentul S3:
- Pe consola Amazon Kendra, alegeți Surse de date apoi selectați sursa de date S3.
- Alege Sincronizați acum.
Durata acestui proces depinde de numărul de documente pe care le indexați. Pentru acest caz de utilizare, poate dura 15 minute, după care ar trebui să vedeți un mesaj că sincronizarea a avut succes.
În Istoricul rulării sincronizării secțiunea, puteți vedea că au fost sincronizate 20 de documente.
Reindexați sursa de date
Într-un scenariu în care sursa de date are informații învechite, acum puteți reindexa sursa de date fără a fi nevoie să ștergeți și să creați o nouă sursă de date. Pentru a modifica modul de sincronizare și a reindexa sursa de date, parcurgeți următorii pași:
- Pe consola Amazon Kendra, alegeți Surse de date apoi selectați sursa de date S3.
- Pe Acţiuni meniu, alegeți Edit.
- Alege Pagina Următoare → a se deplasa către Pasul 3 – Configurați pagina de setări de sincronizare.
- Pentru modul Sincronizare, selectați Sincronizare completă.
- Pentru Frecvență, alege Fugi la cerere.
- Alege Pagina Următoare →.
- În Setați mapările câmpurilor pagina, păstrați valorile implicite.
- Alege Pagina Următoare →.
- Pe Examinați și creați pagina, alege Actualizează.
Acum puteți sincroniza noile documente adăugate în găleata S3.
- Pe consola Amazon Kendra, alegeți Surse de date apoi selectați sursa de date S3.
- Alege Sincronizați acum.
În Istoricul rulării sincronizării secțiunea, puteți vedea că toate documentele au fost sincronizate, indiferent de starea anterioară de sincronizare în coloana modificată.
A curăța
Pentru a evita costurile viitoare și pentru a curăța rolurile și politicile neutilizate, ștergeți resursele pe care le-ați creat:
- Pe indexul Amazon Kendra, alegeți Indexuri în panoul de navigare.
- Selectați indexul pe care l-ați creat și pe Acţiuni meniu, alegeți Șterge.
- Pentru a confirma ștergerea, introduceți Ștergere când vi se solicită și alegeți Șterge.
Așteptați până când primiți mesajul de confirmare; procesul poate dura până la 15 minute.
- Pe consola Amazon S3, ștergeți găleata S3.
- Pe consola IAM, ștergeți rolurile IAM corespunzătoare.
Concluzie
În această postare, ați învățat cum să utilizați Amazon Kendra pentru a implementa un serviciu de căutare întreprindere folosind o conexiune securizată la Amazon S3 care nu necesită un gateway de internet sau un dispozitiv NAT (Network Address Translation). Puteți activa sincronizări mai rapide pentru documente folosind modul de sincronizare.
Există multe funcții suplimentare pe care nu le-am acoperit. De exemplu:
- Puteți activa controlul accesului bazat pe utilizator pentru indexul dvs. Amazon Kendra și puteți restricționa accesul la documente pe baza controalelor de acces pe care le-ați configurat deja.
- Puteți mapa atributele obiectului la atributele indexului Amazon Kendra și le puteți activa pentru fațetare, căutare și afișare în rezultatele căutării.
- Puteți găsi rapid informații din pagini web (tabele HTML) utilizând căutarea tabelară Amazon Kendra
Pentru a afla mai multe despre Amazon Kendra, consultați Ghidul dezvoltatorului Amazon Kendra.
Despre Autori
Maran Chandrasekaran este arhitect senior de soluții la Amazon Web Services, lucrând cu clienții noștri întreprinderi. În afara serviciului, îi place să călătorească.
Arjun Agrawal este inginer software la AWS, lucrând în prezent cu o echipă Amazon Kendra pe un motor de căutare pentru întreprinderi. Este pasionat de noile tehnologii și de rezolvarea problemelor din lumea reală. În afara serviciului, îi place să facă drumeții și să călătorească.
- Distribuție de conținut bazat pe SEO și PR. Amplifică-te astăzi.
- Platoblockchain. Web3 Metaverse Intelligence. Cunoștințe amplificate. Accesați Aici.
- Sursa: https://aws.amazon.com/blogs/machine-learning/search-for-answers-accurately-using-amazon-kendra-s3-connector-with-vpc-support/
- 10
- 100
- 11
- 7
- a
- Despre Noi
- acces
- accesibil
- Cont
- precis
- precis
- peste
- adăugat
- plus
- Suplimentar
- adresa
- După
- algoritmi
- TOATE
- permite
- deja
- Amazon
- Amazon Kendra
- Amazon RDS
- Amazon Web Services
- și
- răspunsuri
- aplicatii
- asociate
- atribute
- în mod automat
- disponibil
- AWS
- înapoi
- bazat
- bază
- înainte
- capacități
- caz
- cazuri
- categorii
- sigur
- Modificări
- taxe
- alegere
- Alege
- clasificare
- Cloud
- Coloană
- Completă
- completarea
- Confirma
- Conectați
- Conectarea
- conexiune
- Consoleze
- conţine
- conține
- conţinut
- context
- continuarea
- Control
- controale
- Corespunzător
- A costat
- acoperi
- crea
- a creat
- creaţie
- În prezent
- clienţii care
- de date
- Baza de date
- baze de date
- seturi de date
- Mod implicit
- defineste
- demonstrează
- depinde de
- implementa
- descrie
- Dezvoltator
- dispozitiv
- diferit
- Afişa
- document
- documente
- Nu
- conduce
- durabilitate
- Est
- ușor de folosit
- permite
- permite
- Motor
- inginer
- Intrați
- Afacere
- Fiecare
- tot
- exemplu
- existent
- DESCRIERE
- camp
- Fișier
- Fişiere
- Găsi
- următor
- Frecvență
- din
- Complet
- viitor
- poartă
- obține
- Grupului
- având în
- ajutor
- Excursie pe jos
- istorie
- Cum
- Cum Pentru a
- Totuși
- HTML
- HTTPS
- Identitate
- îmbunătățiri
- in
- include
- includere
- index
- informații
- instrucțiuni
- integra
- Inteligent
- Internet
- introducerea
- indiferent
- IT
- Loc de munca
- A pastra
- limbă
- Nume
- AFLAȚI
- învățat
- învăţare
- Părăsi
- legate de
- Listă
- încărca
- locaţie
- maşină
- masina de învățare
- Principal
- face
- administrare
- multe
- Hartă
- Meniu
- mesaj
- Metadata
- minute
- ML
- mod
- moduri de
- modificată
- modifica
- mai mult
- cele mai multe
- muta
- multiplu
- nume
- Natural
- Navigaţi
- Navigare
- Nevoie
- reţea
- rețele
- Nou
- număr
- obiect
- obiecte
- exterior
- propriu
- pâine
- Hârtie
- pasionat
- cale
- Model
- modele
- Loc
- Plato
- Informații despre date Platon
- PlatoData
- Politicile
- Post
- premise
- precedent
- privat
- probleme
- proces
- procese
- furniza
- prevăzut
- furnizează
- public
- Întrebări
- mai repede
- repede
- ajunge
- gata
- lumea reală
- reduce
- reflecta
- regiune
- regulat
- necesita
- Resurse
- restrânge
- REZULTATE
- reveni
- Rol
- rolurile
- rădăcină
- Alerga
- funcţionare
- Salesforce
- acelaşi
- scenariu
- programa
- Caută
- motor de cautare
- Secțiune
- sigur
- în siguranță,
- securitate
- senior
- serviciu
- Servicii
- set
- setări
- comun
- să
- Emisiuni
- simplu
- întrucât
- So
- Software
- Inginer Software
- soluţii
- Rezolvarea
- unele
- Sursă
- Surse
- specific
- Începe
- Stare
- Pas
- paşi
- depozitare
- stocate
- magazine
- stil
- subrețea
- subrețele
- de succes
- astfel de
- a sustine
- Suportat
- Sprijină
- sincronizare
- Lua
- echipă
- Tehnologia
- Sursa
- lor
- trei
- timp
- la
- Traducere
- călătorie
- Tipuri
- în
- înţelege
- unix
- nefolosit
- actualizat
- us
- utilizare
- carcasa de utilizare
- utilizatorii
- Valori
- Virginia
- Virtual
- walkthrough
- web
- servicii web
- care
- alb
- hartie alba
- în
- fără
- Apartamente
- de lucru
- Tu
- Ta
- zephyrnet
- Zip