Amazon Kendra este un serviciu de căutare inteligent alimentat de machine learning (ML). Amazon Kendra vă ajută să agregați cu ușurință conținut dintr-o varietate de depozite de conținut într-un index centralizat care vă permite să căutați rapid toate datele companiei dvs. și să găsiți cel mai precis răspuns. Drupal este un software de gestionare a conținutului. Este folosit pentru a crea multe dintre site-urile web și aplicațiile pe care le folosim în fiecare zi. Drupal are un set grozav de caracteristici, cum ar fi crearea simplă de conținut, performanță de încredere și securitate. Multe organizații folosesc Drupal pentru a-și stoca conținutul. Una dintre cerințele cheie pentru mulți clienți care folosesc Drupal este capacitatea de a găsi ușor și în siguranță informații precise în toate documentele din sursa de date.
Cu conectorul Amazon Kendra Drupal, puteți indexa conținutul Drupal, puteți filtra tipurile de conținut personalizat pe care doriți să le indexați și puteți căuta cu ușurință prin conținutul Drupal folosind căutarea inteligentă Amazon Kendra.
Această postare vă arată cum să utilizați conectorul Amazon Kendra Drupal pentru a configura conectorul ca sursă de date pentru indexul dvs. Amazon Kendra și pentru a căuta documentele Drupal. Pe baza configurației conectorului Drupal, puteți sincroniza conectorul pentru a accesa cu crawlere și a indexa diferite tipuri de conținut Drupal, cum ar fi bloguri și wiki-uri. De asemenea, conectorul ingerează informațiile listei de control al accesului (ACL) pentru fiecare fișier. Informațiile ACL sunt utilizate pentru filtrarea contextului utilizatorului, unde rezultatele căutării pentru o interogare sunt filtrate în funcție de ceea ce utilizatorul are acces autorizat.
Cerințe preliminare
Pentru a încerca conectorul Amazon Kendra pentru Drupal folosind această postare ca referință, aveți nevoie de următoarele:
Configurați sursa de date folosind conectorul Amazon Kendra pentru Drupal
Pentru a adăuga o sursă de date la indexul dvs. Amazon Kendra utilizând conectorul Drupal, puteți utiliza un index existent sau creați un nou index. Apoi parcurgeți următorii pași. Pentru mai multe informații despre acest subiect, consultați Ghidul dezvoltatorului Amazon Kendra.
- Pe consola Amazon Kendra, deschideți indexul și alegeți Surse de date în panoul de navigare.
- Alege Adăugați o sursă de date.
- În Drupal, alege Adăugați conector.
- În Specificați detaliile sursei de date secțiune, introduceți un nume și o descriere și alegeți Pagina Următoare →.
- Pe Definiți accesul și securitatea secțiune, pt Adresa URL a gazdei Drupal, introduceți adresa URL a site-ului Drupal.
- Pentru a configura certificatele SSL, puteți crea un certificat autosemnat pentru această configurare folosind
openssl x509 -in mydrupalsite.pem -out drupal.crt
comanda și stochează certificatul într-un Serviciul Amazon de stocare simplă (Amazon S3) găleată. Pentru mai multe detalii despre generarea unei chei private și a certificatului, consultați Generarea certificatelor. - Alege Răsfoiți S3 și alegeți găleata S3 cu certificatul SSL.
- În Autentificare, aveți două opțiuni:
- Utilizați Secrets Manager pentru a crea noi acreditări de autentificare Drupal. Aveți nevoie de un nume de utilizator și o parolă de administrator Drupal (în plus, un ID de client și un secret de client pentru autentificarea OAuth 2.0).
- Utilizați un secret Secrets Manager existent care are acreditările de autentificare Drupal pe care doriți să le acceseze conectorul (în plus, un ID de client și un secret de client pentru autentificarea OAuth 2.0).
- Alege Salvați și adăugați secret.
- Pentru Rolul IAM, alege Creați un nou rol sau alegeți un rol IAM existent configurat cu politici IAM corespunzătoare pentru a accesa secretul Secrets Manager, indexul Amazon Kendra și sursa de date.
A se referi la Roluri IAM pentru surse de date pentru permisiunile necesare pentru rolul IAM.
- Alege Pagina Următoare →.
- În Configurați setările de sincronizare secțiune, selectați Actualităţi, Pagini de bază, Blocuri de bază, Tipuri de conținut personalizate, și Blocuri personalizate împreună cu opțiuni de accesare cu crawlere a comentariilor și a atașamentelor după cum este necesar.
- Opțional, introduceți modelele de includere/excludere pentru titlurile entităților.
- Furnizați informații despre domeniul dvs. de sincronizare (numai complet sau delta) și specificați programul de rulare.
- Alege Pagina Următoare →.
- În Setați mapările câmpurilor secțiunea, adăugați câmpuri Drupal personalizate pe care doriți să le sincronizați și mapările respective ale câmpurilor Amazon Kendra. Câmpurile obligatorii sunt mapate în prealabil de Amazon Kendra.
- Alege Pagina Următoare →.
- Examinați setările de configurare și salvați sursa de date.
- Alege Sincronizează acum pe sursa de date creată pentru a începe sincronizarea datelor cu Amazon Kendra Index.
Timpul necesar pentru accesarea cu crawlere și sincronizarea conținutului în Amazon Kendra variază în funcție de volumul de conținut și de debit.
Acum puteți căuta conținutul Drupal indexat folosind consola de căutare sau o aplicație de căutare. Opțional, puteți căuta cu ACL cu următorii pași suplimentari.
- Accesați pagina de index pe care ați creat-o și pe Control acces utilizatorl fila, alege Editeaza setarile.
- În Setări de control acces, Selectați Da, păstrați valorile implicite pentru Nume de utilizator și grupuri, alege JSON pentru Token de tipși păstrați extinderea grupului de utilizatori ca Nici unul.
- Pe pagina următoare, păstrați valorile implicite (sau modificați-le în funcție de cerințele dvs. de capacitate) și alegeți Actualizează.
Efectuați o căutare inteligentă cu Amazon Kendra
Înainte de a încerca să căutați pe consola Amazon Kendra sau să utilizați API-ul, asigurați-vă că sincronizarea sursei de date este completă. Pentru a verifica, vizualizați sursele de date și verificați dacă ultima sincronizare a avut succes.
- Pentru a începe căutarea, pe consola Amazon Kendra, alegeți Căutați conținut indexat în panoul de navigare.
Sunteți redirecționat către consola de căutare Amazon Kendra. Acum puteți căuta informații din documentele Drupal pe care le-ați indexat folosind Amazon Kendra.
- Pentru această postare, căutăm un document stocat în sursa de date Drupal.
- Extinde Testați interogarea cu un token de acces Și alegeți Aplicați token.
- Pentru Nume de utilizator, introduceți adresa de e-mail asociată contului dvs. Drupal.
- Alege Aplică.
Acum utilizatorul poate vedea numai conținutul la care are acces pe baza numelui de utilizator sau a grupurilor specificate. În exemplul nostru, utilizatorul Drupal cu test@amazon.com
e-mailul nu are acces la niciun document de pe Drupal, așa că niciunul nu este afișat.
Limitări
Rețineți următoarele limitări atunci când utilizați această soluție:
- Tipurile de conținut (cum ar fi articolul sau pagina de bază) care nu sunt asociate cu nicio vizualizare nu pot fi accesate cu crawlere.
- Dacă un administrator nu are acces la un bloc, atunci nu puteți accesa cu crawlere datele din bloc.
- Corpul documentului pentru articol, pagină de bază, bloc de bază, tip de conținut definit de utilizator și tip de bloc definit de utilizator este afișat în format HTML. Dacă conținutul HTML nu este bine format, atunci etichetele legate de HTML vor apărea în corpul documentului și, prin urmare, pot fi văzute în rezultatele căutării Amazon Kendra. Este același lucru cu comentariile articolului, paginii de bază, blocului de bază, tipului de conținut definit de utilizator, tipului de bloc definit de utilizator.
- Tipul de conținut sau tipul de bloc fără descriere sau corp nu va fi injectat în indexul Amazon Kendra, deoarece există o validare pe partea SDK-ului Amazon Kendra. Cu toate acestea, Drupal vă permite să creați tipul de conținut fără descriere sau corp. Doar comentariile și atașamentele respectivelor tipuri de conținut sau blocuri (dacă există) vor fi injectate în indexul Amazon Kendra.
A curăța
Pentru a evita costurile viitoare, curățați resursele pe care le-ați creat ca parte a acestei soluții. Dacă ați creat un nou index Amazon Kendra în timp ce testați această soluție, ștergeți-l. Dacă ați adăugat doar o nouă sursă de date folosind conectorul Amazon Kendra pentru Drupal, ștergeți acea sursă de date. Ștergeți toți utilizatorii IAM creați.
Concluzie
Cu conectorul Amazon Kendra Drupal, organizația dvs. poate căuta conținut stocat într-un site Drupal în siguranță, folosind căutarea inteligentă susținută de Amazon Kendra. În această postare, v-am prezentat integrarea, dar există multe caracteristici suplimentare pe care nu le-am acoperit, cum ar fi următoarele:
- Puteți mapa câmpuri suplimentare la atributele indexului Amazon Kendra și le puteți activa pentru fațetare, căutare și afișare în rezultatele căutării
- Puteți integra sursa de date Drupal cu capacitatea de îmbogățire personalizată a documentelor (CDE) în Amazon Kendra pentru a realiza o logică suplimentară de mapare a atributelor și chiar transformarea personalizată a conținutului în timpul ingerării
Pentru a afla mai multe despre posibilitățile cu Drupal, consultați Ghidul dezvoltatorului Amazon Kendra.
Pentru mai multe informații despre alți conectori încorporați Amazon Kendra pentru surse de date populare, consultați Conectori Amazon Kendra .
Despre autori
Channa Basavaraja este arhitect senior de soluții la AWS, cu peste 2 decenii de experiență în construirea de soluții de afaceri distribuite. Domeniile sale de profunzime se încadrează în învățarea automată, dezvoltarea aplicației/mobile, arhitectura bazată pe evenimente și IoT/edge computing.
Yuanhua Wang este inginer software la AWS cu peste 15 ani de experiență în industria tehnologiei. Interesele sale sunt arhitectura software și construirea de instrumente pe cloud computing.
- Distribuție de conținut bazat pe SEO și PR. Amplifică-te astăzi.
- PlatoData.Network Vertical Generative Ai. Împuterniciți-vă. Accesați Aici.
- PlatoAiStream. Web3 Intelligence. Cunoștințe amplificate. Accesați Aici.
- PlatoESG. carbon, CleanTech, Energie, Mediu inconjurator, Solar, Managementul deșeurilor. Accesați Aici.
- PlatoHealth. Biotehnologie și Inteligență pentru studii clinice. Accesați Aici.
- Sursa: https://aws.amazon.com/blogs/machine-learning/intelligently-search-drupal-content-using-amazon-kendra/
- :are
- :este
- :nu
- :Unde
- $UP
- 100
- 11
- ani 15
- 15%
- 20
- 247
- 7
- a
- capacitate
- Despre Noi
- acces
- Cont
- precis
- peste
- adăuga
- adăugat
- Suplimentar
- În plus,
- adresa
- admin
- agregat
- TOATE
- permite
- de-a lungul
- de asemenea
- Amazon
- Amazon Kendra
- Amazon Web Services
- an
- și
- răspunde
- Orice
- api
- apărea
- aplicație
- aplicatii
- adecvat
- arhitectură
- SUNT
- domenii
- articol
- AS
- asociate
- At
- atribute
- Autentificare
- autor
- autorizat
- evita
- AWS
- bazat
- de bază
- BE
- deoarece
- Bloca
- bloguri
- corp
- construi
- Clădire
- construit-in
- afaceri
- dar
- by
- CAN
- nu poti
- capacitate
- Capacitate
- centralizat
- certificat
- Certificatele
- Schimbare
- verifica
- Alege
- client
- Cloud
- cloud computing
- comentarii
- Completă
- tehnica de calcul
- Configuraţie
- configurat
- Consoleze
- conţinut
- Tipuri de conținut
- conținut
- context
- Control
- Cheltuieli
- acoperi
- crea
- a creat
- scrisori de acreditare
- personalizat
- clienţii care
- de date
- zi
- zeci de ani
- Mod implicit
- Deltă
- adâncime
- descriere
- detalii
- dev
- Dezvoltator
- diferit
- Afişa
- afișat
- distribuite
- document
- documente
- Nu
- în timpul
- fiecare
- cu ușurință
- permite
- inginer
- Intrați
- Afacere
- entitate
- Chiar
- Fiecare
- in fiecare zi
- exemplu
- exista
- existent
- expansiune
- experienţă
- Caracteristică
- DESCRIERE
- camp
- Domenii
- Fișier
- filtru
- Găsi
- următor
- Pentru
- format
- din
- Complet
- viitor
- generator
- mare
- Grupului
- Avea
- ajută
- lui
- gazdă
- Cum
- Cum Pentru a
- Totuși
- HTML
- http
- HTTPS
- ID
- if
- in
- index
- indexate
- industrie
- informații
- integra
- integrare
- Inteligent
- interese
- în
- introdus
- IT
- jpg
- A pastra
- Cheie
- Nume
- AFLAȚI
- învăţare
- Permite
- ca
- limitări
- Listă
- logică
- maşină
- masina de învățare
- face
- administrare
- manager
- multe
- Hartă
- cartografiere
- ML
- mai mult
- cele mai multe
- nume
- Navigare
- Nevoie
- necesar
- Nou
- următor
- Nici unul
- acum
- oauth
- of
- on
- ONE
- afară
- deschide
- Opţiuni
- or
- organizație
- organizații
- Altele
- al nostru
- afară
- peste
- pagină
- pâine
- parte
- Parolă
- modele
- Efectua
- performanță
- permisiuni
- Plato
- Informații despre date Platon
- PlatoData
- Politicile
- Popular
- posibilităţile de
- Post
- alimentat
- privat
- cheie privată
- repede
- trimite
- referință
- legate de
- de încredere
- necesar
- Cerinţe
- Resurse
- respectiv
- REZULTATE
- reține
- Rol
- rolurile
- Alerga
- acelaşi
- Economisiți
- programa
- domeniu
- sdk
- Caută
- căutare
- Secret
- secrete
- Secțiune
- în siguranță,
- securitate
- vedea
- văzut
- senior
- serviciu
- Servicii
- set
- setări
- configurarea
- Emisiuni
- parte
- simplu
- teren
- So
- Software
- Inginer Software
- soluţie
- soluţii
- Sursă
- Surse
- deschidere
- specificată
- SSL
- Certificat SSL
- Începe
- paşi
- depozitare
- stoca
- stocate
- simplu
- de succes
- astfel de
- sigur
- sincronizare
- Tehnologia
- Testarea
- decât
- acea
- Blocul
- lor
- Lor
- apoi
- Acolo.
- prin urmare
- ei
- acest
- Prin
- debit
- timp
- titluri
- la
- Unelte
- subiect
- Transformare
- încerca
- Două
- tip
- Tipuri
- URL-ul
- utilizare
- utilizat
- Utilizator
- utilizatorii
- folosind
- validare
- Valori
- varietate
- verifica
- Vizualizare
- volum
- vrea
- a fost
- we
- web
- servicii web
- site-uri web
- Ce
- cand
- în timp ce
- voi
- cu
- fără
- ani
- Tu
- Ta
- zephyrnet