Amazon Kendra er en intelligent søketjeneste drevet av maskinlæring (ML), som gjør det mulig for organisasjoner å gi relevant informasjon til kunder og ansatte når de trenger det.
Amazon Kendra bruker ML-algoritmer for å gjøre det mulig for brukere å bruke naturlige språkspørringer for å søke etter informasjon spredt over flere datakilder i en bedrift, inkludert vanlige dokumentlagringssystemer som Microsoft OneDrive.
OneDrive er en nettskylagringstjeneste som lar deg være vert for innholdet ditt og få det automatisk synkronisert på tvers av flere enheter. Amazon Kendra kan indeksere dokumentformater som Microsoft OneNote, HTML, PDF, Microsoft Word, Microsoft PowerPoint, Microsoft Excel, Rich Text, JSON, XML, CSV, XSLT og ren tekst.
Vi er glade for å kunngjøre at vi har oppdatert OneDrive-kontakten for Amazon Kendra for å legge til enda flere funksjoner. For eksempel har vi lagt til støtte for å søke i OneNote-dokumenter. I tillegg kan du nå velge å bruke identitets- eller ACL-informasjon for å gjøre søkene dine mer detaljerte.
Koblingen hjelper til med å indeksere dokumenter og deres tilgangskontrollinformasjon for å begrense søkeresultatene til kun de dokumentene brukeren har tilgang til. For å vise søkeresultatene basert på brukertilgangsrettigheter og kun bruke brukerinformasjonen, gir koblingen en identitetssøkerobot for å laste hovedinformasjon, for eksempel bruker- og gruppetilordninger, inn i et hovedlager.
I dette innlegget viser vi hvordan du konfigurerer flere datakilder i Amazon Kendra for å gi et sentralt sted å søke på tvers av dokumentlageret ditt.
Løsningsoversikt
For vår løsning viser vi hvordan du indekserer et OneDrive-lager eller -mappe ved å bruke Amazon Kendra-koblingen for OneDrive. Løsningen består av følgende trinn:
- Opprett og konfigurer en app på Microsoft Azure Portal og få autentiseringslegitimasjonen.
- Opprett en OneDrive-datakilde via Amazon Kendra-konsollen.
- Indekser dataene i OneDrive-depotet.
- Kjør en prøvespørring for å få informasjonen.
- Filtrer søket etter brukere eller grupper.
Forutsetninger
For å prøve ut Amazon Kendra-kontakten for OneDrive, trenger du følgende:
Konfigurer en Azure-applikasjon og tildel tilkoblingstillatelser
Før vi setter opp OneDrive-datakilden, trenger vi noen få detaljer om OneDrive-depotet. Fullfør følgende trinn:
- Logg på Azure.
- Etter å ha logget på med kontoen din, velg Appregistreringer, velg deretter Ny registrering.
- Gi søknaden din et passende navn og registrer søknaden.
- Samle inn informasjon om klient-ID, leietaker-ID og andre detaljer om applikasjonen.
- For å få en klienthemmelighet, velg Legg til et sertifikat eller en hemmelighet etter Kundelegitimasjon.
- Velg Ny klienthemmelighet og gi riktig beskrivelse og utløp.
- Legg merke til verdiene for klient-id, leietaker-id og hemmelig ID. Vi bruker disse for å autentisere OAuth2-applikasjonen.
- naviger til Applikasjon, velg API-tillatelser i navigasjonsruten, og velg Legg til en tillatelse.
- Velg Microsoft Graph.
- Under Søknadstillatelser, Tast inn filet i søkefeltet og under Filer, velg Filer. Les. Alle.
- Velg Legg til tillatelser
- På samme måte legger du til følgende tillatelser på Microsoft Graph alternativ for applikasjonen du opprettet:
Group.Read.All
Notes.Read.All
Etter fullføring vil API-tillatelsene se ut som følgende skjermbilde.
Konfigurer Amazon Kendra-kontakten for OneDrive
For å konfigurere Amazon Kendra-kontakten, fullfør følgende trinn:
- På Amazon Kendra-konsollen velger du Opprett en indeks.
- Til Indeksnavn, skriv inn et navn for indeksen (f.eks.
my-onedrive-index
). - Skriv inn en valgfri beskrivelse.
- Velg Lag en ny rolle.
- Til Rollenavn, skriv inn et IAM-rollenavn.
- Konfigurer valgfrie krypteringsinnstillinger og tagger
- Velg neste
- på Konfigurer brukertilgangskontroll seksjon, velg Ja etter Adgangskontroll innstillinger.
- Til Pollett type, velg JSON på rullegardinmenyen.
- La de gjenværende verdiene stå som standardverdier.
- Velg neste
Før vi går til neste konfigurasjonstrinn, må vi gi Amazon Kendra en rolle som har tillatelsene som er nødvendige for å koble til nettstedet. Disse inkluderer tillatelse til å hente og dekryptere AWS Secrets Manager-hemmeligheten som inneholder applikasjons-IDen og den hemmelige nøkkelen som er nødvendig for å koble til OneDrive-nettstedet.
- Åpne en annen fane for AWS-kontoen, og på IAM-konsollen, naviger til rollen du opprettet tidligere (f.eks.
AmazonKendra-us-west-2-onedrive
). - Velg Legg til tillatelser og Lag inline policy.
- Til Service, velg Kendra.
- Til handlingervelge Skriv og spesifiser
BatchPutDocument
. - Til Ressurser, velg Alle ressurser.
- Velg Gjennomgå retningslinjene.
- Til Navn, skriv inn et navn (for eksempel,
BatchPutPolicy
). - Velg Opprett policy.
- Legg til denne policyen i rollen du opprettet.
- I tillegg fester du
SecretsManagerReadWrite
AWS administrerte politikken til rollen - Gå tilbake til Amazon Kendra-fanen.
- Plukke ut Utviklerutgave Og velg Opprett.
Dette oppretter og sprer IAM-rollen og oppretter deretter Amazon Kendra-indeksen, som kan ta opptil 30 minutter.
- Gå tilbake til Amazon Kendra-konsollen, velg Datakilder i navigasjonsruten, og velg Legg til datakilde.
- Under OneDrive-kontakt V2.0, velg Legg til kontakt.
- Til Navn på datakilde, skriv inn et navn (for eksempel,
my-onedrive
). - Skriv inn en valgfri beskrivelse.
- Velg neste.
- Til OneDrive-leie-ID, skriv inn leietaker-ID-en du samlet inn tidligere.
- Til Konfigurer VPC og sikkerhetsgruppe, la standarden (Ingen VPC).
- Hold Identitetssøkerobot er på valgt. Dette importerer identitetsinformasjon til indeksen.
- For IAM-rolle, velg Lag en ny rolle.
- Skriv inn et rollenavn, for eksempel
AmazonKendra-us-west-2-onedrive
, velg deretter neste. - på Autentisering delen velger Opprett og legg til en hemmelighet.
- Lag en hemmelighet med
clientId
ogclientSecret
som nøkler. - Legg til deres respektive verdier med informasjonen du samlet inn tidligere.
- Velg neste.
- på Konfigurer synkroniseringsinnstillinger seksjonen legger du til OneDrive-brukerne hvis dokumenter du vil indeksere.
- Velg synkroniseringsmodus for indeksen. For dette innlegget velger vi Synkronisering av nytt, endret eller slettet innhold.
- Velg frekvensen for indeksering som Kjør på forespørsel, velg deretter Neste.
Feltkartlegging lar deg angi søkbarhet og relevans for felt. For eksempel lastUpdatedAt
feltet kan sortere eller øke rangeringen av dokumentene basert på hvor nylig det ble oppdatert.
- Behold alle standardinnstillingene i Angi feltkartlegginger delen og velg neste.
- Velg på anmeldelsessiden Legg til datakilde
- Velg Synkroniser nå
Synkroniseringen kan ta opptil 30 minutter å fullføre.
Test løsningen
Nå som du har indeksert innholdet fra OneDrive, kan du teste det ved å spørre etter indeksen.
- Gå til indeksen din på Amazon Kendra-konsollen og velg Søk etter indeksert innhold i navigasjonsruten.
- Skriv inn et søkeord og trykk Enter.
Legg merke til at uten token forhindrer ACL-ene et søkeresultat fra å bli returnert.
- Expand Testsøk med et tilgangstoken Og velg Bruk token.
- Skriv inn riktig token med en bruker som har tillatelser til å lese filen og velg Påfør.
- Søk etter informasjon i OneDrive igjen.
Du kan bekrefte at Amazon Kendra presenterer de rangerte resultatene som forventet.
Gratulerer, du har konfigurert Amazon Kendra til å indeksere og søke i dokumenter i OneDrive og kontrollere tilgangen til dem ved hjelp av ACL.
konklusjonen
Med Microsoft OneDrive V2-kontakten for Amazon Kendra kan organisasjoner benytte seg av ofte brukte dokumentbutikker for bedrifter, sikkert ved hjelp av intelligent søk drevet av Amazon Kendra. Du kan forbedre søkeopplevelsen ved å integrere datakilden med funksjonen Custom Document Enrichment (CDE) i Amazon Kendra for å utføre ytterligere attributtkartleggingslogikk og til og med tilpasset innholdstransformasjon under inntak.
Om forfatterne
Pravinchandra Varma er en Senior Customer Delivery Architect med AWS Professional Services-teamet og brenner for anvendelser av maskinlæring og kunstig intelligens-tjenester.
Supratim Barat er en programvareutvikler med AWS Kendra Yellowbadge Team og er en blockchain- og cybersikkerhetsentusiast
- SEO-drevet innhold og PR-distribusjon. Bli forsterket i dag.
- Platoblokkkjede. Web3 Metaverse Intelligence. Kunnskap forsterket. Tilgang her.
- Minting the Future med Adryenn Ashley. Tilgang her.
- kilde: https://aws.amazon.com/blogs/machine-learning/announcing-the-updated-microsoft-onedrive-connector-v2-for-amazon-kendra/
- : har
- :er
- $OPP
- 7
- a
- Om oss
- adgang
- Logg inn
- tvers
- la til
- Ytterligere
- I tillegg
- algoritmer
- Alle
- tillater
- Amazon
- Amazon Kendra
- og
- Kunngjøre
- Kunngjøring
- En annen
- api
- app
- Søknad
- søknader
- hensiktsmessig
- kunstig
- kunstig intelligens
- AS
- feste
- Autentisering
- automatisk
- AWS
- AWS profesjonelle tjenester
- Azure
- Bar
- basert
- være
- blockchain
- øke
- by
- CAN
- evner
- sentral
- sertifikat
- Velg
- kunde
- Cloud
- sky lagring
- vanligvis
- fullføre
- ferdigstillelse
- Konfigurasjon
- Koble
- Tilkobling
- tilkobling
- Konsoll
- inneholder
- innhold
- kontroll
- crawler
- skape
- opprettet
- skaper
- Credentials
- skikk
- kunde
- Kunder
- cyber
- cybersikkerhet
- dato
- dekryptere
- Misligholde
- mislighold
- levering
- demonstrere
- beskrivelse
- detaljer
- Utvikler
- Enheter
- dokument
- dokumenter
- under
- Tidligere
- ansatte
- muliggjøre
- muliggjør
- kryptering
- ingeniør
- Enter
- Enterprise
- Selv
- eksempel
- Excel
- opphisset
- forventet
- erfaring
- utløps
- Noen få
- felt
- Felt
- filet
- Filer
- etter
- Til
- Frekvens
- fra
- få
- Gruppe
- Gruppens
- Ha
- hjelper
- vert
- Hvordan
- Hvordan
- HTML
- HTTPS
- ID
- Identitet
- import
- in
- inkludere
- Inkludert
- indeks
- informasjon
- Integrering
- Intelligens
- Intelligent
- IT
- JSON
- nøkkel
- nøkler
- Språk
- læring
- Permisjon
- i likhet med
- BEGRENSE
- laste
- Se
- ser ut som
- maskin
- maskinlæring
- gjøre
- fikk til
- leder
- kartlegging
- Meny
- Microsoft
- minutter
- ML
- Mote
- modifisert
- mer
- flytte
- flere
- navn
- Naturlig
- Naviger
- Navigasjon
- nødvendig
- Trenger
- Ny
- neste
- of
- on
- på nett
- Alternativ
- organisasjoner
- Annen
- vår
- side
- brød
- lidenskapelig
- Utfør
- tillatelse
- tillatelser
- Sted
- Plain
- plato
- Platon Data Intelligence
- PlatonData
- politikk
- Post
- powered
- presentere
- gaver
- trykk
- forebygge
- Principal
- profesjonell
- ordentlig
- gi
- gir
- spørsmål
- rangert
- Ranking
- Lese
- nylig
- registrere
- relevans
- relevant
- gjenværende
- Repository
- de
- resultere
- Resultater
- anmeldelse
- Rich
- rettigheter
- Rolle
- spredt
- Søk
- Secret
- Seksjon
- sikkert
- sikkerhet
- valgt
- senior
- tjeneste
- Tjenester
- sett
- innstillinger
- Vis
- nettstedet
- Software
- løsning
- kilde
- Kilder
- Trinn
- Steps
- lagring
- oppbevare
- butikker
- slik
- støtte
- Systemer
- Ta
- Pek
- lag
- leietaker
- test
- Det
- De
- informasjonen
- deres
- Dem
- Disse
- til
- token
- Transformation
- etter
- oppdatert
- bruke
- brukt
- Bruker
- Brukere
- Verdier
- verifisere
- av
- hvilken
- HVEM
- vil
- med
- uten
- ord
- XML
- XSLT
- Du
- Din
- zephyrnet