Amazon Kendra er en intelligent søgetjeneste drevet af maskinlæring (ML), der gør det muligt for organisationer at give relevant information til kunder og medarbejdere, når de har brug for det.
Amazon Kendra bruger ML-algoritmer til at gøre det muligt for brugere at bruge naturlige sprogforespørgsler til at søge efter information spredt på tværs af flere datakilder i en virksomhed, herunder almindeligt anvendte dokumentlagringssystemer som f.eks. Microsoft OneDrive.
OneDrive er en online cloud-lagringstjeneste, der giver dig mulighed for at hoste dit indhold og få det automatisk til at synkronisere på tværs af flere enheder. Amazon Kendra kan indeksere dokumentformater som Microsoft OneNote, HTML, PDF, Microsoft Word, Microsoft PowerPoint, Microsoft Excel, Rich Text, JSON, XML, CSV, XSLT og almindelig tekst.
Vi er glade for at kunne meddele, at vi har opdateret OneDrive-stikket til Amazon Kendra for at tilføje endnu flere muligheder. For eksempel har vi tilføjet support til at søge i OneNote-dokumenter. Derudover kan du nu vælge at bruge identitets- eller ACL-oplysninger til at gøre dine søgninger mere detaljerede.
Connectoren hjælper med at indeksere dokumenter og deres adgangskontroloplysninger for at begrænse søgeresultaterne til kun de dokumenter, som brugeren har tilladelse til at få adgang til. For at vise søgeresultaterne baseret på brugeradgangsrettigheder og kun ved at bruge brugeroplysningerne, giver connectoren en identitetscrawler til at indlæse principielle oplysninger, såsom bruger- og gruppetilknytninger, til et hovedlager.
I dette indlæg demonstrerer vi, hvordan du konfigurerer flere datakilder i Amazon Kendra for at give et centralt sted at søge på tværs af dit dokumentlager.
Løsningsoversigt
Til vores løsning demonstrerer vi, hvordan man indekserer et OneDrive-lager eller en mappe ved hjælp af Amazon Kendra-stikket til OneDrive. Løsningen består af følgende trin:
- Opret og konfigurer en app på Microsoft Azure Portal og få godkendelsesoplysningerne.
- Opret en OneDrive-datakilde via Amazon Kendra-konsollen.
- Indekser dataene i OneDrive-lageret.
- Kør en prøveforespørgsel for at få oplysningerne.
- Filtrer forespørgslen efter brugere eller grupper.
Forudsætninger
For at prøve Amazon Kendra-stikket til OneDrive, skal du bruge følgende:
Konfigurer en Azure-applikation, og tildel forbindelsestilladelser
Før vi opsætter OneDrive-datakilden, har vi brug for et par detaljer om OneDrive-lageret. Udfør følgende trin:
- Log ind på Azure.
- Når du er logget ind med dine kontooplysninger, skal du vælge App-registreringer, Og vælg derefter Ny registrering.
- Giv din ansøgning et passende navn og registrer ansøgningen.
- Indsaml oplysninger om klient-id, lejer-id og andre oplysninger om applikationen.
- For at få en klienthemmelighed skal du vælge Tilføj et certifikat eller en hemmelighed under Kundens legitimationsoplysninger.
- Vælg Ny klienthemmelighed og give den korrekte beskrivelse og udløb.
- Bemærk værdierne for klient-id, lejer-id og hemmelig-id. Vi bruger disse til at godkende OAuth2-applikationen.
- Naviger til App, vælg API-tilladelser i navigationsruden, og vælg Tilføj en tilladelse.
- Vælg Microsoft Graph.
- Under Ansøgningstilladelser, gå ind File (Felt) i søgefeltet og under Filer skal du vælge Filer. Læs. Alle.
- Vælg Tilføj tilladelser
- Tilsvarende skal du tilføje følgende tilladelser på Microsoft Graph mulighed for den applikation, du har oprettet:
Group.Read.All
Notes.Read.All
Efter færdiggørelsen vil API-tilladelserne se ud som følgende skærmbillede.
Konfigurer Amazon Kendra-stikket til OneDrive
For at konfigurere Amazon Kendra-stikket skal du udføre følgende trin:
- På Amazon Kendra-konsollen skal du vælge Opret et indeks.
- Til Indeks navn, indtast et navn til indekset (f.eks.
my-onedrive-index
). - Indtast en valgfri beskrivelse.
- Vælg Lav en ny rolle.
- Til Rollenavn, indtast et IAM-rollenavn.
- Konfigurer valgfri krypteringsindstillinger og tags
- Vælg Næste
- I Konfigurer brugeradgangskontrol sektion, vælg Ja under Adgangskontrol indstillinger.
- Til Polet skriv, vælg JSON i rullemenuen.
- Lad de resterende værdier være deres standardværdier.
- Vælg Næste
Før vi går videre til næste konfigurationstrin, skal vi give Amazon Kendra en rolle, der har de nødvendige tilladelser til at oprette forbindelse til webstedet. Disse omfatter tilladelse til at hente og dekryptere AWS Secrets Manager-hemmeligheden, der indeholder applikations-id'et og den hemmelige nøgle, der er nødvendig for at oprette forbindelse til OneDrive-webstedet.
- Åbn en anden fane for AWS-kontoen, og på IAM-konsollen skal du navigere til den rolle, du oprettede tidligere (f.eks.
AmazonKendra-us-west-2-onedrive
). - Vælg Tilføj tilladelser , Opret inline politik.
- Til Service, vælg Kendra.
- Til handlingervælge Skrive og specificer
BatchPutDocument
. - Til Ressourcer, vælg Alle ressourcer.
- Vælg Gennemgå politik.
- Til Navn, indtast et navn (f.eks.
BatchPutPolicy
). - Vælg Lav politik.
- Føj denne politik til den rolle, du har oprettet.
- Vedhæft desuden
SecretsManagerReadWrite
AWS administrerede politik til rollen - Vend tilbage til fanen Amazon Kendra.
- Type Developer udgave Og vælg Opret.
Dette opretter og udbreder IAM-rollen og opretter derefter Amazon Kendra-indekset, som kan tage op til 30 minutter.
- Vend tilbage til Amazon Kendra-konsollen, vælg Data kilder i navigationsruden, og vælg Tilføj datakilde.
- Under OneDrive-stik V2.0, vælg Tilføj stik.
- Til Datakildenavn, indtast et navn (f.eks.
my-onedrive
). - Indtast en valgfri beskrivelse.
- Vælg Næste.
- Til OneDrive lejer-id, skal du indtaste det lejer-id, du har indsamlet tidligere.
- Til Konfigurer VPC og sikkerhedsgruppe, lad standard (Ingen VPC).
- Holde Identitetscrawler er tændt valgte. Dette importerer identitetsoplysninger til indekset.
- For IAM-rolle, vælg Lav en ny rolle.
- Indtast et rollenavn, som f.eks
AmazonKendra-us-west-2-onedrive
, Og vælg derefter Næste. - I Godkendelse sektion, skal du vælge Opret og tilføj en hemmelighed.
- Skab en hemmelighed med
clientId
,clientSecret
som nøgler. - Tilføj deres respektive værdier med de oplysninger, du har indsamlet tidligere.
- Vælg Næste.
- I Konfigurer synkroniseringsindstillinger skal du tilføje de OneDrive-brugere, hvis dokumenter du vil indeksere.
- Vælg synkroniseringstilstand for indekset. Til dette indlæg vælger vi Synkronisering af nyt, ændret eller slettet indhold.
- Vælg hyppigheden af indeksering som Kør efter behov, Og vælg derefter Næste.
Feltkortlægninger giver dig mulighed for at indstille søgbarheden og relevansen af felter. For eksempel lastUpdatedAt
feltet kan sortere eller booste rangeringen af dokumenterne baseret på, hvor nyligt det er blevet opdateret.
- Behold alle standardindstillingerne i Indstil markkortlægninger sektion og vælg Næste.
- På anmeldelsessiden skal du vælge Tilføj datakilde
- Vælg Synkroniser nu
Synkroniseringen kan tage op til 30 minutter at fuldføre.
Test løsningen
Nu hvor du har indekseret indholdet fra OneDrive, kan du teste det ved at forespørge på indekset.
- Gå til dit indeks på Amazon Kendra-konsollen og vælg Søg efter indekseret indhold i navigationsruden.
- Indtast et søgeord og tryk Indtast.
Bemærk, at uden et token forhindrer ACL'erne et søgeresultat i at blive returneret.
- Udvid Testforespørgsel med et adgangstoken Og vælg Anvend token.
- Indtast det relevante token med en bruger, der har tilladelser til at læse filen og vælge Indløs.
- Søg igen efter information, der findes i OneDrive.
Du kan verificere, at Amazon Kendra præsenterer de rangerede resultater som forventet.
Tillykke, du har konfigureret Amazon Kendra til at indeksere og søge i dokumenter i OneDrive og kontrollere adgangen til dem ved hjælp af ACL.
Konklusion
Med Microsoft OneDrive V2-stikket til Amazon Kendra kan organisationer benytte sig af almindeligt anvendte dokumentbutikker til virksomheder, sikkert ved hjælp af intelligent søgning drevet af Amazon Kendra. Du kan forbedre søgeoplevelsen ved at integrere datakilden med Custom Document Enrichment-funktionen (CDE) i Amazon Kendra for at udføre yderligere attributkortlægningslogik og endda tilpasset indholdstransformation under indtagelse.
Om forfatterne
Pravinchandra Varma er Senior Customer Delivery Architect hos AWS Professional Services-teamet og brænder for applikationer af machine learning og kunstig intelligens-tjenester.
Supratim Barat er en softwareudvikleringeniør hos AWS Kendra Yellowbadge Team og er en blockchain- og cybersikkerhedsentusiast
- SEO Powered Content & PR Distribution. Bliv forstærket i dag.
- Platoblokkæde. Web3 Metaverse Intelligence. Viden forstærket. Adgang her.
- Udmøntning af fremtiden med Adryenn Ashley. Adgang her.
- Kilde: https://aws.amazon.com/blogs/machine-learning/announcing-the-updated-microsoft-onedrive-connector-v2-for-amazon-kendra/
- :har
- :er
- $OP
- 7
- a
- Om
- adgang
- Konto
- tværs
- tilføjet
- Yderligere
- Derudover
- algoritmer
- Alle
- tillader
- Amazon
- Amazon Kendra
- ,
- Annoncere
- Annoncerer
- En anden
- api
- app
- Anvendelse
- applikationer
- passende
- kunstig
- kunstig intelligens
- AS
- vedhæfte
- Godkendelse
- automatisk
- AWS
- AWS Professional Services
- Azure
- Bar
- baseret
- være
- blockchain
- boost
- by
- CAN
- kapaciteter
- central
- certifikat
- Vælg
- kunde
- Cloud
- Cloud Storage
- almindeligt
- fuldføre
- færdiggørelse
- Konfiguration
- Tilslut
- Tilslutning
- tilslutning
- Konsol
- indeholder
- indhold
- kontrol
- crawler
- skabe
- oprettet
- skaber
- Legitimationsoplysninger
- skik
- kunde
- Kunder
- Cyber
- cybersikkerhed
- data
- Dekryptér
- Standard
- defaults
- levering
- demonstrere
- beskrivelse
- detaljer
- Udvikler
- Enheder
- dokumentet
- dokumenter
- i løbet af
- tidligere
- medarbejdere
- muliggøre
- muliggør
- kryptering
- ingeniør
- Indtast
- Enterprise
- Endog
- eksempel
- Excel
- ophidset
- forventet
- erfaring
- udløbet
- få
- felt
- Fields
- File (Felt)
- Filer
- efter
- Til
- Frekvens
- fra
- få
- gruppe
- Gruppens
- Have
- hjælper
- host
- Hvordan
- How To
- HTML
- HTTPS
- ID
- Identity
- import
- in
- omfatter
- Herunder
- indeks
- oplysninger
- Integration
- Intelligens
- Intelligent
- IT
- json
- Nøgle
- nøgler
- Sprog
- læring
- Forlade
- ligesom
- GRÆNSE
- belastning
- Se
- ligner
- maskine
- machine learning
- lave
- lykkedes
- leder
- kortlægning
- Menu
- microsoft
- minutter
- ML
- tilstand
- modificeret
- mere
- bevæge sig
- flere
- navn
- Natural
- Naviger
- Navigation
- nødvendig
- Behov
- Ny
- næste
- of
- on
- online
- Option
- organisationer
- Andet
- vores
- side
- brød
- lidenskabelige
- Udfør
- tilladelse
- Tilladelser
- Place
- Almindeligt
- plato
- Platon Data Intelligence
- PlatoData
- politik
- Indlæg
- strøm
- præsentere
- gaver
- trykke
- forhindre
- Main
- professionel
- passende
- give
- giver
- forespørgsler
- rangeret
- Ranking
- Læs
- for nylig
- register
- relevans
- relevant
- resterende
- Repository
- dem
- resultere
- Resultater
- gennemgå
- Rich
- rettigheder
- roller
- spredt
- Søg
- Secret
- Sektion
- sikkert
- sikkerhed
- valgt
- senior
- tjeneste
- Tjenester
- sæt
- indstillinger
- Vis
- websted
- Software
- løsninger
- Kilde
- Kilder
- Trin
- Steps
- opbevaring
- butik
- forhandler
- sådan
- support
- Systemer
- Tag
- Tryk på
- hold
- lejer
- prøve
- at
- oplysninger
- deres
- Them
- Disse
- til
- token
- Transformation
- under
- opdateret
- brug
- anvendte
- Bruger
- brugere
- Værdier
- verificere
- via
- som
- WHO
- vilje
- med
- uden
- ord
- XML
- XSLT
- Du
- Din
- zephyrnet