Amazon Kendra är en intelligent söktjänst som drivs av maskininlärning (ML), som gör det möjligt för organisationer att tillhandahålla relevant information till kunder och anställda när de behöver det.
Amazon Kendra använder ML-algoritmer för att göra det möjligt för användare att använda naturliga språkfrågor för att söka efter information spridd över flera datakällor i ett företag, inklusive vanliga dokumentlagringssystem som Microsoft OneDrive.
OneDrive är en online-molnlagringstjänst som låter dig vara värd för ditt innehåll och få det automatiskt att synkronisera mellan flera enheter. Amazon Kendra kan indexera dokumentformat som Microsoft OneNote, HTML, PDF, Microsoft Word, Microsoft PowerPoint, Microsoft Excel, Rich Text, JSON, XML, CSV, XSLT och vanlig text.
Vi är glada att kunna meddela att vi har uppdaterat OneDrive-anslutningen för Amazon Kendra för att lägga till ännu fler funktioner. Vi har till exempel lagt till stöd för att söka i OneNote-dokument. Dessutom kan du nu välja att använda identitets- eller ACL-information för att göra dina sökningar mer detaljerade.
Anslutningen hjälper till att indexera dokument och deras åtkomstkontrollinformation för att begränsa sökresultaten till endast de dokument som användaren får tillgång till. För att visa sökresultaten baserat på användarens åtkomsträttigheter och endast använda användarinformationen, tillhandahåller anslutaren en identitetssökrobot för att ladda huvudinformation, såsom användar- och gruppmappningar till ett huvudlager.
I det här inlägget visar vi hur du konfigurerar flera datakällor i Amazon Kendra för att ge en central plats att söka i ditt dokumentarkiv.
Lösningsöversikt
För vår lösning visar vi hur man indexerar ett OneDrive-förråd eller -mapp med hjälp av Amazon Kendra-anslutningen för OneDrive. Lösningen består av följande steg:
- Skapa och konfigurera en app på Microsoft Azure Portal och hämta autentiseringsuppgifterna.
- Skapa en OneDrive-datakälla via Amazon Kendra-konsolen.
- Indexera data i OneDrive-förvaret.
- Kör en exempelfråga för att få informationen.
- Filtrera frågan efter användare eller grupper.
Förutsättningar
För att prova Amazon Kendra-kontakten för OneDrive behöver du följande:
Konfigurera en Azure-applikation och tilldela anslutningsbehörigheter
Innan vi ställer in OneDrive-datakällan behöver vi några detaljer om OneDrive-förvaret. Slutför följande steg:
- Logga in på Azure.
- När du har loggat in med dina kontouppgifter väljer du AppregistreringarOch välj sedan Ny registrering.
- Ge din ansökan ett lämpligt namn och registrera ansökan.
- Samla in information om klient-ID, hyresgäst-ID och andra uppgifter om applikationen.
- För att få en klienthemlighet, välj Lägg till ett certifikat eller en hemlighet under Kunduppgifter.
- Välja Ny kundhemlighet och ge rätt beskrivning och giltighetstid.
- Notera värdena för client-id, tenant-id och secret-id. Vi använder dessa för att autentisera OAuth2-applikationen.
- Navigera till Applikationväljer API-behörigheter i navigeringsfönstret och välj Lägg till en behörighet.
- Välja Microsoft Graph.
- Enligt Ansökan behörigheter, stiga på Fil i sökfältet och under Filer, välj Filer. Läs. Alla.
- Välja Lägg till behörigheter
- På samma sätt, lägg till följande behörigheter på Microsoft Graph alternativ för programmet du skapade:
Group.Read.All
Notes.Read.All
När de är klara kommer API-behörigheterna att se ut som följande skärmdump.
Konfigurera Amazon Kendra-kontakten för OneDrive
Utför följande steg för att konfigurera Amazon Kendra-kontakten:
- På Amazon Kendra-konsolen väljer du Skapa ett index.
- För Indexnamn, ange ett namn för indexet (t.ex.
my-onedrive-index
). - Ange en valfri beskrivning.
- Välja Skapa en ny roll.
- För Rollnamn, ange ett IAM-rollnamn.
- Konfigurera valfria krypteringsinställningar och taggar
- Välja Nästa
- I Konfigurera användaråtkomstkontroll avsnitt, välj Ja under Åtkomstkontroll inställningar.
- För Pollett typ, välj JSON på rullgardinsmenyn.
- Lämna de återstående värdena som standardvärden.
- Välja Nästa
Innan vi går till nästa konfigurationssteg måste vi förse Amazon Kendra med en roll som har de behörigheter som krävs för att ansluta till webbplatsen. Dessa inkluderar tillstånd att hämta och dekryptera AWS Secrets Manager-hemligheten som innehåller applikations-ID och hemliga nyckel som krävs för att ansluta till OneDrive-webbplatsen.
- Öppna en annan flik för AWS-kontot och på IAM-konsolen, navigera till rollen som du skapade tidigare (till exempel,
AmazonKendra-us-west-2-onedrive
). - Välja Lägg till behörigheter och Skapa inline policy.
- För Serviceväljer kendra.
- För Handlingarvälja Skriva och specificera
BatchPutDocument
. - För Resurserväljer Alla resurser.
- Välja Granska policy.
- För Namn , ange ett namn (t.ex.
BatchPutPolicy
). - Välja Skapa policy.
- Lägg till denna policy i rollen du skapade.
- Fäst dessutom
SecretsManagerReadWrite
AWS hanterade policy för rollen - Återgå till Amazon Kendra-fliken.
- Välja Utvecklarutgåva Och välj Skapa.
Detta skapar och sprider IAM-rollen och skapar sedan Amazon Kendra-index, vilket kan ta upp till 30 minuter.
- Gå tillbaka till Amazon Kendra-konsolen, välj Datakällor i navigeringsfönstret och välj Lägg till datakälla.
- Enligt OneDrive-kontakt V2.0väljer Lägg till kontakt.
- För Datakällans namn, ange ett namn (t.ex.
my-onedrive
). - Ange en valfri beskrivning.
- Välja Nästa.
- För OneDrive-hyresgäst-ID, ange det hyresgäst-ID du samlade in tidigare.
- För Konfigurera VPC och säkerhetsgrupp, lämna standard (Ingen VPC).
- Ha kvar Identitetssökrobot är på vald. Detta importerar identitetsinformation till indexet.
- För IAM roll, välj Skapa en ny roll.
- Ange ett rollnamn, t.ex
AmazonKendra-us-west-2-onedrive
Och välj sedan Nästa. - I Autentisering avsnitt väljer Skapa och lägg till en hemlighet.
- Skapa en hemlighet med
clientId
ochclientSecret
som nycklar. - Lägg till deras respektive värden med informationen du samlat in tidigare.
- Välja Nästa.
- I Konfigurera synkroniseringsinställningar lägg till de OneDrive-användare vars dokument du vill indexera.
- Välj synkroniseringsläge för indexet. För det här inlägget väljer vi Synkronisera nytt, ändrat eller borttaget innehåll.
- Välj frekvens för indexering som Kör på begäranOch välj sedan Nästa.
Med fältmappningar kan du ställa in sökbarhet och relevans för fält. Till exempel lastUpdatedAt
kan sortera eller öka rankningen av dokumenten baserat på hur nyligen det uppdaterades.
- Behåll alla standardinställningar i Ställ in fältmappningar avsnitt och välj Nästa.
- Välj på recensionssidan Lägg till datakälla
- Välja Synkronisera nu
Synkroniseringen kan ta upp till 30 minuter att slutföra.
Testa lösningen
Nu när du har indexerat innehållet från OneDrive kan du testa det genom att fråga indexet.
- Gå till ditt index på Amazon Kendra-konsolen och välj Sök efter indexerat innehåll i navigeringsfönstret.
- Ange en sökterm och tryck ange.
Observera att utan en token förhindrar ACL att ett sökresultat returneras.
- Bygga ut Testfråga med en åtkomsttoken Och välj Använd token.
- Ange lämplig token med en användare som har behörighet att läsa filen och välj Ansök.
- Sök efter information som finns i OneDrive igen.
Du kan verifiera att Amazon Kendra presenterar de rankade resultaten som förväntat.
Grattis, du har konfigurerat Amazon Kendra att indexera och söka i dokument i OneDrive och kontrollera åtkomsten till dem med ACL.
Slutsats
Med Microsoft OneDrive V2-anslutningen för Amazon Kendra kan organisationer utnyttja vanliga dokumentbutiker för företag, säkert med intelligent sökning som drivs av Amazon Kendra. Du kan förbättra sökupplevelsen genom att integrera datakällan med CDE-kapaciteten (Custom Document Enrichment) i Amazon Kendra för att utföra ytterligare attributmappningslogik och till och med anpassat innehållstransformation under inmatning.
Om författarna
Pravinchandra Varma är en Senior Customer Delivery Architect med AWS Professional Services-teamet och brinner för tillämpningar av maskininlärning och artificiell intelligens.
Supratim Barat är en mjukvaruutvecklare hos AWS Kendra Yellowbadge Team och är en blockchain- och cybersäkerhetsentusiast
- SEO-drivet innehåll och PR-distribution. Bli förstärkt idag.
- Platoblockchain. Web3 Metaverse Intelligence. Kunskap förstärkt. Tillgång här.
- Minting the Future med Adryenn Ashley. Tillgång här.
- Källa: https://aws.amazon.com/blogs/machine-learning/announcing-the-updated-microsoft-onedrive-connector-v2-for-amazon-kendra/
- : har
- :är
- $UPP
- 7
- a
- Om oss
- tillgång
- Konto
- tvärs
- lagt till
- Annat
- Dessutom
- algoritmer
- Alla
- tillåter
- amason
- Amazon Kendra
- och
- Meddela
- Vi presenterar
- Annan
- api
- app
- Ansökan
- tillämpningar
- lämpligt
- konstgjord
- artificiell intelligens
- AS
- bifoga
- Autentisering
- automatiskt
- AWS
- AWS professionella tjänster
- Azure
- bar
- baserat
- Där vi får lov att vara utan att konstant prestera,
- blockchain
- lyft
- by
- KAN
- kapacitet
- centrala
- certifikat
- Välja
- klient
- cloud
- Cloud Storage
- vanligen
- fullborda
- fullbordan
- konfiguration
- Kontakta
- Anslutning
- anslutning
- Konsol
- innehåller
- innehåll
- kontroll
- sökrobot
- skapa
- skapas
- skapar
- referenser
- beställnings
- kund
- Kunder
- cyber
- Cybersäkerhet
- datum
- Avkryptera
- Standard
- defaults
- leverans
- demonstrera
- beskrivning
- detaljer
- Utvecklare
- enheter
- dokumentera
- dokument
- under
- Tidigare
- anställda
- möjliggöra
- möjliggör
- kryptering
- ingenjör
- ange
- Företag
- Även
- exempel
- excel
- exciterade
- förväntat
- erfarenhet
- upphörande
- få
- fält
- Fält
- Fil
- Filer
- efter
- För
- Frekvens
- från
- skaffa sig
- Grupp
- Gruppens
- Har
- hjälper
- värd
- Hur ser din drömresa ut
- How To
- html
- HTTPS
- ID
- Identitet
- import
- in
- innefattar
- Inklusive
- index
- informationen
- Integrera
- Intelligens
- Intelligent
- IT
- json
- Nyckel
- nycklar
- språk
- inlärning
- Lämna
- tycka om
- BEGRÄNSA
- läsa in
- se
- ser ut som
- Maskinen
- maskininlärning
- göra
- förvaltade
- chef
- kartläggning
- Meny
- Microsoft
- minuter
- ML
- Mode
- modifierad
- mer
- flytta
- multipel
- namn
- Natural
- Navigera
- Navigering
- nödvändigt för
- Behöver
- Nya
- Nästa
- of
- on
- nätet
- Alternativet
- organisationer
- Övriga
- vår
- sida
- panelen
- brinner
- Utföra
- tillstånd
- behörigheter
- Plats
- Enkel
- plato
- Platon Data Intelligence
- PlatonData
- policy
- Inlägg
- drivs
- presentera
- presenterar
- tryck
- förhindra
- Principal
- professionell
- rätt
- ge
- ger
- sökfrågor
- rankad
- Rankning
- Läsa
- nyligen
- registrera
- relevans
- relevanta
- Återstående
- Repository
- att
- resultera
- Resultat
- översyn
- Rik
- rättigheter
- Roll
- spridda
- Sök
- Secret
- §
- säkert
- säkerhet
- vald
- senior
- service
- Tjänster
- in
- inställningar
- show
- webbplats
- Mjukvara
- lösning
- Källa
- Källor
- Steg
- Steg
- förvaring
- lagra
- lagrar
- sådana
- stödja
- System
- Ta
- Tryck
- grupp
- hyresgäst
- testa
- den där
- Smakämnen
- den information
- deras
- Dem
- Dessa
- till
- token
- Transformation
- under
- uppdaterad
- användning
- Begagnade
- Användare
- användare
- Värden
- verifiera
- via
- som
- VEM
- kommer
- med
- utan
- ord
- XML
- XSLT
- Om er
- Din
- zephyrnet