Søg sikkert i ustrukturerede data på Windows-filsystemer med Amazon Kendra-stikket til Amazon FSx til Windows File Server PlatoBlockchain Data Intelligence. Lodret søgning. Ai.

Søg sikkert i ustrukturerede data på Windows-filsystemer med Amazon Kendra-stikket til Amazon FSx til Windows File Server

Kritisk information kan spredes på tværs af flere datakilder i din organisation, herunder kilder såsom Windows-filsystemer, der er gemt på Amazon FSx til Windows filserver. Du kan nu bruge Amazon Kendra-stik til FSx til Windows-filserver at indeksere dokumenter (HTML, PDF, MS Word, MS PowerPoint og almindelig tekst), der er gemt i dit Windows-filsystem på FSx for Windows File Server og søge efter information på tværs af dette indhold ved hjælp af intelligent søgning i Amazon Kendra.

Organisationer gemmer ustrukturerede data i filer på delte Windows-filsystemer og sikrer dem ved at bruge Windows Access Control Lists (ACL'er) for at sikre, at brugere kan læse, skrive og oprette filer i henhold til deres adgangstilladelser konfigureret i virksomhedens Active Directory (AD) domæne . At finde specifik information fra disse data kræver ikke kun at søge gennem filerne, men også at sikre, at brugeren er autoriseret til at få adgang til dem. Amazon Kendra-stikket til FSx til Windows-filserveren indekserer filerne, der er gemt på FSx til Windows-filserveren og indtager ACL'erne i Amazon Kendra-indekset, så svaret på en søgeforespørgsel foretaget af en bruger kun inkluderer resultater fra de dokumenter, som bruger er autoriseret til at læse.

Dette indlæg tager eksemplet med et sæt dokumenter, der er gemt sikkert på et filsystem ved hjælp af ACL'er på FSx til Windows File Server. Disse dokumenter optages i et Amazon Kendra-indeks ved at konfigurere og synkronisere dette filsystem som en datakilde for indekset ved hjælp af forbindelsen til FSx for Windows File Server. Derefter demonstrerer vi, at når en bruger foretager en søgeforespørgsel, bruger Amazon Kendra-indekset ACL'erne baseret på det brugernavn og de grupper, brugeren tilhører, og returnerer kun de dokumenter, som brugeren har tilladelse til at få adgang til. Vi inkluderer også detaljer om konfigurationen og skærmbilleder på hvert trin, så du kan bruge dette som reference, når du konfigurerer Amazon Kendra-stikket til FSx til Windows-filserver i din opsætning.

Forudsætninger

For at prøve Amazon Kendra-stikket til FSx til Windows-filserver, skal du bruge følgende:

Løsningsarkitektur

Følgende diagram illustrerer løsningsarkitekturen:
Søg sikkert i ustrukturerede data på Windows-filsystemer med Amazon Kendra-stikket til Amazon FSx til Windows File Server PlatoBlockchain Data Intelligence. Lodret søgning. Ai.

Dokumenterne i dette eksempel er gemt på et filsystem (3 i diagrammet) på FSx for Windows File Server (4). Filerne er sat op med ACL'er baseret på bruger- og gruppekonfigurationerne i AD-domænet oprettet vha AWS Directory Service (1), hvortil FSx til Windows-filserver hører. Dette filsystem på FSx til Windows File Server er konfigureret som en datakilde for Amazon Kendra (5). AWS Single Sign On (AWS SSO) er aktiveret med AD'en som identitetskilden, og Amazon Kendra-indekset er sat op til at bruge AWS SSO (2) til brugernavn og gruppeopslag for brugerkonteksten for søgeforespørgslerne fra implementering af kundesøgeløsninger ( 6). FSx til Windows File Server-filsystemet, AWS Managed Microsoft AD-server, den Amazon Virtual Private Cloud (Amazon VPC) og undernet, der er konfigureret i dette eksempel, oprettes ved hjælp af Hurtig start til FSx til Windows filserver.

FSx til Windows-filserverkonfiguration

Følgende skærmbillede viser filsystemet på FSx til Windows File Server konfigureret som en del af et AWS-administreret Microsoft AD-domæne, der bruges i vores eksempel, som det ses på Amazon FSx-konsollen.
Søg sikkert i ustrukturerede data på Windows-filsystemer med Amazon Kendra-stikket til Amazon FSx til Windows File Server PlatoBlockchain Data Intelligence. Lodret søgning. Ai.

AWS-administreret Microsoft AD-konfiguration

Den AD, som FSx til Windows-filserveren tilhører, er konfigureret som en AWS-administreret Microsoft AD, som det ses på det følgende skærmbillede af Directory Service-konsollen.
Søg sikkert i ustrukturerede data på Windows-filsystemer med Amazon Kendra-stikket til Amazon FSx til Windows File Server PlatoBlockchain Data Intelligence. Lodret søgning. Ai.

Brugere, grupper og ACL-konfiguration for eksempeldatasæt

Til dette indlæg brugte vi et datasæt bestående af et par AWS offentligt tilgængelige whitepapers og gemte dem i mapper baseret på deres kategorier (Best_Practices, Databases, General, Machine_Learning, Securityog Well_Architected) på et filsystem på FSx til Windows filserver. Følgende skærmbillede viser mapperne set fra en Windows bastion-vært, der er en del af AD-domænet, som filsystemet tilhører.

Søg sikkert i ustrukturerede data på Windows-filsystemer med Amazon Kendra-stikket til Amazon FSx til Windows File Server PlatoBlockchain Data Intelligence. Lodret søgning. Ai.

Brugere og grupper konfigureres i AD-domænet som følger:

  • kadmin - group_kadmin
  • patricia - group_sa, group_kauthenticated
  • james - group_db_sa, group_kauthenticated
  • john - group_ml_sa, group_kauthenticated
  • mary, julie, tom - group_kauthenticated

Følgende skærmbillede viser brugere og grupper, der er konfigureret i AWS Managed Microsoft AD-domænet som set fra Windows bastion-værten.

Søg sikkert i ustrukturerede data på Windows-filsystemer med Amazon Kendra-stikket til Amazon FSx til Windows File Server PlatoBlockchain Data Intelligence. Lodret søgning. Ai.

ACL'erne for filerne i hver mappe er sat op baseret på bruger- og gruppekonfigurationerne i AD-domænet, som FSx for Windows File Server tilhører:

  • Alle godkendte brugere (group_kauthenticated) – Kan tilgå dokumenterne i Best_Practices , General mapper
  • Solutions Architects (group_sa) – Kan tilgå dokumenterne i Best_Practices, General, Securityog Well_Architected mapper
  • Databaseemneekspert Solutions Architects (group_db_sa) – Kan tilgå dokumenterne i Best_Practices, General, Security, Well_Architectedog Database mapper
  • Maskinlæringsfagekspert Solutions Architects (group_ml_sa) – Kan få adgang Best_Practices, General, Security, Well_Architectedog Machine_Learning mapper
  • Admin (group_kadmin) – Kan få adgang til dokumenterne i enhver af de seks mapper

Følgende skærmbillede viser ACL-konfigurationerne for hver af mapperne med vores eksempeldata, set fra Windows bastion-værten.
Søg sikkert i ustrukturerede data på Windows-filsystemer med Amazon Kendra-stikket til Amazon FSx til Windows File Server PlatoBlockchain Data Intelligence. Lodret søgning. Ai.

AWS Single Sign-On-konfiguration

AWS SSO er konfigureret med AD-domænet som identitetskilden. Følgende skærmbillede viser indstillingerne på AWS SSO-konsollen.
Søg sikkert i ustrukturerede data på Windows-filsystemer med Amazon Kendra-stikket til Amazon FSx til Windows File Server PlatoBlockchain Data Intelligence. Lodret søgning. Ai.

Grupperne synkroniseres i AWS SSO fra AD, som vist på det følgende skærmbillede.
Søg sikkert i ustrukturerede data på Windows-filsystemer med Amazon Kendra-stikket til Amazon FSx til Windows File Server PlatoBlockchain Data Intelligence. Lodret søgning. Ai.

Følgende skærmbillede viser medlemmerne af group_kauthenticated gruppe synkroniseret fra AD.
Søg sikkert i ustrukturerede data på Windows-filsystemer med Amazon Kendra-stikket til Amazon FSx til Windows File Server PlatoBlockchain Data Intelligence. Lodret søgning. Ai.

Datakildekonfiguration ved hjælp af Amazon Kendra-stik til FSx til Windows-filserver

Vi konfigurerer en datakilde ved hjælp af Amazon Kendra-stikket til FSx til Windows-filserver i et Amazon Kendra-indeks på Amazon Kendra-konsollen. Du kan oprette et nyt Amazon Kendra-indeks eller brug en eksisterende og tilføj en ny datakilde.

Når du tilføjer en datakilde til et Amazon Kendra-indeks, skal du vælge FSx til Windows-filserverforbindelsen ved at vælge Tilføj stik under Amazon FSx.
Søg sikkert i ustrukturerede data på Windows-filsystemer med Amazon Kendra-stikket til Amazon FSx til Windows File Server PlatoBlockchain Data Intelligence. Lodret søgning. Ai.

Trinene til at tilføje et datakildenavn og ressourcetags svarer til at tilføje enhver anden datakilde, som vist på det følgende skærmbillede.
Søg sikkert i ustrukturerede data på Windows-filsystemer med Amazon Kendra-stikket til Amazon FSx til Windows File Server PlatoBlockchain Data Intelligence. Lodret søgning. Ai.

Detaljerne for konfiguration af det specifikke filsystem på Amazon FSx og typen af ​​filsystem (FSx for Windows File Server i dette tilfælde) er konfigureret til i Kilde afsnit. Godkendelsesoplysningerne for en bruger med administratorrettigheder til filsystemet konfigureres ved hjælp af en AWS Secrets Manager hemmelighed.
Søg sikkert i ustrukturerede data på Windows-filsystemer med Amazon Kendra-stikket til Amazon FSx til Windows File Server PlatoBlockchain Data Intelligence. Lodret søgning. Ai.

VPC- og sikkerhedsgruppeindstillingerne for datakildekonfigurationen inkluderer detaljerne om VPC, undernet og sikkerhedsgruppen for Amazon FSx og AD-serveren. I det følgende skærmbillede opretter vi også en ny IAM-rolle til datakilden.
Søg sikkert i ustrukturerede data på Windows-filsystemer med Amazon Kendra-stikket til Amazon FSx til Windows File Server PlatoBlockchain Data Intelligence. Lodret søgning. Ai.

Det næste trin i datakildekonfigurationen involverer at kortlægge Amazon FSx-forbindelsesfelterne til Amazon Kendra-facetter eller feltnavne. I det følgende skærmbillede forlader vi konfigurationen uændret. Trinnet efter dette involverer gennemgang af konfigurationen og bekræftelse af, at datakilden skal oprettes.
Søg sikkert i ustrukturerede data på Windows-filsystemer med Amazon Kendra-stikket til Amazon FSx til Windows File Server PlatoBlockchain Data Intelligence. Lodret søgning. Ai.

Når du har konfigureret filsystemet på FSx til Windows File Server, hvor eksempeldataene er gemt som en datakilde, konfigurerer du grundlæggende handlinger for Custom Document Enrichment (CDE) for denne datakilde, så Amazon Kendra-indekset filed _category er konfigureret baseret på den mappe, hvori et dokument er gemt. Datakildesynkroniseringen startes efter CDE-konfigurationen, således at _category attributter for dokumenterne konfigureres under indlæsningsarbejdsgangen.

Søg sikkert i ustrukturerede data på Windows-filsystemer med Amazon Kendra-stikket til Amazon FSx til Windows File Server PlatoBlockchain Data Intelligence. Lodret søgning. Ai.

Som vist på det følgende skærmbillede er Amazon Kendra-indeksets brugeradgangskontrolindstillinger konfigureret til bruger- og gruppeopslag gennem AWS SSO-integration. JSON-token-baseret brugeradgangskontrol er aktiveret til at søge baseret på bruger- og gruppenavne fra Amazon Kendra Search-konsollen.

Søg sikkert i ustrukturerede data på Windows-filsystemer med Amazon Kendra-stikket til Amazon FSx til Windows File Server PlatoBlockchain Data Intelligence. Lodret søgning. Ai.

I facetdefinitionen for Amazon Kendra-indekset skal du sørge for, at facetable- og visningsfelterne er markeret for _category. Dette giver dig mulighed for at bruge _category værdier sat af CDE's grundlæggende handlinger som facetter under søgning.

Søg sikkert i ustrukturerede data på Windows-filsystemer med Amazon Kendra-stikket til Amazon FSx til Windows File Server PlatoBlockchain Data Intelligence. Lodret søgning. Ai.

Søg med Amazon Kendra

Når datakildesynkroniseringen er fuldført, kan vi begynde at søge fra Amazon Kendra Search-konsollen ved at vælge Søg efter indekseret indhold i navigationsruden på Amazon Kendra-konsollen. Fordi vi bruger AWS-hvidbøger som datasættet til at indsætte i Amazon Kendra-indekset, bruger vi "Hvad er DynamoDB?" som søgeforespørgslen. Kun godkendte brugere har autoriseret adgang til filerne på filsystemet på FSx for Windows File Server; Derfor, når vi bruger denne søgeforespørgsel uden at angive noget brugernavn eller gruppe, får vi ingen resultater.
Søg sikkert i ustrukturerede data på Windows-filsystemer med Amazon Kendra-stikket til Amazon FSx til Windows File Server PlatoBlockchain Data Intelligence. Lodret søgning. Ai.

Lad os nu indstille brugernavnet til mary@kendra-01.com. Brugeren mary tilhører group_kauthenticated, og har derfor tilladelse til at få adgang til dokumenterne i Best_Practices , General mapper. I det følgende skærmbillede inkluderer søgesvaret dokumenter med facetten category indstillet til Best Practices , Generelt. De grundlæggende CDE-handlinger sætter facetten category afhængigt af de mappenavne, der er indeholdt i source_uri. Dette bekræfter, at de ACL'er, der er indtaget i Amazon Kendra af forbindelsen til FSx for Windows File Server, håndhæves i søgeresultaterne baseret på brugernavnet.
Søg sikkert i ustrukturerede data på Windows-filsystemer med Amazon Kendra-stikket til Amazon FSx til Windows File Server PlatoBlockchain Data Intelligence. Lodret søgning. Ai.

Nu ændrer vi brugernavnet til patricia@kendra-01.com. Brugeren patricia tilhører group_sa, med adgang til Security , Well_Architected mapper, foruden Best_Practices , General mapper. Søgesvaret inkluderer resultater fra disse yderligere mapper.
Søg sikkert i ustrukturerede data på Windows-filsystemer med Amazon Kendra-stikket til Amazon FSx til Windows File Server PlatoBlockchain Data Intelligence. Lodret søgning. Ai.

Nu kan vi observere, hvordan resultaterne fra søgesvaret ændrer sig, når vi ændrer brugernavnet til james@kendra-01.com, john@kendra-01.comog kadmin@kendra-01.com i de følgende skærmbilleder.
Søg sikkert i ustrukturerede data på Windows-filsystemer med Amazon Kendra-stikket til Amazon FSx til Windows File Server PlatoBlockchain Data Intelligence. Lodret søgning. Ai. Søg sikkert i ustrukturerede data på Windows-filsystemer med Amazon Kendra-stikket til Amazon FSx til Windows File Server PlatoBlockchain Data Intelligence. Lodret søgning. Ai. Søg sikkert i ustrukturerede data på Windows-filsystemer med Amazon Kendra-stikket til Amazon FSx til Windows File Server PlatoBlockchain Data Intelligence. Lodret søgning. Ai.

Ryd op

Hvis du implementerede en AWS-infrastruktur til at eksperimentere med Amazon Kendra-stikket til FSx til Windows-filserver, skal du rydde op i infrastrukturen som følger:

  1. Hvis du brugte Hurtig start til FSx til Windows filserver, slet AWS CloudFormation stak du har oprettet, så den sletter alle de ressourcer, den har oprettet.
  2. Hvis du har oprettet et nyt Amazon Kendra-indeks, skal du slette det.
  3. Hvis du kun tilføjede en ny datakilde ved hjælp af connectoren, skal du slette denne datakilde.
  4. Slet AWS SSO-konfigurationen.

Konklusion

Amazon Kendra-stikket til FSx til Windows File Server muliggør sikker og intelligent søgning efter information spredt i ustruktureret indhold. Dataene gemmes sikkert på filsystemer på FSx Windows-filserver med ACL'er og deles med brugere baseret på deres Microsoft AD-domæneoplysninger.

For mere information om Amazon Kendra-stikket til FSx til Windows-filserver, se Kom godt i gang med en Amazon FSx-datakilde (konsol) , Brug af en Amazon FSx-datakilde.

For information om tilpasset dokumentberigelse, se Tilpasning af dokumentmetadata under indlæsningsprocessen , Berig dit indhold og metadata for at forbedre din søgeoplevelse med tilpasset dokumentberigelse i Amazon Kendra.


Om forfatteren

Abhinav JawadekarAbhinav Jawadekar er Senior Partner Solutions Architect hos Amazon Web Services. Abhinav arbejder sammen med AWS-partnere for at hjælpe dem i deres cloud-rejse.

Tidsstempel:

Mere fra AWS maskinindlæring