Indexe seu conteúdo do Confluence usando o novo Confluence Connector V2 para Amazon Kendra

Republicado por Platão

seguidores: 0

Amazona Kendra é um serviço de pesquisa inteligente altamente preciso e simples de usar, desenvolvido com aprendizado de máquina (ML). O Amazon Kendra oferece um conjunto de conectores de fonte de dados para simplificar o processo de ingestão e indexação de seu conteúdo, onde quer que ele resida.

Dados valiosos nas organizações são armazenados em repositórios estruturados e não estruturados. Uma solução de pesquisa corporativa deve ser capaz de reunir dados em vários repositórios estruturados e não estruturados para indexar e pesquisar.

Um desses repositórios de dados não estruturados é o Confluence. O Confluence é um espaço de trabalho em equipe que oferece às equipes de trabalhadores do conhecimento um local para criar, capturar e colaborar em qualquer projeto ou ideia. Os espaços de equipe ajudam as equipes a estruturar, organizar e compartilhar o trabalho, para que cada membro da equipe tenha visibilidade do conhecimento institucional e acesso às informações de que precisa.

Existem duas confluências ofertas:

Na nuvem – Isso é oferecido como um produto de software como serviço (SaaS). Está sempre ativo, continuamente atualizado e altamente seguro.
Data Center (autogerenciado) – Aqui, você hospeda o Confluence em sua infraestrutura, que pode ser local ou na nuvem. Isso permite que você mantenha os dados em sua rede e gerencie-os você mesmo.

Temos o prazer de anunciar que agora você pode usar o novo conector Amazon Kendra V2 para Confluence para pesquisar informações armazenadas em sua conta do Confluence na nuvem e em seu data center. Neste post, mostramos como indexar informações armazenadas no Confluence e usar a função de pesquisa inteligente do Amazon Kendra. Além disso, a pesquisa inteligente baseada em ML pode localizar com precisão informações de documentos não estruturados com conteúdo narrativo em linguagem natural, para os quais a pesquisa por palavra-chave não é muito eficaz.

O que há de novo para esta versão

Esta versão oferece suporte à autenticação OAuth 2.0, além da autenticação básica para a edição Cloud. Para a edição Data Center (local), adicionamos OAuth2 além da autenticação básica e tokens de acesso pessoal para mostrar os resultados da pesquisa com base nos direitos de acesso do usuário. Você pode se beneficiar dos seguintes recursos:

Agora você pode rastrear comentários, além de espaços, páginas, blogs e anexos
Agora você tem opções refinadas para seu escopo de sincronização - você pode especificar páginas, blogs, comentários e anexos
Você pode optar por importar identidades (ou não)
Esta versão oferece suporte regex para escolher títulos de entidade, bem como tipos de arquivo
Você tem a opção de vários modos de sincronização

Visão geral da solução

Com o Amazon Kendra, você pode configurar várias fontes de dados para fornecer um local central para pesquisar em seu repositório de documentos. Para nossa solução, demonstramos como indexar um repositório Confluence usando o conector Amazon Kendra para Confluence. A solução consiste nos seguintes passos:

Escolha um mecanismo de autenticação.
Configure um aplicativo no Confluence e obtenha os detalhes da conexão.
Armazene os detalhes em Gerenciador de segredos da AWS.
Crie uma fonte de dados do Confluence V2 por meio do console do Amazon Kendra.
Indexe os dados no repositório do Confluence.
Execute uma consulta de exemplo para testar a solução.

Pré-requisitos

Para experimentar o conector Amazon Kendra para Confluence, você precisa do seguinte:

Escolha um mecanismo de autenticação

Escolha seu método de autenticação preferido:

Basico – Isso funciona nas edições Cloud e Data Center. Você precisa de um ID de usuário e uma senha para configurar este método.
Token de acesso pessoal – Esta opção só funciona para a edição Data Center.
OAuth2 – Isso é mais envolvente e funciona para as edições Cloud e Data Center.

Reunir detalhes de autenticação

Nesta seção, mostramos as etapas para coletar seus detalhes de autenticação, dependendo do seu método de autenticação.

Autenticação básica

Para autenticação básica com a edição Data Center, tudo o que você precisa é seu login e senha. Certifique-se de que seu login tenha privilégios para coletar todo o conteúdo.

Para a edição Cloud, seu ID de usuário serve como seu login de usuário. Para sua senha, você precisa obter um token. Conclua as seguintes etapas:

Logar em https://id.atlassian.com/manage-profile/security/api-tokens e escolha Criar token de API.

Indexe seu conteúdo do Confluence usando o novo conector Confluence V2 para Amazon Kendra | Inteligência de dados PlatoBlockchain da Amazon Web Services. Pesquisa vertical. Ai.

Escolha O rótulo, insira um nome para o token.
Escolha Crie.

Indexe seu conteúdo do Confluence usando o novo conector Confluence V2 para Amazon Kendra | Inteligência de dados PlatoBlockchain da Amazon Web Services. Pesquisa vertical. Ai.

Copie o valor e salve-o para usar como sua senha.

Indexe seu conteúdo do Confluence usando o novo conector Confluence V2 para Amazon Kendra | Inteligência de dados PlatoBlockchain da Amazon Web Services. Pesquisa vertical. Ai.

Token de acesso pessoal

Este método de autenticação funciona apenas no local (Data Center). Conclua as etapas a seguir para adquirir detalhes de autenticação:

Faça login na URL do Confluence usando o ID de usuário e a senha que você deseja que o Amazon Kendra use ao recuperar o conteúdo.
Escolha o ícone do perfil e escolha Configurações.

Indexe seu conteúdo do Confluence usando o novo conector Confluence V2 para Amazon Kendra | Inteligência de dados PlatoBlockchain da Amazon Web Services. Pesquisa vertical. Ai.

Escolha Tokens de acesso pessoal no painel de navegação e escolha Criar token.

criar token

Escolha Nome do token, Insira o nome.
Escolha Data de validade, desmarque Expiração automática.
Escolha Crie.

Indexe seu conteúdo do Confluence usando o novo conector Confluence V2 para Amazon Kendra | Inteligência de dados PlatoBlockchain da Amazon Web Services. Pesquisa vertical. Ai.

Copie o token e salve-o em um local seguro.

Indexe seu conteúdo do Confluence usando o novo conector Confluence V2 para Amazon Kendra | Inteligência de dados PlatoBlockchain da Amazon Web Services. Pesquisa vertical. Ai.

Para configurar o Secrets Manager, usamos a URL de login e esse valor.

Autenticação OAuth2 para edição do Confluence Cloud

Este método de autenticação segue todas as Documentação OAuth2.0 (3LO) da Confluência. Primeiro criamos e configuramos um aplicativo no Confluence e o habilitamos para OAuth2. O processo é um pouco diferente para as edições Cloud e Data Center. Em seguida, obtemos um token de autorização e o trocamos por um token de acesso. Por fim, obtemos o ID do cliente, o segredo do cliente e o código do cliente. Conclua as seguintes etapas:

Faça login no aplicativo Confluence.
Navegar para https://developer.atlassian.com/.
Próximo de Meus apps, escolha Crie e escolha Integração OAuth2.

Indexe seu conteúdo do Confluence usando o novo conector Confluence V2 para Amazon Kendra | Inteligência de dados PlatoBlockchain da Amazon Web Services. Pesquisa vertical. Ai.

Escolha Nome, Insira o nome.
Escolha Crie.

Indexe seu conteúdo do Confluence usando o novo conector Confluence V2 para Amazon Kendra | Inteligência de dados PlatoBlockchain da Amazon Web Services. Pesquisa vertical. Ai.

Escolha Autorização no painel de navegação.
Escolha Adicionar ao lado do seu tipo de autorização.

Indexe seu conteúdo do Confluence usando o novo conector Confluence V2 para Amazon Kendra | Inteligência de dados PlatoBlockchain da Amazon Web Services. Pesquisa vertical. Ai.

Escolha URL de retorno de chamada, insira a URL que você usa para fazer login no Confluence.
Escolha Salvar as alterações .

salvar alterações

Debaixo Gerador de URL de autorização, escolha Adicionar APIs.

adicionar APIs

Próximo de API de identidade do usuário, escolha Adicionar, Em seguida, escolha configurar.

adicionar permissões

Escolha Editar escopos para configurar escopos de leitura para o aplicativo.
Selecionar Ver perfil de usuário ativo e Visualizar perfis de usuários.

editar escopos

Escolha Permissões no painel de navegação.
Próximo de API do Confluence, escolha Adicionar, Em seguida, escolha configurar.
No escopos clássicos guia, escolha Editar escopos.
Selecione todos os escopos de leitura, pesquisa e download.
Escolha Salvar.

escopos granulares

No Escopos granulares guia, escolha Editar escopos.
Pesquise read e selecione todos os escopos encontrados.
Escolha Salvar.

confirmação de escolha de escopo

Escolha Autorização no painel de navegação.
Ao lado do seu tipo de autorização, escolha configurar.

configurar tipo de autorização

Você deve ver três URLs listados.

URLs gerados

Copie o código para URL de autorização granular da API do Confluence.

Segue código de exemplo:

https://auth.atlassian.com/authorize?
audience=api.atlassian.com
&client_id=YOUR_CLIENT_ID
&scope=REQUESTED_SCOPE%20REQUESTED_SCOPE_TWO &redirect_uri=https://YOUR_APP_CALLBACK_URL
&state=YOUR_USER_BOUND_VALUE
&response_type=code
&prompt=consent

Se você deseja gerar um token de atualização para não precisar repetir esse processo, adicione offline_access (ou %20offline_access) ao final de todos os escopos na URL (por exemplo, &scope=REQUESTED_SCOPE%20REQUESTED_SCOPE_TWO%20offline_access).
Se estiver tudo bem em gerar um novo token a cada vez, basta digitar a URL no seu navegador.
Escolha ACEITAR.

escolha aceitar

Você é redirecionado para a página inicial do Confluence.

Inspecione a URL do navegador e localize code=xxxxx.
Copie este código e salve-o.

Este é o código de autorização que usamos para trocar com o token de acesso.

copiar código de autorização

Retorne ao console do desenvolvedor Atlassian e escolha Configurações no painel de navegação.
Copie os valores do ID do cliente e do ID secreto e salve-os.

Precisamos desses valores para fazer uma chamada para trocar o token de autorização pelo token de acesso.

utilidade do carteiro

Em seguida, usamos o Postman utilitário para postar o código de autorização para obter o token de acesso. Você pode usar ferramentas alternativas como enrolar para fazer isso também.

A URL para postar o código de autorização é https://auth.atlassian.com/oauth/token.

O corpo JSON a ser postado é o seguinte:

{"grant_type": "authorization_code", "client_id": "YOUR_CLIENT_ID", "client_secret": "YOUR_CLIENT_SECRET", "code": "YOUR_AUTHORIZATION_CODE", "redirect_uri": "https://YOUR_APP_CALLBACK_URL"}

A grant_type parâmetro é codificado permanentemente. Coletamos os valores para client_id e client_secret em uma etapa anterior. O valor de code é o código de autorização que coletamos anteriormente.

Uma resposta bem-sucedida retornará o token de acesso. Se você adicionou acesso offline ao URL anteriormente, também receberá um token de atualização.

resposta de retorno com token de acesso

Salve o token de acesso para usar ao configurar o Secrets Manager.

Se você estiver gerando um novo token a partir do token de atualização, o token atual será válido apenas por 1 hora. Se você precisar obter um novo token, poderá começar tudo de novo. No entanto, se você tiver o token de atualização, como antes, use o Postman para postar no seguinte URL: https://auth.atlassian.com/oauth/token. Use o seguinte formato JSON para o corpo do token:

{"grant_type": "refresh_token", "client_id": "YOUR_CLIENT_ID", "client_secret": "YOUR_CLIENT_SECRET", "refresh_token": "YOUR_REFRESH_TOKEN"}

A chamada retornará um novo token de acesso

novo token de acesso

Autenticação OAuth2 para a edição Confluence Data Center

Se estiver usando a edição Data Center com autenticação OAuth2, conclua as seguintes etapas:

Faça login na edição Confluence Data Center.
Escolha o ícone de roda dentada e escolha Configuração geral.
No painel de navegação, escolha Links de aplicativos, Em seguida, escolha Criar link.
No Criar link janela pop-up, selecione Aplicação externa e Entrada, Em seguida, escolha Continuar.
Escolha Nome, Insira o nome.
Escolha URL de redirecionamento, entrar https://httpbin.org/.
Escolha Salvar.
Copie e salve os valores para o ID do cliente e o segredo do cliente.
Em uma guia separada do navegador, abra o URL https://example-app.com/pkce.
Escolha Gerar String Aleatória e Calcular Hash.
Copie o valor em Desafio do Código.
Retorne à sua guia original.

Use o seguinte URL para obter o código de autorização:

https://<confluence url>/rest/oauth2/latest/authorize
?client_id=CLIENT_ID
&redirect_uri=REDIRECT_URI
&response_type=code
&scope=SCOPE
&code_challenge=CODE_CHALLENGE
&code_challenge_method=S256

Use o ID do cliente que você copiou anteriormente e https://httpbin.org para o URI de redirecionamento. Para CODE_CHALLENGE, digite o código que você copiou anteriormente.

Escolha Permitir.

Indexe seu conteúdo do Confluence usando o novo conector Confluence V2 para Amazon Kendra | Inteligência de dados PlatoBlockchain da Amazon Web Services. Pesquisa vertical. Ai.

Você é redirecionado para httpbin.org.

Salve o código para usar na próxima etapa.

Indexe seu conteúdo do Confluence usando o novo conector Confluence V2 para Amazon Kendra | Inteligência de dados PlatoBlockchain da Amazon Web Services. Pesquisa vertical. Ai.

Para obter o token de acesso e o token de atualização, use uma ferramenta como enrolar or Postman para postar os seguintes valores para https://<your confluence URL>/rest/oauth2/latest/token:
```
grant_type: authorization_code
client_id: YOUR_CLIENT_ID
client_secret: YOUR_CLIENT_SECRET
code: YOUR_AUTHORIZATION_CODE
code_verifier: CODE_VERIFIER
redirect_uri: YOUR_REDIRECT_URL
```

Use o ID do cliente, o segredo do cliente e o código de autorização que você salvou anteriormente. Para CODE_VERIFIER, insira o valor de quando você gerou o desafio de código.

Copie o token de acesso e o token de atualização para usar mais tarde

copiar tokens de acesso e atualização

O token de acesso e o token de atualização são válidos apenas por 1 hora. Para atualizar o token, poste o seguinte código no mesmo URL para obter novos valores:

grant_type: refresh_token
client_id: YOUR_CLIENT_ID
client_secret: YOUR_CLIENT_SECRET
refresh_token: REFRESH_TOKEN
redirect_uri: YOUR_REDIRECT_URL

Os novos tokens são válidos por 1 hora.

novos tokens

Armazenar credenciais do Confluence no Secrets Manager

Para armazenar suas credenciais do Confluence no Secrets Manager, conclua as seguintes etapas:

No console do Secrets Manager, escolha Guarde um novo segredo.
Selecionar Outro tipo de segredo.

outro tipo

Dependendo do tipo de segredo, insira os valores-chave da seguinte forma:
- Para a autenticação básica do Confluence Cloud, insira os seguintes pares chave-valor (observe que a senha não é a senha de login, mas o token que você criou anteriormente):
```
"username" : "<your login username>", "password" : "<your token value>"
```
- Para a autenticação OAuth do Confluence Cloud, insira os seguintes pares chave-valor:
```
"confluenceAppKey" : “<your clientid>” "confluenceAppSecret" : “<your client Secret>” "confluenceAccessToken" : “<your access token>” "confluenceRefreshToken" : “<your refresh token>”
```
- Para a autenticação básica do Confluence Data Center, insira os seguintes pares chave-valor:
```
"username" : "<login username>" "password" : "<login password>"
```
- Para autenticação de token de acesso pessoal do Confluence Data Center, insira os seguintes pares chave-valor:
```
"patToken" :"<your personal access token>"
```
- Para a autenticação OAuth do Confluence Data Center, insira os seguintes pares chave-valor:
```
"confluenceAppKey" : "<your client id>" "confluenceAppSecret" : “<your Client Secret>” "confluenceAccessToken" : “<your Access Token>" "confluenceRefreshToken" : “<your refresh token>”
```

Escolha Próximo.

escolha o próximo

Escolha Nome secreto, insira um nome (por exemplo, AmazonKendra-my-confluence-secret).
Insira uma descrição opcional.
Escolha Próximo.

configurar segredo

No Configurar rotação seção, mantenha todas as configurações em seus padrões e escolha Próximo.

configurar rotação

No Avaliações página, escolha Loja.

Configurar o conector Amazon Kendra para Confluence

Para configurar o conector do Amazon Kendra, conclua as seguintes etapas:

No console Amazon Kendra, escolha Criar um índice.

criar um índice

Escolha Nome do índice, insira um nome para o índice (por exemplo, my-confluence-index).
Insira uma descrição opcional.
Escolha Nome do papel, insira um nome de função do IAM.
Defina as configurações e tags de criptografia opcionais.
Escolha Próximo.

especificar detalhes do índice

No Configurar o controle de acesso do usuário seção, deixe as configurações em seus padrões e escolha Próximo.

configurar o controle de acesso do usuário

No Especificar provisionamento seção, selecione Edição de desenvolvedor e escolha Próximo.

especificar provisionamento

Na página de revisão, escolha Crie.

Isso cria e propaga a função do IAM e, em seguida, cria o índice do Amazon Kendra, que pode levar até 30 minutos.

índice criado

Crie uma fonte de dados do Confluence

Conclua as etapas a seguir para criar sua fonte de dados:

No console Amazon Kendra, escolha As fontes de dados no painel de navegação.
Debaixo Conector do Confluence V2.0, escolha Adicionar conector.

. Indexe seu conteúdo do Confluence usando o novo conector Confluence V2 para Amazon Kendra | Inteligência de dados PlatoBlockchain da Amazon Web Services. Pesquisa vertical. Ai.

Escolha Nome da fonte de dados, insira um nome (por exemplo, my-Confluence-data-source).
Insira uma descrição opcional.
Escolha Próximo.

especificar detalhes da fonte de dados

Escolha um dos Nuvem de Confluência or Servidor Confluence dependendo da sua fonte de dados.
Escolha Autenticação, escolha sua opção de autenticação.
Selecionar O rastreador de identidade está ativado.
Escolha Papel do IAM¸ escolher Crie uma nova função.
Escolha Nome do papel, insira um nome (por exemplo, AmazonKendra-my-confluence-datasource-role).
Escolha Próximo.

definir acesso e segurança

Para as edições Confluence Data Center e Cloud, podemos adicionar informações adicionais opcionais (não mostradas) como o VPC. Somente para a edição Data Center, podemos adicionar informações adicionais para o proxy da web. Há também uma opção de autenticação adicional se estiver usando um token de acesso pessoal válido apenas para Data Center e não para a edição Cloud.

Escolha Escopo de sincronização, selecione todo o conteúdo para sincronizar.
Escolha Modo de sincronização, selecione Sincronização completa.
Escolha Frequência, escolha Executar sob demanda.
Escolha Próximo.

definir configurações de sincronização

Opcionalmente, você pode definir campos de mapeamento.

O mapeamento de campos é um exercício útil no qual você pode substituir os nomes dos campos por valores que sejam fáceis de usar e que se encaixem no vocabulário da sua organização.

Para esta postagem, mantenha todos os padrões e escolha Próximo.

definir mapeamentos de campo

Revise as configurações e escolha Adicionar fonte de dados.
Para sincronizar a fonte de dados, escolha Sincronize agora.

fonte de dados de sincronização

Uma mensagem de banner aparece quando a sincronização é concluída.

Teste a solução

Agora que você ingeriu o conteúdo de sua conta do Confluence em seu índice do Amazon Kendra, pode testar algumas consultas. Para fins de nosso teste, criamos um site do Confluence com duas equipes: team1 com o membro Analyst1 e team2 com o membro Analyst2.

No console do Amazon Kendra, navegue até seu índice e escolha Pesquisar conteúdo indexado.
Insira um exemplo de consulta de pesquisa e analise os resultados da pesquisa (os resultados variam de acordo com o conteúdo da sua conta).

pesquisa simples

O conector do Confluence também rastreia informações de identidade local do Confluence. Você pode usar esse recurso para restringir sua consulta por usuário. O Confluence oferece opções abrangentes de visibilidade. Os usuários podem escolher seu conteúdo para ser visto por outros usuários, em nível de espaço ou por grupos. Quando você filtra suas pesquisas por usuários, a consulta retorna apenas os documentos aos quais o usuário tem acesso no momento da ingestão.

Para usar esse recurso, expanda Consulta de teste com nome de usuário ou grupos e escolha Aplicar nome de usuário ou grupos.
Digite o nome de usuário do seu usuário e escolha Aplicar.

Observe que para a edição do Confluence Data Center, o nome de usuário é o ID do e-mail.

aplicar nome de usuário ou grupos

Execute novamente sua consulta de pesquisa.

Isso traz para você um conjunto filtrado de resultados. Observe que trazemos de volta apenas 62 resultados.

resultado filtrado

Agora, voltamos e restringimos Bob Straham apenas para poder acessar seu espaço de trabalho e executar a pesquisa novamente.

resultados de bob

Observe que obtemos apenas um subconjunto dos resultados porque a pesquisa é restrita apenas ao conteúdo de Bob.

Ao confrontar o Amazon Kendra com um aplicativo como um aplicativo criado usando Criador de experiência, você pode passar a identidade do usuário (na forma de ID de e-mail para a edição Cloud ou nome de usuário para a edição Data Center) para o Amazon Kendra para garantir que cada usuário veja apenas o conteúdo específico de seu ID de usuário. Como alternativa, você pode usar Centro de identidade do AWS IAM (sucessor do AWS Single Sign-On) para controlar o contexto do usuário que está sendo passado para o Amazon Kendra para limitar as consultas por usuário.

Parabéns! Você usou com sucesso o Amazon Kendra para encontrar respostas e insights com base no conteúdo indexado de sua conta do Confluence.

limpar

Para evitar custos futuros, limpe os recursos que você criou como parte desta solução. Se você criou um novo índice do Amazon Kendra ao testar esta solução, exclua-o. Se você adicionou apenas uma nova fonte de dados usando o conector Amazon Kendra para Confluence V2, exclua essa fonte de dados.

Conclusão

Com o novo conector Confluence V2 para Amazon Kendra, as organizações podem acessar o repositório de informações armazenadas em suas contas com segurança usando a pesquisa inteligente fornecida pelo Amazon Kendra.

Para saber mais sobre essas possibilidades e muito mais, consulte o Guia do desenvolvedor do Amazon Kendra. Para obter mais informações sobre como você pode criar, modificar ou excluir metadados e conteúdo ao ingerir seus dados do Confluence, consulte Enriquecendo seus documentos durante a ingestão e Enriqueça seu conteúdo e metadados para aprimorar sua experiência de pesquisa com o enriquecimento de documentos personalizados no Amazon Kendra.

Sobre o autor

Ashish Lagwankar é arquiteto de soluções corporativas sênior na AWS. Seus principais interesses incluem tecnologias de IA/ML, serverless e de contêiner. Ashish está baseado na área de Boston, MA, e gosta de ler, ao ar livre e passar tempo com sua família.

Conteúdo com tecnologia de SEO e distribuição de relações públicas. Seja amplificado hoje.
PlatoAiStream. Inteligência de Dados Web3. Conhecimento Amplificado. Acesse aqui.
Cunhando o Futuro com Adryenn Ashley. Acesse aqui.
Compre e venda ações em empresas PRE-IPO com PREIPO®. Acesse aqui.
Fonte: https://aws.amazon.com/blogs/machine-learning/index-your-confluence-content-using-the-new-confluence-connector-v2-for-amazon-kendra/

Carimbo de hora: 23 de maio de 2023

Republicado por Platão

Resumo do lançamento do Amazon Textract 2022H2

Retreinar redes neurais automaticamente com Renate

Gerencie fluxos de trabalho de AutoML com AWS Step Functions e AutoGluon no Amazon SageMaker

Habilite a tomada de decisão inteligente com o Amazon SageMaker Canvas e o Amazon QuickSight

Automatize o processo para alterar planos de fundo de imagens usando Amazon Bedrock e AWS Step Functions | Amazon Web Services

Dimensione a inferência do YOLOv5 com endpoints do Amazon SageMaker e AWS Lambda

Automação de inspeção visual usando Amazon SageMaker JumpStart

Modere, classifique e processe documentos usando o Amazon Rekognition e o Amazon Textract

Sobre Nós

Pesquisa vertical e IA

Plataforma

Fique Ligado

Conta