Amazona Kendra é um serviço de pesquisa inteligente altamente preciso e simples de usar, desenvolvido com aprendizado de máquina (ML). O Amazon Kendra oferece um conjunto de conectores de fonte de dados para simplificar o processo de ingestão e indexação de seu conteúdo, onde quer que ele resida.
Dados valiosos nas organizações são armazenados em repositórios estruturados e não estruturados. Uma solução de pesquisa corporativa deve ser capaz de reunir dados em vários repositórios estruturados e não estruturados para indexar e pesquisar.
Um desses repositórios de dados não estruturados é o Confluence. O Confluence é um espaço de trabalho em equipe que oferece às equipes de trabalhadores do conhecimento um local para criar, capturar e colaborar em qualquer projeto ou ideia. Os espaços de equipe ajudam as equipes a estruturar, organizar e compartilhar o trabalho, para que cada membro da equipe tenha visibilidade do conhecimento institucional e acesso às informações de que precisa.
Existem duas confluências ofertas:
- Na nuvem – Isso é oferecido como um produto de software como serviço (SaaS). Está sempre ativo, continuamente atualizado e altamente seguro.
- Data Center (autogerenciado) – Aqui, você hospeda o Confluence em sua infraestrutura, que pode ser local ou na nuvem. Isso permite que você mantenha os dados em sua rede e gerencie-os você mesmo.
Temos o prazer de anunciar que agora você pode usar o novo conector Amazon Kendra V2 para Confluence para pesquisar informações armazenadas em sua conta do Confluence na nuvem e em seu data center. Neste post, mostramos como indexar informações armazenadas no Confluence e usar a função de pesquisa inteligente do Amazon Kendra. Além disso, a pesquisa inteligente baseada em ML pode localizar com precisão informações de documentos não estruturados com conteúdo narrativo em linguagem natural, para os quais a pesquisa por palavra-chave não é muito eficaz.
O que há de novo para esta versão
Esta versão oferece suporte à autenticação OAuth 2.0, além da autenticação básica para a edição Cloud. Para a edição Data Center (local), adicionamos OAuth2 além da autenticação básica e tokens de acesso pessoal para mostrar os resultados da pesquisa com base nos direitos de acesso do usuário. Você pode se beneficiar dos seguintes recursos:
- Agora você pode rastrear comentários, além de espaços, páginas, blogs e anexos
- Agora você tem opções refinadas para seu escopo de sincronização - você pode especificar páginas, blogs, comentários e anexos
- Você pode optar por importar identidades (ou não)
- Esta versão oferece suporte regex para escolher títulos de entidade, bem como tipos de arquivo
- Você tem a opção de vários modos de sincronização
Visão geral da solução
Com o Amazon Kendra, você pode configurar várias fontes de dados para fornecer um local central para pesquisar em seu repositório de documentos. Para nossa solução, demonstramos como indexar um repositório Confluence usando o conector Amazon Kendra para Confluence. A solução consiste nos seguintes passos:
- Escolha um mecanismo de autenticação.
- Configure um aplicativo no Confluence e obtenha os detalhes da conexão.
- Armazene os detalhes em Gerenciador de segredos da AWS.
- Crie uma fonte de dados do Confluence V2 por meio do console do Amazon Kendra.
- Indexe os dados no repositório do Confluence.
- Execute uma consulta de exemplo para testar a solução.
Pré-requisitos
Para experimentar o conector Amazon Kendra para Confluence, você precisa do seguinte:
Escolha um mecanismo de autenticação
Escolha seu método de autenticação preferido:
- Basico – Isso funciona nas edições Cloud e Data Center. Você precisa de um ID de usuário e uma senha para configurar este método.
- Token de acesso pessoal – Esta opção só funciona para a edição Data Center.
- OAuth2 – Isso é mais envolvente e funciona para as edições Cloud e Data Center.
Reunir detalhes de autenticação
Nesta seção, mostramos as etapas para coletar seus detalhes de autenticação, dependendo do seu método de autenticação.
Autenticação básica
Para autenticação básica com a edição Data Center, tudo o que você precisa é seu login e senha. Certifique-se de que seu login tenha privilégios para coletar todo o conteúdo.
Para a edição Cloud, seu ID de usuário serve como seu login de usuário. Para sua senha, você precisa obter um token. Conclua as seguintes etapas:
- Logar em https://id.atlassian.com/manage-profile/security/api-tokens e escolha Criar token de API.
- Escolha O rótulo, insira um nome para o token.
- Escolha Crie.
- Copie o valor e salve-o para usar como sua senha.
Token de acesso pessoal
Este método de autenticação funciona apenas no local (Data Center). Conclua as etapas a seguir para adquirir detalhes de autenticação:
- Faça login na URL do Confluence usando o ID de usuário e a senha que você deseja que o Amazon Kendra use ao recuperar o conteúdo.
- Escolha o ícone do perfil e escolha Configurações.
- Escolha Tokens de acesso pessoal no painel de navegação e escolha Criar token.
- Escolha Nome do token, Insira o nome.
- Escolha Data de validade, desmarque Expiração automática.
- Escolha Crie.
- Copie o token e salve-o em um local seguro.
Para configurar o Secrets Manager, usamos a URL de login e esse valor.
Autenticação OAuth2 para edição do Confluence Cloud
Este método de autenticação segue todas as Documentação OAuth2.0 (3LO) da Confluência. Primeiro criamos e configuramos um aplicativo no Confluence e o habilitamos para OAuth2. O processo é um pouco diferente para as edições Cloud e Data Center. Em seguida, obtemos um token de autorização e o trocamos por um token de acesso. Por fim, obtemos o ID do cliente, o segredo do cliente e o código do cliente. Conclua as seguintes etapas:
- Faça login no aplicativo Confluence.
- Navegar para https://developer.atlassian.com/.
- Próximo de Meus apps, escolha Crie e escolha Integração OAuth2.
- Escolha Nome, Insira o nome.
- Escolha Crie.
- Escolha Autorização no painel de navegação.
- Escolha Adicionar ao lado do seu tipo de autorização.
- Escolha URL de retorno de chamada, insira a URL que você usa para fazer login no Confluence.
- Escolha Salvar as alterações .
- Debaixo Gerador de URL de autorização, escolha Adicionar APIs.
- Próximo de API de identidade do usuário, escolha Adicionar, Em seguida, escolha configurar.
- Escolha Editar escopos para configurar escopos de leitura para o aplicativo.
- Selecionar Ver perfil de usuário ativo e Visualizar perfis de usuários.
- Escolha Permissões no painel de navegação.
- Próximo de API do Confluence, escolha Adicionar, Em seguida, escolha configurar.
- No escopos clássicos guia, escolha Editar escopos.
- Selecione todos os escopos de leitura, pesquisa e download.
- Escolha Salvar.
- No Escopos granulares guia, escolha Editar escopos.
- Pesquise read e selecione todos os escopos encontrados.
- Escolha Salvar.
- Escolha Autorização no painel de navegação.
- Ao lado do seu tipo de autorização, escolha configurar.
Você deve ver três URLs listados.
- Copie o código para URL de autorização granular da API do Confluence.
Segue código de exemplo:
- Se você deseja gerar um token de atualização para não precisar repetir esse processo, adicione
offline_access
(ou%20offline_access
) ao final de todos os escopos na URL (por exemplo,&scope=REQUESTED_SCOPE%20REQUESTED_SCOPE_TWO%20offline_access
). - Se estiver tudo bem em gerar um novo token a cada vez, basta digitar a URL no seu navegador.
- Escolha ACEITAR.
Você é redirecionado para a página inicial do Confluence.
- Inspecione a URL do navegador e localize
code=xxxxx
. - Copie este código e salve-o.
Este é o código de autorização que usamos para trocar com o token de acesso.
- Retorne ao console do desenvolvedor Atlassian e escolha Configurações no painel de navegação.
- Copie os valores do ID do cliente e do ID secreto e salve-os.
Precisamos desses valores para fazer uma chamada para trocar o token de autorização pelo token de acesso.
Em seguida, usamos o Postman utilitário para postar o código de autorização para obter o token de acesso. Você pode usar ferramentas alternativas como enrolar para fazer isso também.
- A URL para postar o código de autorização é
https://auth.atlassian.com/oauth/token
. - O corpo JSON a ser postado é o seguinte:
A grant_type
parâmetro é codificado permanentemente. Coletamos os valores para client_id
e client_secret
em uma etapa anterior. O valor de code é o código de autorização que coletamos anteriormente.
Uma resposta bem-sucedida retornará o token de acesso. Se você adicionou acesso offline ao URL anteriormente, também receberá um token de atualização.
- Salve o token de acesso para usar ao configurar o Secrets Manager.
Se você estiver gerando um novo token a partir do token de atualização, o token atual será válido apenas por 1 hora. Se você precisar obter um novo token, poderá começar tudo de novo. No entanto, se você tiver o token de atualização, como antes, use o Postman para postar no seguinte URL: https://auth.atlassian.com/oauth/token
. Use o seguinte formato JSON para o corpo do token:
A chamada retornará um novo token de acesso
Autenticação OAuth2 para a edição Confluence Data Center
Se estiver usando a edição Data Center com autenticação OAuth2, conclua as seguintes etapas:
- Faça login na edição Confluence Data Center.
- Escolha o ícone de roda dentada e escolha Configuração geral.
- No painel de navegação, escolha Links de aplicativos, Em seguida, escolha Criar link.
- No Criar link janela pop-up, selecione Aplicação externa e Entrada, Em seguida, escolha Continuar.
- Escolha Nome, Insira o nome.
- Escolha URL de redirecionamento, entrar
https://httpbin.org/
. - Escolha Salvar.
- Copie e salve os valores para o ID do cliente e o segredo do cliente.
- Em uma guia separada do navegador, abra o URL https://example-app.com/pkce.
- Escolha Gerar String Aleatória e Calcular Hash.
- Copie o valor em Desafio do Código.
- Retorne à sua guia original.
- Use o seguinte URL para obter o código de autorização:
Use o ID do cliente que você copiou anteriormente e https://httpbin.org
para o URI de redirecionamento. Para CODE_CHALLENGE
, digite o código que você copiou anteriormente.
- Escolha Permitir.
Você é redirecionado para httpbin.org
.
- Salve o código para usar na próxima etapa.
- Para obter o token de acesso e o token de atualização, use uma ferramenta como enrolar or Postman para postar os seguintes valores para
https://<your confluence URL>/rest/oauth2/latest/token
:
Use o ID do cliente, o segredo do cliente e o código de autorização que você salvou anteriormente. Para CODE_VERIFIER
, insira o valor de quando você gerou o desafio de código.
- Copie o token de acesso e o token de atualização para usar mais tarde
O token de acesso e o token de atualização são válidos apenas por 1 hora. Para atualizar o token, poste o seguinte código no mesmo URL para obter novos valores:
Os novos tokens são válidos por 1 hora.
Armazenar credenciais do Confluence no Secrets Manager
Para armazenar suas credenciais do Confluence no Secrets Manager, conclua as seguintes etapas:
- No console do Secrets Manager, escolha Guarde um novo segredo.
- Selecionar Outro tipo de segredo.
- Dependendo do tipo de segredo, insira os valores-chave da seguinte forma:
- Para a autenticação básica do Confluence Cloud, insira os seguintes pares chave-valor (observe que a senha não é a senha de login, mas o token que você criou anteriormente):
- Para a autenticação OAuth do Confluence Cloud, insira os seguintes pares chave-valor:
- Para a autenticação básica do Confluence Data Center, insira os seguintes pares chave-valor:
- Para autenticação de token de acesso pessoal do Confluence Data Center, insira os seguintes pares chave-valor:
- Para a autenticação OAuth do Confluence Data Center, insira os seguintes pares chave-valor:
- Escolha Próximo.
- Escolha Nome secreto, insira um nome (por exemplo,
AmazonKendra-my-confluence-secret
). - Insira uma descrição opcional.
- Escolha Próximo.
- No Configurar rotação seção, mantenha todas as configurações em seus padrões e escolha Próximo.
- No Avaliações página, escolha Loja.
Configurar o conector Amazon Kendra para Confluence
Para configurar o conector do Amazon Kendra, conclua as seguintes etapas:
- No console Amazon Kendra, escolha Criar um índice.
- Escolha Nome do índice, insira um nome para o índice (por exemplo,
my-confluence-index
). - Insira uma descrição opcional.
- Escolha Nome do papel, insira um nome de função do IAM.
- Defina as configurações e tags de criptografia opcionais.
- Escolha Próximo.
- No Configurar o controle de acesso do usuário seção, deixe as configurações em seus padrões e escolha Próximo.
- No Especificar provisionamento seção, selecione Edição de desenvolvedor e escolha Próximo.
- Na página de revisão, escolha Crie.
Isso cria e propaga a função do IAM e, em seguida, cria o índice do Amazon Kendra, que pode levar até 30 minutos.
Crie uma fonte de dados do Confluence
Conclua as etapas a seguir para criar sua fonte de dados:
- No console Amazon Kendra, escolha As fontes de dados no painel de navegação.
- Debaixo Conector do Confluence V2.0, escolha Adicionar conector.
.
- Escolha Nome da fonte de dados, insira um nome (por exemplo,
my-Confluence-data-source
). - Insira uma descrição opcional.
- Escolha Próximo.
- Escolha um dos Nuvem de Confluência or Servidor Confluence dependendo da sua fonte de dados.
- Escolha Autenticação, escolha sua opção de autenticação.
- Selecionar O rastreador de identidade está ativado.
- Escolha Papel do IAM¸ escolher Crie uma nova função.
- Escolha Nome do papel, insira um nome (por exemplo,
AmazonKendra-my-confluence-datasource-role
). - Escolha Próximo.
Para as edições Confluence Data Center e Cloud, podemos adicionar informações adicionais opcionais (não mostradas) como o VPC. Somente para a edição Data Center, podemos adicionar informações adicionais para o proxy da web. Há também uma opção de autenticação adicional se estiver usando um token de acesso pessoal válido apenas para Data Center e não para a edição Cloud.
- Escolha Escopo de sincronização, selecione todo o conteúdo para sincronizar.
- Escolha Modo de sincronização, selecione Sincronização completa.
- Escolha Frequência, escolha Executar sob demanda.
- Escolha Próximo.
- Opcionalmente, você pode definir campos de mapeamento.
O mapeamento de campos é um exercício útil no qual você pode substituir os nomes dos campos por valores que sejam fáceis de usar e que se encaixem no vocabulário da sua organização.
- Para esta postagem, mantenha todos os padrões e escolha Próximo.
- Revise as configurações e escolha Adicionar fonte de dados.
- Para sincronizar a fonte de dados, escolha Sincronize agora.
Uma mensagem de banner aparece quando a sincronização é concluída.
Teste a solução
Agora que você ingeriu o conteúdo de sua conta do Confluence em seu índice do Amazon Kendra, pode testar algumas consultas. Para fins de nosso teste, criamos um site do Confluence com duas equipes: team1 com o membro Analyst1 e team2 com o membro Analyst2.
- No console do Amazon Kendra, navegue até seu índice e escolha Pesquisar conteúdo indexado.
- Insira um exemplo de consulta de pesquisa e analise os resultados da pesquisa (os resultados variam de acordo com o conteúdo da sua conta).
O conector do Confluence também rastreia informações de identidade local do Confluence. Você pode usar esse recurso para restringir sua consulta por usuário. O Confluence oferece opções abrangentes de visibilidade. Os usuários podem escolher seu conteúdo para ser visto por outros usuários, em nível de espaço ou por grupos. Quando você filtra suas pesquisas por usuários, a consulta retorna apenas os documentos aos quais o usuário tem acesso no momento da ingestão.
- Para usar esse recurso, expanda Consulta de teste com nome de usuário ou grupos e escolha Aplicar nome de usuário ou grupos.
- Digite o nome de usuário do seu usuário e escolha Aplicar.
Observe que para a edição do Confluence Data Center, o nome de usuário é o ID do e-mail.
Execute novamente sua consulta de pesquisa.
Isso traz para você um conjunto filtrado de resultados. Observe que trazemos de volta apenas 62 resultados.
Agora, voltamos e restringimos Bob Straham apenas para poder acessar seu espaço de trabalho e executar a pesquisa novamente.
Observe que obtemos apenas um subconjunto dos resultados porque a pesquisa é restrita apenas ao conteúdo de Bob.
Ao confrontar o Amazon Kendra com um aplicativo como um aplicativo criado usando Criador de experiência, você pode passar a identidade do usuário (na forma de ID de e-mail para a edição Cloud ou nome de usuário para a edição Data Center) para o Amazon Kendra para garantir que cada usuário veja apenas o conteúdo específico de seu ID de usuário. Como alternativa, você pode usar Centro de identidade do AWS IAM (sucessor do AWS Single Sign-On) para controlar o contexto do usuário que está sendo passado para o Amazon Kendra para limitar as consultas por usuário.
Parabéns! Você usou com sucesso o Amazon Kendra para encontrar respostas e insights com base no conteúdo indexado de sua conta do Confluence.
limpar
Para evitar custos futuros, limpe os recursos que você criou como parte desta solução. Se você criou um novo índice do Amazon Kendra ao testar esta solução, exclua-o. Se você adicionou apenas uma nova fonte de dados usando o conector Amazon Kendra para Confluence V2, exclua essa fonte de dados.
Conclusão
Com o novo conector Confluence V2 para Amazon Kendra, as organizações podem acessar o repositório de informações armazenadas em suas contas com segurança usando a pesquisa inteligente fornecida pelo Amazon Kendra.
Para saber mais sobre essas possibilidades e muito mais, consulte o Guia do desenvolvedor do Amazon Kendra. Para obter mais informações sobre como você pode criar, modificar ou excluir metadados e conteúdo ao ingerir seus dados do Confluence, consulte Enriquecendo seus documentos durante a ingestão e Enriqueça seu conteúdo e metadados para aprimorar sua experiência de pesquisa com o enriquecimento de documentos personalizados no Amazon Kendra.
Sobre o autor
Ashish Lagwankar é arquiteto de soluções corporativas sênior na AWS. Seus principais interesses incluem tecnologias de IA/ML, serverless e de contêiner. Ashish está baseado na área de Boston, MA, e gosta de ler, ao ar livre e passar tempo com sua família.
- Conteúdo com tecnologia de SEO e distribuição de relações públicas. Seja amplificado hoje.
- PlatoAiStream. Inteligência de Dados Web3. Conhecimento Amplificado. Acesse aqui.
- Cunhando o Futuro com Adryenn Ashley. Acesse aqui.
- Compre e venda ações em empresas PRE-IPO com PREIPO®. Acesse aqui.
- Fonte: https://aws.amazon.com/blogs/machine-learning/index-your-confluence-content-using-the-new-confluence-connector-v2-for-amazon-kendra/
- :tem
- :é
- :não
- :onde
- $UP
- 1
- 10
- 100
- 11
- 12
- 14
- 15%
- 17
- 1934
- 200
- 22
- 24
- 28
- 30
- 500
- 7
- 8
- 9
- a
- Capaz
- Sobre
- ACEITAR
- Acesso
- Conta
- preciso
- exatamente
- adquirir
- em
- ativo
- adicionar
- adicionado
- Adição
- Adicional
- Informação adicional
- novamente
- AI / ML
- Todos os Produtos
- permite
- tb
- sempre
- Amazon
- Amazona Kendra
- Amazon Web Services
- an
- e
- Anunciar
- respostas
- qualquer
- api
- APIs
- app
- aparece
- Aplicação
- Aplicar
- SOMOS
- ÁREA
- AS
- At
- Autenticação
- autorização
- evitar
- AWS
- em caminho duplo
- bandeira
- baseado
- basic
- BE
- Porque
- antes
- ser
- beneficiar
- Blogs
- grão
- corpo
- Boston
- ambos
- trazer
- Traz
- navegador
- construído
- mas a
- by
- chamada
- CAN
- capturar
- Centralização de
- central
- desafiar
- escolha
- escolhas
- Escolha
- escolha
- cliente
- Na nuvem
- código
- colaborar
- COM
- comentários
- competir
- completar
- compreensivo
- confirmação
- da conexão
- cônsul
- Recipiente
- conteúdo
- conteúdo
- contexto
- continuamente
- ao controle
- núcleo
- custos
- poderia
- rastreador
- crio
- criado
- cria
- Credenciais
- Atual
- personalizadas
- dados,
- Data Center
- defaults
- demonstrar
- Dependendo
- descrição
- detalhes
- Developer
- diferente
- do
- documento
- INSTITUCIONAIS
- não
- down
- download
- durante
- cada
- Mais cedo
- edição
- Eficaz
- ou
- permitir
- criptografia
- final
- aumentar
- garantir
- Entrar
- Empreendimento
- entidade
- Cada
- exemplo
- exchange
- animado
- Exercício
- Expandir
- vasta experiência
- família
- Característica
- Funcionalidades
- campo
- Campos
- Envie o
- filtro
- Finalmente
- Encontre
- Primeiro nome
- caber
- seguinte
- segue
- Escolha
- formulário
- formato
- encontrado
- da
- cheio
- função
- futuro
- reunir
- Acessorios
- gerar
- gerado
- gerando
- ter
- dá
- Go
- Do grupo
- Ter
- ter
- ajudar
- SUA PARTICIPAÇÃO FAZ A DIFERENÇA
- altamente
- sua
- Início
- hospedeiro
- hora
- Como funciona o dobrador de carta de canal
- Como Negociar
- Contudo
- HTML
- http
- HTTPS
- ÍCONE
- ID
- idéia
- identidades
- Identidade
- if
- importar
- in
- incluir
- índice
- INFORMAÇÕES
- Infraestrutura
- insights
- DOCUMENTOS
- Inteligente
- interesses
- para dentro
- envolvido
- IT
- jpg
- json
- apenas por
- Guarda
- Conhecimento
- língua
- APRENDER
- aprendizagem
- Deixar
- Nível
- como
- LIMITE
- Listado
- local
- log
- entrar
- máquina
- aprendizado de máquina
- fazer
- gerencia
- Gerente
- mapeamento
- mecanismo
- membro
- mensagem
- metadados
- método
- Minutos
- ML
- modificar
- mais
- múltiplo
- nome
- nomes
- NARRATIVA
- natural
- Navegar
- Navegação
- você merece...
- rede
- Novo
- Novo acesso
- Próximo
- Perceber..
- agora
- juramento
- of
- oferecido
- Oferece
- modo offline
- OK
- on
- só
- aberto
- Opção
- Opções
- or
- organizações
- original
- Outros
- A Nossa
- Fora
- ao ar livre
- Acima de
- página
- pares
- pão
- parâmetro
- parte
- passar
- passou
- Senha
- permissões
- pessoal
- Lugar
- platão
- Inteligência de Dados Platão
- PlatãoData
- pop-up
- possibilidades
- Publique
- alimentado
- preferido
- anterior
- privilégios
- processo
- Produto
- Perfil
- projeto
- fornecer
- procuração
- fins
- consultas
- acaso
- Leia
- Leitura
- redirecionar
- regex
- repetir
- repositório
- Recursos
- resposta
- restringir
- restringido
- Resultados
- retorno
- Retorna
- rever
- direitos
- Tipo
- Execute
- s
- SaaS
- seguro
- mesmo
- Salvar
- escopo
- Pesquisar
- Segredo
- Seção
- seguro
- firmemente
- segurança
- Vejo
- visto
- vê
- senior
- separado
- Serverless
- serve
- serviço
- Serviços
- conjunto
- contexto
- Configurações
- vários
- Partilhar
- rede de apoio social
- mostrar
- mostrando
- simples
- simplificar
- solteiro
- ligeiramente diferente
- So
- Software
- software como serviço
- solução
- Soluções
- alguns
- fonte
- Fontes
- Espaço
- espaços
- específico
- Passar
- começo
- Passo
- Passos
- loja
- armazenadas
- estrutura
- estruturada
- bem sucedido
- entraram com sucesso
- tal
- suíte
- ajuda
- suportes
- superfície
- Tire
- Torneira
- Profissionais
- equipes
- Tecnologias
- teste
- ensaio
- que
- A
- as informações
- deles
- Eles
- então
- Lá.
- Este
- deles
- isto
- aqueles
- três
- tempo
- títulos
- para
- juntos
- token
- Tokens
- ferramenta
- ferramentas
- tentar
- dois
- tipo
- para
- Atualizada
- URL
- usar
- usava
- Utilizador
- user-friendly
- usuários
- utilização
- utilidade
- valor
- Valores
- versão
- muito
- via
- visibilidade
- queremos
- we
- web
- serviços web
- Site
- BEM
- quando
- qual
- enquanto
- precisarão
- de
- dentro
- Atividades:
- trabalhador
- trabalho
- Vocês
- investimentos
- você mesmo
- zefirnet