Na exibição de itens, os itens são fornecidos na forma de uma lista ordenada em tempo hábil, com cada item contendo informações de metadados adicionais:
{ "results": { "items": [ { "channel_label": "ch_0", "start_time": "1.509", "speaker_label": "spk_0", "end_time": "2.21", "alternatives": [ { "confidence": "0.999", "content": "Hi" } ], "type": "pronunciation" }, { "channel_label": "ch_0", "speaker_label": "spk_0", "alternatives": [ { "confidence": "0.0", "content": "," } ], "type": "punctuation" }, { "channel_label": "ch_0", "start_time": "2.22", "speaker_label": "spk_0", "end_time": "2.9", "alternatives": [ { "confidence": "0.999", "content": "welcome" } ], "type": "pronunciation" }, { "channel_label": "ch_0", "speaker_label": "spk_0", "alternatives": [ { "confidence": "0.0", "content": "." } ], "type": "punctuation" } ] }
}
Os metadados são os seguintes:
- Formato – O valor type indica se o item específico é uma pontuação ou uma pronúncia. Exemplos de pontuação com suporte são vírgula, ponto final e ponto de interrogação.
- Alternativas – Uma matriz de objetos contendo a transcrição real, juntamente com o nível de confiança, ordenados por nível de confiança. Quando o recurso de resultados alternativos não está ativado, esta lista sempre possui apenas um item.
- Confiança – Uma indicação de quão confiante o Amazon Transcribe está quanto à exatidão da transcrição. Ele usa valores de 0 a 1, com 1 indicando 100% de confiança.
- Conteúdo – A palavra transcrita.
- Hora de início – Um ponteiro de tempo do arquivo de áudio ou vídeo indicando o início do item no formato ss.SSS.
- Tempo final – Um ponteiro de tempo do arquivo de áudio ou vídeo indicando o final do item no formato ss.SSS.
- Rótulo do canal – O identificador de canal, que está presente no item somente quando o recurso de identificação de canal foi habilitado na configuração do trabalho.
- Rótulo do alto-falante – O identificador do alto-falante, que está presente no item apenas quando o recurso de particionamento do alto-falante foi ativado na configuração do trabalho.
Identificando parágrafos
A identificação de parágrafos depende de informações de metadados na exibição de itens. Em particular, utilizamos as informações de horário de início e término junto com o tipo de transcrição e o conteúdo para identificar sentenças e então decidir quais sentenças são as melhores candidatas para pontos de entrada de parágrafo.
Uma frase é considerada uma lista de itens de transcrição que existe entre itens de pontuação que indicam ponto final. Exceções a isso são o início e o fim da transcrição, que são, por padrão, limites de sentença. A figura a seguir mostra um exemplo desses itens.
A identificação da frase é direta com o Amazon Transcribe porque a pontuação é um recurso pronto para uso, juntamente com os tipos de pontuação vírgula, ponto final e ponto de interrogação. Neste conceito, utilizamos um ponto final como limite da frase.
Nem toda frase deve ser um ponto de parágrafo. Para identificar os parágrafos, introduzimos um novo insight no nível da frase chamado atraso inicial, conforme ilustrado na figura a seguir. Usamos um atraso inicial para definir o atraso de tempo que o locutor introduz na pronúncia da frase atual em comparação com a anterior.
O cálculo do atraso inicial requer o tempo de início da frase atual e o tempo final da frase anterior por locutor. Como o Amazon Transcribe fornece horários de início e término por item, o cálculo requer o uso do primeiro e do último itens das sentenças atual e anterior, respectivamente.
Conhecendo os atrasos iniciais de cada sentença, podemos aplicar análises estatísticas e descobrir a significância de cada atraso em comparação com a população total de atrasos. Em nosso contexto, atrasos significativos são aqueles que ultrapassam a duração típica da população. O gráfico a seguir mostra um exemplo.
Para esse conceito, decidimos aceitar as sentenças com atrasos iniciais maiores que o valor médio como significativas e introduzir um ponto de parágrafo no início de cada sentença. Além do valor médio, existem outras opções, como aceitar todos os atrasos iniciais maiores que a mediana, ou terceiro quantil ou valor superior da cerca da população.
Acrescentamos mais uma etapa ao processo de identificação do parágrafo, levando em consideração o número de palavras contidas em cada parágrafo. Quando os parágrafos contêm um número significativo de palavras, executamos uma operação de divisão, adicionando assim mais um parágrafo ao resultado final.
No contexto da contagem de palavras, definimos como significativas as contagens de palavras que excedem o valor da cerca superior. Tomamos essa decisão deliberadamente, para restringir as operações de divisão aos parágrafos que realmente se comportam como valores discrepantes em nossos resultados. O gráfico a seguir mostra um exemplo.
A operação de divisão seleciona o novo ponto de entrada do parágrafo considerando o insight máximo do atraso inicial da frase. Dessa forma, o novo parágrafo é introduzido na frase que exibe o atraso máximo de início dentro do parágrafo atual. As divisões podem ser repetidas até que nenhuma contagem de palavras exceda o limite selecionado, em nosso caso, o valor da cerca superior. A figura a seguir mostra um exemplo.
Conclusão
Nesta postagem, apresentamos um conceito para introduzir parágrafos automaticamente em suas transcrições, sem intervenção manual, com base nos metadados que o Amazon Transcribe fornece junto com a transcrição real.
Este conceito não é específico de idioma ou sotaque, porque depende de metadados não linguísticos para sugerir pontos de entrada de parágrafo. As variações futuras podem incluir informações gramaticais ou semânticas em um caso por idioma, aprimorando ainda mais a lógica de identificação do parágrafo.
Se você tiver comentários sobre esta postagem, envie seus comentários na seção de comentários. Estamos ansiosos para ouvir de você. Confira Recursos de transcrição da Amazon para obter recursos adicionais que ajudarão você a obter o máximo valor de suas transcrições.
Sobre os autores
Kostas Tzouvanas é arquiteto de soluções corporativas na Amazon Web Services. Ele ajuda os clientes a arquitetar soluções baseadas em nuvem para atingir seu potencial de negócios. Seu foco principal são plataformas de negociação e sistemas de computação de alto desempenho. Ele também é apaixonado por genômica e bioinformática.
Pavlos Kaimakis é um arquiteto de soluções corporativas que cuida de clientes corporativos em GR/CY/MT, apoiando-os com sua experiência para projetar e implementar soluções que gerem valor para eles. Pavlos passou a maior parte do tempo de sua carreira no setor de produtos e suporte ao cliente - tanto do ponto de vista da engenharia quanto do gerenciamento. Pavlos adora viajar e está sempre pronto para explorar novos lugares no mundo.
- Conteúdo com tecnologia de SEO e distribuição de relações públicas. Seja amplificado hoje.
- PlatoAiStream. Inteligência de Dados Web3. Conhecimento Amplificado. Acesse aqui.
- Cunhando o Futuro com Adryenn Ashley. Acesse aqui.
- Compre e venda ações em empresas PRE-IPO com PREIPO®. Acesse aqui.
- Fonte: https://aws.amazon.com/blogs/machine-learning/arrange-your-transcripts-into-paragraphs-with-amazon-transcribe/
- :tem
- :é
- :não
- $UP
- 1
- 100
- 22
- 7
- 9
- a
- Sobre
- ACEITAR
- aceitar
- Alcançar
- real
- adicionar
- acrescentando
- Adicional
- Depois de
- Todos os Produtos
- juntamente
- tb
- alternativa
- alternativas
- sempre
- Amazon
- Amazon Transcribe
- Amazon Web Services
- quantidade
- an
- análise
- e
- à parte
- Aplicar
- SOMOS
- Ordem
- AS
- At
- auditivo
- automaticamente
- baseado
- BE
- Porque
- Começo
- MELHOR
- entre
- O maior
- ambos
- limites
- limite
- Caixa
- negócio
- by
- chamado
- CAN
- candidatos
- Oportunidades
- casas
- Canal
- verificar
- comentários
- comparação
- computação
- conceito
- confiança
- confiante
- Configuração
- consideração
- considerado
- considerando
- não contenho
- contida
- conteúdo
- contexto
- Atual
- cliente
- Suporte ao cliente
- Clientes
- decidir
- decisão
- Padrão
- atraso
- atrasos
- Design
- documento
- distância
- duração
- cada
- habilitado
- final
- Engenharia
- aprimorando
- Empreendimento
- entrada
- Cada
- exemplo
- exemplos
- excedem
- excede
- exposições
- existe
- vasta experiência
- Explorando
- Característica
- Funcionalidades
- retornos
- Figura
- Envie o
- final
- Primeiro nome
- Foco
- seguinte
- segue
- Escolha
- formulário
- formato
- para a frente
- da
- cheio
- mais distante
- futuro
- genómica
- ter
- gráfico
- maior
- Ter
- he
- audição
- ajudar
- ajuda
- hi
- Alta
- sua
- Como funciona o dobrador de carta de canal
- HTTPS
- identificação
- identificador
- identificar
- if
- executar
- in
- incluir
- indicam
- indicam
- indicação
- INFORMAÇÕES
- introspecção
- da intervenção
- para dentro
- introduzir
- introduzido
- Introduz
- IT
- Unid
- Trabalho
- jpg
- língua
- Sobrenome
- Nível
- como
- Lista
- lógica
- olhar
- procurando
- ama
- a Principal
- fazer
- de grupos
- manual
- marca
- max
- máximo
- significar
- metadados
- mais
- a maioria
- Novo
- não
- número
- objetos
- of
- on
- ONE
- só
- operação
- Operações
- Opções
- or
- Outros
- A Nossa
- Fora
- Acima de
- particular
- apaixonado
- atuação
- perspectiva
- Locais
- Plataformas
- platão
- Inteligência de Dados Platão
- PlatãoData
- ponto
- pontos
- população
- Publique
- potencial
- presente
- apresentado
- anterior
- processo
- Produto
- fornecido
- fornece
- questão
- repetido
- exige
- respectivamente
- restringir
- resultar
- Resultados
- Execute
- Seção
- setor
- selecionado
- sentença
- Serviços
- rede de apoio social
- Shows
- significado
- periodo
- So
- solução
- Soluções
- Palestrantes
- específico
- gasto
- divisão
- splits
- começo
- estatístico
- Passo
- Dê um basta
- franco
- enviar
- tal
- sugerir
- ajuda
- Suportado
- Apoiar
- sistemas
- tomar
- do que
- que
- A
- o mundo
- deles
- Eles
- então
- Lá.
- assim
- Este
- Terceiro
- isto
- aqueles
- tempo
- vezes
- para
- Total
- Trading
- Plataformas de negociação
- Cópia
- verdadeiramente
- tipo
- tipos
- típico
- até
- Uso
- usar
- usos
- utilizar
- valor
- Valores
- Vídeo
- Ver
- foi
- Caminho..
- we
- web
- serviços web
- boas-vindas
- quando
- qual
- precisarão
- de
- sem
- Word
- palavras
- mundo
- Vocês
- investimentos
- zefirnet