Classificação de texto para conversas online com aprendizado de máquina na AWS

Republicado por Platão

seguidores: 0

As conversas online são onipresentes na vida moderna, abrangendo setores de videogames a telecomunicações. Isso levou a um crescimento exponencial na quantidade de dados de conversação online, o que ajudou no desenvolvimento de sistemas de processamento de linguagem natural (NLP) de última geração, como chatbots e modelos de geração de linguagem natural (NLG). Com o tempo, várias técnicas de PNL para análise de texto também evoluíram. Isso exige o requisito de um serviço totalmente gerenciado que possa ser integrado a aplicativos usando chamadas de API sem a necessidade de ampla experiência em aprendizado de máquina (ML). A AWS oferece serviços de IA da AWS pré-treinados, como Amazon Comprehend, que pode lidar efetivamente com casos de uso de PNL envolvendo classificação, resumo de texto, reconhecimento de entidade e muito mais para coletar insights do texto.

Além disso, as conversas on-line levaram a um fenômeno generalizado de uso não tradicional da linguagem. As técnicas tradicionais de PNL geralmente têm um desempenho ruim nesses dados de texto devido à constante evolução e vocabulários específicos de domínio que existem em diferentes plataformas, bem como os desvios lexicais significativos das palavras do inglês adequado, seja por acidente ou intencionalmente como uma forma de ataque adversário .

Neste post, descrevemos várias abordagens de ML para classificação de texto de conversas online com ferramentas e serviços disponíveis na AWS.

Pré-requisitos

Antes de se aprofundar neste caso de uso, preencha os seguintes pré-requisitos:

Configure um Conta da AWS e criar um usuário do IAM.
Configure o CLI da AWS e SDKs da AWS.
(Opcional) Configure seu Ambiente de IDE Cloud9.

Conjunto de dados

Para esta postagem, usamos o Viés não intencional do quebra-cabeça no conjunto de dados de classificação de toxicidade, uma referência para o problema específico de classificação de toxicidade em conversas online. O conjunto de dados fornece rótulos de toxicidade, bem como vários atributos de subgrupo, como obsceno, ataque de identidade, insulto, ameaça e sexualmente explícito. Os rótulos são fornecidos como valores fracionários, que representam a proporção de anotadores humanos que acreditaram no atributo aplicado a um determinado trecho de texto, o que raramente é unânime. Para gerar rótulos binários (por exemplo, tóxico ou não tóxico), um limite de 0.5 é aplicado aos valores fracionários e comentários com valores maiores que o limite são tratados como a classe positiva para esse rótulo.

Incorporação de subpalavras e RNNs

Para nossa primeira abordagem de modelagem, usamos uma combinação de incorporação de subpalavras e redes neurais recorrentes (RNNs) para treinar modelos de classificação de texto. As incorporações de subpalavras foram introduzidas por Bojanowski et ai. em 2017 como uma melhoria em relação aos métodos anteriores de incorporação em nível de palavra. Os modelos tradicionais de pular grama do Word2Vec são treinados para aprender uma representação vetorial estática de uma palavra de destino que prevê de maneira ideal o contexto dessa palavra. Os modelos de subpalavras, por outro lado, representam cada palavra alvo como um saco de n-gramas de caracteres que compõem a palavra, onde um n-grama é composto por um conjunto de n caracteres consecutivos. Esse método permite que o modelo de incorporação represente melhor a morfologia subjacente de palavras relacionadas no corpus, bem como o cálculo de incorporações para palavras novas e fora do vocabulário (OOV). Isso é particularmente importante no contexto de conversas on-line, um espaço de problemas no qual os usuários geralmente digitam palavras incorretamente (às vezes intencionalmente para evitar a detecção) e também usam um vocabulário exclusivo e em constante evolução que pode não ser capturado por um corpus de treinamento geral.

Amazon Sage Maker facilita o treinamento e a otimização de um modelo de incorporação de subpalavras não supervisionado em seu próprio corpus de dados de texto específicos de domínio com o built-in Algoritmo BlazingText. Também podemos baixar modelos de uso geral existentes treinados em grandes conjuntos de dados de texto online, como o seguinte Modelos em inglês disponíveis diretamente do fastText. Na instância do notebook SageMaker, basta executar o seguinte para fazer download de um modelo fastText pré-treinado:

!wget -O vectors.zip https://dl.fbaipublicfiles.com/fasttext/vectors-english/crawl-300d-2M-subword.zip

Se você treinou seus próprios embeddings com BlazingText ou baixou um modelo pré-treinado, o resultado é um binário de modelo compactado que você pode usar com a biblioteca gensim para incorporar uma determinada palavra de destino como um vetor com base em suas subpalavras constituintes:

# Imports
import os
from zipfile import ZipFile
from gensim.models.fasttext import load_facebook_vectors # Unzip the model binary into 'dir_path'
with ZipFile('vectors.zip', 'r') as zipObj: zipObj.extractall(path=<dir_path_name>) # Load embedding model into memory
embed_model = load_facebook_vectors(os.path.join(<dir_path_name>, 'vectors.bin')) # Compute embedding vector for 'word'
word_embedding = embed_model[word]

Depois de pré-processarmos um determinado segmento de texto, podemos usar essa abordagem para gerar uma representação vetorial para cada uma das palavras constituintes (separadas por espaços). Em seguida, usamos o SageMaker e uma estrutura de aprendizado profundo, como o PyTorch, para treinar um RNN personalizado com um objetivo de classificação binária ou multirótulo para prever se o texto é tóxico ou não e o subtipo específico de toxicidade com base em exemplos de treinamento rotulados.

Para carregar seu texto pré-processado para Serviço de armazenamento simples da Amazon (Amazon S3), use o seguinte código:

import boto3
s3 = boto3.client('s3') bucket = <bucket_name>
prefix = <prefix_name> s3.upload_file('train.pkl', bucket, os.path.join(prefix, 'train/train.pkl'))
s3.upload_file('valid.pkl', bucket, os.path.join(prefix, 'valid/valid.pkl'))
s3.upload_file('test.pkl', bucket, os.path.join(prefix, 'test/test.pkl'))

Para iniciar o treinamento de modelo multi-GPU escalável com o SageMaker, insira o seguinte código:

import sagemaker
sess = sagemaker.Session()
role = iam.get_role(RoleName= ‘AmazonSageMakerFullAccess’)['Role']['Arn'] from sagemaker.pytorch import PyTorch # hyperparameters, which are passed into the training job
hyperparameters = { 'epochs': 20, # Maximum number of epochs to train model 'train-batch-size': 128, # Training batch size (No. sentences) 'eval-batch-size': 1024, # Evaluation batch size (No. sentences) 'embed-size': 300, # Vector dimension of word embeddings (Must match embedding model) 'lstm-hidden-size': 200, # Number of neurons in LSTM hidden layer 'lstm-num-layers': 2, # Number of stacked LSTM layers 'proj-size': 100, # Number of neurons in intermediate projection layer 'num-targets': len(<list_of_label_names>), # Number of targets for classification 'class-weight': ' '.join([str(c) for c in <list_of_weights_per_class>]), # Weight to apply to each target during training 'total-length':<max_number_of_words_per_sentence>, 'metric-for-best-model': 'ap_score_weighted', # Metric on which to select the best model
} # create the Estimator
pytorch_estimator = PyTorch( entry_point='train.py', source_dir=<source_dir_path>, instance_type=<train_instance_type>, volume_size=200, instance_count=1, role=role, framework_version='1.6.0’, py_version='py36', hyperparameters=hyperparameters, metric_definitions=[ {'Name': 'validation:accuracy', 'Regex': 'eval_accuracy = (.*?);'}, {'Name': 'validation:f1-micro', 'Regex': 'eval_f1_score_micro = (.*?);'}, {'Name': 'validation:f1-macro', 'Regex': 'eval_f1_score_macro = (.*?);'}, {'Name': 'validation:f1-weighted', 'Regex': 'eval_f1_score_weighted = (.*?);'}, {'Name': 'validation:ap-micro', 'Regex': 'eval_ap_score_micro = (.*?);'}, {'Name': 'validation:ap-macro', 'Regex': 'eval_ap_score_macro = (.*?);'}, {'Name': 'validation:ap-weighted', 'Regex': 'eval_ap_score_weighted = (.*?);'}, {'Name': 'validation:auc-micro', 'Regex': 'eval_auc_score_micro = (.*?);'}, {'Name': 'validation:auc-macro', 'Regex': 'eval_auc_score_macro = (.*?);'}, {'Name': 'validation:auc-weighted', 'Regex': 'eval_auc_score_weighted = (.*?);'} ]
) pytorch_estimator.fit( { 'train': 's3://<bucket_name>/<prefix_name>/train', 'valid': 's3://<bucket_name>/<prefix_name>/valid', 'test': 's3://<bucket_name>/<prefix_name>/test' }
)

Dentro , definimos um conjunto de dados PyTorch que é usado por train.py para preparar os dados de texto para treinamento e avaliação do modelo:

def pad_matrix(m: torch.Tensor, max_len: int =100)-> tuple[int, torch.Tensor] : """Pads an embedding matrix to a specified maximum length.""" if m.ndim == 1: m = m.reshape(1, -1) mask = np.ones_like(m) if m.shape[0] > max_len: m = m[:max_len, :] mask = mask[:max_len, :] else: m = np.pad(m, ((0, max_len - m.shape[0]), (0,0))) mask = np.pad(mask, ((0, max_len - mask.shape[0]), (0,0))) return m, mask class EmbeddingDataset(Dataset: torch.utils.data.Dataset): """PyTorch dataset representing pretrained sentence embeddings, masks, and labels.""" def __init__(self, text: str, labels: int, max_len: int=100): self.text = text self.labels = labels self.max_len = max_len def __len__(self) -> int: return len(self.labels) def __getitem__(self, idx: int) -> dict: e = embed_line(self.text[idx]) length = e.shape[0] m, mask = pad_matrix(e, max_len=self.max_len) item = {} item['embeddings'] = torch.from_numpy(m) item['mask'] = torch.from_numpy(mask) item['labels'] = torch.tensor(self.labels[idx]) if length > self.max_len: item['lengths'] = torch.tensor(self.max_len) else: item['lengths'] = torch.tensor(length) return item

Observe que este código antecipa que o vectors.zip arquivo contendo seus embeddings fastText ou BlazingText será armazenado em .

Além disso, você pode implantar facilmente modelos fastText pré-treinados por conta própria em endpoints SageMaker ativos para calcular vetores incorporados em tempo real para uso em tarefas relevantes em nível de palavra. Veja a seguir Exemplo do GitHub para mais detalhes.

Transformers com cara de abraço

Para nossa segunda abordagem de modelagem, fazemos a transição para o uso de Transformers, introduzido no artigo Atenção É Tudo Que Você Precisa. Os transformadores são modelos de aprendizado profundo projetados para evitar deliberadamente as armadilhas das RNNs, contando com um mecanismo de autoatenção para desenhar dependências globais entre entrada e saída. A arquitetura do modelo Transformer permite uma paralelização significativamente melhor e pode alcançar alto desempenho em um tempo de treinamento relativamente curto.

Baseado no sucesso de Transformers, o BERT, lançado no jornal BERT: Pré-treinamento de transformadores bidirecionais profundos para compreensão de idiomas, adicionado pré-treinamento bidirecional para representação de idioma. Inspirado na tarefa Cloze, o BERT é pré-treinado com modelagem de linguagem mascarada (MLM), na qual o modelo aprende a recuperar as palavras originais para tokens mascarados aleatoriamente. O modelo BERT também é pré-treinado na tarefa de previsão da próxima sentença (NSP) para prever se duas sentenças estão na ordem correta de leitura. Desde seu advento em 2018, o BERT e suas variações têm sido amplamente utilizados em tarefas de classificação de texto.

Nossa solução usa uma variante do BERT conhecida como RoBERTa, que foi introduzida no artigo RoBERTa: uma abordagem de pré-treinamento de BERT altamente otimizada. O RoBERTa melhora ainda mais o desempenho do BERT em uma variedade de tarefas de linguagem natural por meio de treinamento de modelo otimizado, incluindo modelos de treinamento mais longos em um corpus 10 vezes maior, usando hiperparâmetros otimizados, mascaramento aleatório dinâmico, remoção da tarefa NSP e muito mais.

Nossos modelos baseados em RoBERTa usam o Transformadores de rosto abraçando library, que é uma estrutura Python de código aberto popular que fornece implementações de alta qualidade de todos os tipos de modelos Transformer de última geração para uma variedade de tarefas de PNL. Hugging Face fez parceria com a AWS para permitir que você treine e implante facilmente modelos do Transformer no SageMaker. Esta funcionalidade está disponível através Abraçando as imagens do contêiner de aprendizado profundo da AWS, que incluem as bibliotecas Transformers, Tokenizers e Datasets e integração otimizada com o SageMaker para treinamento e inferência de modelos.

Em nossa implementação, herdamos o backbone da arquitetura RoBERTa da estrutura Hugging Face Transformers e usamos o SageMaker para treinar e implantar nosso próprio modelo de classificação de texto, que chamamos de RoBERTox. RoBERTox usa codificação de pares de bytes (BPE), introduzida em Tradução de máquina neural de palavras raras com unidades de subpalavra, para tokenizar o texto de entrada em representações de subpalavra. Podemos então treinar nossos modelos e tokenizers nos dados do Jigsaw ou em qualquer corpus grande de domínio específico (como os logs de bate-papo de um jogo específico) e usá-los para classificação de texto personalizada. Definimos nossa classe de modelo de classificação personalizada no código a seguir:

class RoBERToxForSequenceClassification(CustomLossMixIn, RobertaPreTrainedModel): _keys_to_ignore_on_load_missing = [r"position_ids"] def __init__(self, config: PretrainedConfig, *inputs, **kwargs): """Initialize the RoBERToxForSequenceClassification instance Parameters ---------- config : PretrainedConfig num_labels : Optional[int] if not None, overwrite the default classification head in pretrained model. mode : Optional[str] 'MULTI_CLASS', 'MULTI_LABEL' or "REGRESSION". Used to determine loss class_weight : Optional[List[float]] If not None, add class weight to BCEWithLogitsLoss or CrossEntropyLoss """ super().__init__(config, *inputs, **kwargs) # Define model architecture self.roberta = RobertaModel(self.config, add_pooling_layer=False) self.classifier = RobertaClassificationHead(self.config) self.init_weights() @modeling_roberta.add_start_docstrings_to_model_forward( modeling_roberta.ROBERTA_INPUTS_DOCSTRING.format("batch_size, sequence_length") ) @modeling_roberta.add_code_sample_docstrings( tokenizer_class=modeling_roberta._TOKENIZER_FOR_DOC, checkpoint=modeling_roberta._CHECKPOINT_FOR_DOC, output_type=SequenceClassifierOutput, config_class=modeling_roberta._CONFIG_FOR_DOC, ) def forward( self, input_ids: torch.Tensor = None, attention_mask: torch.Tensor = None, token_type_ids: torch.Tensor = None, position_ids: torch.Tensor =None, head_mask: torch.Tensor =None, inputs_embeds: torch.Tensor =None, labels: torch.Tensor =None, output_attentions: torch.Tensor =None, output_hidden_states: torch.Tensor =None, return_dict: bool =None, sample_weights: torch.Tensor =None, ) -> : dict: """Forward pass to return loss, logits, ... Returns -------- output : SequenceClassifierOutput has those keys: loss, logits, hidden states, attentions """ return_dict = return_dict or self.config.use_return_dict outputs = self.roberta( input_ids, attention_mask=attention_mask, token_type_ids=token_type_ids, position_ids=position_ids, head_mask=head_mask, inputs_embeds=inputs_embeds, output_attentions=output_attentions, output_hidden_states=output_hidden_states, return_dict=return_dict, ) sequence_output = outputs[0] # [CLS] embedding logits = self.classifier(sequence_output) loss = self.compute_loss(logits, labels, sample_weights=sample_weights) if not return_dict: output = (logits,) + outputs[2:] return ((loss,) + output) if loss is not None else output return SequenceClassifierOutput( loss=loss, logits=logits, hidden_states=outputs.hidden_states, attentions=outputs.attentions, ) def compute_loss(self, logits: torch.Tensor, labels: torch.Tensor, sample_weights: Optional[torch.Tensor] = None) -> torch.FloatTensor: return super().compute_loss(logits, labels, sample_weights)

Antes do treinamento, preparamos nossos dados de texto e rótulos usando a biblioteca de conjuntos de dados do Hugging Face e carregamos o resultado no Amazon S3:

from datasets import Dataset
import multiprocessing data_train = Dataset.from_pandas(df_train)
… tokenizer = <instantiated_huggingface_tokenizer> def preprocess_function(examples: examples) -> torch.Tensor: result = tokenizer(examples["text"], padding="max_length", max_length=128, truncation=True) return result num_proc = multiprocessing.cpu_count()
print("Number of CPUs =", num_proc) data_train = data_train.map( preprocess_function, batched=True, load_from_cache_file=False, num_proc=num_proc
)
… import botocore
from datasets.filesystems import S3FileSystem s3_session = botocore.session.Session() # create S3FileSystem instance with s3_session
s3 = S3FileSystem(session=s3_session) # saves encoded_dataset to your s3 bucket
data_train.save_to_disk(f's3://<bucket_name>/<prefix_name>/train', fs=s3)
…

Iniciamos o treinamento do modelo de forma semelhante ao RNN:

import sagemaker
sess = sagemaker.Session()
role = sagemaker.get_execution_role()
from sagemaker.huggingface import HuggingFace # hyperparameters, which are passed into the training job
hyperparameters = { 'model-name': <huggingface_base_model_name>, 'epochs': 10, 'train-batch-size': 32, 'eval-batch-size': 64, 'num-labels': len(<list_of_label_names>), 'class-weight': ' '.join([str(c) for c in <list_of_class_weights>]), 'metric-for-best-model': 'ap_score_weighted', 'save-total-limit': 1,
} # create the Estimator
huggingface_estimator = HuggingFace( entry_point='train.py', source_dir=<source_dir_path>, instance_type=<train_instance_type>, instance_count=1, role=role, transformers_version='4.6.1', pytorch_version='1.7.1', py_version='py36', hyperparameters=hyperparameters, metric_definitions=[ {'Name': 'validation:accuracy', 'Regex': 'eval_accuracy = (.*?);'}, {'Name': 'validation:f1-micro', 'Regex': 'eval_f1_score_micro = (.*?);'}, {'Name': 'validation:f1-macro', 'Regex': 'eval_f1_score_macro = (.*?);'}, {'Name': 'validation:f1-weighted', 'Regex': 'eval_f1_score_weighted = (.*?);'}, {'Name': 'validation:ap-micro', 'Regex': 'eval_ap_score_micro = (.*?);'}, {'Name': 'validation:ap-macro', 'Regex': 'eval_ap_score_macro = (.*?);'}, {'Name': 'validation:ap-weighted', 'Regex': 'eval_ap_score_weighted = (.*?);'}, {'Name': 'validation:auc-micro', 'Regex': 'eval_auc_score_micro = (.*?);'}, {'Name': 'validation:auc-macro', 'Regex': 'eval_auc_score_macro = (.*?);'}, {'Name': 'validation:auc-weighted', 'Regex': 'eval_auc_score_weighted = (.*?);'} ]
) huggingface_estimator.fit( { 'train': 's3://<bucket_name>/<prefix_name>/train', 'valid': 's3://<bucket_name>/<prefix_name>/valid', 'test': 's3://<bucket_name>/<prefix_name>/test'
)

Por fim, o trecho de código Python a seguir ilustra o processo de servir RoBERTox por meio de um endpoint SageMaker ao vivo para classificação de texto em tempo real para uma solicitação JSON:

from sagemaker.huggingface import HuggingFaceModel
from sagemaker import get_execution_role
from sagemaker.predictor import Predictor
from sagemaker.serializers import JSONSerializer
from sagemaker.deserializers import JSONDeserializer class Classifier(Predictor): def __init__(self, endpoint_name, sagemaker_session): super().__init__(endpoint_name, sagemaker_session, serializer=JSONSerializer(), deserializer=JSONDeserializer()) hf_model = HuggingFaceModel( role=get_execution_role(), model_data=<s3_model_and_tokenizer.tar.gz>, entry_point="inference.py", transformers_version="4.6.1", pytorch_version="1.7.1", py_version="py36", predictor_cls=Classifier
) predictor = hf_model.deploy(instance_type=<deploy_instance_type>, initial_instance_count=1)

Avaliação do desempenho do modelo: conjunto de dados de viés não intencional do Jigsaw

A tabela a seguir contém métricas de desempenho para modelos treinados e avaliados em dados da competição Jigsaw Unintended Bias in Toxicity Detection Kaggle. Treinamos modelos para três tarefas diferentes, mas inter-relacionadas:

Caso binário – O modelo foi treinado no conjunto de dados de treinamento completo para prever o toxicity apenas etiqueta
Caso de granulação fina – O subconjunto dos dados de treinamento para o qual toxicity>=0.5 foi usado para prever outros rótulos de subtipo de toxicidade (obscene, threat, insult, identity_attack, sexual_explicit)
Caso multitarefa – O conjunto de dados de treinamento completo foi usado para prever todos os seis rótulos simultaneamente

Treinamos modelos RNN e RoBERTa para cada uma dessas três tarefas usando os rótulos fracionários fornecidos pelo Jigsaw, que correspondem à proporção de anotadores que acharam o rótulo apropriado para o texto, bem como com rótulos binários combinados com pesos de classe na rede função de perda. No esquema de rotulagem binária, as proporções foram limitadas em 0.5 para cada rótulo disponível (1 se rótulo>=0.5, 0 caso contrário), e as funções de perda do modelo foram ponderadas com base nas proporções relativas de cada rótulo binário no conjunto de dados de treinamento. Em todos os casos, verificamos que a utilização dos rótulos fracionários resultou diretamente no melhor desempenho, indicando o valor agregado da informação inerente ao grau de concordância entre os anotadores.

Exibimos duas métricas de modelo: a precisão média (AP), que fornece um resumo da curva de precisão-recall calculando a média ponderada dos valores de precisão alcançados em cada limite de classificação e a área sob a curva característica de operação do receptor (AUC) , que agrega o desempenho do modelo nos limites de classificação em relação à taxa de verdadeiros positivos e à taxa de falsos positivos. Observe que a classe verdadeira para uma determinada instância de texto no conjunto de teste corresponde a se a proporção verdadeira é maior ou igual a 0.5 (1 se rótulo>=0.5, 0 caso contrário).

.	Incorporação de subpalavras + RNN	Roberto
.	Rótulos fracionários	Rótulos binários + ponderação de classe	Rótulos fracionários	Rótulos binários + ponderação de classe
Binário	PA=0.746, AUC=0.966	AP=0.730, AUC=0.963	AP=0.758, AUC=0.966	AP=0.747, AUC=0.963
Refinado	AP=0.906, AUC=0.909	AP=0.850, AUC=0.851	AP=0.913, AUC=0.913	AP=0.911, AUC=0.912
Multitarefa	PA=0.721, AUC=0.972	AP=0.535, AUC=0.907	AP=0.740, AUC=0.972	AP=0.711, AUC=0.961

Conclusão

Neste post, apresentamos duas abordagens de classificação de texto para conversas online usando serviços AWS ML. Você pode generalizar essas soluções em plataformas de comunicação on-line, com setores como o de jogos particularmente propensos a se beneficiar da capacidade aprimorada de detectar conteúdo prejudicial. Em postagens futuras, planejamos discutir ainda mais uma arquitetura de ponta a ponta para implantação perfeita de modelos em sua conta da AWS.

Se você quiser ajuda para acelerar o uso de ML em seus produtos e processos, entre em contato com o Laboratório de soluções de ML da Amazon.

Sobre os autores

Classificação de texto para conversas online com machine learning no AWS PlatoBlockchain Data Intelligence. Pesquisa vertical. Ai. Marca Ryan é cientista de dados no Amazon Machine Learning Solutions Lab. Ele tem experiência específica na aplicação de aprendizado de máquina a problemas na área de saúde e nas ciências da vida, e nas horas vagas gosta de ler história e ficção científica.

Sourav Bhabesh é cientista de dados no Amazon ML Solutions Lab. Ele desenvolve soluções de IA/ML para clientes da AWS em vários setores. Sua especialidade é Processamento de Linguagem Natural (PNL) e é apaixonado por aprendizado profundo. Fora do trabalho, gosta de ler livros e viajar.

Liutong Zhou é um cientista aplicado no Amazon ML Solutions Lab. Ele cria soluções de IA/ML sob medida para clientes da AWS em vários setores. Ele é especialista em Processamento de Linguagem Natural (PNL) e é apaixonado por aprendizado profundo multimodal. Ele é um tenor lírico e gosta de cantar óperas fora do trabalho.

Sia Gholami é Cientista de Dados Sênior no Amazon ML Solutions Lab, onde desenvolve soluções de IA/ML para clientes em vários setores. Ele é apaixonado por processamento de linguagem natural (PNL) e aprendizado profundo. Fora do trabalho, Sia gosta de passar o tempo na natureza e jogar tênis.

Daniel Horowitz é um gerente de ciência de IA aplicada. Ele lidera uma equipe de cientistas no Amazon ML Solutions Lab trabalhando para resolver os problemas dos clientes e impulsionar a adoção da nuvem com ML.

Carimbo de hora: 29 de Junho de 2022

Carimbo de hora: Junho 23, 2022

Classificação de texto para conversas online com machine learning na AWS

Republicado por Platão

Pré-requisitos

Conjunto de dados

Incorporação de subpalavras e RNNs

Transformers com cara de abraço

Avaliação do desempenho do modelo: conjunto de dados de viés não intencional do Jigsaw

Conclusão

Sobre os autores

Mais de Aprendizado de máquina da AWS

Processamento inteligente de documentos com serviços de IA da AWS: parte 1

Modelos de transformadores de face abraçada de host usando o Amazon SageMaker Serverless Inference

Treinamento distribuído com Amazon EKS e Torch Distributed Elastic

Exafunction oferece suporte ao AWS Inferentia para obter o melhor desempenho de preço para inferência de aprendizado de máquina

O LightGBM integrado do Amazon SageMaker agora oferece treinamento distribuído usando o Dask

Novo suporte de formato de dados expandido no Amazon Kendra

Otimize hiperparâmetros com o Amazon SageMaker Automatic Model Tuning

Sobre Nós

Pesquisa vertical e IA

Plataforma

Fique Ligado

Conta