Классификация текстов для онлайн-разговоров с помощью машинного обучения на AWS

Переиздано Платоном

Читают: 0

Онлайн-разговоры широко распространены в современной жизни, охватывая различные отрасли от видеоигр до телекоммуникаций. Это привело к экспоненциальному росту объема данных онлайн-разговоров, что помогло в разработке современных систем обработки естественного языка (NLP), таких как чат-боты и модели генерации естественного языка (NLG). Со временем также развились различные методы НЛП для анализа текста. Это обуславливает потребность в полностью управляемой службе, которую можно интегрировать в приложения с помощью вызовов API без необходимости в обширных знаниях в области машинного обучения (ML). AWS предлагает предварительно обученные сервисы AWS AI, такие как Amazon Comprehend, который может эффективно обрабатывать варианты использования NLP, включая классификацию, обобщение текста, распознавание сущностей и многое другое, чтобы получать информацию из текста.

Кроме того, онлайн-разговоры привели к широко распространенному явлению нетрадиционного использования языка. Традиционные методы NLP часто плохо работают с этими текстовыми данными из-за постоянно развивающегося и специфичного для предметной области словаря, который существует на разных платформах, а также из-за значительных лексических отклонений слов от правильного английского языка, случайно или преднамеренно как форма состязательной атаки. .

В этом посте мы описываем несколько подходов машинного обучения для классификации текстов онлайн-разговоров с помощью инструментов и сервисов, доступных на AWS.

Предпосылки

Прежде чем углубляться в этот вариант использования, выполните следующие предварительные условия:

Настроить Аккаунт AWS и создать пользователя IAM.
Настройте Интерфейс командной строки AWS и SDK AWS.
(Необязательно) Настройте свой IDE-среда Cloud9.

Dataset

Для этого поста мы используем Непреднамеренная систематическая ошибка Jigsaw в наборе данных классификации токсичности, эталон для конкретной проблемы классификации токсичности в онлайн-разговорах. Набор данных предоставляет метки токсичности, а также несколько атрибутов подгрупп, таких как непристойность, атака на личность, оскорбление, угроза и откровенно сексуальный характер. Метки предоставляются в виде дробных значений, которые представляют собой долю комментаторов-людей, которые считают, что атрибут применяется к данному фрагменту текста, которые редко бывают единодушны. Для создания двоичных меток (например, токсичных или нетоксичных) к дробным значениям применяется порог 0.5, а комментарии со значениями, превышающими пороговое значение, рассматриваются как положительный класс для этой метки.

Встраивание подслов и RNN

Для нашего первого подхода к моделированию мы используем комбинацию встраивания подслов и рекуррентных нейронных сетей (RNN) для обучения моделей классификации текста. Вложения подслов были введены Бояновский и др. в 2017 году как улучшение предыдущих методов встраивания на уровне слов. Традиционные модели Word2Vec с пропуском грамм обучаются для изучения статического векторного представления целевого слова, которое оптимально предсказывает контекст этого слова. Модели подслов, с другой стороны, представляют каждое целевое слово как набор n-грамм символов, составляющих слово, где n-грамма состоит из набора n последовательных символов. Этот метод позволяет модели встраивания лучше представлять лежащую в основе морфологию родственных слов в корпусе, а также вычислять вложения для новых слов, не входящих в словарь (OOV). Это особенно важно в контексте онлайн-разговоров, проблемной области, в которой пользователи часто допускают ошибки в написании слов (иногда намеренно, чтобы избежать обнаружения), а также используют уникальный, постоянно развивающийся словарный запас, который может быть не охвачен общим учебным корпусом.

Создатель мудреца Амазонки упрощает обучение и оптимизацию неконтролируемой модели встраивания подслов в ваш собственный корпус текстовых данных, специфичных для предметной области, с помощью встроенного Алгоритм BlazingText. Мы также можем загрузить существующие модели общего назначения, обученные на больших наборах данных онлайн-текста, таких как следующие: Модели английского языка доступны непосредственно из fastText. В экземпляре записной книжки SageMaker просто запустите следующую команду, чтобы загрузить предварительно обученную модель fastText:

!wget -O vectors.zip https://dl.fbaipublicfiles.com/fasttext/vectors-english/crawl-300d-2M-subword.zip

Независимо от того, обучили ли вы свои собственные встраивания с помощью BlazingText или загрузили предварительно обученную модель, результатом будет сжатый двоичный файл модели, который вы можете использовать с библиотекой gensim для встраивания заданного целевого слова в виде вектора на основе составляющих его подслов:

# Imports
import os
from zipfile import ZipFile
from gensim.models.fasttext import load_facebook_vectors # Unzip the model binary into 'dir_path'
with ZipFile('vectors.zip', 'r') as zipObj: zipObj.extractall(path=<dir_path_name>) # Load embedding model into memory
embed_model = load_facebook_vectors(os.path.join(<dir_path_name>, 'vectors.bin')) # Compute embedding vector for 'word'
word_embedding = embed_model[word]

После предварительной обработки данного сегмента текста мы можем использовать этот подход для создания векторного представления для каждого из составляющих слов (разделенных пробелами). Затем мы используем SageMaker и инфраструктуру глубокого обучения, такую как PyTorch, для обучения настроенной RNN с целью бинарной или многокомпонентной классификации, чтобы предсказывать, является ли текст токсичным или нет, и конкретный подтип токсичности на основе помеченных обучающих примеров.

Чтобы загрузить предварительно обработанный текст в Простой сервис хранения Amazon (Amazon S3), используйте следующий код:

import boto3
s3 = boto3.client('s3') bucket = <bucket_name>
prefix = <prefix_name> s3.upload_file('train.pkl', bucket, os.path.join(prefix, 'train/train.pkl'))
s3.upload_file('valid.pkl', bucket, os.path.join(prefix, 'valid/valid.pkl'))
s3.upload_file('test.pkl', bucket, os.path.join(prefix, 'test/test.pkl'))

Чтобы начать обучение масштабируемой модели с несколькими графическими процессорами с помощью SageMaker, введите следующий код:

import sagemaker
sess = sagemaker.Session()
role = iam.get_role(RoleName= ‘AmazonSageMakerFullAccess’)['Role']['Arn'] from sagemaker.pytorch import PyTorch # hyperparameters, which are passed into the training job
hyperparameters = { 'epochs': 20, # Maximum number of epochs to train model 'train-batch-size': 128, # Training batch size (No. sentences) 'eval-batch-size': 1024, # Evaluation batch size (No. sentences) 'embed-size': 300, # Vector dimension of word embeddings (Must match embedding model) 'lstm-hidden-size': 200, # Number of neurons in LSTM hidden layer 'lstm-num-layers': 2, # Number of stacked LSTM layers 'proj-size': 100, # Number of neurons in intermediate projection layer 'num-targets': len(<list_of_label_names>), # Number of targets for classification 'class-weight': ' '.join([str(c) for c in <list_of_weights_per_class>]), # Weight to apply to each target during training 'total-length':<max_number_of_words_per_sentence>, 'metric-for-best-model': 'ap_score_weighted', # Metric on which to select the best model
} # create the Estimator
pytorch_estimator = PyTorch( entry_point='train.py', source_dir=<source_dir_path>, instance_type=<train_instance_type>, volume_size=200, instance_count=1, role=role, framework_version='1.6.0’, py_version='py36', hyperparameters=hyperparameters, metric_definitions=[ {'Name': 'validation:accuracy', 'Regex': 'eval_accuracy = (.*?);'}, {'Name': 'validation:f1-micro', 'Regex': 'eval_f1_score_micro = (.*?);'}, {'Name': 'validation:f1-macro', 'Regex': 'eval_f1_score_macro = (.*?);'}, {'Name': 'validation:f1-weighted', 'Regex': 'eval_f1_score_weighted = (.*?);'}, {'Name': 'validation:ap-micro', 'Regex': 'eval_ap_score_micro = (.*?);'}, {'Name': 'validation:ap-macro', 'Regex': 'eval_ap_score_macro = (.*?);'}, {'Name': 'validation:ap-weighted', 'Regex': 'eval_ap_score_weighted = (.*?);'}, {'Name': 'validation:auc-micro', 'Regex': 'eval_auc_score_micro = (.*?);'}, {'Name': 'validation:auc-macro', 'Regex': 'eval_auc_score_macro = (.*?);'}, {'Name': 'validation:auc-weighted', 'Regex': 'eval_auc_score_weighted = (.*?);'} ]
) pytorch_estimator.fit( { 'train': 's3://<bucket_name>/<prefix_name>/train', 'valid': 's3://<bucket_name>/<prefix_name>/valid', 'test': 's3://<bucket_name>/<prefix_name>/test' }
)

В , мы определяем набор данных PyTorch, который используется train.py подготовить текстовые данные для обучения и оценки модели:

def pad_matrix(m: torch.Tensor, max_len: int =100)-> tuple[int, torch.Tensor] : """Pads an embedding matrix to a specified maximum length.""" if m.ndim == 1: m = m.reshape(1, -1) mask = np.ones_like(m) if m.shape[0] > max_len: m = m[:max_len, :] mask = mask[:max_len, :] else: m = np.pad(m, ((0, max_len - m.shape[0]), (0,0))) mask = np.pad(mask, ((0, max_len - mask.shape[0]), (0,0))) return m, mask class EmbeddingDataset(Dataset: torch.utils.data.Dataset): """PyTorch dataset representing pretrained sentence embeddings, masks, and labels.""" def __init__(self, text: str, labels: int, max_len: int=100): self.text = text self.labels = labels self.max_len = max_len def __len__(self) -> int: return len(self.labels) def __getitem__(self, idx: int) -> dict: e = embed_line(self.text[idx]) length = e.shape[0] m, mask = pad_matrix(e, max_len=self.max_len) item = {} item['embeddings'] = torch.from_numpy(m) item['mask'] = torch.from_numpy(mask) item['labels'] = torch.tensor(self.labels[idx]) if length > self.max_len: item['lengths'] = torch.tensor(self.max_len) else: item['lengths'] = torch.tensor(length) return item

Обратите внимание, что этот код предполагает, что vectors.zip файл, содержащий ваши вложения fastText или BlazingText, будет храниться в .

Кроме того, вы можете легко развернуть предварительно обученные модели fastText самостоятельно на работающих конечных точках SageMaker, чтобы вычислять векторы встраивания на лету для использования в соответствующих задачах на уровне слов. См. следующее Пример GitHub Больше подробностей.

Трансформеры с обнимающим лицом

Для нашего второго подхода к моделированию мы переходим к использованию трансформаторов, представленных в статье. Внимание это все, что вам нужно. Преобразователи — это модели глубокого обучения, предназначенные для того, чтобы сознательно избегать ловушек RNN, полагаясь на механизм самоконтроля для построения глобальных зависимостей между вводом и выводом. Архитектура модели Transformer обеспечивает значительно лучшую распараллеливание и позволяет достичь высокой производительности за относительно короткое время обучения.

Основанный на успехе «Трансформеров», BERT представлен в газете. BERT: предварительная подготовка глубинных двунаправленных трансформаторов для понимания языка, добавлено двунаправленное предварительное обучение для языкового представления. Вдохновленный задачей Cloze, BERT предварительно обучен моделированию маскированного языка (MLM), в котором модель учится восстанавливать исходные слова для случайно замаскированных токенов. Модель BERT также предварительно обучена задаче прогнозирования следующего предложения (NSP), чтобы предсказать, находятся ли два предложения в правильном порядке чтения. С момента своего появления в 2018 году BERT и его варианты широко используются в задачах классификации текста.

В нашем решении используется вариант BERT, известный как RoBERTa, который был представлен в статье. Роберта: надежно оптимизированный подход к предварительной подготовке BERT. RoBERTa дополнительно повышает производительность BERT в различных задачах на естественном языке за счет оптимизированного обучения моделей, в том числе более длинных моделей обучения на 10-кратно большем корпусе, с использованием оптимизированных гиперпараметров, динамического случайного маскирования, удаления задачи NSP и многого другого.

Наши модели на базе RoBERTa используют Трансформеры с обнимающимися лицами библиотека, которая является популярной платформой Python с открытым исходным кодом, которая обеспечивает высококачественные реализации всех видов современных моделей Transformer для различных задач NLP. Hugging Face стала партнером AWS чтобы вы могли легко обучать и развертывать модели Transformer в SageMaker. Эта функция доступна через Обнимающее лицо Образы контейнера AWS Deep Learning Container, которые включают в себя библиотеки Transformers, Tokenizers и Datasets, а также оптимизированную интеграцию с SageMaker для обучения моделей и логических выводов.

В нашей реализации мы наследуем основу архитектуры RoBERTa от платформы Hugging Face Transformers и используем SageMaker для обучения и развертывания нашей собственной модели классификации текста, которую мы называем RoBERTox. RoBERTox использует кодирование пар байтов (BPE), представленное в Нейронный машинный перевод редких слов с подсловами, чтобы разбить входной текст на представления подслов. Затем мы можем обучить наши модели и токенизаторы на данных Jigsaw или на любом большом корпусе, относящемся к предметной области (например, на журналах чатов из конкретной игры), и использовать их для пользовательской классификации текста. Мы определяем наш пользовательский класс модели классификации в следующем коде:

class RoBERToxForSequenceClassification(CustomLossMixIn, RobertaPreTrainedModel): _keys_to_ignore_on_load_missing = [r"position_ids"] def __init__(self, config: PretrainedConfig, *inputs, **kwargs): """Initialize the RoBERToxForSequenceClassification instance Parameters ---------- config : PretrainedConfig num_labels : Optional[int] if not None, overwrite the default classification head in pretrained model. mode : Optional[str] 'MULTI_CLASS', 'MULTI_LABEL' or "REGRESSION". Used to determine loss class_weight : Optional[List[float]] If not None, add class weight to BCEWithLogitsLoss or CrossEntropyLoss """ super().__init__(config, *inputs, **kwargs) # Define model architecture self.roberta = RobertaModel(self.config, add_pooling_layer=False) self.classifier = RobertaClassificationHead(self.config) self.init_weights() @modeling_roberta.add_start_docstrings_to_model_forward( modeling_roberta.ROBERTA_INPUTS_DOCSTRING.format("batch_size, sequence_length") ) @modeling_roberta.add_code_sample_docstrings( tokenizer_class=modeling_roberta._TOKENIZER_FOR_DOC, checkpoint=modeling_roberta._CHECKPOINT_FOR_DOC, output_type=SequenceClassifierOutput, config_class=modeling_roberta._CONFIG_FOR_DOC, ) def forward( self, input_ids: torch.Tensor = None, attention_mask: torch.Tensor = None, token_type_ids: torch.Tensor = None, position_ids: torch.Tensor =None, head_mask: torch.Tensor =None, inputs_embeds: torch.Tensor =None, labels: torch.Tensor =None, output_attentions: torch.Tensor =None, output_hidden_states: torch.Tensor =None, return_dict: bool =None, sample_weights: torch.Tensor =None, ) -> : dict: """Forward pass to return loss, logits, ... Returns -------- output : SequenceClassifierOutput has those keys: loss, logits, hidden states, attentions """ return_dict = return_dict or self.config.use_return_dict outputs = self.roberta( input_ids, attention_mask=attention_mask, token_type_ids=token_type_ids, position_ids=position_ids, head_mask=head_mask, inputs_embeds=inputs_embeds, output_attentions=output_attentions, output_hidden_states=output_hidden_states, return_dict=return_dict, ) sequence_output = outputs[0] # [CLS] embedding logits = self.classifier(sequence_output) loss = self.compute_loss(logits, labels, sample_weights=sample_weights) if not return_dict: output = (logits,) + outputs[2:] return ((loss,) + output) if loss is not None else output return SequenceClassifierOutput( loss=loss, logits=logits, hidden_states=outputs.hidden_states, attentions=outputs.attentions, ) def compute_loss(self, logits: torch.Tensor, labels: torch.Tensor, sample_weights: Optional[torch.Tensor] = None) -> torch.FloatTensor: return super().compute_loss(logits, labels, sample_weights)

Перед тренировкой мы подготавливаем наши текстовые данные и метки с помощью библиотеки наборов данных Hugging Face и загружаем результат в Amazon S3:

from datasets import Dataset
import multiprocessing data_train = Dataset.from_pandas(df_train)
… tokenizer = <instantiated_huggingface_tokenizer> def preprocess_function(examples: examples) -> torch.Tensor: result = tokenizer(examples["text"], padding="max_length", max_length=128, truncation=True) return result num_proc = multiprocessing.cpu_count()
print("Number of CPUs =", num_proc) data_train = data_train.map( preprocess_function, batched=True, load_from_cache_file=False, num_proc=num_proc
)
… import botocore
from datasets.filesystems import S3FileSystem s3_session = botocore.session.Session() # create S3FileSystem instance with s3_session
s3 = S3FileSystem(session=s3_session) # saves encoded_dataset to your s3 bucket
data_train.save_to_disk(f's3://<bucket_name>/<prefix_name>/train', fs=s3)
…

Мы начинаем обучение модели аналогично RNN:

import sagemaker
sess = sagemaker.Session()
role = sagemaker.get_execution_role()
from sagemaker.huggingface import HuggingFace # hyperparameters, which are passed into the training job
hyperparameters = { 'model-name': <huggingface_base_model_name>, 'epochs': 10, 'train-batch-size': 32, 'eval-batch-size': 64, 'num-labels': len(<list_of_label_names>), 'class-weight': ' '.join([str(c) for c in <list_of_class_weights>]), 'metric-for-best-model': 'ap_score_weighted', 'save-total-limit': 1,
} # create the Estimator
huggingface_estimator = HuggingFace( entry_point='train.py', source_dir=<source_dir_path>, instance_type=<train_instance_type>, instance_count=1, role=role, transformers_version='4.6.1', pytorch_version='1.7.1', py_version='py36', hyperparameters=hyperparameters, metric_definitions=[ {'Name': 'validation:accuracy', 'Regex': 'eval_accuracy = (.*?);'}, {'Name': 'validation:f1-micro', 'Regex': 'eval_f1_score_micro = (.*?);'}, {'Name': 'validation:f1-macro', 'Regex': 'eval_f1_score_macro = (.*?);'}, {'Name': 'validation:f1-weighted', 'Regex': 'eval_f1_score_weighted = (.*?);'}, {'Name': 'validation:ap-micro', 'Regex': 'eval_ap_score_micro = (.*?);'}, {'Name': 'validation:ap-macro', 'Regex': 'eval_ap_score_macro = (.*?);'}, {'Name': 'validation:ap-weighted', 'Regex': 'eval_ap_score_weighted = (.*?);'}, {'Name': 'validation:auc-micro', 'Regex': 'eval_auc_score_micro = (.*?);'}, {'Name': 'validation:auc-macro', 'Regex': 'eval_auc_score_macro = (.*?);'}, {'Name': 'validation:auc-weighted', 'Regex': 'eval_auc_score_weighted = (.*?);'} ]
) huggingface_estimator.fit( { 'train': 's3://<bucket_name>/<prefix_name>/train', 'valid': 's3://<bucket_name>/<prefix_name>/valid', 'test': 's3://<bucket_name>/<prefix_name>/test'
)

Наконец, следующий фрагмент кода Python иллюстрирует процесс обслуживания RoBERTox через действующую конечную точку SageMaker для классификации текста в реальном времени для запроса JSON:

from sagemaker.huggingface import HuggingFaceModel
from sagemaker import get_execution_role
from sagemaker.predictor import Predictor
from sagemaker.serializers import JSONSerializer
from sagemaker.deserializers import JSONDeserializer class Classifier(Predictor): def __init__(self, endpoint_name, sagemaker_session): super().__init__(endpoint_name, sagemaker_session, serializer=JSONSerializer(), deserializer=JSONDeserializer()) hf_model = HuggingFaceModel( role=get_execution_role(), model_data=<s3_model_and_tokenizer.tar.gz>, entry_point="inference.py", transformers_version="4.6.1", pytorch_version="1.7.1", py_version="py36", predictor_cls=Classifier
) predictor = hf_model.deploy(instance_type=<deploy_instance_type>, initial_instance_count=1)

Оценка производительности модели: набор данных Jigsaw о непреднамеренном смещении

В следующей таблице приведены показатели производительности для моделей, обученных и оцененных на основе данных конкурса Jigsaw Unintended Bias in Toxicity Detection Kaggle. Мы обучали модели для трех разных, но взаимосвязанных задач:

Двоичный случай – Модель была обучена на полном наборе обучающих данных для прогнозирования toxicity только этикетка
Мелкозернистый случай – Подмножество обучающих данных, для которых toxicity>=0.5 был использован для прогнозирования других меток подтипа токсичности (obscene, threat, insult, identity_attack, sexual_explicit)
Многозадачный кейс – Полный обучающий набор данных использовался для одновременного прогнозирования всех шести меток.

Мы обучили модели RNN и RoBERTa для каждой из этих трех задач, используя предоставленные Jigsaw дробные метки, которые соответствуют доле аннотаторов, считавших метку подходящей для текста, а также бинарные метки в сочетании с весами классов в сети. функция потерь. В схеме двоичной маркировки пропорции были ограничены порогом 0.5 для каждой доступной метки (1, если метка >= 0.5, 0 в противном случае), а функции потерь модели были взвешены на основе относительных пропорций каждой двоичной метки в обучающем наборе данных. Во всех случаях мы обнаружили, что непосредственное использование дробных меток приводит к лучшей производительности, указывая на дополнительную ценность информации, присущую степени согласия между аннотаторами.

Мы отображаем две метрики модели: среднюю точность (AP), которая дает сводку кривой точности-отзыва путем вычисления средневзвешенного значения точности, достигнутого на каждом пороге классификации, и площадь под кривой рабочей характеристики приемника (AUC). , который объединяет производительность модели по пороговым значениям классификации по отношению к частоте истинно положительных и ложноположительных результатов. Обратите внимание, что истинный класс для данного экземпляра текста в тестовом наборе соответствует тому, является ли истинная пропорция больше или равной 0.5 (1, если метка>=0.5, 0 в противном случае).

.	Встраивание подслов + RNN	РОБЕРТа
.	Дробные метки	Двоичные метки + взвешивание классов	Дробные метки	Двоичные метки + взвешивание классов
Двоичный	АП=0.746, ППК=0.966	АП=0.730, ППК=0.963	АП=0.758, ППК=0.966	АП=0.747, ППК=0.963
Мелкозернистый	АП=0.906, ППК=0.909	АП=0.850, ППК=0.851	АП=0.913, ППК=0.913	АП=0.911, ППК=0.912
Многозадачный	АП=0.721, ППК=0.972	АП=0.535, ППК=0.907	АП=0.740, ППК=0.972	АП=0.711, ППК=0.961

Заключение

В этом посте мы представили два подхода к классификации текста для онлайн-разговоров с использованием сервисов AWS ML. Вы можете обобщить эти решения на платформах онлайн-коммуникаций, причем такие отрасли, как игры, особенно выиграют от улучшенной способности обнаруживать вредоносный контент. В будущих публикациях мы планируем дополнительно обсудить комплексную архитектуру для удобного развертывания моделей в вашей учетной записи AWS.

Если вам нужна помощь в ускорении использования машинного обучения в ваших продуктах и процессах, обратитесь в Лаборатория решений Amazon ML.

Об авторах

Классификация текста для онлайн-разговоров с помощью машинного обучения в AWS PlatoBlockchain Data Intelligence. Вертикальный поиск. Ай. Райан Брэнд Специалист по анализу данных в лаборатории Amazon Machine Learning Solutions Lab. У него есть конкретный опыт применения машинного обучения для решения проблем здравоохранения и наук о жизни, а в свободное время он любит читать историю и научную фантастику.

Сурав Бхабеш является специалистом по данным в лаборатории решений Amazon ML. Он разрабатывает решения AI/ML для клиентов AWS в различных отраслях. Его специальность — обработка естественного языка (NLP), и он увлечен глубоким обучением. Помимо работы любит читать книги и путешествовать.

Лютонг Чжоу является прикладным ученым в лаборатории решений Amazon ML. Он создает индивидуальные решения AI/ML для клиентов AWS в различных отраслях. Он специализируется на обработке естественного языка (NLP) и увлечен мультимодальным глубоким обучением. Он лирический тенор и помимо работы любит петь оперы.

Сиа Голами — старший специалист по данным в лаборатории решений Amazon ML, где он создает решения AI/ML для клиентов из различных отраслей. Он увлечен обработкой естественного языка (NLP) и глубоким обучением. Вне работы Сия любит проводить время на природе и играть в теннис.

Дэниел Горовиц является менеджером по прикладному искусственному интеллекту. Он возглавляет группу ученых в Amazon ML Solutions Lab, которые работают над решением проблем клиентов и внедрением облачных технологий с помощью машинного обучения.

Отметка времени: 29 июня 2022

Отметка времени: Июнь 23, 2022

Классификация текстов для онлайн-разговоров с помощью машинного обучения на AWS

Переиздано Платоном

Предпосылки

Dataset

Встраивание подслов и RNN

Трансформеры с обнимающим лицом

Оценка производительности модели: набор данных Jigsaw о непреднамеренном смещении

Заключение

Об авторах

Больше от Машинное обучение AWS

Интеллектуальная обработка документов с помощью сервисов AWS AI: часть 1

Хостинг моделей трансформеров Hugging Face с использованием Amazon SageMaker Serverless Inference

Распределенное обучение с Amazon EKS и Torch Distributed Elastic

Exafunction поддерживает AWS Inferentia, чтобы обеспечить наилучшее соотношение цены и качества для логического вывода на основе машинного обучения.

Встроенный в Amazon SageMaker LightGBM теперь предлагает распределенное обучение с использованием Dask

Поддержка нового расширенного формата данных в Amazon Kendra

Оптимизация гиперпараметров с помощью автоматической настройки моделей Amazon SageMaker

О Нас

Вертикальный поиск и AI

Платформа

Оставайтесь на связи

Учетная запись