Класифікація тексту для онлайн-розмов за допомогою машинного навчання на AWS

Перевидано Платоном

читають: 0

Онлайн-розмови повсюдно поширені в сучасному житті, охоплюючи галузі від відеоігор до телекомунікацій. Це призвело до експоненційного зростання обсягу даних онлайн-розмов, що допомогло в розробці найсучасніших систем обробки природної мови (NLP), таких як чат-боти та моделі генерації природної мови (NLG). Згодом також розвивалися різні техніки НЛП для аналізу тексту. Це обумовлює потребу в повністю керованій службі, яку можна інтегрувати в програми за допомогою викликів API без потреби в широкому досвіді машинного навчання (ML). AWS пропонує попередньо навчені сервіси AWS AI, наприклад «Амазонка», який може ефективно обробляти сценарії використання НЛП, включаючи класифікацію, підсумовування тексту, розпізнавання сутностей тощо, щоб збирати ідеї з тексту.

Крім того, онлайн-розмови призвели до широкого поширення явища нетрадиційного використання мови. Традиційні техніки НЛП часто погано працюють із цими текстовими даними через постійну зміну словникових запасів, які існують на різних платформах, а також значні лексичні відхилення слів від правильної англійської мови, або випадково, або навмисно як форма змагальної атаки. .

У цій публікації ми описуємо кілька підходів ML для текстової класифікації онлайн-розмов за допомогою інструментів і сервісів, доступних на AWS.

Передумови

Перш ніж заглиблюватися в цей сценарій використання, виконайте наступні передумови:

Налаштуйте Обліковий запис AWS та створити користувача IAM.
Налаштуйте CLI AWS та SDK AWS.
(Необов’язково) Налаштуйте свій Середовище IDE Cloud9.

Набір даних

Для цього допису ми використовуємо Jigsaw Ненавмисне зміщення в наборі даних класифікації токсичності, еталон для конкретної проблеми класифікації токсичності в онлайн-розмовах. Набір даних містить ярлики токсичності, а також кілька атрибутів підгруп, таких як непристойність, напад на ідентифікацію, образа, погроза та відверто сексуальний характер. Мітки надаються як дробові значення, які представляють частку людей-анотаторів, які повірили, що атрибут застосований до даного фрагмента тексту, і рідко бувають одностайними. Щоб створити двійкові мітки (наприклад, токсичні чи нетоксичні), до дробових значень застосовується поріг 0.5, а коментарі зі значеннями, які перевищують порогове значення, розглядаються як позитивний клас для цієї мітки.

Вбудовування підслів і RNN

Для нашого першого підходу до моделювання ми використовуємо комбінацію вбудовування підслів і рекурентних нейронних мереж (RNN) для навчання моделей класифікації тексту. Вбудовування підслів було введено Бояновський та ін. у 2017 році як покращення попередніх методів вбудовування на рівні слів. Традиційні моделі Word2Vec skip-gram навчені вивчати статичне векторне представлення цільового слова, яке оптимально передбачає контекст цього слова. З іншого боку, моделі підслів представляють кожне цільове слово як пакет n-грам символів, які складають слово, де n-грама складається з набору n послідовних символів. Цей метод дозволяє моделі вбудовування краще представляти основну морфологію споріднених слів у корпусі, а також обчислювати вбудовування для нових слів, що не є словниковим (OOV). Це особливо важливо в контексті онлайн-розмов, проблемного простору, в якому користувачі часто неправильно пишуть слова (іноді навмисно, щоб уникнути виявлення), а також використовують унікальну лексику, що постійно розвивається, яку може не охопити загальний навчальний корпус.

Amazon SageMaker дозволяє легко навчати та оптимізувати модель вбудованого підслова без нагляду на вашому власному корпусі доменних текстових даних за допомогою вбудованої Алгоритм BlazingText. Ми також можемо завантажити існуючі моделі загального призначення, навчені на великих наборах даних онлайнового тексту, як-от наведені нижче Англомовні моделі доступні безпосередньо з fastText. З екземпляра блокнота SageMaker просто запустіть наступне, щоб завантажити попередньо підготовлену модель fastText:

!wget -O vectors.zip https://dl.fbaipublicfiles.com/fasttext/vectors-english/crawl-300d-2M-subword.zip

Незалежно від того, навчили ви власні вбудовування за допомогою BlazingText чи завантажили попередньо навчену модель, результатом буде архівований двійковий файл моделі, який ви можете використовувати з бібліотекою gensim для вбудовування певного цільового слова як вектора на основі його складових підслів:

# Imports
import os
from zipfile import ZipFile
from gensim.models.fasttext import load_facebook_vectors # Unzip the model binary into 'dir_path'
with ZipFile('vectors.zip', 'r') as zipObj: zipObj.extractall(path=<dir_path_name>) # Load embedding model into memory
embed_model = load_facebook_vectors(os.path.join(<dir_path_name>, 'vectors.bin')) # Compute embedding vector for 'word'
word_embedding = embed_model[word]

Після попередньої обробки заданого сегмента тексту ми можемо використати цей підхід для створення векторного представлення для кожного зі складових слів (відокремлених пробілами). Потім ми використовуємо SageMaker і структуру глибокого навчання, таку як PyTorch, щоб навчити налаштовану RNN із двойковою або багатозначною метою класифікації, щоб передбачити, чи є текст токсичним чи ні, і конкретний підтип токсичності на основі позначених навчальних прикладів.

Щоб завантажити попередньо оброблений текст у Служба простого зберігання Amazon (Amazon S3), використовуйте такий код:

import boto3
s3 = boto3.client('s3') bucket = <bucket_name>
prefix = <prefix_name> s3.upload_file('train.pkl', bucket, os.path.join(prefix, 'train/train.pkl'))
s3.upload_file('valid.pkl', bucket, os.path.join(prefix, 'valid/valid.pkl'))
s3.upload_file('test.pkl', bucket, os.path.join(prefix, 'test/test.pkl'))

Щоб розпочати навчання масштабованої моделі з кількома GPU за допомогою SageMaker, введіть такий код:

import sagemaker
sess = sagemaker.Session()
role = iam.get_role(RoleName= ‘AmazonSageMakerFullAccess’)['Role']['Arn'] from sagemaker.pytorch import PyTorch # hyperparameters, which are passed into the training job
hyperparameters = { 'epochs': 20, # Maximum number of epochs to train model 'train-batch-size': 128, # Training batch size (No. sentences) 'eval-batch-size': 1024, # Evaluation batch size (No. sentences) 'embed-size': 300, # Vector dimension of word embeddings (Must match embedding model) 'lstm-hidden-size': 200, # Number of neurons in LSTM hidden layer 'lstm-num-layers': 2, # Number of stacked LSTM layers 'proj-size': 100, # Number of neurons in intermediate projection layer 'num-targets': len(<list_of_label_names>), # Number of targets for classification 'class-weight': ' '.join([str(c) for c in <list_of_weights_per_class>]), # Weight to apply to each target during training 'total-length':<max_number_of_words_per_sentence>, 'metric-for-best-model': 'ap_score_weighted', # Metric on which to select the best model
} # create the Estimator
pytorch_estimator = PyTorch( entry_point='train.py', source_dir=<source_dir_path>, instance_type=<train_instance_type>, volume_size=200, instance_count=1, role=role, framework_version='1.6.0’, py_version='py36', hyperparameters=hyperparameters, metric_definitions=[ {'Name': 'validation:accuracy', 'Regex': 'eval_accuracy = (.*?);'}, {'Name': 'validation:f1-micro', 'Regex': 'eval_f1_score_micro = (.*?);'}, {'Name': 'validation:f1-macro', 'Regex': 'eval_f1_score_macro = (.*?);'}, {'Name': 'validation:f1-weighted', 'Regex': 'eval_f1_score_weighted = (.*?);'}, {'Name': 'validation:ap-micro', 'Regex': 'eval_ap_score_micro = (.*?);'}, {'Name': 'validation:ap-macro', 'Regex': 'eval_ap_score_macro = (.*?);'}, {'Name': 'validation:ap-weighted', 'Regex': 'eval_ap_score_weighted = (.*?);'}, {'Name': 'validation:auc-micro', 'Regex': 'eval_auc_score_micro = (.*?);'}, {'Name': 'validation:auc-macro', 'Regex': 'eval_auc_score_macro = (.*?);'}, {'Name': 'validation:auc-weighted', 'Regex': 'eval_auc_score_weighted = (.*?);'} ]
) pytorch_estimator.fit( { 'train': 's3://<bucket_name>/<prefix_name>/train', 'valid': 's3://<bucket_name>/<prefix_name>/valid', 'test': 's3://<bucket_name>/<prefix_name>/test' }
)

В , ми визначаємо набір даних PyTorch, який використовує train.py підготувати текстові дані для навчання та оцінки моделі:

def pad_matrix(m: torch.Tensor, max_len: int =100)-> tuple[int, torch.Tensor] : """Pads an embedding matrix to a specified maximum length.""" if m.ndim == 1: m = m.reshape(1, -1) mask = np.ones_like(m) if m.shape[0] > max_len: m = m[:max_len, :] mask = mask[:max_len, :] else: m = np.pad(m, ((0, max_len - m.shape[0]), (0,0))) mask = np.pad(mask, ((0, max_len - mask.shape[0]), (0,0))) return m, mask class EmbeddingDataset(Dataset: torch.utils.data.Dataset): """PyTorch dataset representing pretrained sentence embeddings, masks, and labels.""" def __init__(self, text: str, labels: int, max_len: int=100): self.text = text self.labels = labels self.max_len = max_len def __len__(self) -> int: return len(self.labels) def __getitem__(self, idx: int) -> dict: e = embed_line(self.text[idx]) length = e.shape[0] m, mask = pad_matrix(e, max_len=self.max_len) item = {} item['embeddings'] = torch.from_numpy(m) item['mask'] = torch.from_numpy(mask) item['labels'] = torch.tensor(self.labels[idx]) if length > self.max_len: item['lengths'] = torch.tensor(self.max_len) else: item['lengths'] = torch.tensor(length) return item

Зауважте, що цей код передбачає, що vectors.zip файл, що містить ваші вбудовані файли fastText або BlazingText, буде збережено в .

Крім того, ви можете легко самостійно розгортати заздалегідь підготовлені моделі fastText для живих кінцевих точок SageMaker, щоб миттєво обчислювати вектори вбудовування для використання у відповідних завданнях на рівні слів. Дивіться наступне Приклад GitHub для більш докладної інформації.

Трансформери з обличчям, що обіймається

Для нашого другого підходу до моделювання ми переходимо до використання трансформаторів, представлених у статті Увага – це все, що вам потрібно. Трансформатори — це моделі глибокого навчання, розроблені для навмисного уникнення пасток RNN, покладаючись на механізм самоуважності для визначення глобальних залежностей між входом і виходом. Архітектура моделі Transformer дозволяє значно краще розпаралелювати і може досягти високої продуктивності за відносно короткий час навчання.

Створений на основі успіху Трансформерів, BERT, представлений у статті BERT: Попередня підготовка глибоких двонаправлених трансформаторів для розуміння мови, додано двонаправлене попереднє навчання для представлення мови. Натхненний завданням Cloze, BERT попередньо навчений моделюванню замаскованої мови (MLM), у якому модель вчиться відновлювати вихідні слова для випадково замаскованих токенів. Модель BERT також попередньо навчена на завдання передбачення наступного речення (NSP), щоб передбачити, чи два речення знаходяться в правильному порядку читання. З моменту появи в 2018 році BERT і його варіації широко використовуються в завданнях класифікації текстів.

Наше рішення використовує варіант BERT, відомий як RoBERTa, який був представлений у статті RoBERTa: надійно оптимізований підхід до переробки BERT. RoBERTa додатково покращує продуктивність BERT у різноманітних завданнях природної мови за рахунок оптимізованого навчання моделі, включаючи довше навчання моделей на в 10 разів більшому корпусі, використовуючи оптимізовані гіперпараметри, динамічне випадкове маскування, видалення завдання NSP тощо.

Наші моделі на основі RoBERTa використовують Обійми трансформатори обличчя бібліотека, яка є популярним фреймворком Python з відкритим вихідним кодом, який забезпечує високоякісні реалізації всіх типів найсучасніших моделей Transformer для різноманітних завдань NLP. Hugging Face співпрацює з AWS щоб ви могли легко навчати та розгортати моделі Transformer на SageMaker. Ця функція доступна через Зображення контейнера AWS Deep Learning Hugging Face, які включають бібліотеки Transformers, Tokenizers і Datasets, а також оптимізовану інтеграцію з SageMaker для навчання моделі та висновків.

У нашій реалізації ми успадковуємо основу архітектури RoBERTa від фреймворку Hugging Face Transformers і використовуємо SageMaker для навчання та розгортання нашої власної моделі класифікації тексту, яку ми називаємо RoBERTox. RoBERTox використовує парне кодування байтів (BPE), введене в Нейронний машинний переклад рідкісних слів з одиницями підслова, щоб токенізувати введений текст у представлення підслов. Потім ми можемо навчити наші моделі та токенізери на даних Jigsaw або будь-якому великому доменно-спеціальному корпусі (наприклад, журналах чату з певної гри) і використовувати їх для індивідуальної класифікації тексту. Ми визначаємо наш власний клас моделі класифікації в такому коді:

class RoBERToxForSequenceClassification(CustomLossMixIn, RobertaPreTrainedModel): _keys_to_ignore_on_load_missing = [r"position_ids"] def __init__(self, config: PretrainedConfig, *inputs, **kwargs): """Initialize the RoBERToxForSequenceClassification instance Parameters ---------- config : PretrainedConfig num_labels : Optional[int] if not None, overwrite the default classification head in pretrained model. mode : Optional[str] 'MULTI_CLASS', 'MULTI_LABEL' or "REGRESSION". Used to determine loss class_weight : Optional[List[float]] If not None, add class weight to BCEWithLogitsLoss or CrossEntropyLoss """ super().__init__(config, *inputs, **kwargs) # Define model architecture self.roberta = RobertaModel(self.config, add_pooling_layer=False) self.classifier = RobertaClassificationHead(self.config) self.init_weights() @modeling_roberta.add_start_docstrings_to_model_forward( modeling_roberta.ROBERTA_INPUTS_DOCSTRING.format("batch_size, sequence_length") ) @modeling_roberta.add_code_sample_docstrings( tokenizer_class=modeling_roberta._TOKENIZER_FOR_DOC, checkpoint=modeling_roberta._CHECKPOINT_FOR_DOC, output_type=SequenceClassifierOutput, config_class=modeling_roberta._CONFIG_FOR_DOC, ) def forward( self, input_ids: torch.Tensor = None, attention_mask: torch.Tensor = None, token_type_ids: torch.Tensor = None, position_ids: torch.Tensor =None, head_mask: torch.Tensor =None, inputs_embeds: torch.Tensor =None, labels: torch.Tensor =None, output_attentions: torch.Tensor =None, output_hidden_states: torch.Tensor =None, return_dict: bool =None, sample_weights: torch.Tensor =None, ) -> : dict: """Forward pass to return loss, logits, ... Returns -------- output : SequenceClassifierOutput has those keys: loss, logits, hidden states, attentions """ return_dict = return_dict or self.config.use_return_dict outputs = self.roberta( input_ids, attention_mask=attention_mask, token_type_ids=token_type_ids, position_ids=position_ids, head_mask=head_mask, inputs_embeds=inputs_embeds, output_attentions=output_attentions, output_hidden_states=output_hidden_states, return_dict=return_dict, ) sequence_output = outputs[0] # [CLS] embedding logits = self.classifier(sequence_output) loss = self.compute_loss(logits, labels, sample_weights=sample_weights) if not return_dict: output = (logits,) + outputs[2:] return ((loss,) + output) if loss is not None else output return SequenceClassifierOutput( loss=loss, logits=logits, hidden_states=outputs.hidden_states, attentions=outputs.attentions, ) def compute_loss(self, logits: torch.Tensor, labels: torch.Tensor, sample_weights: Optional[torch.Tensor] = None) -> torch.FloatTensor: return super().compute_loss(logits, labels, sample_weights)

Перед навчанням ми готуємо наші текстові дані та мітки за допомогою бібліотеки наборів даних Hugging Face і завантажуємо результат до Amazon S3:

from datasets import Dataset
import multiprocessing data_train = Dataset.from_pandas(df_train)
… tokenizer = <instantiated_huggingface_tokenizer> def preprocess_function(examples: examples) -> torch.Tensor: result = tokenizer(examples["text"], padding="max_length", max_length=128, truncation=True) return result num_proc = multiprocessing.cpu_count()
print("Number of CPUs =", num_proc) data_train = data_train.map( preprocess_function, batched=True, load_from_cache_file=False, num_proc=num_proc
)
… import botocore
from datasets.filesystems import S3FileSystem s3_session = botocore.session.Session() # create S3FileSystem instance with s3_session
s3 = S3FileSystem(session=s3_session) # saves encoded_dataset to your s3 bucket
data_train.save_to_disk(f's3://<bucket_name>/<prefix_name>/train', fs=s3)
…

Ми починаємо навчання моделі подібно до RNN:

import sagemaker
sess = sagemaker.Session()
role = sagemaker.get_execution_role()
from sagemaker.huggingface import HuggingFace # hyperparameters, which are passed into the training job
hyperparameters = { 'model-name': <huggingface_base_model_name>, 'epochs': 10, 'train-batch-size': 32, 'eval-batch-size': 64, 'num-labels': len(<list_of_label_names>), 'class-weight': ' '.join([str(c) for c in <list_of_class_weights>]), 'metric-for-best-model': 'ap_score_weighted', 'save-total-limit': 1,
} # create the Estimator
huggingface_estimator = HuggingFace( entry_point='train.py', source_dir=<source_dir_path>, instance_type=<train_instance_type>, instance_count=1, role=role, transformers_version='4.6.1', pytorch_version='1.7.1', py_version='py36', hyperparameters=hyperparameters, metric_definitions=[ {'Name': 'validation:accuracy', 'Regex': 'eval_accuracy = (.*?);'}, {'Name': 'validation:f1-micro', 'Regex': 'eval_f1_score_micro = (.*?);'}, {'Name': 'validation:f1-macro', 'Regex': 'eval_f1_score_macro = (.*?);'}, {'Name': 'validation:f1-weighted', 'Regex': 'eval_f1_score_weighted = (.*?);'}, {'Name': 'validation:ap-micro', 'Regex': 'eval_ap_score_micro = (.*?);'}, {'Name': 'validation:ap-macro', 'Regex': 'eval_ap_score_macro = (.*?);'}, {'Name': 'validation:ap-weighted', 'Regex': 'eval_ap_score_weighted = (.*?);'}, {'Name': 'validation:auc-micro', 'Regex': 'eval_auc_score_micro = (.*?);'}, {'Name': 'validation:auc-macro', 'Regex': 'eval_auc_score_macro = (.*?);'}, {'Name': 'validation:auc-weighted', 'Regex': 'eval_auc_score_weighted = (.*?);'} ]
) huggingface_estimator.fit( { 'train': 's3://<bucket_name>/<prefix_name>/train', 'valid': 's3://<bucket_name>/<prefix_name>/valid', 'test': 's3://<bucket_name>/<prefix_name>/test'
)

Нарешті, наступний фрагмент коду Python ілюструє процес обслуговування RoBERTox через живу кінцеву точку SageMaker для класифікації тексту в реальному часі для запиту JSON:

from sagemaker.huggingface import HuggingFaceModel
from sagemaker import get_execution_role
from sagemaker.predictor import Predictor
from sagemaker.serializers import JSONSerializer
from sagemaker.deserializers import JSONDeserializer class Classifier(Predictor): def __init__(self, endpoint_name, sagemaker_session): super().__init__(endpoint_name, sagemaker_session, serializer=JSONSerializer(), deserializer=JSONDeserializer()) hf_model = HuggingFaceModel( role=get_execution_role(), model_data=<s3_model_and_tokenizer.tar.gz>, entry_point="inference.py", transformers_version="4.6.1", pytorch_version="1.7.1", py_version="py36", predictor_cls=Classifier
) predictor = hf_model.deploy(instance_type=<deploy_instance_type>, initial_instance_count=1)

Оцінка ефективності моделі: набір даних ненавмисного зміщення Jigsaw

У наведеній нижче таблиці наведено показники ефективності для моделей, навчених і оцінених за даними конкурсу Jigsaw Unintended Bias in Toxicity Detection Kaggle. Ми підготували моделі для трьох різних, але взаємопов’язаних завдань:

Двійковий відмінок – Модель було навчено на повному навчальному наборі даних для прогнозування toxicity тільки етикетка
Дрібнозернистий корпус – Підмножина навчальних даних, для яких toxicity>=0.5 використовувався для прогнозування інших міток підтипу токсичності (obscene, threat, insult, identity_attack, sexual_explicit)
Багатозадачний кейс – Повний навчальний набір даних використовувався для прогнозування всіх шести міток одночасно

Ми навчили моделі RNN і RoBERTa для кожного з цих трьох завдань за допомогою дробових міток, наданих Jigsaw, які відповідають частці анотаторів, які вважали, що мітка підходить для тексту, а також за допомогою двійкових міток у поєднанні з вагами класів у мережі. функція втрат. У схемі бінарного маркування пропорції були встановлені на рівні 0.5 для кожної доступної мітки (1, якщо мітка>=0.5, 0 в іншому випадку), а функції втрат моделі були зважені на основі відносних пропорцій кожної двійкової мітки в навчальному наборі даних. У всіх випадках ми виявили, що використання дробових міток безпосередньо призвело до найкращої продуктивності, вказуючи на додаткову цінність інформації, притаманну ступеню узгодженості між анотаторами.

Ми відображаємо два показники моделі: середню точність (AP), яка надає зведення кривої точності-запам’ятовування шляхом обчислення зваженого середнього значень точності, досягнутих за кожним порогом класифікації, і площу під кривою робочих характеристик приймача (AUC) , який агрегує продуктивність моделі за пороговими значеннями класифікації щодо частоти справжніх позитивних результатів і частоти помилкових позитивних результатів. Зауважте, що справжній клас для даного екземпляра тексту в тестовому наборі відповідає тому, чи справжня частка більша або дорівнює 0.5 (1, якщо label>=0.5, 0 в іншому випадку).

.	Вбудовування підслова + RNN	РоБЕРТа
.	Дробові мітки	Двійкові мітки + зважування класу	Дробові мітки	Двійкові мітки + зважування класу
двійковий	AP=0.746, AUC=0.966	AP=0.730, AUC=0.963	AP=0.758, AUC=0.966	AP=0.747, AUC=0.963
Дрібнозернистий	AP=0.906, AUC=0.909	AP=0.850, AUC=0.851	AP=0.913, AUC=0.913	AP=0.911, AUC=0.912
Багатозадачний	AP=0.721, AUC=0.972	AP=0.535, AUC=0.907	AP=0.740, AUC=0.972	AP=0.711, AUC=0.961

Висновок

У цій публікації ми представили два підходи до класифікації тексту для онлайн-розмов за допомогою сервісів AWS ML. Ви можете узагальнити ці рішення на платформах онлайн-комунікації, причому такі галузі, як ігри, особливо ймовірно, виграють від покращеної здатності виявляти шкідливий вміст. У наступних публікаціях ми плануємо додатково обговорити наскрізну архітектуру для безперебійного розгортання моделей у вашому обліковому записі AWS.

Якщо ви бажаєте допомогти прискорити використання ML у своїх продуктах і процесах, зверніться до Лабораторія рішень Amazon ML.

Про авторів

Класифікація тексту для онлайн-розмов із машинним навчанням на AWS PlatoBlockchain Data Intelligence. Вертикальний пошук. Ai. Райан Бренд є дослідником даних у лабораторії рішень Amazon Machine Learning Solutions. Він має певний досвід застосування машинного навчання до проблем охорони здоров’я та наук про життя, а у вільний час любить читати історію та наукову фантастику.

Сурав Бхабеш є спеціалістом з обробки даних у Amazon ML Solutions Lab. Він розробляє рішення AI/ML для клієнтів AWS у різних галузях. Його спеціалізація — обробка природної мови (NLP), і він захоплений глибоким навчанням. Поза роботою любить читати книги та подорожувати.

Лютун Чжоу є прикладним науковцем у Amazon ML Solutions Lab. Він створює індивідуальні рішення AI/ML для клієнтів AWS у різних галузях. Він спеціалізується на обробці природної мови (NLP) і захоплюється мультимодальним глибоким навчанням. Він ліричний тенор і любить співати опери поза роботою.

Сіа Голамі є старшим спеціалістом із обробки даних у Amazon ML Solutions Lab, де він створює рішення AI/ML для клієнтів у різних галузях. Він захоплений обробкою природної мови (НЛП) і глибоким навчанням. Поза роботою Сія любить проводити час на природі та грати в теніс.

Даніель Горовиц є науковим менеджером прикладного штучного інтелекту. Він очолює групу вчених у Amazon ML Solutions Lab, яка працює над вирішенням проблем клієнтів і стимулює впровадження хмарних технологій за допомогою ML.

Часова мітка: 29 Червня, 2022.

Часова мітка: Червень 23, 2022

Класифікація тексту для онлайн-бесід із машинним навчанням на AWS

Перевидано Платоном

Передумови

Набір даних

Вбудовування підслів і RNN

Трансформери з обличчям, що обіймається

Оцінка ефективності моделі: набір даних ненавмисного зміщення Jigsaw

Висновок

Про авторів

Більше від AWS Машинне навчання

Інтелектуальна обробка документів за допомогою сервісів AWS AI: Частина 1

Розмістіть моделі трансформаторів Hugging Face за допомогою безсерверного висновку Amazon SageMaker

Розподілене навчання за допомогою Amazon EKS і Torch Distributed Elastic

Exafunction підтримує AWS Inferentia, щоб розблокувати найкращу цінову продуктивність для машинного навчання

Вбудований у Amazon SageMaker LightGBM тепер пропонує розподілене навчання за допомогою Dask

Підтримка нового розширеного формату даних в Amazon Kendra

Оптимізуйте гіперпараметри за допомогою автоматичного налаштування моделі Amazon SageMaker

Про нас

Вертикальний пошук & Ai

платформа

Залишайтеся на зв'язку

рахунки