Text Classification For Online Conversations With Machine Learning On AWS

Ponovno objavil Platon

Spremljevalci: 0

Spletni pogovori so v sodobnem življenju vseprisotni in zajemajo panoge od video iger do telekomunikacij. To je pripeljalo do eksponentne rasti količine podatkov o spletnih pogovorih, kar je pomagalo pri razvoju najsodobnejših sistemov za obdelavo naravnega jezika (NLP), kot so klepetalni roboti in modeli za ustvarjanje naravnega jezika (NLG). Sčasoma so se razvile tudi različne NLP tehnike za analizo besedil. To zahteva zahtevo po popolnoma upravljani storitvi, ki jo je mogoče integrirati v aplikacije z uporabo klicev API-ja brez potrebe po obsežnem strokovnem znanju s strojnim učenjem (ML). AWS ponuja vnaprej usposobljene storitve umetne inteligence AWS, kot so Amazonsko razumevanje, ki lahko učinkovito obravnava primere uporabe NLP, ki vključujejo klasifikacijo, povzemanje besedila, prepoznavanje entitet in več za zbiranje vpogledov iz besedila.

Poleg tega so spletni pogovori pripeljali do zelo razširjenega pojava netradicionalne rabe jezika. Tradicionalne tehnike NLP pogosto slabo delujejo na teh besedilnih podatkih zaradi nenehno razvijajočih se besednjakov, specifičnih za domeno, ki obstajajo znotraj različnih platform, pa tudi znatnih leksikalnih odstopanj besed od pravilne angleščine, bodisi po naključju bodisi namerno kot oblika kontradiktornega napada. .

V tej objavi opisujemo več pristopov ML za besedilno klasifikacijo spletnih pogovorov z orodji in storitvami, ki so na voljo na AWS.

Predpogoji

Preden se poglobite v ta primer uporabe, izpolnite naslednje predpogoje:

Nastavite AWS račun in ustvarite uporabnika IAM.
Nastavite AWS CLI in SDK-ji za AWS.
(Izbirno) Nastavite svoj Cloud9 IDE okolje.

Podatkovni niz

Za to objavo uporabljamo Jigsaw Nenamerna pristranskost v nizu podatkov o klasifikaciji strupenosti, merilo za specifičen problem razvrščanja toksičnosti v spletnih pogovorih. Nabor podatkov vsebuje oznake strupenosti in več atributov podskupin, kot so nespodobno, napad na identiteto, žalitev, grožnja in spolno eksplicitno. Oznake so podane kot delne vrednosti, ki predstavljajo delež človeških označevalcev, ki so verjeli, da je atribut uporabljen za dani del besedila, ki so redko soglasni. Za ustvarjanje binarnih oznak (na primer strupenih ali nestrupenih) se za delne vrednosti uporabi prag 0.5, pripombe z vrednostmi, ki so višje od praga, pa se obravnavajo kot pozitivni razred za to oznako.

Vdelava podbesed in RNN

Za naš prvi pristop modeliranja uporabljamo kombinacijo vdelave podbesed in ponavljajočih se nevronskih mrež (RNN) za urjenje modelov klasifikacije besedila. Vdelave podbesed je uvedel Bojanowski et al. leta 2017 kot izboljšava prejšnjih metod vdelave na ravni besed. Tradicionalni modeli Word2Vec skip-gram so usposobljeni za učenje statične vektorske predstavitve ciljne besede, ki optimalno napove kontekst te besede. Po drugi strani modeli podbesed predstavljajo vsako ciljno besedo kot vrečo n-gramov znakov, ki sestavljajo besedo, pri čemer je n-gram sestavljen iz niza n zaporednih znakov. Ta metoda omogoča, da model vdelave bolje predstavi osnovno morfologijo sorodnih besed v korpusu kot tudi izračun vdelav za nove besede, ki niso v besedišču (OOV). To je še posebej pomembno v kontekstu spletnih pogovorov, problematičnega prostora, v katerem uporabniki pogosto napačno črkujejo besede (včasih namerno, da bi se izognili zaznavanju) in uporabljajo tudi edinstven, nenehno razvijajoč se besednjak, ki ga splošni korpus usposabljanja morda ne bo zajel.

Amazon SageMaker poenostavi usposabljanje in optimizacijo nenadzorovanega modela vdelave podbesed na vašem lastnem korpusu domensko specifičnih besedilnih podatkov z vgrajenim BlazingText algoritem. Prenesemo lahko tudi obstoječe splošne modele, usposobljene za velike podatkovne nize spletnega besedila, kot je naslednje Modeli v angleškem jeziku so na voljo neposredno pri FastText. Iz primerka prenosnega računalnika SageMaker preprosto zaženite naslednje, da prenesete vnaprej pripravljen model fastText:

!wget -O vectors.zip https://dl.fbaipublicfiles.com/fasttext/vectors-english/crawl-300d-2M-subword.zip

Ne glede na to, ali ste usposobili lastne vdelave z BlazingText ali prenesli vnaprej naučen model, je rezultat stisnjen dvojiški model, ki ga lahko uporabite s knjižnico gensim za vdelavo dane ciljne besede kot vektorja na podlagi njegovih sestavnih podbesed:

# Imports
import os
from zipfile import ZipFile
from gensim.models.fasttext import load_facebook_vectors # Unzip the model binary into 'dir_path'
with ZipFile('vectors.zip', 'r') as zipObj: zipObj.extractall(path=<dir_path_name>) # Load embedding model into memory
embed_model = load_facebook_vectors(os.path.join(<dir_path_name>, 'vectors.bin')) # Compute embedding vector for 'word'
word_embedding = embed_model[word]

Ko predhodno obdelamo dani segment besedila, lahko s tem pristopom ustvarimo vektorsko predstavitev za vsako od sestavnih besed (kot so ločene s presledki). Nato uporabimo SageMaker in ogrodje za globoko učenje, kot je PyTorch, da usposobimo prilagojeni RNN z binarnim ali večoznačnim ciljem razvrščanja, da predvidimo, ali je besedilo strupeno ali ne, in specifično podvrsto toksičnosti na podlagi označenih primerov usposabljanja.

Za nalaganje vnaprej obdelanega besedila v Preprosta storitev shranjevanja Amazon (Amazon S3), uporabite naslednjo kodo:

import boto3
s3 = boto3.client('s3') bucket = <bucket_name>
prefix = <prefix_name> s3.upload_file('train.pkl', bucket, os.path.join(prefix, 'train/train.pkl'))
s3.upload_file('valid.pkl', bucket, os.path.join(prefix, 'valid/valid.pkl'))
s3.upload_file('test.pkl', bucket, os.path.join(prefix, 'test/test.pkl'))

Če želite s programom SageMaker začeti usposabljanje za razširljive modele z več grafičnimi procesorji, vnesite naslednjo kodo:

import sagemaker
sess = sagemaker.Session()
role = iam.get_role(RoleName= ‘AmazonSageMakerFullAccess’)['Role']['Arn'] from sagemaker.pytorch import PyTorch # hyperparameters, which are passed into the training job
hyperparameters = { 'epochs': 20, # Maximum number of epochs to train model 'train-batch-size': 128, # Training batch size (No. sentences) 'eval-batch-size': 1024, # Evaluation batch size (No. sentences) 'embed-size': 300, # Vector dimension of word embeddings (Must match embedding model) 'lstm-hidden-size': 200, # Number of neurons in LSTM hidden layer 'lstm-num-layers': 2, # Number of stacked LSTM layers 'proj-size': 100, # Number of neurons in intermediate projection layer 'num-targets': len(<list_of_label_names>), # Number of targets for classification 'class-weight': ' '.join([str(c) for c in <list_of_weights_per_class>]), # Weight to apply to each target during training 'total-length':<max_number_of_words_per_sentence>, 'metric-for-best-model': 'ap_score_weighted', # Metric on which to select the best model
} # create the Estimator
pytorch_estimator = PyTorch( entry_point='train.py', source_dir=<source_dir_path>, instance_type=<train_instance_type>, volume_size=200, instance_count=1, role=role, framework_version='1.6.0’, py_version='py36', hyperparameters=hyperparameters, metric_definitions=[ {'Name': 'validation:accuracy', 'Regex': 'eval_accuracy = (.*?);'}, {'Name': 'validation:f1-micro', 'Regex': 'eval_f1_score_micro = (.*?);'}, {'Name': 'validation:f1-macro', 'Regex': 'eval_f1_score_macro = (.*?);'}, {'Name': 'validation:f1-weighted', 'Regex': 'eval_f1_score_weighted = (.*?);'}, {'Name': 'validation:ap-micro', 'Regex': 'eval_ap_score_micro = (.*?);'}, {'Name': 'validation:ap-macro', 'Regex': 'eval_ap_score_macro = (.*?);'}, {'Name': 'validation:ap-weighted', 'Regex': 'eval_ap_score_weighted = (.*?);'}, {'Name': 'validation:auc-micro', 'Regex': 'eval_auc_score_micro = (.*?);'}, {'Name': 'validation:auc-macro', 'Regex': 'eval_auc_score_macro = (.*?);'}, {'Name': 'validation:auc-weighted', 'Regex': 'eval_auc_score_weighted = (.*?);'} ]
) pytorch_estimator.fit( { 'train': 's3://<bucket_name>/<prefix_name>/train', 'valid': 's3://<bucket_name>/<prefix_name>/valid', 'test': 's3://<bucket_name>/<prefix_name>/test' }
)

V okviru , definiramo nabor podatkov PyTorch, ki ga uporablja train.py za pripravo besedilnih podatkov za usposabljanje in oceno modela:

def pad_matrix(m: torch.Tensor, max_len: int =100)-> tuple[int, torch.Tensor] : """Pads an embedding matrix to a specified maximum length.""" if m.ndim == 1: m = m.reshape(1, -1) mask = np.ones_like(m) if m.shape[0] > max_len: m = m[:max_len, :] mask = mask[:max_len, :] else: m = np.pad(m, ((0, max_len - m.shape[0]), (0,0))) mask = np.pad(mask, ((0, max_len - mask.shape[0]), (0,0))) return m, mask class EmbeddingDataset(Dataset: torch.utils.data.Dataset): """PyTorch dataset representing pretrained sentence embeddings, masks, and labels.""" def __init__(self, text: str, labels: int, max_len: int=100): self.text = text self.labels = labels self.max_len = max_len def __len__(self) -> int: return len(self.labels) def __getitem__(self, idx: int) -> dict: e = embed_line(self.text[idx]) length = e.shape[0] m, mask = pad_matrix(e, max_len=self.max_len) item = {} item['embeddings'] = torch.from_numpy(m) item['mask'] = torch.from_numpy(mask) item['labels'] = torch.tensor(self.labels[idx]) if length > self.max_len: item['lengths'] = torch.tensor(self.max_len) else: item['lengths'] = torch.tensor(length) return item

Upoštevajte, da ta koda predvideva, da bo vectors.zip datoteka, ki vsebuje vaše vdelave fastText ali BlazingText, bo shranjena v .

Poleg tega lahko preprosto uvedete vnaprej pripravljene modele fastText same za žive končne točke SageMaker za sprotno izračunavanje vdelanih vektorjev za uporabo v ustreznih nalogah na ravni besed. Glej naslednje Primer GitHub Za več podrobnosti.

Transformerji z objemajočim se obrazom

Za naš drugi pristop modeliranja preidemo na uporabo transformatorjev, predstavljenih v članku Pozornost je vse, kar potrebujete. Transformatorji so modeli globokega učenja, zasnovani tako, da se namenoma izognejo pastem RNN-jev, tako da se zanašajo na mehanizem samopozornosti, da narišejo globalne odvisnosti med vhodom in izhodom. Arhitektura modela Transformer omogoča znatno boljšo paralelizacijo in lahko doseže visoko zmogljivost v relativno kratkem času usposabljanja.

Zgrajen na uspehu Transformerjev, BERT, predstavljen v časopisu BERT: predhodno usposabljanje globokih dvosmernih transformatorjev za jezikovno razumevanje, dodano dvosmerno predhodno usposabljanje za predstavitev jezika. Po navdihu naloge Cloze je BERT predhodno usposobljen za modeliranje maskiranega jezika (MLM), pri katerem se model nauči obnoviti izvirne besede za naključno maskirane žetone. Model BERT je tudi predhodno usposobljen za nalogo napovedi naslednjega stavka (NSP), da napove, ali sta dva stavka v pravilnem vrstnem redu branja. Od njegovega pojava leta 2018 se BERT in njegove različice pogosto uporabljajo pri nalogah klasifikacije besedil.

Naša rešitev uporablja različico BERT, znano kot RoBERTa, ki je bila predstavljena v članku RoBERTa: Odlično optimiziran BERT pristop za iskanje. RoBERTa dodatno izboljša zmogljivost BERT pri različnih nalogah naravnega jezika z optimiziranim usposabljanjem modelov, vključno z daljšim usposabljanjem modelov na 10-krat večjem korpusu, z uporabo optimiziranih hiperparametrov, dinamičnega naključnega maskiranja, odstranitve naloge NSP in še več.

Naši modeli, ki temeljijo na RoBERTa, uporabljajo Objemni obrazni transformatorji knjižnico, ki je priljubljeno odprtokodno ogrodje Python, ki zagotavlja visokokakovostne implementacije vseh vrst najsodobnejših modelov Transformer za različne naloge NLP. Hugging Face je sodeloval z AWS da vam omogoči enostavno usposabljanje in uvajanje modelov Transformer na SageMaker. Ta funkcija je na voljo prek Hugging Face AWS Deep Learning Container slike, ki vključuje knjižnice Transformers, Tokenizers in Datasets ter optimizirano integracijo s SageMaker za usposabljanje in sklepanje modelov.

Pri naši implementaciji podedujemo hrbtenico arhitekture RoBERTa iz ogrodja Hugging Face Transformers in uporabljamo SageMaker za usposabljanje in uvajanje lastnega modela klasifikacije besedila, ki ga imenujemo RoBERTox. RoBERTox uporablja kodiranje parov bajtov (BPE), uvedeno v Nevronsko strojno prevajanje redkih besed s podbesednimi enotami, za tokenizacijo vhodnega besedila v predstavitve podbesed. Nato lahko naše modele in tokenizerje urimo na podatkih Jigsaw ali katerem koli velikem korpusu, specifičnem za domeno (kot so dnevniki klepetov iz določene igre) in jih uporabimo za prilagojeno klasifikacijo besedila. Naš razred klasifikacijskega modela po meri definiramo v naslednji kodi:

class RoBERToxForSequenceClassification(CustomLossMixIn, RobertaPreTrainedModel): _keys_to_ignore_on_load_missing = [r"position_ids"] def __init__(self, config: PretrainedConfig, *inputs, **kwargs): """Initialize the RoBERToxForSequenceClassification instance Parameters ---------- config : PretrainedConfig num_labels : Optional[int] if not None, overwrite the default classification head in pretrained model. mode : Optional[str] 'MULTI_CLASS', 'MULTI_LABEL' or "REGRESSION". Used to determine loss class_weight : Optional[List[float]] If not None, add class weight to BCEWithLogitsLoss or CrossEntropyLoss """ super().__init__(config, *inputs, **kwargs) # Define model architecture self.roberta = RobertaModel(self.config, add_pooling_layer=False) self.classifier = RobertaClassificationHead(self.config) self.init_weights() @modeling_roberta.add_start_docstrings_to_model_forward( modeling_roberta.ROBERTA_INPUTS_DOCSTRING.format("batch_size, sequence_length") ) @modeling_roberta.add_code_sample_docstrings( tokenizer_class=modeling_roberta._TOKENIZER_FOR_DOC, checkpoint=modeling_roberta._CHECKPOINT_FOR_DOC, output_type=SequenceClassifierOutput, config_class=modeling_roberta._CONFIG_FOR_DOC, ) def forward( self, input_ids: torch.Tensor = None, attention_mask: torch.Tensor = None, token_type_ids: torch.Tensor = None, position_ids: torch.Tensor =None, head_mask: torch.Tensor =None, inputs_embeds: torch.Tensor =None, labels: torch.Tensor =None, output_attentions: torch.Tensor =None, output_hidden_states: torch.Tensor =None, return_dict: bool =None, sample_weights: torch.Tensor =None, ) -> : dict: """Forward pass to return loss, logits, ... Returns -------- output : SequenceClassifierOutput has those keys: loss, logits, hidden states, attentions """ return_dict = return_dict or self.config.use_return_dict outputs = self.roberta( input_ids, attention_mask=attention_mask, token_type_ids=token_type_ids, position_ids=position_ids, head_mask=head_mask, inputs_embeds=inputs_embeds, output_attentions=output_attentions, output_hidden_states=output_hidden_states, return_dict=return_dict, ) sequence_output = outputs[0] # [CLS] embedding logits = self.classifier(sequence_output) loss = self.compute_loss(logits, labels, sample_weights=sample_weights) if not return_dict: output = (logits,) + outputs[2:] return ((loss,) + output) if loss is not None else output return SequenceClassifierOutput( loss=loss, logits=logits, hidden_states=outputs.hidden_states, attentions=outputs.attentions, ) def compute_loss(self, logits: torch.Tensor, labels: torch.Tensor, sample_weights: Optional[torch.Tensor] = None) -> torch.FloatTensor: return super().compute_loss(logits, labels, sample_weights)

Pred usposabljanjem pripravimo besedilne podatke in oznake s knjižnico naborov podatkov Hugging Face in naložimo rezultat v Amazon S3:

from datasets import Dataset
import multiprocessing data_train = Dataset.from_pandas(df_train)
… tokenizer = <instantiated_huggingface_tokenizer> def preprocess_function(examples: examples) -> torch.Tensor: result = tokenizer(examples["text"], padding="max_length", max_length=128, truncation=True) return result num_proc = multiprocessing.cpu_count()
print("Number of CPUs =", num_proc) data_train = data_train.map( preprocess_function, batched=True, load_from_cache_file=False, num_proc=num_proc
)
… import botocore
from datasets.filesystems import S3FileSystem s3_session = botocore.session.Session() # create S3FileSystem instance with s3_session
s3 = S3FileSystem(session=s3_session) # saves encoded_dataset to your s3 bucket
data_train.save_to_disk(f's3://<bucket_name>/<prefix_name>/train', fs=s3)
…

Usposabljanje modela začnemo na podoben način kot RNN:

import sagemaker
sess = sagemaker.Session()
role = sagemaker.get_execution_role()
from sagemaker.huggingface import HuggingFace # hyperparameters, which are passed into the training job
hyperparameters = { 'model-name': <huggingface_base_model_name>, 'epochs': 10, 'train-batch-size': 32, 'eval-batch-size': 64, 'num-labels': len(<list_of_label_names>), 'class-weight': ' '.join([str(c) for c in <list_of_class_weights>]), 'metric-for-best-model': 'ap_score_weighted', 'save-total-limit': 1,
} # create the Estimator
huggingface_estimator = HuggingFace( entry_point='train.py', source_dir=<source_dir_path>, instance_type=<train_instance_type>, instance_count=1, role=role, transformers_version='4.6.1', pytorch_version='1.7.1', py_version='py36', hyperparameters=hyperparameters, metric_definitions=[ {'Name': 'validation:accuracy', 'Regex': 'eval_accuracy = (.*?);'}, {'Name': 'validation:f1-micro', 'Regex': 'eval_f1_score_micro = (.*?);'}, {'Name': 'validation:f1-macro', 'Regex': 'eval_f1_score_macro = (.*?);'}, {'Name': 'validation:f1-weighted', 'Regex': 'eval_f1_score_weighted = (.*?);'}, {'Name': 'validation:ap-micro', 'Regex': 'eval_ap_score_micro = (.*?);'}, {'Name': 'validation:ap-macro', 'Regex': 'eval_ap_score_macro = (.*?);'}, {'Name': 'validation:ap-weighted', 'Regex': 'eval_ap_score_weighted = (.*?);'}, {'Name': 'validation:auc-micro', 'Regex': 'eval_auc_score_micro = (.*?);'}, {'Name': 'validation:auc-macro', 'Regex': 'eval_auc_score_macro = (.*?);'}, {'Name': 'validation:auc-weighted', 'Regex': 'eval_auc_score_weighted = (.*?);'} ]
) huggingface_estimator.fit( { 'train': 's3://<bucket_name>/<prefix_name>/train', 'valid': 's3://<bucket_name>/<prefix_name>/valid', 'test': 's3://<bucket_name>/<prefix_name>/test'
)

Nazadnje, naslednji delček kode Python ponazarja postopek strežbe RoBERTox prek končne točke SageMaker v živo za razvrščanje besedila v realnem času za zahtevo JSON:

from sagemaker.huggingface import HuggingFaceModel
from sagemaker import get_execution_role
from sagemaker.predictor import Predictor
from sagemaker.serializers import JSONSerializer
from sagemaker.deserializers import JSONDeserializer class Classifier(Predictor): def __init__(self, endpoint_name, sagemaker_session): super().__init__(endpoint_name, sagemaker_session, serializer=JSONSerializer(), deserializer=JSONDeserializer()) hf_model = HuggingFaceModel( role=get_execution_role(), model_data=<s3_model_and_tokenizer.tar.gz>, entry_point="inference.py", transformers_version="4.6.1", pytorch_version="1.7.1", py_version="py36", predictor_cls=Classifier
) predictor = hf_model.deploy(instance_type=<deploy_instance_type>, initial_instance_count=1)

Vrednotenje uspešnosti modela: nabor podatkov o nenamerni pristranskosti Jigsaw

Naslednja tabela vsebuje metrike uspešnosti za modele, ki so bili usposobljeni in ocenjeni na podlagi podatkov tekmovanja Jigsaw Unintended Bias in Toxicity Detection Kaggle. Modele smo usposobili za tri različne, a med seboj povezane naloge:

Binarni primer – Model je bil usposobljen na celotnem naboru podatkov za usposabljanje za napovedovanje toxicity samo etiketa
Drobnozrnato ohišje – Podmnožica podatkov o usposabljanju, za katere toxicity>=0.5 je bil uporabljen za napovedovanje drugih oznak podvrste strupenosti (obscene, threat, insult, identity_attack, sexual_explicit)
Večopravilni primer – Celoten nabor podatkov za usposabljanje je bil uporabljen za predvidevanje vseh šestih oznak hkrati

Modele RNN in RoBERTa smo usposobili za vsako od teh treh nalog z uporabo delnih oznak, ki jih je zagotovil Jigsaw, ki ustrezajo deležu označevalcev, ki so mislili, da je oznaka primerna za besedilo, pa tudi z binarnimi oznakami v kombinaciji z utežmi razreda v omrežju funkcija izgube. V shemi binarnega označevanja so bili deleži omejeni na 0.5 za vsako razpoložljivo oznako (1, če je oznaka >=0.5, 0 drugače), funkcije izgube modela pa so bile utežene na podlagi relativnih deležev vsake binarne oznake v naboru podatkov za usposabljanje. V vseh primerih smo ugotovili, da je uporaba delnih oznak neposredno povzročila najboljšo učinkovitost, kar kaže na dodano vrednost informacij, ki so del stopnje strinjanja med označevalci.

Prikažemo dve metriki modela: povprečno natančnost (AP), ki zagotavlja povzetek krivulje natančnosti-odpoklica z izračunom tehtanega povprečja vrednosti natančnosti, doseženih pri vsakem pragu razvrščanja, in območje pod krivuljo delovanja sprejemnika (AUC) , ki združuje zmogljivost modela prek klasifikacijskih pragov glede na resnično pozitivno stopnjo in lažno pozitivno stopnjo. Upoštevajte, da pravi razred za dani primerek besedila v testnem nizu ustreza temu, ali je pravi delež večji ali enak 0.5 (1, če je oznaka >=0.5, 0 sicer).

.	Vdelava podbesed + RNN	RoBERTa
.	Delovne oznake	Binarne oznake + ponderiranje razreda	Delovne oznake	Binarne oznake + ponderiranje razreda
Binarni	AP=0.746, AUC=0.966	AP=0.730, AUC=0.963	AP=0.758, AUC=0.966	AP=0.747, AUC=0.963
Drobnozrnat	AP=0.906, AUC=0.909	AP=0.850, AUC=0.851	AP=0.913, AUC=0.913	AP=0.911, AUC=0.912
Multitask	AP=0.721, AUC=0.972	AP=0.535, AUC=0.907	AP=0.740, AUC=0.972	AP=0.711, AUC=0.961

zaključek

V tej objavi smo predstavili dva pristopa k klasifikaciji besedil za spletne pogovore z uporabo storitev AWS ML. Te rešitve lahko posplošite na spletne komunikacijske platforme, pri čemer bodo industrije, kot je igranje iger, še posebej verjetno imele koristi od izboljšane sposobnosti zaznavanja škodljive vsebine. V prihodnjih objavah načrtujemo nadaljnjo razpravo o arhitekturi od konca do konca za brezhibno uvajanje modelov v vaš račun AWS.

Če želite pomoč pri pospeševanju uporabe ML v svojih izdelkih in procesih, se obrnite na Amazon ML Solutions Lab.

O avtorjih

Klasifikacija besedila za spletne pogovore s strojnim učenjem na AWS PlatoBlockchain Data Intelligence. Navpično iskanje. Ai. Ryan Brand je podatkovni znanstvenik v laboratoriju Amazon Machine Learning Solutions. Ima posebne izkušnje z uporabo strojnega učenja pri problemih v zdravstvu in na področju znanosti o življenju, v prostem času pa rad bere zgodovino in znanstveno fantastiko.

Sourav Bhabesh je podatkovni znanstvenik v Amazon ML Solutions Lab. Razvija rešitve AI/ML za stranke AWS v različnih panogah. Njegova posebnost je obdelava naravnega jezika (NLP) in je navdušen nad globokim učenjem. Poleg službe rad bere knjige in potuje.

Liutong Zhou je uporabni znanstvenik v Amazon ML Solutions Lab. Za stranke AWS v različnih panogah gradi rešitve AI/ML po meri. Specializiral se je za obdelavo naravnega jezika (NLP) in navdušen nad multimodalnim poglobljenim učenjem. Je lirični tenorist in izven dela rad poje opere.

Sia Gholami je višji podatkovni znanstvenik v Amazon ML Solutions Lab, kjer gradi rešitve AI/ML za stranke v različnih panogah. Navdušen je nad obdelavo naravnega jezika (NLP) in globokim učenjem. Sia izven službe rada preživlja čas v naravi in igra tenis.

Daniel Horowitz je vodja znanosti o uporabni umetni inteligenci. Vodi skupino znanstvenikov v laboratoriju Amazon ML Solutions Lab, ki se ukvarja z reševanjem težav strank in spodbujanjem sprejemanja oblaka z ML.

Časovni žig: Junij 29, 2022

Časovni žig: Junij 23, 2022

Klasifikacija besedila za spletne pogovore s strojnim učenjem na AWS

Ponovno objavil Platon

Predpogoji

Podatkovni niz

Vdelava podbesed in RNN

Transformerji z objemajočim se obrazom

Vrednotenje uspešnosti modela: nabor podatkov o nenamerni pristranskosti Jigsaw

zaključek

O avtorjih

Več od Strojno učenje AWS

Inteligentna obdelava dokumentov s storitvami AI AWS: 1. del

Gostite transformatorske modele Hugging Face z Amazon SageMaker Serverless Inference

Porazdeljeno usposabljanje z Amazon EKS in Torch Distributed Elastic

Exafunction podpira AWS Inferentia za odklepanje najboljše cenovne zmogljivosti za sklepanje strojnega učenja

LightGBM, vgrajen v Amazon SageMaker, zdaj ponuja porazdeljeno usposabljanje z uporabo Daska

Nova podpora za razširjen format podatkov v Amazon Kendra

Optimizirajte hiperparametre s samodejno nastavitvijo modela Amazon SageMaker

O nas

Navpično iskanje in Ai

Platforma

Ostanite povezani

Račun