Text Classification For Online Conversations With Machine Learning On AWS

Újra kiadta Platón

Követő: 0

Az online beszélgetések mindenütt jelen vannak a modern életben, a videojátékoktól a telekommunikációig. Ez az online beszélgetési adatok mennyiségének exponenciális növekedéséhez vezetett, ami elősegítette a legkorszerűbb természetes nyelvi feldolgozó (NLP) rendszerek, például a chatbotok és a természetes nyelvgenerációs (NLG) modellek kifejlesztését. Az idő múlásával a szövegelemzés különböző NLP-technikái is fejlődtek. Ez szükségessé teszi egy teljesen felügyelt szolgáltatás követelményét, amely API-hívások segítségével integrálható alkalmazásokba anélkül, hogy kiterjedt gépi tanulási (ML) szakértelemre lenne szükség. Az AWS előre kiképzett AWS AI szolgáltatásokat kínál, mint pl Amazon Comprehend, amely hatékonyan képes kezelni az osztályozást, szövegösszegzést, entitásfelismerést és sok mást magában foglaló NLP-használati eseteket, hogy betekintést nyerhessen a szövegből.

Ezenkívül az online beszélgetések a nem hagyományos nyelvhasználat széles körben elterjedt jelenségéhez vezettek. A hagyományos NLP technikák gyakran gyengén teljesítenek ezeken a szöveges adatokon a különböző platformokon folyamatosan fejlődő és tartomány-specifikus szókincsek miatt, valamint a szavak jelentős lexikális eltérései miatt a megfelelő angol nyelvtől, akár véletlenül, akár szándékosan az ellenséges támadás egy formájaként. .

Ebben a bejegyzésben több ML megközelítést ismertetünk az online beszélgetések szöveges osztályozására az AWS-en elérhető eszközökkel és szolgáltatásokkal.

Előfeltételek

Mielőtt mélyebben belemerülne ebbe a használati esetbe, kérjük, teljesítse a következő előfeltételeket:

Állítson be egy AWS-fiók és a hozzon létre egy IAM-felhasználót.
Állítsa be a AWS CLI és a AWS SDK-k.
(Opcionális) Állítsa be Cloud9 IDE környezet.

adatbázisba

Ehhez a bejegyzéshez a Jigsaw Nem szándékolt torzítás a toxicitási osztályozási adatkészletben, egy etalon az online beszélgetések során előforduló toxicitás osztályozásának sajátos problémájához. Az adatkészlet toxicitási címkéket, valamint számos alcsoport-attribútumot tartalmaz, például obszcén, személyazonossági támadás, sértés, fenyegetés és szexuális jellegű. A címkék törtértékekként vannak megadva, amelyek azon emberi annotátorok arányát jelzik, akik hittek az adott szövegrészre alkalmazott attribútumban, ami ritkán egyhangú. A bináris címkék (például mérgező vagy nem mérgező) generálásához 0.5-ös küszöbértéket alkalmaznak a törtértékekre, és a küszöbértéknél nagyobb értékű megjegyzéseket a rendszer az adott címke pozitív osztályaként kezeli.

Alszavak beágyazása és RNN-ek

Első modellezési megközelítésünkben az alszavak beágyazása és az ismétlődő neurális hálózatok (RNN-ek) kombinációját használjuk a szövegosztályozási modellek betanításához. Az alszavak beágyazását vezette be Bojanowski et al. 2017-ben a korábbi szószintű beágyazási módszerek továbbfejlesztéseként. A hagyományos Word2Vec skip-gram modelleket arra tanítják, hogy megtanulják a célszó statikus vektoros ábrázolását, amely optimálisan megjósolja a szó kontextusát. Az alszómodellek viszont minden célszót a szót alkotó n-grammokból álló zsákként jelenítenek meg, ahol az n-gram n egymást követő karakterből áll. Ez a módszer lehetővé teszi, hogy a beágyazási modell jobban reprezentálja a korpuszban lévő kapcsolódó szavak mögöttes morfológiáját, valamint az újszerű, szókincsen kívüli (OOV) szavak beágyazásainak kiszámítását. Ez különösen fontos az online beszélgetések kontextusában, egy olyan problémakörben, ahol a felhasználók gyakran hibásan írják le a szavakat (néha szándékosan, hogy elkerüljék a felismerést), és egy egyedi, folyamatosan fejlődő szókincset használnak, amelyet egy általános képzési korpusz esetleg nem fog meg.

Amazon SageMaker megkönnyíti a felügyelt részszóbeágyazási modell betanítását és optimalizálását a saját domain-specifikus szöveges adatokból álló korpuszán a beépített BlazingText algoritmus. Letölthetünk meglévő általános célú modelleket is, amelyek nagy online szöveges adathalmazokra lettek kiképezve, mint például az alábbiak Az angol nyelvű modellek közvetlenül a fastText-től kaphatók. A SageMaker notebook-példányból egyszerűen futtassa a következőket egy előre betanított fastText modell letöltéséhez:

!wget -O vectors.zip https://dl.fbaipublicfiles.com/fasttext/vectors-english/crawl-300d-2M-subword.zip

Függetlenül attól, hogy a BlazingText segítségével betanította a saját beágyazásait, vagy letöltött egy előre betanított modellt, az eredmény egy tömörített modell bináris, amelyet a gensim könyvtárral együtt használhat egy adott célszó vektorként való beágyazására az alkotó alszavak alapján:

# Imports
import os
from zipfile import ZipFile
from gensim.models.fasttext import load_facebook_vectors # Unzip the model binary into 'dir_path'
with ZipFile('vectors.zip', 'r') as zipObj: zipObj.extractall(path=<dir_path_name>) # Load embedding model into memory
embed_model = load_facebook_vectors(os.path.join(<dir_path_name>, 'vectors.bin')) # Compute embedding vector for 'word'
word_embedding = embed_model[word]

Egy adott szövegszegmens előfeldolgozása után ezt a megközelítést használhatjuk vektoros ábrázolás létrehozására az egyes alkotó szavakhoz (szóközökkel elválasztva). Ezután a SageMaker-t és egy mély tanulási keretrendszert, például a PyTorch-et használjuk egy testreszabott RNN betanításához bináris vagy többcímkés osztályozási céllal, hogy megjósolhassuk, hogy a szöveg mérgező-e vagy sem, és megjelölt betanítási példák alapján a toxicitás konkrét altípusát.

Az előre feldolgozott szöveg feltöltéséhez ide Amazon egyszerű tárolási szolgáltatás (Amazon S3), használja a következő kódot:

import boto3
s3 = boto3.client('s3') bucket = <bucket_name>
prefix = <prefix_name> s3.upload_file('train.pkl', bucket, os.path.join(prefix, 'train/train.pkl'))
s3.upload_file('valid.pkl', bucket, os.path.join(prefix, 'valid/valid.pkl'))
s3.upload_file('test.pkl', bucket, os.path.join(prefix, 'test/test.pkl'))

A méretezhető, több GPU-s modell betanításának elindításához a SageMakerrel, írja be a következő kódot:

import sagemaker
sess = sagemaker.Session()
role = iam.get_role(RoleName= ‘AmazonSageMakerFullAccess’)['Role']['Arn'] from sagemaker.pytorch import PyTorch # hyperparameters, which are passed into the training job
hyperparameters = { 'epochs': 20, # Maximum number of epochs to train model 'train-batch-size': 128, # Training batch size (No. sentences) 'eval-batch-size': 1024, # Evaluation batch size (No. sentences) 'embed-size': 300, # Vector dimension of word embeddings (Must match embedding model) 'lstm-hidden-size': 200, # Number of neurons in LSTM hidden layer 'lstm-num-layers': 2, # Number of stacked LSTM layers 'proj-size': 100, # Number of neurons in intermediate projection layer 'num-targets': len(<list_of_label_names>), # Number of targets for classification 'class-weight': ' '.join([str(c) for c in <list_of_weights_per_class>]), # Weight to apply to each target during training 'total-length':<max_number_of_words_per_sentence>, 'metric-for-best-model': 'ap_score_weighted', # Metric on which to select the best model
} # create the Estimator
pytorch_estimator = PyTorch( entry_point='train.py', source_dir=<source_dir_path>, instance_type=<train_instance_type>, volume_size=200, instance_count=1, role=role, framework_version='1.6.0’, py_version='py36', hyperparameters=hyperparameters, metric_definitions=[ {'Name': 'validation:accuracy', 'Regex': 'eval_accuracy = (.*?);'}, {'Name': 'validation:f1-micro', 'Regex': 'eval_f1_score_micro = (.*?);'}, {'Name': 'validation:f1-macro', 'Regex': 'eval_f1_score_macro = (.*?);'}, {'Name': 'validation:f1-weighted', 'Regex': 'eval_f1_score_weighted = (.*?);'}, {'Name': 'validation:ap-micro', 'Regex': 'eval_ap_score_micro = (.*?);'}, {'Name': 'validation:ap-macro', 'Regex': 'eval_ap_score_macro = (.*?);'}, {'Name': 'validation:ap-weighted', 'Regex': 'eval_ap_score_weighted = (.*?);'}, {'Name': 'validation:auc-micro', 'Regex': 'eval_auc_score_micro = (.*?);'}, {'Name': 'validation:auc-macro', 'Regex': 'eval_auc_score_macro = (.*?);'}, {'Name': 'validation:auc-weighted', 'Regex': 'eval_auc_score_weighted = (.*?);'} ]
) pytorch_estimator.fit( { 'train': 's3://<bucket_name>/<prefix_name>/train', 'valid': 's3://<bucket_name>/<prefix_name>/valid', 'test': 's3://<bucket_name>/<prefix_name>/test' }
)

Belül , definiálunk egy PyTorch-adatkészletet, amelyet a train.py a szöveges adatok előkészítése a modell betanításához és értékeléséhez:

def pad_matrix(m: torch.Tensor, max_len: int =100)-> tuple[int, torch.Tensor] : """Pads an embedding matrix to a specified maximum length.""" if m.ndim == 1: m = m.reshape(1, -1) mask = np.ones_like(m) if m.shape[0] > max_len: m = m[:max_len, :] mask = mask[:max_len, :] else: m = np.pad(m, ((0, max_len - m.shape[0]), (0,0))) mask = np.pad(mask, ((0, max_len - mask.shape[0]), (0,0))) return m, mask class EmbeddingDataset(Dataset: torch.utils.data.Dataset): """PyTorch dataset representing pretrained sentence embeddings, masks, and labels.""" def __init__(self, text: str, labels: int, max_len: int=100): self.text = text self.labels = labels self.max_len = max_len def __len__(self) -> int: return len(self.labels) def __getitem__(self, idx: int) -> dict: e = embed_line(self.text[idx]) length = e.shape[0] m, mask = pad_matrix(e, max_len=self.max_len) item = {} item['embeddings'] = torch.from_numpy(m) item['mask'] = torch.from_numpy(mask) item['labels'] = torch.tensor(self.labels[idx]) if length > self.max_len: item['lengths'] = torch.tensor(self.max_len) else: item['lengths'] = torch.tensor(length) return item

Vegye figyelembe, hogy ez a kód előrevetíti, hogy a vectors.zip A fastText vagy BlazingText beágyazásait tartalmazó fájl tárolásra kerül .

Ezenkívül az előre betanított fastText modelleket egyszerűen telepítheti a SageMaker élő végpontjaihoz, hogy menet közben kiszámolhassa a beágyazási vektorokat a releváns szószintű feladatokhoz. Lásd a következőket GitHub példa fül alatt találsz.

Transformers átölelő arccal

Második modellezési megközelítésünkhöz áttérünk a cikkben bemutatott Transformers használatára Csak a figyelem kell. A transzformátorok mély tanulási modellek, amelyeket az RNN-ek buktatóinak szándékosan történő elkerülésére terveztek azáltal, hogy egy önfigyelő mechanizmusra támaszkodnak, hogy globális függőséget vonjanak le a bemenet és a kimenet között. A Transformer modellarchitektúra lényegesen jobb párhuzamosítást tesz lehetővé, és viszonylag rövid edzési idő alatt nagy teljesítményt tud elérni.

A Transformers, a BERT sikerére építve, amelyet a lapban mutattak be BERT: Mély kétirányú transzformátorok előképzése a nyelv megértéséhez, hozzáadott kétirányú előképzés a nyelvi reprezentációhoz. A Cloze feladat ihlette a BERT-t a maszkolt nyelvi modellezéssel (MLM), amelyben a modell megtanulja visszaállítani a véletlenszerűen maszkolt tokenek eredeti szavait. A BERT-modell a következő mondat-előrejelzési (NSP) feladatra is előképzett, hogy megjósolja, hogy két mondat helyes olvasási sorrendben van-e. 2018-as megjelenése óta a BERT és variációi széles körben használatosak szövegosztályozási feladatokban.

Megoldásunk a BERT RoBERTa néven ismert változatát használja, amelyet a cikkben mutattunk be RoBERTa: Robusztusan optimalizált BERT előképzési megközelítés. A RoBERTa tovább javítja a BERT teljesítményét számos természetes nyelvi feladatban optimalizált modellképzéssel, beleértve a 10-szer nagyobb korpuszon hosszabb betanítási modelleket, optimalizált hiperparamétereket, dinamikus véletlenszerű maszkolást, az NSP-feladat eltávolítását stb.

RoBERTa alapú modelljeink a Átölelve Face Transformers könyvtár, amely egy népszerű nyílt forráskódú Python-keretrendszer, amely mindenféle legmodernebb Transformer modell kiváló minőségű megvalósítását biztosítja különféle NLP-feladatokhoz. A Hugging Face együttműködött az AWS-szel lehetővé teszi a Transformer modellek egyszerű betanítását és üzembe helyezését a SageMakeren. Ez a funkció a következőn keresztül érhető el Hugging Face AWS Deep Learning Container képek, amelyek magukban foglalják a Transformers, Tokenizers és Datasets könyvtárakat, valamint a SageMakerrel optimalizált integrációt a modellképzéshez és következtetésekhez.

Megvalósításunk során a RoBERTa architektúra gerincét a Hugging Face Transformers keretrendszertől örököljük, és a SageMaker segítségével tanítjuk és telepítjük saját szövegosztályozási modellünket, amelyet RoBERToxnak nevezünk. A RoBERTox bájtpáros kódolást (BPE) használ, amelyet ben vezettek be Ritka szavak idegi gépi fordítása részszóegységekkel, a bemeneti szöveg alszavak reprezentációiba való tokenizálásához. Ezután modelljeinket és tokenizátorainkat betaníthatjuk a Jigsaw adatokra vagy bármilyen nagy, tartományspecifikus korpuszra (például egy adott játék chatnaplójára), és testreszabott szövegosztályozásra használhatjuk őket. Egyéni besorolási modell osztályunkat a következő kódban határozzuk meg:

class RoBERToxForSequenceClassification(CustomLossMixIn, RobertaPreTrainedModel): _keys_to_ignore_on_load_missing = [r"position_ids"] def __init__(self, config: PretrainedConfig, *inputs, **kwargs): """Initialize the RoBERToxForSequenceClassification instance Parameters ---------- config : PretrainedConfig num_labels : Optional[int] if not None, overwrite the default classification head in pretrained model. mode : Optional[str] 'MULTI_CLASS', 'MULTI_LABEL' or "REGRESSION". Used to determine loss class_weight : Optional[List[float]] If not None, add class weight to BCEWithLogitsLoss or CrossEntropyLoss """ super().__init__(config, *inputs, **kwargs) # Define model architecture self.roberta = RobertaModel(self.config, add_pooling_layer=False) self.classifier = RobertaClassificationHead(self.config) self.init_weights() @modeling_roberta.add_start_docstrings_to_model_forward( modeling_roberta.ROBERTA_INPUTS_DOCSTRING.format("batch_size, sequence_length") ) @modeling_roberta.add_code_sample_docstrings( tokenizer_class=modeling_roberta._TOKENIZER_FOR_DOC, checkpoint=modeling_roberta._CHECKPOINT_FOR_DOC, output_type=SequenceClassifierOutput, config_class=modeling_roberta._CONFIG_FOR_DOC, ) def forward( self, input_ids: torch.Tensor = None, attention_mask: torch.Tensor = None, token_type_ids: torch.Tensor = None, position_ids: torch.Tensor =None, head_mask: torch.Tensor =None, inputs_embeds: torch.Tensor =None, labels: torch.Tensor =None, output_attentions: torch.Tensor =None, output_hidden_states: torch.Tensor =None, return_dict: bool =None, sample_weights: torch.Tensor =None, ) -> : dict: """Forward pass to return loss, logits, ... Returns -------- output : SequenceClassifierOutput has those keys: loss, logits, hidden states, attentions """ return_dict = return_dict or self.config.use_return_dict outputs = self.roberta( input_ids, attention_mask=attention_mask, token_type_ids=token_type_ids, position_ids=position_ids, head_mask=head_mask, inputs_embeds=inputs_embeds, output_attentions=output_attentions, output_hidden_states=output_hidden_states, return_dict=return_dict, ) sequence_output = outputs[0] # [CLS] embedding logits = self.classifier(sequence_output) loss = self.compute_loss(logits, labels, sample_weights=sample_weights) if not return_dict: output = (logits,) + outputs[2:] return ((loss,) + output) if loss is not None else output return SequenceClassifierOutput( loss=loss, logits=logits, hidden_states=outputs.hidden_states, attentions=outputs.attentions, ) def compute_loss(self, logits: torch.Tensor, labels: torch.Tensor, sample_weights: Optional[torch.Tensor] = None) -> torch.FloatTensor: return super().compute_loss(logits, labels, sample_weights)

Edzés előtt elkészítjük szöveges adatainkat és címkéinket a Hugging Face adatkészlet-könyvtárával, és feltöltjük az eredményt az Amazon S3-ra:

from datasets import Dataset
import multiprocessing data_train = Dataset.from_pandas(df_train)
… tokenizer = <instantiated_huggingface_tokenizer> def preprocess_function(examples: examples) -> torch.Tensor: result = tokenizer(examples["text"], padding="max_length", max_length=128, truncation=True) return result num_proc = multiprocessing.cpu_count()
print("Number of CPUs =", num_proc) data_train = data_train.map( preprocess_function, batched=True, load_from_cache_file=False, num_proc=num_proc
)
… import botocore
from datasets.filesystems import S3FileSystem s3_session = botocore.session.Session() # create S3FileSystem instance with s3_session
s3 = S3FileSystem(session=s3_session) # saves encoded_dataset to your s3 bucket
data_train.save_to_disk(f's3://<bucket_name>/<prefix_name>/train', fs=s3)
…

A modell képzését az RNN-hez hasonló módon indítjuk:

import sagemaker
sess = sagemaker.Session()
role = sagemaker.get_execution_role()
from sagemaker.huggingface import HuggingFace # hyperparameters, which are passed into the training job
hyperparameters = { 'model-name': <huggingface_base_model_name>, 'epochs': 10, 'train-batch-size': 32, 'eval-batch-size': 64, 'num-labels': len(<list_of_label_names>), 'class-weight': ' '.join([str(c) for c in <list_of_class_weights>]), 'metric-for-best-model': 'ap_score_weighted', 'save-total-limit': 1,
} # create the Estimator
huggingface_estimator = HuggingFace( entry_point='train.py', source_dir=<source_dir_path>, instance_type=<train_instance_type>, instance_count=1, role=role, transformers_version='4.6.1', pytorch_version='1.7.1', py_version='py36', hyperparameters=hyperparameters, metric_definitions=[ {'Name': 'validation:accuracy', 'Regex': 'eval_accuracy = (.*?);'}, {'Name': 'validation:f1-micro', 'Regex': 'eval_f1_score_micro = (.*?);'}, {'Name': 'validation:f1-macro', 'Regex': 'eval_f1_score_macro = (.*?);'}, {'Name': 'validation:f1-weighted', 'Regex': 'eval_f1_score_weighted = (.*?);'}, {'Name': 'validation:ap-micro', 'Regex': 'eval_ap_score_micro = (.*?);'}, {'Name': 'validation:ap-macro', 'Regex': 'eval_ap_score_macro = (.*?);'}, {'Name': 'validation:ap-weighted', 'Regex': 'eval_ap_score_weighted = (.*?);'}, {'Name': 'validation:auc-micro', 'Regex': 'eval_auc_score_micro = (.*?);'}, {'Name': 'validation:auc-macro', 'Regex': 'eval_auc_score_macro = (.*?);'}, {'Name': 'validation:auc-weighted', 'Regex': 'eval_auc_score_weighted = (.*?);'} ]
) huggingface_estimator.fit( { 'train': 's3://<bucket_name>/<prefix_name>/train', 'valid': 's3://<bucket_name>/<prefix_name>/valid', 'test': 's3://<bucket_name>/<prefix_name>/test'
)

Végül a következő Python-kódrészlet a RoBERTox kiszolgálásának folyamatát mutatja be egy élő SageMaker-végponton keresztül a JSON-kérés valós idejű szöveges osztályozása érdekében:

from sagemaker.huggingface import HuggingFaceModel
from sagemaker import get_execution_role
from sagemaker.predictor import Predictor
from sagemaker.serializers import JSONSerializer
from sagemaker.deserializers import JSONDeserializer class Classifier(Predictor): def __init__(self, endpoint_name, sagemaker_session): super().__init__(endpoint_name, sagemaker_session, serializer=JSONSerializer(), deserializer=JSONDeserializer()) hf_model = HuggingFaceModel( role=get_execution_role(), model_data=<s3_model_and_tokenizer.tar.gz>, entry_point="inference.py", transformers_version="4.6.1", pytorch_version="1.7.1", py_version="py36", predictor_cls=Classifier
) predictor = hf_model.deploy(instance_type=<deploy_instance_type>, initial_instance_count=1)

A modell teljesítményének értékelése: Jigsaw nem szándékolt torzítási adatkészlet

Az alábbi táblázat a Jigsaw Unintended Bias in Toxicity Detection Kaggle verseny adatai alapján betanított és kiértékelt modellek teljesítménymutatóit tartalmazza. Három különböző, de egymással összefüggő feladatra képeztünk modelleket:

Bináris eset – A modellt a teljes képzési adatkészletre képezték ki, hogy előre jelezzék a toxicity csak címke
Finom szemcsés tok – A képzési adatok azon részhalmaza, amelyre toxicity>=0.5 más toxicitási altípus-címkék előrejelzésére használták (obscene, threat, insult, identity_attack, sexual_explicit)
Többfeladatos eset – A teljes képzési adatkészletet mind a hat címke egyidejű előrejelzésére használták

Mindhárom feladathoz RNN- és RoBERTa-modellt képeztünk ki a Jigsaw által biztosított törtcímkék segítségével, amelyek megfelelnek azon jegyzők arányának, akik szerint a címke megfelelő a szöveghez, valamint a hálózatban osztálysúlyokkal kombinált bináris címkékkel. veszteségfüggvény. A bináris címkézési sémában az arányokat 0.5-re küszöböltük minden elérhető címkére (1, ha címke>=0.5, egyébként 0), és a modellvesztési függvényeket a betanítási adatkészletben lévő egyes bináris címkék relatív arányai alapján súlyoztuk. Minden esetben azt találtuk, hogy a törtcímkék használata közvetlenül a legjobb teljesítményt eredményezte, jelezve az annotátorok közötti egyetértés mértékében rejlő információ hozzáadott értékét.

Két modell metrikát jelenítünk meg: az átlagos precizitást (AP), amely összefoglalja a precíziós-visszahívási görbét az egyes osztályozási küszöböknél elért pontossági értékek súlyozott átlagának kiszámításával, valamint a vevő működési jelleggörbe alatti területét (AUC). , amely összesíti a modell teljesítményét az osztályozási küszöbök között a valódi pozitív arány és a hamis pozitív arány tekintetében. Vegye figyelembe, hogy a teszthalmaz adott szövegpéldányának valódi osztálya annak felel meg, hogy a valódi arány nagyobb-e vagy egyenlő-e 0.5-tel (1, ha a címke>=0.5, egyébként 0).

.	Alszó beágyazása + RNN	RoBERTa
.	Tört címkék	Bináris címkék + osztálysúlyozás	Tört címkék	Bináris címkék + osztálysúlyozás
Kétkomponensű	AP=0.746, AUC=0.966	AP=0.730, AUC=0.963	AP=0.758, AUC=0.966	AP=0.747, AUC=0.963
Finom szemcsés	AP=0.906, AUC=0.909	AP=0.850, AUC=0.851	AP=0.913, AUC=0.913	AP=0.911, AUC=0.912
Multitask	AP=0.721, AUC=0.972	AP=0.535, AUC=0.907	AP=0.740, AUC=0.972	AP=0.711, AUC=0.961

Következtetés

Ebben a bejegyzésben két szövegosztályozási megközelítést mutattunk be az AWS ML-szolgáltatásokat használó online beszélgetésekhez. Ezeket a megoldásokat általánosíthatja az online kommunikációs platformokon, és az olyan iparágakban, mint a játék, különösen nagy valószínűséggel profitálhat a káros tartalom észlelésének jobb képességéből. A jövőbeni bejegyzésekben azt tervezzük, hogy tovább tárgyaljuk a teljes körű architektúrát a modellek zökkenőmentes telepítéséhez az AWS-fiókjában.

Ha segítségre van szüksége az ML használatának felgyorsításához termékeiben és folyamataiban, kérjük, forduljon a Amazon ML Solutions Lab.

A szerzőkről

Szövegbesorolás az online beszélgetésekhez gépi tanulással az AWS PlatoBlockchain Data Intelligence rendszeren. Függőleges keresés. Ai. Ryan Brand az Amazon Machine Learning Solutions Lab adattudományi kutatója. Konkrét tapasztalattal rendelkezik az egészségügy és az élettudományok problémáira való gépi tanulás alkalmazásában, szabadidejében pedig szívesen olvas történelmet és tudományos-fantasztikus műveket.

Sourav Bhabesh adatkutató az Amazon ML Solutions Labnál. AI/ML megoldásokat fejleszt az AWS ügyfelei számára különböző iparágakban. Szakterülete a Natural Language Processing (NLP), és szenvedélyesen foglalkozik a mély tanulással. A munkán kívül szeret könyveket olvasni és utazni.

Liutong Zhou az Amazon ML Solutions Lab alkalmazott tudósa. Egyedi AI/ML megoldásokat készít az AWS ügyfelei számára a különböző iparágakban. A természetes nyelvi feldolgozásra (NLP) specializálódott, és szenvedélyesen rajong a multimodális mély tanulásért. Lírai tenor, és a munkán kívül is szívesen énekel operákat.

Sia Gholami vezető adattudós az Amazon ML Solutions Labnál, ahol AI/ML megoldásokat épít ügyfelei számára a különböző iparágakban. Szenvedélye a természetes nyelvi feldolgozás (NLP) és a mély tanulás. A munkán kívül Sia szívesen tölt időt a természetben és teniszez.

Daniel Horowitz Alkalmazott AI tudományos menedzser. Az Amazon ML Solutions Lab kutatócsoportját vezeti, amely az ügyfelek problémáinak megoldásán és az ML-felhő használatának elősegítésén dolgozik.

Időbélyeg: Június 29, 2022

Időbélyeg: 23. június 2022.

Szövegbesorolás az online beszélgetésekhez az AWS gépi tanulással

Újra kiadta Platón

Előfeltételek

adatbázisba

Alszavak beágyazása és RNN-ek

Transformers átölelő arccal

A modell teljesítményének értékelése: Jigsaw nem szándékolt torzítási adatkészlet

Következtetés

A szerzőkről

Még több AWS gépi tanulás

Intelligens dokumentumfeldolgozás AWS AI szolgáltatásokkal: 1. rész

Host Hugging Face transzformátor modellek az Amazon SageMaker Serverless Inference segítségével

Elosztott képzés az Amazon EKS és a Torch Distributed Elastic segítségével

Az Exafunction támogatja az AWS Inferentiát, hogy a legjobb árteljesítményt biztosítsa a gépi tanulási következtetésekhez

Az Amazon SageMaker beépített LightGBM mostantól elosztott képzést kínál a Dask használatával

Új kiterjesztett adatformátum-támogatás az Amazon Kendra-ban

Optimalizálja a hiperparamétereket az Amazon SageMaker automatikus modellhangolásával

Rólunk

Vertical Search & Ai

Emelvény

Maradjon kapcsolatban

Fiók