Invite à zéro tir et à quelques tirs pour le modèle de base BloomZ 176B avec le SDK simplifié Amazon SageMaker JumpStart

Republié par Platon

Suiveurs: 0

Amazon SageMaker JumpStart est un hub d'apprentissage automatique (ML) proposant des algorithmes, des modèles et des solutions ML. Avec SageMaker JumpStart, les praticiens du ML peuvent choisir parmi une liste croissante d'outils les plus performants et accessibles au public. modèles de fondation (FM) tels que BLOOM, Llama 2, Faucon-40B, Diffusion stable, OuvrirLLaMA, Flan-T5/UL2, ou FM de Adhérer ainsi que le Lumière allumée.

Dans cet article et le bloc-notes qui l'accompagne, nous montrons comment déployer le modèle de fondation BloomZ 176B à l'aide du SDK SageMaker Python simplifié in Amazon SageMaker JumpStart comme point de terminaison et l'utiliser pour diverses tâches de traitement du langage naturel (NLP). Vous pouvez également accéder aux modèles de fondation via Amazon SageMakerStudio. Le modèle BloomZ 176B, l'un des plus grands modèles accessibles au public, est un modèle d'instruction à la pointe de la technologie qui peut effectuer diverses tâches d'apprentissage PNL en contexte et d'apprentissage zéro coup. Le réglage des instructions est une technique qui consiste à affiner un modèle de langage sur une collection de tâches NLP à l'aide d'instructions. Pour en savoir plus sur le réglage des instructions, reportez-vous à Invite zéro coup pour le modèle de fondation Flan-T5 dans Amazon SageMaker JumpStart.

L'apprentissage zéro coup en PNL permet à un LLM pré-formé de générer des réponses à des tâches pour lesquelles il n'a pas été spécifiquement formé. Dans cette technique, le modèle est fourni avec un texte d'entrée et une invite qui décrit la sortie attendue du modèle en langage naturel. L'apprentissage zéro coup est utilisé dans une variété de tâches PNL, telles que les suivantes :

Texte multilingue et classification des sentiments
Questions et réponses multilingues
Génération de code
Reformulation de paragraphe
Récapitulation
Raisonnement de bon sens et inférence en langage naturel
Question répondant
Classification des phrases et des sentiments
Génération d'articles imaginaires basée sur un titre
Résumer un titre à partir d'un article

L'apprentissage ponctuel consiste à entraîner un modèle à effectuer de nouvelles tâches en ne fournissant que quelques exemples. Ceci est utile lorsque des données étiquetées limitées sont disponibles pour la formation. L'apprentissage peu visible est utilisé dans une variété de tâches, y compris les suivantes :

Résumé de texte
Génération de code
Reconnaissance de l'entité de nom
Question répondant
Grammaire et correction orthographique
Description du produit et généralisation
Classification des phrases et des sentiments
Chatbot et IA conversationnelle
Génération de tweets
Traduction automatique
Classement des intentions

À propos de Bloom

Le modèle de langage BigScience Large Open-science Open-access Multilingual (BLOOM) est un grand modèle de langage basé sur un transformateur (LLM). BLOOM est un LLM autorégressif formé pour continuer le texte à partir d'une invite sur de grandes quantités de données textuelles en utilisant des ressources de calcul à l'échelle industrielle. En tant que tel, il est capable de produire un texte cohérent qui se distingue à peine du texte écrit par des humains. BLOOM peut également être chargé d'effectuer des tâches de texte pour lesquelles il n'a pas été explicitement formé en les transformant en tâches de génération de texte.

Avec ses 176 milliards de paramètres, BLOOM est capable de générer du texte dans 46 langues naturelles et 13 langages de programmation. Pour presque tous, comme l'espagnol, le français et l'arabe, BLOOM est le premier modèle de langage avec plus de 100 milliards de paramètres jamais créés. Les chercheurs peuvent télécharger, exécuter et étudier BLOOM pour étudier les performances et le comportement des LLM récemment développés jusqu'à leurs opérations internes les plus profondes.

Vue d'ensemble de la solution

Dans cet article, nous montrons comment utiliser le modèle BloomZ 176B à la pointe de la technologie de Étreindre le visage pour la génération de texte. Vous pouvez utiliser le modèle BloomZ 176B avec un apprentissage en quelques coups et un apprentissage en zéro coup pour de nombreuses tâches NLP, sans affiner le modèle. Il n'est pas nécessaire de former un nouveau modèle car des modèles comme BloomZ 176B ont un nombre important de paramètres tels qu'ils peuvent facilement s'adapter à de nombreux contextes sans être recyclés. Le modèle BloomZ 176B a été formé avec une grande quantité de données, ce qui le rend applicable à de nombreuses tâches à usage général.

Le code de toutes les étapes de cette démo est disponible ci-dessous cahier.

Réglage des instructions

La taille et la complexité des LLM ont explosé ces dernières années. Les LLM ont démontré des capacités remarquables dans l'apprentissage de la sémantique du langage naturel et la production de réponses de type humain. De nombreux LLM récents sont affinés avec une technique puissante appelée réglage des instructions, qui aide le modèle à effectuer de nouvelles tâches ou à générer des réponses à de nouvelles invites sans ajustement spécifique à l'invite. Un modèle réglé sur les instructions utilise sa compréhension des tâches ou des concepts associés pour générer des prédictions à de nouvelles invites. Étant donné que cette technique n'implique pas la mise à jour des poids du modèle, elle évite le processus long et coûteux en calculs requis pour affiner un modèle pour une nouvelle tâche inédite.

Le réglage des instructions consiste à affiner un modèle de langage sur une collection de tâches NLP à l'aide d'instructions. Dans cette technique, le modèle est formé pour effectuer des tâches en suivant des instructions textuelles au lieu d'ensembles de données spécifiques pour chaque tâche. Le modèle est affiné avec un ensemble d'exemples d'entrée et de sortie pour chaque tâche, permettant au modèle de se généraliser à de nouvelles tâches sur lesquelles il n'a pas été explicitement formé tant que des invites sont fournies pour les tâches. Le réglage des instructions permet d'améliorer la précision et l'efficacité des modèles et est utile dans les situations où de grands ensembles de données ne sont pas disponibles pour des tâches spécifiques.

Ingénierie rapide pour les tâches NLP à prise zéro et à quelques prises sur les modèles BLOOM

Ingénierie rapide traite de la création d'invites de haute qualité pour guider le modèle vers les réponses souhaitées. Les invites doivent être conçues en fonction de la tâche et de l'ensemble de données spécifiques utilisés. L'objectif ici est de fournir au modèle les informations nécessaires pour générer des réponses de haute qualité tout en minimisant le bruit. Cela peut impliquer des mots-clés, des contextes supplémentaires, des questions, etc.

Une invite bien conçue peut rendre le modèle plus créatif et généralisé afin qu'il puisse facilement s'adapter à de nouvelles tâches. Les invites peuvent également aider à intégrer les connaissances du domaine sur des tâches spécifiques et à améliorer l'interprétabilité. Une ingénierie rapide peut considérablement améliorer les performances des modèles d'apprentissage zéro coup et peu de coups. La création d'invites de haute qualité nécessite un examen attentif de la tâche à accomplir, ainsi qu'une compréhension approfondie des forces et des limites du modèle.

Dans le tableau suivant, le modèle BloomZ 176B est utilisé pour générer des réponses pour diverses tâches NLP à tir nul et à tir réduit. La première colonne affiche la tâche, la deuxième colonne contient l'invite fournie au modèle (où le texte du modèle est en gras et le texte non gras est l'exemple d'entrée) et la troisième colonne est la réponse du modèle lorsqu'il est interrogé contre l'invite

Pour toutes les tâches suivantes, nous définissons les hyperparamètres sur 600 pour être le max_length, num_return_sequences, top_k être 250, top_p être de 0.95, et aucun échantillonnage.

Tâche	Entrée rapide	Sortie
Tâches d'apprentissage zéro coup
Texte multilingue ou classification des sentiments (du chinois vers l'anglais)	一个传奇的开端，一个不灭的神话，这不仅仅是一部电影，而是作为一个走进新时代的标签，永远彪炳史册。Évaluez-vous l'avis précédent comme positif, neutre ou négatif ?	positif
Réponse aux questions multilingue (anglais vers chinois)	Explique-moi en chinois traditionnel quelle est la rétropropagation	梯度反向传播算法是一种机器学习算法，用于训练人工神经网络。该算法使用梯度下降来最小化损失函数。
Génération de code	Rediger un arbre de recherche binaire avec O(log(n)) complexité de calcul. {code_start}	def recherche_binaire(a, x): bas = 0 élevé = len(a) – 1 tandis que bas <= haut : moyen = (bas + haut) // 2 si a[moyen] < x : bas = moyen + 1 elif a[moyen] > x : élevé = moyen - 1 autre: retour milieu retour -1′ ... autre: retour milieu retour bas' La sortie est tronquée
Reformulation du paragraphe	Amazon Web Services (AWS) a annoncé neuf nouvelles mises à jour majeures pour sa plateforme d'apprentissage automatique basée sur le cloud, SageMaker. SageMaker vise à fournir un service d'apprentissage automatique qui peut être utilisé pour créer, former et déployer des modèles ML pour pratiquement tous les cas d'utilisation. Au cours de la conférence re:Invent de cette année, AWS a fait plusieurs annonces pour améliorer encore les capacités de SageMaker.nnComment reformuleriez-vous cela brièvement en anglais ?, Amazon Web Services (AWS) a annoncé neuf nouvelles mises à jour majeures pour sa plateforme d'apprentissage automatique basée sur le cloud, SageMaker. SageMaker vise à fournir un service d'apprentissage automatique qui peut être utilisé pour créer, former et déployer des modèles ML pour pratiquement tous les cas d'utilisation. Au cours de la conférence re:Invent de cette année, AWS a fait plusieurs annonces pour améliorer encore les capacités de SageMaker. nLa phrase ci-dessus est très compliquée. Veuillez me fournir une version synonyme simplifiée composée de plusieurs phrases :	Amazon SageMaker reçoit une mise à jour majeure Amazon Web Services (AWS) a annoncé neuf nouvelles mises à jour majeures pour sa plateforme d'apprentissage automatique basée sur le cloud, SageMaker. SageMaker vise à fournir un service d'apprentissage automatique qui peut être utilisé pour créer, former et déployer des modèles ML pour pratiquement tous les cas d'utilisation.
Récapitulation	Amazon Comprehend utilise le traitement du langage naturel (NLP) pour extraire des informations sur le contenu des documents. Il développe des informations en reconnaissant les entités, les phrases clés, le langage, les sentiments et d'autres éléments communs dans un document. Utilisez Amazon Comprehend pour créer de nouveaux produits basés sur la compréhension de la structure des documents. Par exemple, en utilisant Amazon Comprehend, vous pouvez rechercher des mentions de produits dans les flux de réseaux sociaux ou numériser un référentiel de documents complet à la recherche de phrases clés. Vous pouvez accéder aux fonctionnalités d'analyse de documents d'Amazon Comprehend à l'aide de la console Amazon Comprehend ou des API Amazon Comprehend. Vous pouvez exécuter une analyse en temps réel pour de petites charges de travail ou lancer des tâches d'analyse asynchrones pour de grands ensembles de documents. Vous pouvez utiliser les modèles préformés fournis par Amazon Comprehend, ou vous pouvez former vos propres modèles personnalisés pour la classification et la reconnaissance des entités. Toutes les fonctionnalités d'Amazon Comprehend acceptent les documents texte UTF-8 comme entrée. De plus, la classification personnalisée et la reconnaissance d'entités personnalisées acceptent les fichiers image, les fichiers PDF et les fichiers Word en entrée. Amazon Comprehend peut examiner et analyser des documents dans diverses langues, en fonction de la fonctionnalité spécifique. Pour plus d'informations, consultez Langues prises en charge dans Amazon Comprehend. La capacité de langue dominante d'Amazon Comprehend peut examiner les documents et déterminer la langue dominante pour une sélection beaucoup plus large de langues.nn===nRédigez un résumé du texte précédent en anglais :	Amazon Comprehend utilise le traitement du langage naturel (NLP) pour extraire des informations sur le contenu des documents. Il développe des informations en reconnaissant les entités, les phrases clés, le langage, les sentiments et d'autres éléments communs dans un document. Utilisez Amazon Comprehend pour créer de nouveaux produits basés sur la compréhension de la structure des documents. Par exemple, en utilisant Amazon Comprehend, vous pouvez rechercher des mentions de produits dans les flux de réseaux sociaux ou numériser un référentiel de documents complet à la recherche de phrases clés. Vous pouvez accéder aux fonctionnalités d'analyse de documents d'Amazon Comprehend à l'aide de la console Amazon Comprehend ou des API Amazon Comprehend. Vous pouvez exécuter une analyse en temps réel pour de petites charges de travail ou lancer des tâches d'analyse asynchrones pour de grands ensembles de documents. Vous pouvez utiliser les modèles préformés fournis par Amazon Comprehend, ou vous pouvez former vos propres modèles personnalisés pour la classification et la reconnaissance des entités. Toutes les fonctionnalités d'Amazon Comprehend acceptent les documents texte UTF-8 comme entrée. De plus, la classification personnalisée et la reconnaissance d'entités personnalisées acceptent les fichiers image, les fichiers PDF et les fichiers Word en entrée. Amazon Comprehend peut examiner et analyser des documents dans diverses langues, en fonction de la fonctionnalité spécifique. Pour plus d'informations, consultez Langues prises en charge dans Amazon Comprehend. La capacité de langue dominante d'Amazon Comprehend peut examiner les documents et déterminer la langue dominante pour une sélection de langues beaucoup plus large.
Raisonnement de bon sens et inférence en langage naturel	Étant donné que La coupe du monde a débuté à Los Angeles, aux États-Unis. S'ensuit-il que La coupe du monde se déroule aux États-Unis. Oui ou non?, La coupe du monde a débuté à Los Angeles, aux États-Unis. En utilisant uniquement la description ci-dessus et ce que vous savez sur le monde, est « La coupe du monde se déroule aux États-Unis » certainement correct? Oui ou non?,	Oui
Question répondant	question: quelles sont les principales fonctionnalités du nouveau Kindle ?nnContexte : Le Kindle le plus récent et le plus innovant à ce jour vous permet de prendre des notes sur des millions de livres et de documents, d'écrire des listes et des journaux, et plus encore. Pour les lecteurs qui ont toujours souhaité pouvoir écrire dans leurs livres électroniques, le nouveau Kindle d'Amazon leur permet de faire exactement cela. Le Kindle Scribe est le premier Kindle pour la lecture et l'écriture et permet aux utilisateurs de compléter leurs livres et documents avec des notes, des listes, etc. Voici tout ce que vous devez savoir sur le Kindle Scribe, y compris les questions fréquemment posées. Le Kindle Scribe facilite la lecture et l'écriture comme vous le feriez sur papier Le Kindle Scribe est doté d'un écran antireflet de 10.2 pouces (le plus grand de tous les appareils Kindle), d'une résolution nette de 300 ppp et de 35 feux avant à DEL qui s'adaptent automatiquement à votre environnement. Personnalisez davantage votre expérience avec la lumière chaude réglable, les tailles de police, l'espacement des lignes, etc. Il est livré avec votre choix de stylet de base ou de stylet premium, que vous utilisez pour écrire sur l'écran comme vous le feriez sur du papier. Ils se fixent également magnétiquement à votre Kindle et n'ont jamais besoin d'être rechargés. Le stylet Premium comprend une gomme dédiée et un bouton de raccourci personnalisable. Le Kindle Scribe possède le plus d'options de stockage de tous les appareils Kindle : choisissez parmi 8 Go, 16 Go ou 32 Go en fonction de votre niveau de lecture et d'écriture. nnRépondre	prenez des notes sur des millions de livres et de documents, écrivez des listes et des journaux, et plus encore
Classification des phrases et des sentiments	Révision :nCe film est tellement génial et encore une fois nous éblouit et nous ravitnCette phrase de critique de film est-elle négative ou positive ?nOPTIONS:n-positif n-négatif	Positif
Génération d'articles imaginaires basée sur le titre	Titre: "L'université a de nouvelles installations à venir”nÉtant donné le titre ci-dessus d'un article imaginaire, imaginez l'article.n”””	Le projet de 1.2 million de livres sterling verra la création d'un nouveau centre d'enseignement et d'apprentissage à l'Université des Highlands et des îles (UHI) à Inverness. Il sera construit sur le site de l'ancien Inverness College of Commerce. L'UHI a déclaré que la nouvelle installation serait utilisée pour l'enseignement et l'apprentissage, ainsi que pour le soutien et l'administration des étudiants. L'université a déclaré qu'il serait également utilisé pour des conférences et des événements. Le nouveau bâtiment sera construit sur le site de l'ancien Inverness College of Commerce L'université a déclaré que le nouveau bâtiment serait construit sur le site de l'ancien Inverness College of Commerce, qui a fermé ses portes en 2013. Il a déclaré que la nouvelle installation serait utilisée pour l'enseignement et l'apprentissage, ainsi que pour le soutien et l'administration des étudiants. Il serait également utilisé pour des conférences et des événements. UHI a déclaré que la nouvelle installation serait construite sur le site de l'ancien Inverness College of Commerce L'université a déclaré que le nouveau bâtiment serait construit sur le site de l'ancien Inverness College of Commerce, qui a fermé ses portes en 2013. Il a déclaré que la nouvelle installation serait utilisée pour l'enseignement et l'apprentissage, ainsi que pour le soutien et l'administration des étudiants. ... Il serait également utilisé pour des conférences et des événements. UHI a déclaré que la nouvelle installation serait construite sur le site de l'ancien Inverness…
Résumer un titre basé sur l'article	'Le Kindle le plus récent et le plus innovant à ce jour vous permet de prendre des notes sur des millions de livres et de documents, d'écrire des listes et des journaux, et plus encore. Pour les lecteurs qui ont toujours souhaité pouvoir écrire dans leurs livres électroniques, le nouveau Kindle d'Amazon leur permet de faire exactement cela. Le Kindle Scribe est le premier Kindle pour la lecture et l'écriture et permet aux utilisateurs de compléter leurs livres et documents avec des notes, des listes, etc. Voici tout ce que vous devez savoir sur le Kindle Scribe, y compris les questions fréquemment posées. Le Kindle Scribe facilite la lecture et l'écriture comme vous le feriez sur papier Le Kindle Scribe est doté d'un écran antireflet de 10.2 pouces (le plus grand de tous les appareils Kindle), d'une résolution nette de 300 ppp et de 35 feux avant à DEL qui s'adaptent automatiquement à votre environnement. Personnalisez davantage votre expérience avec la lumière chaude réglable, les tailles de police, l'espacement des lignes, etc. Il est livré avec votre choix de stylet de base ou de stylet premium, que vous utilisez pour écrire sur l'écran comme vous le feriez sur du papier. Ils se fixent également magnétiquement à votre Kindle et n'ont jamais besoin d'être rechargés. Le stylet Premium comprend une gomme dédiée et un bouton de raccourci personnalisable. Le Kindle Scribe possède le plus d'options de stockage de tous les appareils Kindle : choisissez parmi 8 Go, 16 Go ou 32 Go en fonction de votre niveau de lecture et d'écriture. nn nnDonnez-moi un bon titre pour l'article ci-dessus.	Kindle Scribe d'Amazon : tout ce que vous devez savoir
Tâches d'apprentissage peu nombreuses
Récapitulation	[Original] : Les scientifiques d'Amazon, en collaboration avec des chercheurs de l'Université de Sheffield, mettent à la disposition du public pour la première fois un ensemble de données d'extraction et de vérification de faits à grande échelle. L'ensemble de données, comprenant plus de 185,000 XNUMX affirmations étayées par des preuves, est mis à disposition pour catalyser, espérons-le, la recherche et le développement qui résolvent les problèmes d'extraction et de vérification des faits dans les applications logicielles ou les services basés sur le cloud qui effectuent l'extraction automatique d'informations. [Résumé] : Les chercheurs d'Amazon et de l'Université rendent l'ensemble de données d'extraction et de vérification des faits accessible au public. ### [Original] : Les membres Prime aux États-Unis peuvent se faire livrer encore plus à leur porte avec un abonnement Prime. Les membres peuvent désormais profiter gratuitement d'un an de Grubhub + d'une valeur de 9.99 $ par mois, sans frais supplémentaires pour leur abonnement Prime. Pour activer cette offre, visitez amazon.com/grubhub. Cette nouvelle offre comprend des frais de livraison de nourriture illimités à 0 $ sur les commandes de plus de 12 $ ainsi que des avantages exclusifs pour les membres Grubhub + et des récompenses comme de la nourriture gratuite et des réductions sur les commandes. De plus, les convives peuvent « bien manger tout en faisant le bien » en optant pour le programme Donate the Change de Grubhub, une initiative de dons jumelés qui a permis de recueillir plus de 25 millions de dollars rien qu'en 2021, au profit de plus de 20 organisations caritatives à travers le pays. [Résumé] : Les membres Prime aux États-Unis peuvent profiter gratuitement d'un an de Grubhub+, sans frais de livraison de nourriture sur les commandes éligibles. ### [Original] : Les scientifiques d'Amazon, en collaboration avec des chercheurs de l'Université de Sheffield, mettent à la disposition du public pour la première fois un ensemble de données d'extraction et de vérification de faits à grande échelle. L'ensemble de données, comprenant plus de 185,000 XNUMX affirmations étayées par des preuves, est mis à disposition pour catalyser, espérons-le, la recherche et le développement qui résolvent les problèmes d'extraction et de vérification des faits dans les applications logicielles ou les services basés sur le cloud qui effectuent l'extraction automatique d'informations. [Résumé]:	[Résumé]: Les chercheurs d'Amazon et de l'université rendent l'ensemble de données d'extraction et de vérification des faits accessible au public.
Génération de code	description: un bouton orange qui dit stop code : Arrêter ### description : une boîte bleue qui contient des cercles jaunes avec des bordures rouges code: ### description : un titre indiquant "Bienvenue dans l'IA" code:	code: Bienvenue dans l'IA '
Reconnaissance de l'entité de nom	[Texte] : Fred est un entrepreneur en série. Cofondateur et PDG de Platform.sh, il a précédemment cofondé Commerce Guys, l'un des principaux fournisseurs de commerce électronique Drupal. Sa mission est de garantir que, alors que nous poursuivons un voyage ambitieux pour transformer en profondeur la façon dont le cloud computing est utilisé et perçu, nous gardons les pieds sur terre en poursuivant la croissance rapide dont nous avons bénéficié jusqu'à présent. [Nom] : Fred [Poste] : Co-fondateur et PDG [Entreprise] : Platform.sh ### [Texte] : Microsoft (le mot étant un portemanteau de "logiciel de micro-ordinateur") a été fondé par Bill Gates le 4 avril 1975, pour développer et vendre des interpréteurs BASIC pour l'Altair 8800. Steve Ballmer a remplacé Gates en tant que PDG en 2000, et plus tard envisageait une stratégie « dispositifs et services ». [Nom] : Steve Ballmer [Poste] : PDG [Entreprise] : Microsoft ### [Texte] : Franck Riboud est né le 7 novembre 1955 à Lyon. Il est le fils d'Antoine Riboud, l'ancien PDG, qui a transformé l'ancien verrier européen BSN Group en un acteur majeur de l'agroalimentaire. Il est PDG de Danone. [Nom] : Franck Riboud [Poste] : PDG [Entreprise] : Danone ### [Texte] : David Melvin est un professionnel de l'investissement et des services financiers chez CITIC CLSA avec plus de 30 ans d'expérience dans la banque d'investissement et le capital-investissement. Il est actuellement conseiller principal de CITIC CLSA.	[Nom] : Fred [Poste] : Co-fondateur et PDG [Entreprise] : Platform.sh
Question répondant	Contexte : NLP Cloud a été fondé en 2021 lorsque l'équipe s'est rendu compte qu'il n'y avait pas de moyen simple d'exploiter de manière fiable le traitement du langage naturel en production. Question : Quand NLP Cloud a-t-il été créé ? Réponse: 2021 ### Contexte : NLP Cloud a développé son API à la mi-2020 et a ajouté de nombreux modèles open source pré-formés depuis lors. Question : Qu'est-ce que NLP Cloud a développé ? Réponse : API ### Contexte : Tous les plans peuvent être arrêtés à tout moment. Vous ne payez que le temps d'utilisation du service. En cas de déclassement, vous bénéficierez d'une remise sur votre prochaine facture. Question : Quand peut-on arrêter les plans ? Réponse : À tout moment ### Contexte : Le principal défi avec GPT-J est la consommation de mémoire. L'utilisation d'un plan GPU est recommandée. Question : Quel forfait est recommandé pour GPT-J ? Répondre:"""	Réponse : plan GPU'
Grammaire et correction orthographique	J'aime goin à la plage. Correction : J'adore aller à la plage. ### Laissez-moi l'avoir ! Correction : laissez-moi l'avoir ! ### Il a trop d'inconvénients. Correction : Il a trop d'inconvénients. ### je ne veux pas y aller Correction:	Correction : je ne veux pas y aller
Description du produit et généralisation	Générez une description de produit à partir de mots-clés. Mots-clés : chaussures, femmes, 59 $ Phrase : De belles chaussures pour femmes au prix de 59 $. ### Mots-clés : pantalons, hommes, 69 $ Phrase : Pantalon moderne pour homme, pour 69 $ seulement. ### Mots-clés : gants, hiver, 19 $ Phrase : Gants incroyablement chauds pour les hivers froids, à 19 $. ### Mots-clés : t-shirt, hommes, 39 $ Phrase:	Phrase : T-shirt cool pour homme, pour 39 $ seulement.
Classification des phrases et des sentiments	Message : Lorsque le vaisseau spatial a atterri sur Mars, toute l'humanité était excitée Sujet : l'espace ### Message : J'adore jouer au tennis et au golf. Je m'entraîne deux fois par semaine. Thème : sport ### Message : Gérer une équipe de vendeurs est un travail difficile mais gratifiant. Sujet : affaires ### Message : J'essaie de faire cuire du poulet avec des tomates. Topic:	Sujet : la nourriture
Chatbot et IA conversationnelle	Il s'agit d'une discussion entre un [humain] et un [robot]. Le [robot] est très gentil et empathique. [humain] : Bonjour, ravi de vous rencontrer. [robot] : Ravi de vous rencontrer également. ### [humain] : Comment ça se passe aujourd'hui ? [robot] : Pas si mal, merci ! Et toi? ### [humain] : Je vais bien, mais je suis un peu triste… [robot] : Ah ? Pourquoi ça? ### [humain] : J'ai attrapé la grippe [robot]:	[robot] : Oh non, je suis désolé d'entendre ça !
Génération de tweets	mot clé : marchés tweet : Recueillez les commentaires de la nature et des marchés, pas des gens ### mot-clé : enfants tweet : Peut-être que nous mourrons pour pouvoir revenir enfants. ### mot-clé : startups tweet : Les startups ne devraient pas se soucier de la façon d'éteindre les incendies, elles devraient se soucier de la façon de les démarrer. ### mot-clé: pnl tweet:	tweet : la PNL est un outil, pas un objectif.
Traduction automatique	Hugging Face a révolutionné le PNL. Traduction : Hugging Face a révolutionné la PNL. ### Cela est incroyable ! Traduction : C'est incroyable ! ### Désolé, je ne peux pas. Traduction : Désolé mais je ne peux pas. ### NLP Cloud permet de déployer le NLP en production facilement. Traduction:	Traduction : NLP Cloud facilite le déploiement du NLP en production.
Classement des intentions	Je veux commencer à coder demain parce que ça a l'air tellement amusant ! Intention : commencer à coder ### Montrez-moi les dernières photos que vous avez s'il vous plaît. Intention : montrer des images ### Recherchez tous ces fichiers aussi vite que possible. Intention : rechercher des fichiers ### Pouvez-vous s'il vous plaît m'apprendre le chinois la semaine prochaine ? Intention:	Intention : apprends-moi le chinois

Accédez au modèle d'instructions BloomZ 176B dans SageMaker

SageMaker JumpStart offre deux façons de commencer à utiliser ces modèles Bloom réglés sur les instructions : Amazon SageMakerStudio et le SDK SageMaker. Les sections suivantes illustrent à quoi ressemblent chacune de ces options et comment y accéder.

Accédez au modèle avec le SDK SageMaker JumpStart simplifié

La SDK SageMaker JumpStart simplifié facilite la formation et le déploiement de modèles SageMaker JumpStart intégrés avec quelques lignes de code. Cela vous donne accès à toute la bibliothèque de modèles SageMaker JumpStart, y compris les derniers modèles de fondation et modèles de génération d'images, sans avoir à fournir d'entrées autres que l'ID du modèle.

Vous pouvez tirer parti des valeurs par défaut spécifiques au modèle que nous fournissons pour spécifier la configuration, telles que l'image Docker, le type d'instance ML, l'emplacement de l'artefact du modèle et les hyperparamètres, entre autres champs. Ces attributs ne sont que des valeurs par défaut ; vous pouvez les remplacer et conserver un contrôle granulaire sur les modèles AWS que vous créez. À la suite de ces changements, l'effort d'écriture de workflows Python pour déployer et former les modèles SageMaker JumpStart a été réduit, ce qui vous permet de passer plus de temps sur les tâches importantes. Cette fonction est disponible dans toutes les régions où JumpStart est pris en charge et est accessible avec le Kit de développement logiciel (SDK) SageMaker Python version 2.154.0 ou ultérieure.

Vous pouvez déployer par programmation un point de terminaison via le SDK SageMaker. Vous devrez spécifier l'ID de modèle de votre modèle souhaité dans le hub de modèles SageMaker et le type d'instance utilisé pour le déploiement. L'URI du modèle, qui contient le script d'inférence, et l'URI du conteneur Docker sont obtenus via le SDK SageMaker. Ces URI sont fournis par SageMaker JumpStart et peuvent être utilisés pour initialiser un objet de modèle SageMaker pour le déploiement.

Déployer le modèle et interroger le point de terminaison

Ce bloc-notes nécessite ipywidgets. Installez ipywidgets, puis utilisez le rôle d'exécution associé au bloc-notes actuel en tant que rôle de compte AWS avec accès SageMaker.

Choisissez le modèle pré-formé

Nous choisissons le bloomz-176b-fp16 modèle pré-entraîné :

model_id = "huggingface-textgeneration1-bloomz-176b-fp16"

Le bloc-notes des sections suivantes utilise BloomZ 176B par exemple. Pour une liste complète des modèles préformés SageMaker, reportez-vous à Algorithmes intégrés avec table modèle pré-formée.

Récupérer des artefacts et déployer un point de terminaison

Avec SageMaker, nous pouvons effectuer une inférence sur le modèle pré-formé sans l'ajuster d'abord sur un nouvel ensemble de données. On commence par récupérer le deploy_image_uri, deploy_source_uriet une model_uri pour le modèle pré-entraîné. Pour héberger le modèle pré-entraîné, nous créons une instance de sagemaker.model.modèle et déployez-le. Cela peut prendre quelques minutes.

Nous pouvons maintenant déployer le modèle à l'aide du SDK SageMaker JumpStart simplifié avec les lignes de code suivantes :

from sagemaker.jumpstart.model import JumpStartModel #if no instance for this model id is available, use a smaller id
model = JumpStartModel(model_id=model_id) # ml.p4de.24xlarge is used by default. You can add the kwarg
# instance_type to change this setting.
predictor = model.deploy() endpoint_name = predictor.endpoint_name

Nous utilisons Conteneurs d'inférence de grand modèle (LMI) SageMaker pour héberger le modèle BloomZ 176B. LMI est une pile logicielle LLM (conteneur) conçue par AWS qui offre des fonctions faciles à utiliser et un gain de performances sur les modèles d'IA générative. Il est intégré au parallélisme de modèles, à la compilation, à la quantification et à d'autres piles pour accélérer l'inférence. Pour plus de détails, reportez-vous à Déployez BLOOM-176B et OPT-30B sur Amazon SageMaker avec de grands modèles d'inférence Deep Learning Containers et DeepSpeed.

Notez que le déploiement de ce modèle nécessite une instance p4de.24xlarge et que le déploiement prend généralement environ 1 heure. Si vous n'avez pas de quota pour cette instance, demandez une augmentation de quota sur la console AWS Service Quotas.

Interrogez le point de terminaison et analysez la réponse à l'aide de divers paramètres pour contrôler le texte généré

L'entrée du point de terminaison est n'importe quelle chaîne de texte formatée en JSON et encodée au format utf-8. La sortie du point de terminaison est un fichier JSON avec du texte généré.

Dans l'exemple suivant, nous fournissons un exemple de texte d'entrée. Vous pouvez saisir n'importe quel texte et le modèle prédit les mots suivants dans la séquence. Des séquences de texte plus longues peuvent être générées en appelant le modèle à plusieurs reprises. Le code suivant montre comment appeler un point de terminaison avec ces arguments :

from sagemaker.predictor import retrieve_default predictor = retrieve_default(model_id=model_id, model_version="*", endpoint_name=endpoint=name)
response = predictor.predict("How to make a pasta?")
print(response["generated_text"])

Nous obtenons la sortie suivante :

['How to make a pasta? boil a pot of water and add salt. Add the pasta to the water and cook until al dente. Drain the pasta.']

Accéder au modèle dans SageMaker Studio

Vous pouvez également accéder à ces modèles via le Page de destination JumpStart en Atelier. Cette page répertorie les solutions ML de bout en bout disponibles, les modèles pré-formés et les exemples de blocs-notes.

Au moment de la publication de l'article, BloomZ 176B n'est disponible que dans le us-east-2 Région.

Accéder au modèle dans SageMaker Studio

Vous pouvez choisir la carte modèle BloomZ 176B pour afficher le carnet.

choisissez la carte modèle BloomZ 176B

Vous pouvez ensuite importer le bloc-notes pour continuer à exécuter le bloc-notes.

importer le bloc-notes

Nettoyer

Pour éviter des frais permanents, supprimez les points de terminaison d'inférence SageMaker. Vous pouvez supprimer les terminaux via la console SageMaker ou depuis le notebook SageMaker Studio à l'aide des commandes suivantes :

predictor.delete_model()
predictor.delete_endpoint()

Conclusion

Dans cet article, nous avons donné un aperçu des avantages de l'apprentissage zéro coup et peu de coups et décrit comment une ingénierie rapide peut améliorer les performances des modèles réglés sur les instructions. Nous avons également montré comment déployer facilement un modèle BloomZ 176B réglé sur les instructions de SageMaker JumpStart et fourni des exemples pour montrer comment vous pouvez effectuer différentes tâches NLP à l'aide du point de terminaison du modèle BloomZ 176B déployé dans SageMaker.

Nous vous encourageons à déployer un modèle BloomZ 176B à partir de SageMaker JumpStart et à créer vos propres invites pour les cas d'utilisation NLP.

Pour en savoir plus sur SageMaker JumpStart, consultez les éléments suivants :

À propos des auteurs

Rajakumar Sampathkumar est responsable de compte technique principal chez AWS, fournissant des conseils aux clients sur l'alignement des technologies commerciales et soutenant la réinvention de leurs modèles et processus d'exploitation du cloud. Il est passionné par le cloud et l'apprentissage automatique. Raj est également un spécialiste de l'apprentissage automatique et travaille avec les clients AWS pour concevoir, déployer et gérer leurs charges de travail et architectures AWS.

Dr Xin Huang est un scientifique appliqué pour Amazon SageMaker JumpStart et les algorithmes intégrés d'Amazon SageMaker. Il se concentre sur le développement d'algorithmes d'apprentissage automatique évolutifs. Ses intérêts de recherche portent sur le traitement du langage naturel, l'apprentissage en profondeur explicable sur des données tabulaires et l'analyse robuste du clustering spatio-temporel non paramétrique. Il a publié de nombreux articles dans les conférences ACL, ICDM, KDD et Royal Statistical Society: Series A journal.

Evan Kravitz est ingénieur logiciel chez Amazon Web Services, travaillant sur SageMaker JumpStart. Il aime cuisiner et courir à New York.

Contenu propulsé par le référencement et distribution de relations publiques. Soyez amplifié aujourd'hui.
PlatoData.Network Ai générative verticale. Autonomisez-vous. Accéder ici.
PlatoAiStream. Intelligence Web3. Connaissance Amplifiée. Accéder ici.
PlatonESG. Automobile / VE, Carbone, Technologie propre, Énergie, Environnement, Solaire, La gestion des déchets. Accéder ici.
PlatoHealth. Veille biotechnologique et essais cliniques. Accéder ici.
GraphiquePrime. Élevez votre jeu de trading avec ChartPrime. Accéder ici.
Décalages de bloc. Modernisation de la propriété des compensations environnementales. Accéder ici.
La source: https://aws.amazon.com/blogs/machine-learning/zero-shot-and-few-shot-prompting-for-the-bloomz-176b-foundation-model-with-the-simplified-amazon-sagemaker-jumpstart-sdk/

Horodatage: 14 août 2023

Horodatage: Le 12 septembre 2023

Republié par Platon

Améliorez Amazon Connect et Lex avec des capacités d'IA générative | Services Web Amazon

La société de courtage immobilier John L. Scott utilise Amazon Textract pour supprimer le langage racial restrictif des actes de propriété des propriétaires

À propos de nous

Recherche verticale et Ai

Plateforme

Restez à l'affût

Compte