Solicitudes de disparo cero y de pocos disparos para el modelo de base BloomZ 176B con el SDK JumpStart simplificado de Amazon SageMaker

Reeditado por Platón

seguidores: 0

JumpStart de Amazon SageMaker es un centro de aprendizaje automático (ML) que ofrece algoritmos, modelos y soluciones de ML. Con SageMaker JumpStart, los profesionales de ML pueden elegir entre una lista cada vez mayor de los mejores y disponibles públicamente. modelos de cimientos (FM) como BLOOM, llamas 2, Halcón-40B, Difusión estable, OpenLLaMA, Flan-T5/UL2o FM de Adherirse y Luces encendidas.

En esta publicación y el cuaderno adjunto, demostramos cómo implementar el modelo de base BloomZ 176B usando el SDK simplificado de Python de SageMaker in JumpStart de Amazon SageMaker como punto final y utilícelo para varias tareas de procesamiento de lenguaje natural (NLP). También puede acceder a los modelos de base a través de Estudio Amazon SageMaker. El modelo BloomZ 176B, uno de los modelos más grandes disponibles públicamente, es un modelo de instrucción sintonizado de última generación que puede realizar varias tareas de PNL de aprendizaje de pocos intentos y cero intentos en contexto. El ajuste de instrucciones es una técnica que implica el ajuste fino de un modelo de lenguaje en una colección de tareas de PNL usando instrucciones. Para obtener más información sobre el ajuste de instrucciones, consulte Solicitud de disparo cero para el modelo de base Flan-T5 en Amazon SageMaker JumpStart.

El aprendizaje de disparo cero en NLP permite que un LLM preentrenado genere respuestas a tareas para las que no ha sido entrenado específicamente. En esta técnica, el modelo recibe un texto de entrada y un indicador que describe el resultado esperado del modelo en lenguaje natural. El aprendizaje de disparo cero se utiliza en una variedad de tareas de PNL, como las siguientes:

Clasificación multilingüe de texto y sentimiento
Preguntas y respuestas multilingües
Codigo de GENERACION
Reformulación de párrafo
Resumen
Razonamiento de sentido común e inferencia del lenguaje natural
Respuesta a la pregunta
Clasificación de oraciones y sentimientos
Generación de artículos imaginarios a partir de un título
Resumir un título basado en un artículo

El aprendizaje de pocos disparos implica entrenar a un modelo para realizar nuevas tareas proporcionando solo algunos ejemplos. Esto es útil cuando se dispone de datos etiquetados limitados para el entrenamiento. El aprendizaje de pocos espectáculos se utiliza en una variedad de tareas, incluidas las siguientes:

Resumen de texto
Codigo de GENERACION
Reconocimiento de entidad de nombre
Respuesta a la pregunta
Corrección gramatical y ortográfica
Descripción del producto y generalización.
Clasificación de oraciones y sentimientos
Chatbot e IA conversacional
Generación de tuits
Traducción a máquina
Clasificación de intenciones

Acerca de Bloom

El modelo de lenguaje BigScience Large Open-science Open-access Multilingual (BLOOM) es un modelo de lenguaje grande (LLM) basado en transformadores. BLOOM es un LLM autorregresivo capacitado para continuar el texto desde un indicador en grandes cantidades de datos de texto utilizando recursos computacionales a escala industrial. Como tal, es capaz de generar un texto coherente que apenas se distingue del texto escrito por humanos. También se puede indicar a BLOOM que realice tareas de texto para las que no ha sido entrenado explícitamente al convertirlas en tareas de generación de texto.

Con sus 176 mil millones de parámetros, BLOOM puede generar texto en 46 lenguajes naturales y 13 lenguajes de programación. Para casi todos ellos, como el español, el francés y el árabe, BLOOM es el primer modelo de idioma con más de 100 XNUMX millones de parámetros jamás creado. Los investigadores pueden descarga, ejecuta y estudia BLOOM para investigar el rendimiento y el comportamiento de los LLM desarrollados recientemente hasta sus operaciones internas más profundas.

Resumen de la solución

En esta publicación, mostramos cómo usar el modelo BloomZ 176B de última generación ajustado por instrucciones de Abrazando la cara para la generación de texto. Puede usar el modelo BloomZ 176B con aprendizaje de pocos disparos y aprendizaje de cero disparos para muchas tareas de NLP, sin ajustar el modelo. No es necesario entrenar un nuevo modelo porque modelos como BloomZ 176B tienen una cantidad significativa de parámetros que pueden adaptarse fácilmente a muchos contextos sin tener que volver a entrenar. El modelo BloomZ 176B ha sido entrenado con una gran cantidad de datos, lo que lo hace aplicable para muchas tareas de propósito general.

El código para todos los pasos de esta demostración está disponible en el siguiente cuaderno.

Ajuste de instrucciones

El tamaño y la complejidad de los LLM se han disparado en los últimos años. Los LLM han demostrado capacidades notables para aprender la semántica del lenguaje natural y producir respuestas similares a las humanas. Muchos LLM recientes se perfeccionan con una poderosa técnica llamada sintonización de instrucciones, que ayuda al modelo a realizar nuevas tareas o generar respuestas a nuevas indicaciones sin un ajuste fino específico de la indicación. Un modelo ajustado a la instrucción utiliza su comprensión de tareas o conceptos relacionados para generar predicciones para indicaciones novedosas. Debido a que esta técnica no implica la actualización de los pesos del modelo, evita el proceso laborioso y computacionalmente costoso necesario para ajustar un modelo para una tarea nueva que no se había visto anteriormente.

El ajuste de instrucciones implica el ajuste fino de un modelo de lenguaje en una colección de tareas de PNL usando instrucciones. En esta técnica, el modelo se entrena para realizar tareas siguiendo instrucciones textuales en lugar de conjuntos de datos específicos para cada tarea. El modelo se ajusta con un conjunto de ejemplos de entrada y salida para cada tarea, lo que permite generalizar el modelo a nuevas tareas en las que no se ha capacitado explícitamente, siempre que se proporcionen indicaciones para las tareas. El ajuste de instrucciones ayuda a mejorar la precisión y la eficacia de los modelos y es útil en situaciones en las que no hay grandes conjuntos de datos disponibles para tareas específicas.

Ingeniería rápida para tareas de NLP de cero disparos y pocos disparos en modelos BLOOM

Ingeniería rápida se ocupa de crear indicaciones de alta calidad para guiar al modelo hacia las respuestas deseadas. Los avisos deben diseñarse en función de la tarea específica y el conjunto de datos que se utiliza. El objetivo aquí es proporcionar al modelo la información necesaria para generar respuestas de alta calidad y minimizar el ruido. Esto podría incluir palabras clave, contextos adicionales, preguntas y más.

Un indicador bien diseñado puede hacer que el modelo sea más creativo y generalizado para que pueda adaptarse fácilmente a nuevas tareas. Las indicaciones también pueden ayudar a incorporar el conocimiento del dominio en tareas específicas y mejorar la interpretabilidad. La ingeniería rápida puede mejorar en gran medida el rendimiento de los modelos de aprendizaje de cero disparos y pocos disparos. La creación de indicaciones de alta calidad requiere una consideración cuidadosa de la tarea en cuestión, así como una comprensión profunda de las fortalezas y limitaciones del modelo.

En la siguiente tabla, el modelo BloomZ 176B se usa para generar respuestas para varias tareas de NLP de disparo cero y pocos disparos. La primera columna muestra la tarea, la segunda columna contiene la solicitud proporcionada al modelo (donde el texto de la plantilla está en negrita y el texto que no está en negrita es la entrada de ejemplo) y la tercera columna es la respuesta del modelo cuando se consulta la solicitud.

Para todas las siguientes tareas, configuramos los hiperparámetros como 600 para que sean los max_length, num_return_sequences, top_k ser 250, top_p ser 0.95, y sin muestreo.

Tarea	Entrada rápida	Salida
Tareas de aprendizaje de tiro cero
Clasificación de sentimientos o texto multilingüe (del chino al inglés)	永远彪炳史册。¿Calificaría la revisión anterior como positiva, neutral o negativa?	positivo
Respuesta de preguntas multilingüe (inglés a chino)	Explícame en chino tradicional ¿Qué es la retropropagación?	Más小化损失函数。
Codigo de GENERACION	Escribir a árbol de búsqueda binaria con O(log(n)) complejidad computacional. {código_inicio}	def búsqueda_binaria(a, x): bajo = 0 alto = largo(a) – 1 mientras que bajo <= alto: medio = (bajo + alto) // 2 si un[medio] < x: bajo = medio + 1 elif a[medio] > x: alto = medio – 1 más: volver a la mitad retorno -1′ ... más: volver a la mitad volver bajo' La salida está truncada
Reformulación de párrafo	Amazon Web Services (AWS) ha anunciado nueve importantes actualizaciones nuevas para su plataforma de aprendizaje automático basada en la nube, SageMaker. SageMaker tiene como objetivo proporcionar un servicio de aprendizaje automático que se puede usar para crear, entrenar e implementar modelos ML para prácticamente cualquier caso de uso. Durante la conferencia re:Invent de este año, AWS realizó varios anuncios para mejorar aún más las capacidades de SageMaker.nn¿Cómo reformularías eso brevemente usando inglés?Amazon Web Services (AWS) ha anunciado nueve importantes actualizaciones nuevas para su plataforma de aprendizaje automático basada en la nube, SageMaker. SageMaker tiene como objetivo proporcionar un servicio de aprendizaje automático que se puede usar para crear, entrenar e implementar modelos ML para prácticamente cualquier caso de uso. Durante la conferencia re:Invent de este año, AWS realizó varios anuncios para mejorar aún más las capacidades de SageMaker. norteLa frase anterior es muy complicada. Por favor, proporcione una versión sinónima simplificada que consta de varias oraciones:	Amazon SageMaker obtiene una actualización importante Amazon Web Services (AWS) ha anunciado nueve importantes actualizaciones nuevas para su plataforma de aprendizaje automático basada en la nube, SageMaker. SageMaker tiene como objetivo proporcionar un servicio de aprendizaje automático que se puede usar para crear, entrenar e implementar modelos ML para prácticamente cualquier caso de uso.
Resumen	Amazon Comprehend utiliza procesamiento de lenguaje natural (NLP) para extraer información sobre el contenido de los documentos. Desarrolla conocimientos mediante el reconocimiento de entidades, frases clave, idioma, sentimientos y otros elementos comunes en un documento. Utilice Amazon Comprehend para crear nuevos productos basados en la comprensión de la estructura de los documentos. Por ejemplo, con Amazon Comprehend puede buscar en las fuentes de las redes sociales menciones de productos o escanear un repositorio de documentos completo en busca de frases clave. Puede acceder a las capacidades de análisis de documentos de Amazon Comprehend mediante la consola de Amazon Comprehend o mediante las API de Amazon Comprehend. Puede ejecutar análisis en tiempo real para cargas de trabajo pequeñas o puede iniciar trabajos de análisis asíncronos para grandes conjuntos de documentos. Puede utilizar los modelos previamente entrenados que proporciona Amazon Comprehend, o puede entrenar sus propios modelos personalizados para la clasificación y el reconocimiento de entidades. Todas las características de Amazon Comprehend aceptan documentos de texto UTF-8 como entrada. Además, la clasificación personalizada y el reconocimiento de entidades personalizadas aceptan archivos de imagen, archivos PDF y archivos de Word como entrada. Amazon Comprehend puede examinar y analizar documentos en una variedad de idiomas, según la característica específica. Para obtener más información, consulte Idiomas admitidos en Amazon Comprehend. La capacidad de idioma dominante de Amazon Comprehend puede examinar documentos y determinar el idioma dominante para una selección mucho más amplia de idiomas.nn===nEscribe un resumen del texto anterior en inglés:	Amazon Comprehend utiliza procesamiento de lenguaje natural (NLP) para extraer información sobre el contenido de los documentos. Desarrolla conocimientos mediante el reconocimiento de entidades, frases clave, idioma, sentimientos y otros elementos comunes en un documento. Utilice Amazon Comprehend para crear nuevos productos basados en la comprensión de la estructura de los documentos. Por ejemplo, con Amazon Comprehend puede buscar en las fuentes de las redes sociales menciones de productos o escanear un repositorio de documentos completo en busca de frases clave. Puede acceder a las capacidades de análisis de documentos de Amazon Comprehend mediante la consola de Amazon Comprehend o mediante las API de Amazon Comprehend. Puede ejecutar análisis en tiempo real para cargas de trabajo pequeñas o puede iniciar trabajos de análisis asíncronos para grandes conjuntos de documentos. Puede utilizar los modelos previamente entrenados que proporciona Amazon Comprehend, o puede entrenar sus propios modelos personalizados para la clasificación y el reconocimiento de entidades. Todas las características de Amazon Comprehend aceptan documentos de texto UTF-8 como entrada. Además, la clasificación personalizada y el reconocimiento de entidades personalizadas aceptan archivos de imagen, archivos PDF y archivos de Word como entrada. Amazon Comprehend puede examinar y analizar documentos en una variedad de idiomas, según la característica específica. Para obtener más información, consulte Idiomas admitidos en Amazon Comprehend. La capacidad de idioma dominante de Amazon Comprehend puede examinar documentos y determinar el idioma dominante para una selección mucho más amplia de idiomas.
Razonamiento de sentido común e inferencia del lenguaje natural	Dado que La copa del mundo ha comenzado en Los Ángeles, Estados Unidos. ¿Se sigue que La copa del mundo se lleva a cabo en Estados Unidos. ¿Sí o no?, La copa del mundo ha comenzado en Los Ángeles, Estados Unidos. Usando solo la descripción anterior y lo que sabes sobre el mundo, es “La copa del mundo se lleva a cabo en Estados Unidos” definitivamente correcto? ¿Sí o no?,	Sí
Respuesta a la pregunta	pregunta: ¿Cuáles son las características clave del nuevo Kindle?nnContexto: El Kindle más nuevo e innovador hasta la fecha le permite tomar notas en millones de libros y documentos, escribir listas y diarios, y más. Para los lectores que siempre han deseado poder escribir en sus libros electrónicos, el nuevo Kindle de Amazon les permite hacer precisamente eso. Kindle Scribe es el primer Kindle para leer y escribir y permite a los usuarios complementar sus libros y documentos con notas, listas y más. Aquí encontrará todo lo que necesita saber sobre Kindle Scribe, incluidas las preguntas más frecuentes. El Kindle Scribe facilita la lectura y escritura como lo haría en papel El Kindle Scribe cuenta con una pantalla sin reflejos de 10.2 pulgadas (la más grande de todos los dispositivos Kindle), una resolución nítida de 300 ppp y 35 luces LED frontales que se ajustan automáticamente a su entorno. Personaliza aún más tu experiencia con la luz cálida ajustable, los tamaños de fuente, el espacio entre líneas y más. Viene con su elección de lápiz básico o lápiz premium, que usa para escribir en la pantalla como lo haría en papel. También se adhieren magnéticamente a su Kindle y nunca necesitan cargarse. Premium Pen incluye un borrador dedicado y un botón de acceso directo personalizable. El Kindle Scribe tiene la mayor cantidad de opciones de almacenamiento de todos los dispositivos Kindle: elija entre 8 GB, 16 GB o 32 GB para adaptarse a su nivel de lectura y escritura. nnResponder	tome notas en millones de libros y documentos, escriba listas y diarios, y más
Clasificación de oraciones y sentimientos	Revisión: nEsta película es genial y una vez más nos deslumbra y deleita.n¿Esta oración de reseña de película es negativa o positiva?nOPCIONES:n-positivo n-negativo	Positivo
Generación de artículos imaginarios basados en el título.	Posición: “La universidad tiene nuevas instalaciones próximamente”nDado el título anterior de un artículo imaginario, imagina el artículo.n”””	El proyecto de £ 1.2 millones verá la creación de un nuevo centro de enseñanza y aprendizaje en la Universidad de Highlands and Islands (UHI) en Inverness. Se construirá en el sitio de la antigua Inverness College of Commerce. UHI dijo que la nueva instalación se usaría para la enseñanza y el aprendizaje, así como para el apoyo y la administración de los estudiantes. La universidad dijo que también se usaría para conferencias y eventos. El nuevo edificio se construirá en el sitio de la antigua Inverness College of Commerce La universidad dijo que el nuevo edificio se construiría en el sitio de la antigua Facultad de Comercio de Inverness, que cerró en 2013. Dijo que la nueva instalación se usaría para la enseñanza y el aprendizaje, así como para el apoyo y la administración de los estudiantes. También sería utilizado para conferencias y eventos. UHI dijo que la nueva instalación se construiría en el sitio de la antigua Inverness College of Commerce La universidad dijo que el nuevo edificio se construiría en el sitio de la antigua Facultad de Comercio de Inverness, que cerró en 2013. Dijo que la nueva instalación se usaría para la enseñanza y el aprendizaje, así como para el apoyo y la administración de los estudiantes. ... También sería utilizado para conferencias y eventos. UHI dijo que la nueva instalación se construiría en el sitio de la antigua Inverness ...
Resumir un título basado en el artículo	“El Kindle más nuevo e innovador hasta la fecha le permite tomar notas en millones de libros y documentos, escribir listas y diarios, y más. Para los lectores que siempre han deseado poder escribir en sus libros electrónicos, el nuevo Kindle de Amazon les permite hacer precisamente eso. Kindle Scribe es el primer Kindle para leer y escribir y permite a los usuarios complementar sus libros y documentos con notas, listas y más. Aquí encontrará todo lo que necesita saber sobre Kindle Scribe, incluidas las preguntas más frecuentes. El Kindle Scribe facilita la lectura y escritura como lo haría en papel El Kindle Scribe cuenta con una pantalla sin reflejos de 10.2 pulgadas (la más grande de todos los dispositivos Kindle), una resolución nítida de 300 ppp y 35 luces LED frontales que se ajustan automáticamente a su entorno. Personaliza aún más tu experiencia con la luz cálida ajustable, los tamaños de fuente, el espacio entre líneas y más. Viene con su elección de lápiz básico o lápiz premium, que usa para escribir en la pantalla como lo haría en papel. También se adhieren magnéticamente a su Kindle y nunca necesitan cargarse. Premium Pen incluye un borrador dedicado y un botón de acceso directo personalizable. El Kindle Scribe tiene la mayor cantidad de opciones de almacenamiento de todos los dispositivos Kindle: elija entre 8 GB, 16 GB o 32 GB para adaptarse a su nivel de lectura y escritura. nn nnDame un buen título para el artículo anterior.	Kindle Scribe de Amazon: todo lo que necesitas saber
Tareas de aprendizaje de pocas tomas
Resumen	[Original]: Los científicos de Amazon, en colaboración con investigadores de la Universidad de Sheffield, están poniendo a disposición del público por primera vez un conjunto de datos de verificación y extracción de hechos a gran escala. El conjunto de datos, que comprende más de 185,000 XNUMX afirmaciones respaldadas por evidencia, está disponible para catalizar la investigación y el desarrollo que aborden los problemas de extracción y verificación de hechos en aplicaciones de software o servicios basados en la nube que realizan la extracción automática de información. [Resumen]: Los investigadores de Amazon y de la Universidad ponen a disposición del público un conjunto de datos de verificación y extracción de hechos. ### [Original]: Los miembros Prime en los EE. UU. pueden recibir aún más en su puerta con una membresía Prime. Los miembros ahora pueden disfrutar de un año de Grubhub+ valorado en $ 9.99 por mes de forma gratuita, sin costo adicional a su membresía Prime. Para activar esta oferta, visite amazon.com/grubhub. Esta nueva oferta incluye tarifas ilimitadas de entrega de alimentos de $0 en pedidos superiores a $12, así como ventajas exclusivas para los miembros de Grubhub+ y recompensas como comida gratis y descuentos en pedidos. Además, los comensales pueden "comer bien mientras hacen el bien" al optar por el programa Donate the Change de Grubhub, una iniciativa de igualación de donaciones que recaudó más de $ 25 millones solo en 2021, beneficiando a más de 20 organizaciones benéficas en todo el país. [Resumen]: los miembros Prime en los EE. UU. pueden disfrutar de un año de Grubhub+ gratis, sin cargos por entrega de alimentos en pedidos elegibles. ### [Original]: Los científicos de Amazon, en colaboración con investigadores de la Universidad de Sheffield, están poniendo a disposición del público por primera vez un conjunto de datos de verificación y extracción de hechos a gran escala. El conjunto de datos, que comprende más de 185,000 XNUMX afirmaciones respaldadas por evidencia, está disponible para catalizar la investigación y el desarrollo que aborden los problemas de extracción y verificación de hechos en aplicaciones de software o servicios basados en la nube que realizan la extracción automática de información. [Resumen]:	[Resumen]: Los investigadores de Amazon y de la Universidad ponen a disposición del público un conjunto de datos de verificación y extracción de hechos.
Codigo de GENERACION	descripción: un botón naranja que dice alto código: detener ### descripción: un cuadro azul que contiene círculos amarillos con bordes rojos código: ### descripción: un titular que dice Bienvenido a AI código:	código: Bienvenido a IA '
Reconocimiento de entidad de nombre	[Texto]: Fred es un emprendedor en serie. Cofundador y director ejecutivo de Platform.sh, anteriormente cofundó Commerce Guys, un proveedor líder de comercio electrónico de Drupal. Su misión es garantizar que mientras continuamos en un viaje ambicioso para transformar profundamente la forma en que se usa y se percibe la computación en la nube, mantenemos los pies bien puestos en el suelo y continuamos con el rápido crecimiento que hemos disfrutado hasta ahora. [Nombre]: Fred [Puesto]: Co-fundador y CEO [Empresa]: Platform.sh ### [Texto]: Microsoft (la palabra es un acrónimo de "software de microcomputadora") fue fundada por Bill Gates el 4 de abril de 1975 para desarrollar y vender intérpretes BASIC para Altair 8800. Steve Ballmer reemplazó a Gates como director ejecutivo en 2000, y luego imaginó una estrategia de “dispositivos y servicios”. [Nombre]: Steve Ballmer [Puesto]: director ejecutivo [Empresa]: Microsoft ### [Texto]: Franck Riboud nació el 7 de noviembre de 1955 en Lyon. Es hijo de Antoine Riboud, el anterior director ejecutivo, que transformó al antiguo fabricante de vidrio europeo BSN Group en un actor líder en la industria alimentaria. Es el director general de Danone. [Nombre]: Franck Riboud [Puesto]: director ejecutivo [Empresa]: Danone ### [Texto]: David Melvin es un profesional de inversiones y servicios financieros en CITIC CLSA con más de 30 años de experiencia en banca de inversión y capital privado. Actualmente es Consejero Senior de CITIC CLSA.	[Nombre]: Fred [Puesto]: Co-fundador y CEO [Empresa]: Platform.sh
Respuesta a la pregunta	Contexto: NLP Cloud se fundó en 2021 cuando el equipo se dio cuenta de que no había una manera fácil de aprovechar de manera confiable el procesamiento del lenguaje natural en la producción. Pregunta: ¿Cuándo se fundó NLP Cloud? Respuesta: 2021 ### Contexto: NLP Cloud desarrolló su API a mediados de 2020 y, desde entonces, agregaron muchos modelos de código abierto preentrenados. Pregunta: ¿Qué desarrolló NLP Cloud? Respuesta: API ### Contexto: todos los planes se pueden detener en cualquier momento. Solo pagas por el tiempo que usaste el servicio. En caso de una rebaja, obtendrá un descuento en su próxima factura. Pregunta: ¿Cuándo se pueden detener los planes? Respuesta: en cualquier momento ### Contexto: el principal desafío con GPT-J es el consumo de memoria. Se recomienda usar un plan de GPU. Pregunta: ¿Qué plan se recomienda para GPT-J? Respuesta:"""	Respuesta: plan GPU'
Corrección gramatical y ortográfica	Me encanta ir a la playa. Corrección: me encanta ir a la playa. ### ¡Déjame tenerlo! Corrección: ¡Déjame tenerlo! ### Tiene demasiados inconvenientes. Corrección: Tiene demasiados inconvenientes. ### no quiero ir Corrección:	Corrección: no quiero ir
Descripción del producto y generalización.	Genere una descripción del producto a partir de palabras clave. Palabras clave: zapatos, mujer, $59 Frase: Hermosos zapatos para mujer al precio de $59. ### Palabras clave: pantalones, hombres, $69 Frase: Pantalón moderno para hombre, por solo $69. ### Palabras clave: guantes, invierno, $19 Oración: Guantes increíblemente cálidos para inviernos fríos, a $19. ### Palabras clave: camiseta, hombre, $39 Frase:	Oración: camiseta genial para hombres, por solo $ 39.
Clasificación de oraciones y sentimientos	Mensaje: Cuando la nave espacial aterrizó en Marte, toda la humanidad estaba emocionada Tema: espacio ### Mensaje: Me encanta jugar al tenis y al golf. Estoy practicando dos veces por semana. Tema: deporte ### Mensaje: Dirigir un equipo de vendedores es un trabajo duro pero gratificante. Tema: negocio ### Mensaje: Estoy tratando de cocinar pollo con tomates. Tema:	Tema: comida
Chatbot e IA conversacional	Esta es una discusión entre un [humano] y un [robot]. El [robot] es muy agradable y empático. [humano]: Hola, encantado de conocerte. [robot]: Encantado de conocerte también. ### [humano]: ¿Cómo te va hoy? [robot]: ¡No tan mal, gracias! ¿Y tú? ### [humano]: Estoy bien, pero estoy un poco triste… [robot]: ¿Ah? ¿Por qué eso? ### [humano]: Cogí la gripe [robot]:	[robot]: ¡Oh no, lamento escuchar eso!
Generación de tuits	palabra clave: mercados tweet: Tome retroalimentación de la naturaleza y los mercados, no de las personas ### palabra clave: niños tuit: Tal vez muramos para poder volver como niños. ### palabra clave: nuevas empresas tweet: Las empresas emergentes no deben preocuparse por cómo apagar incendios, deben preocuparse por cómo iniciarlos. ### palabra clave: PNL Pío:	tuit: La PNL es una herramienta, no un objetivo.
Traducción a máquina	Hugging Face, una revolución en la PNL. Traducción: Hugging Face revolucionó la PNL. ### Cela est increíble! Traducción: ¡Esto es increíble! ### Désolé je ne peux pas. Traducción: Lo siento pero no puedo. ### NLP Cloud permet de deployment le NLP en instalaciones de producción. Traducción:	Traducción: NLP Cloud facilita la implementación de NLP en producción.
Clasificación de intenciones	¡Quiero empezar a programar mañana porque parece muy divertido! Intención: empezar a codificar ### Muéstrame las últimas fotos que tienes por favor. Intención: mostrar imágenes ### Busque todos estos archivos lo más rápido posible. Intención: buscar archivos ### ¿Puedes por favor enseñarme chino la próxima semana? Intención:	Intención: enséñame chino

Acceda al modelo ajustado por instrucciones BloomZ 176B en SageMaker

SageMaker JumpStart ofrece dos formas de comenzar a utilizar estos modelos Bloom ajustados a las instrucciones: Estudio Amazon SageMaker y el SDK de SageMaker. Las siguientes secciones ilustran el aspecto de cada una de estas opciones y cómo acceder a ellas.

Acceda al modelo con el SDK de SageMaker JumpStart simplificado

La SageMaker JumpStart SDK simplificado facilita el entrenamiento y la implementación de modelos SageMaker JumpStart integrados con un par de líneas de código. Esto le da acceso a toda la biblioteca de modelos JumpStart de SageMaker, incluidos los últimos modelos básicos y modelos de generación de imágenes, sin tener que proporcionar ninguna entrada además del ID del modelo.

Puede aprovechar los valores predeterminados específicos del modelo que proporcionamos para especificar la configuración, como la imagen de Docker, el tipo de instancia de ML, la ubicación del artefacto del modelo y los hiperparámetros, entre otros campos. Estos atributos son solo valores predeterminados; puede anularlos y mantener un control granular sobre los modelos de AWS que cree. Como resultado de estos cambios, se ha reducido el esfuerzo de escribir flujos de trabajo de Python para implementar y entrenar modelos SageMaker JumpStart, lo que le permite dedicar más tiempo a las tareas importantes. Esta función está disponible en todas las regiones donde se admite JumpStart y se puede acceder a ella con el SDK de SageMaker Python la versión 2.154.0 o posterior.

Puede implementar un punto final mediante programación a través del SDK de SageMaker. Deberá especificar el ID de modelo de su modelo deseado en el centro de modelos de SageMaker y el tipo de instancia utilizado para la implementación. El URI del modelo, que contiene el script de inferencia, y el URI del contenedor de Docker se obtienen a través del SDK de SageMaker. Estos URI los proporciona SageMaker JumpStart y se pueden usar para inicializar un objeto de modelo de SageMaker para su implementación.

Implementar el modelo y consultar el punto final

Este cuaderno requiere ipywidgets. Instale ipywidgets y luego use el rol de ejecución asociado con el cuaderno actual como rol de cuenta de AWS con acceso a SageMaker.

Elija el modelo pre-entrenado

Elegimos el bloomz-176b-fp16 modelo pre-entrenado:

model_id = "huggingface-textgeneration1-bloomz-176b-fp16"

El cuaderno en las siguientes secciones utiliza BloomZ 176B como ejemplo. Para obtener una lista completa de los modelos preentrenados de SageMaker, consulte Algoritmos integrados con tabla de modelo preentrenada.

Recuperar artefactos e implementar un punto final

Con SageMaker, podemos realizar inferencias en el modelo previamente entrenado sin ajustarlo primero en un nuevo conjunto de datos. Empezamos recuperando el deploy_image_uri, deploy_source_uriy model_uri para el modelo pre-entrenado. Para alojar el modelo preentrenado, creamos una instancia de sagemaker.modelo.Modelo y desplegarlo. Esto puede tomar unos pocos minutos.

Ahora podemos implementar el modelo usando el SDK SageMaker JumpStart simplificado con las siguientes líneas de código:

from sagemaker.jumpstart.model import JumpStartModel #if no instance for this model id is available, use a smaller id
model = JumpStartModel(model_id=model_id) # ml.p4de.24xlarge is used by default. You can add the kwarg
# instance_type to change this setting.
predictor = model.deploy() endpoint_name = predictor.endpoint_name

Utilizamos Contenedores de inferencia de modelos grandes (LMI) de SageMaker para albergar el modelo BloomZ 176B. LMI es una pila (contenedor) de software LLM construida por AWS que ofrece funciones fáciles de usar y aumento de rendimiento en modelos de IA generativa. Está integrado con paralelismo de modelos, compilación, cuantificación y otras pilas para acelerar la inferencia. Para más detalles, consulte Implemente BLOOM-176B y OPT-30B en Amazon SageMaker con inferencia de modelos grandes Contenedores de aprendizaje profundo y DeepSpeed.

Tenga en cuenta que la implementación de este modelo requiere una instancia p4de.24xlarge y la implementación suele demorar aproximadamente 1 hora. Si no tiene una cuota para esa instancia, solicite un aumento de cuota en la consola de Cuotas de servicio de AWS.

Consulta el punto final y analiza la respuesta usando varios parámetros para controlar el texto generado

La entrada al punto final es cualquier cadena de texto con formato JSON y codificado en formato utf-8. La salida del punto final es un archivo JSON con texto generado.

En el siguiente ejemplo, proporcionamos un texto de entrada de muestra. Puede ingresar cualquier texto y el modelo predice las siguientes palabras en la secuencia. Se pueden generar secuencias de texto más largas llamando al modelo repetidamente. El siguiente código muestra cómo invocar un punto final con estos argumentos:

from sagemaker.predictor import retrieve_default predictor = retrieve_default(model_id=model_id, model_version="*", endpoint_name=endpoint=name)
response = predictor.predict("How to make a pasta?")
print(response["generated_text"])

Obtenemos el siguiente resultado:

['How to make a pasta? boil a pot of water and add salt. Add the pasta to the water and cook until al dente. Drain the pasta.']

Acceda al modelo en SageMaker Studio

También puede acceder a estos modelos a través de la Página de destino de JumpStart en el estudio. En esta página, se enumeran las soluciones de aprendizaje automático de extremo a extremo disponibles, los modelos preentrenados y los cuadernos de ejemplo.

Al momento de publicar el post, BloomZ 176B solo está disponible en el us-east-2 Región.

Acceda al modelo en SageMaker Studio

Puede elegir la tarjeta modelo BloomZ 176B para ver el portátil.

elige la tarjeta del modelo BloomZ 176B

A continuación, puede importar el cuaderno para seguir ejecutándolo.

importar el cuaderno

Limpiar

Para evitar cargos continuos, elimine los extremos de inferencia de SageMaker. Puede eliminar los terminales a través de la consola de SageMaker o desde el cuaderno de SageMaker Studio con los siguientes comandos:

predictor.delete_model()
predictor.delete_endpoint()

Conclusión

En esta publicación, brindamos una descripción general de los beneficios del aprendizaje de disparos cero y pocos disparos y describimos cómo la ingeniería rápida puede mejorar el rendimiento de los modelos ajustados por instrucción. También mostramos cómo implementar fácilmente un modelo BloomZ 176B ajustado por instrucciones de SageMaker JumpStart y brindamos ejemplos para demostrar cómo puede realizar diferentes tareas de NLP utilizando el punto final del modelo BloomZ 176B implementado en SageMaker.

Lo alentamos a implementar un modelo BloomZ 176B de SageMaker JumpStart y crear sus propias indicaciones para los casos de uso de NLP.

Para obtener más información sobre SageMaker JumpStart, consulte lo siguiente:

Acerca de los autores

Rajakumar Sampathkumar es Gerente Técnico Principal de Cuentas en AWS, brinda orientación a los clientes sobre la alineación de la tecnología comercial y apoya la reinvención de sus modelos y procesos de operación en la nube. Le apasiona la nube y el aprendizaje automático. Raj también es especialista en aprendizaje automático y trabaja con clientes de AWS para diseñar, implementar y administrar sus cargas de trabajo y arquitecturas de AWS.

Dra. Xin Huang es un científico aplicado para los algoritmos integrados de Amazon SageMaker JumpStart y Amazon SageMaker. Se centra en el desarrollo de algoritmos escalables de aprendizaje automático. Sus intereses de investigación se encuentran en el área del procesamiento del lenguaje natural, el aprendizaje profundo explicable en datos tabulares y el análisis sólido de la agrupación de espacio-tiempo no paramétrica. Ha publicado muchos artículos en conferencias ACL, ICDM, KDD y la revista Royal Statistical Society: Serie A.

Evan Kravitz es ingeniero de software en Amazon Web Services y trabaja en SageMaker JumpStart. Le gusta cocinar y salir a correr en la ciudad de Nueva York.

Distribución de relaciones públicas y contenido potenciado por SEO. Consiga amplificado hoy.
PlatoData.Network Vertical Generativo Ai. Empodérate. Accede Aquí.
PlatoAiStream. Inteligencia Web3. Conocimiento amplificado. Accede Aquí.
PlatoESG. Automoción / vehículos eléctricos, Carbón, tecnología limpia, Energía, Ambiente, Solar, Gestión de residuos. Accede Aquí.
PlatoSalud. Inteligencia en Biotecnología y Ensayos Clínicos. Accede Aquí.
ChartPrime. Eleve su juego comercial con ChartPrime. Accede Aquí.
Desplazamientos de bloque. Modernización de la propiedad de compensaciones ambientales. Accede Aquí.
Fuente: https://aws.amazon.com/blogs/machine-learning/zero-shot-and-few-shot-prompting-for-the-bloomz-176b-foundation-model-with-the-simplified-amazon-sagemaker-jumpstart-sdk/

Sello de tiempo: 14 de agosto de 2023

Sello de tiempo: 10 de mayo de 2023

Reeditado por Platón

Acelere la respuesta ante desastres con visión artificial para imágenes satelitales con Amazon SageMaker y Amazon Augmented AI

Cree un detector de correo no deseado con Amazon SageMaker | Servicios web de Amazon

Modere, clasifique y procese documentos con Amazon Rekognition y Amazon Textract

Prediga los precios de bienes raíces residenciales en ImmoScout24 con Amazon SageMaker

Mejora de la estabilidad y flexibilidad de las canalizaciones de ML en Amazon Packaging Innovation con Amazon SageMaker Pipelines

Sobre Nosotros

Búsqueda vertical y Ai

Productos

Manténganse Conectados

Mi Cuenta