Aprendizaje profundo explicado visualmente

Comprender el aprendizaje profundo mediante ejemplos visuales

Foto por julien tromeur on Unsplash

El aprendizaje profundo es una de las técnicas de IA más poderosas; sin embargo, puede resultar difícil de entender. En este blog, intentaré explicar el aprendizaje profundo utilizando imágenes y ejemplos.

La arquitectura del aprendizaje profundo se inspira en cómo funciona nuestro cerebro. Es una conexión de neuronas. Los modelos de aprendizaje profundo pueden tener muchos parámetros. La cantidad de parámetros se basa en la cantidad de capas y neuronas, que pueden crecer exponencialmente para una arquitectura sofisticada.

En este blog, abordaré un caso de uso empresarial de detección de fraude financiero. Uno de los mayores desafíos en la detección de fraude es el problema del desequilibrio de clases, lo que significa que los datos utilizados para entrenar modelos de aprendizaje automático tienen muy pocos casos de fraude.

Arquitectura de aprendizaje profundo (imagen del autor)

Es como entrenar un modelo de aprendizaje automático para que encuentre una aguja en un pajar. La detección de fraude es un problema especial que justifica tener un enfoque sofisticado como la arquitectura de aprendizaje profundo.

En el ejemplo, tomaré datos del sistema de transacciones bancarias. Los datos se ven como se muestran aquí. Los datos tienen el tipo de transacción financiera, monto, así como origen y destino, saldo antiguo y saldo nuevo. También hay una bandera que indica si la transacción fue fraudulenta o no.

La cita del conjunto de datos está disponible al final del blog.

Datos de detección de fraude (imagen del autor)

Los datos se dividen en datos de entrenamiento y de prueba. El modelo de aprendizaje profundo se desarrolla en el conjunto de entrenamiento y luego se valida con los datos de prueba. Entonces, este modelo se puede utilizar para predecir el fraude a partir de datos invisibles.

División de entrenamiento/prueba (imagen del autor)

Aquí se muestra el modelo de aprendizaje profundo para la predicción de fraude. Las neuronas de entrada corresponden a los datos de la transacción. Cada neurona corresponde a una columna en los datos de entrada, como el tipo de transacción, el monto y la información del saldo en el origen y el destino.

Hay una capa intermedia y luego la capa final que tiene dos neuronas, una que predice que no habrá fraude y la otra que predice que no habrá fraude.

Las líneas son señales que pasan entre las diferentes capas. Una línea verde indica una señal positiva y una línea roja indica una señal negativa

El modelo de aprendizaje profundo para la detección de fraudes (imagen del autor)

Vemos que la neurona 1_0 está pasando una señal positiva a la neurona Fraude.

¡Esto significa que ha aprendido en profundidad cómo es una transacción fraudulenta! Esto es emocionante !

La neurona 1_0 está pasando una señal positiva a la neurona 2_1 (fraude) (imagen del autor)

¡Echemos un vistazo al interior de la neurona 1_0!

Dentro de la neurona 1_0 (imagen del autor)

El gráfico de radar es una representación de lo que la neurona ha aprendido sobre los datos. Una línea azul indica un valor alto y una línea roja indica un valor bajo. El gráfico de radar indica un equilibrio antiguo y nuevo alto, pero casi similar, en el origen. Sin embargo, existe una diferencia muy grande entre el saldo antiguo y el nuevo en el destino.

Esta situación es un indicio de fraude. Esta situación se puede mostrar visualmente a continuación.

Muestra visualmente cómo se ve una transacción fraudulenta (imagen del autor)

Aquí se muestra la precisión del modelo de aprendizaje profundo utilizando una matriz de confusión.

Matriz de confusión (imagen del autor)

En total, hay alrededor de 95000 transacciones, de las cuales 62 son transacciones fraudulentas, lo que es muchísimo menos que la transacción total. Sin embargo, el modelo de aprendizaje profundo está funcionando bien, ya que es capaz de identificar correctamente 52 como fraude, lo que también se denomina verdadero positivo (tp).

Hay 1 falso positivo (fp), lo que significa que no es un fraude, pero el modelo lo marcó incorrectamente como fraude. Entonces la precisión, que es tp / (tp +fp), equivale al 98%.

Además, hay 10 falsos negativos (fn), lo que significa que son transacciones fraudulentas, pero nuestro modelo no es capaz de predecirlos. Entonces la medida recuerda que es tp / (tp +fn) que es 83%

La arquitectura de aprendizaje profundo es muy poderosa ya que ayuda a resolver problemas complejos como la detección de fraude. Una forma visual de analizar la arquitectura de aprendizaje profundo es útil para comprender la arquitectura y cómo resuelve el problema.

Cita de fuente de datos para conjuntos de datos financieros sintéticos para la detección de fraude

Los conjuntos de datos financieros sintéticos para la detección de fraude están disponibles aquí: https://www.kaggle.com/competitions/spaceship-titanic/overview

Tal y como se especifica en el apartado Licencia, dispone de licencia CC BY-SA 4.0.

  • Compartir — copiar y redistribuir el material en cualquier medio o formato
  • Adaptar — remezclar, transformar y construir sobre el material para cualquier propósito, incluso comercial.

Por favor, únete a medio con mi enlace de referencia.

Por favor, Suscríbase para mantenerme informado cada vez que publico una nueva historia.

Puede visitar mi sitio web para realizar análisis sin codificación. https://experiencedatascience.com

En el sitio web, también puede participar en los próximos talleres de IA para disfrutar de una experiencia interesante e innovadora en ciencia de datos e IA.

Aquí te dejo el enlace a mi canal de YouTube.
https://www.youtube.com/c/DataScienceDemonstrated

Aprendizaje profundo explicado visualmente Republicado desde la fuente https://towardsdatascience.com/deep-learning-visually-explained-a9fff874d280?source=rss—-7f60cf5620c9—4 vía https://towardsdatascience.com/feed

<!–

->

Sello de tiempo:

Mas de Consultores Blockchain