Los algoritmos de regresión pertenecen a la familia de algoritmos de Aprendizaje Automático Supervisado que es un subconjunto de algoritmos de aprendizaje automático. Una de las principales características de los algoritmos de aprendizaje supervisado es que modelan las dependencias y relaciones entre las características de salida y de entrada para predecir el valor de los nuevos datos. Los algoritmos de regresión predicen los valores de salida basándose en las características de entrada de los datos introducidos en el sistema. La metodología es que el algoritmo construye un modelo sobre las características de los datos de entrenamiento y utiliza el modelo para predecir el valor de los nuevos datos.
Según Oracle, aquí hay una gran definición de Regresión – una función de minería de datos para predecir un número. Un ejemplo es cómo se aprovechan los modelos de regresión para predecir el valor de los bienes inmuebles en función de la ubicación, el tamaño y otros factores. Hoy en día, los modelos de regresión tienen muchas aplicaciones, sobre todo en la previsión financiera, el análisis de tendencias, el marketing, la predicción de series temporales e incluso la modelización de la respuesta a los medicamentos. Algunos de los tipos populares de algoritmos de regresión son la regresión lineal, los árboles de regresión, la regresión de lazo y la regresión multivariante.
La revista Analytics India Magazine enumera los algoritmos de regresión más populares
1. Modelo de regresión lineal simple: La regresión lineal simple es un método estadístico que permite resumir y estudiar las relaciones entre dos variables continuas (cuantitativas). La regresión lineal es un modelo lineal en el que se asume una relación lineal entre las variables de entrada (x) y la única variable de salida (y). En este caso, la y puede calcularse a partir de una combinación lineal de las variables de entrada (x). Cuando hay una única variable de entrada (x), el método se denomina regresión lineal simple. Cuando hay múltiples variables de entrada, el procedimiento se denomina regresión lineal múltiple.
Aplicación: algunas de las aplicaciones más populares del algoritmo de regresión lineal son en la predicción de la cartera financiera, la previsión de los salarios, las predicciones de bienes raíces y en el tráfico para llegar a las ETAs.
2. Regresión Lasso: LASSO son las siglas de Least Absolute Selection Shrinkage Operator en el que la contracción se define como una restricción en los parámetros. El objetivo de la regresión lasso es obtener el subconjunto de predictores que minimiza el error de predicción para una variable de respuesta cuantitativa. El algoritmo opera imponiendo una restricción sobre los parámetros del modelo que hace que los coeficientes de regresión de algunas variables se reduzcan hacia un cero.
Las variables con un coeficiente de regresión igual a cero después del proceso de contracción se excluyen del modelo. Las variables con coeficientes de regresión distintos de cero son las que están más fuertemente asociadas con la variable de respuesta. Las variables explicativas pueden ser cuantitativas, categóricas o ambas. Este análisis de regresión lasso es básicamente un método de contracción y selección de variables y ayuda a los analistas a determinar cuáles de los predictores son más importantes.
Aplicación: Los algoritmos de regresión Lasso han sido ampliamente utilizados en las redes financieras y en la economía. En finanzas, su aplicación se ve en la previsión de probabilidades de impago y los modelos de previsión basados en Lasso se utilizan en la evaluación del marco de riesgo de toda la empresa. Las regresiones de tipo Lasso también se utilizan para realizar plataformas de pruebas de estrés para analizar múltiples escenarios de estrés.
3. Regresión logística: Una de las técnicas de regresión más utilizadas en la industria, que se aplica ampliamente en la detección de fraudes, la puntuación de tarjetas de crédito y los ensayos clínicos, siempre que la respuesta sea binaria tiene una gran ventaja. Una de las principales ventajas de este popular algoritmo es que se puede incluir más de una variable dependiente que puede ser continua o dicotómica. La otra gran ventaja de este algoritmo de aprendizaje automático supervisado es que proporciona un valor cuantificado para medir la fuerza de la asociación en función del resto de variables. A pesar de su popularidad, los investigadores han sacado a relucir sus limitaciones, citando la falta de una técnica robusta y también una gran dependencia del modelo.
Aplicación: Hoy en día las empresas despliegan la Regresión Logística para predecir el valor de la vivienda en el negocio inmobiliario, el valor de vida del cliente en el sector de los seguros y se aprovechan para producir un resultado continuo como si un cliente puede comprar/comprará el escenario.
4. Máquinas de Vectores de Soporte: Support Vector Machine (SVM) es otro de los algoritmos más potentes con fuertes fundamentos teóricos basados en la teoría de Vapnik-Chervonenkis, tal y como se define en los docs de Oracle. Este algoritmo de aprendizaje automático supervisado tiene una fuerte regularización y puede aprovecharse tanto para los retos de clasificación como de regresión. Se caracterizan por el uso de kernels, la escasez de la solución y el control de la capacidad que se obtiene actuando sobre el margen, o sobre el número de vectores de soporte, etc. La capacidad del sistema se controla mediante parámetros que no dependen de la dimensionalidad del espacio de características. Dado que el algoritmo SVM opera de forma nativa con atributos numéricos, utiliza una normalización de la puntuación z en los atributos numéricos. En la regresión, los algoritmos de las máquinas de vectores de apoyo utilizan la función de pérdida de insensibilidad a épsilon (margen de tolerancia) para resolver los problemas de regresión.
Aplicación: los algoritmos de regresión de las máquinas de vectores de apoyo han encontrado varias aplicaciones en la industria del petróleo y el gas, la clasificación de imágenes y textos y la categorización de hipertextos. En los yacimientos petrolíferos, se aprovecha específicamente para la exploración para entender la posición de las capas de rocas y crear modelos 2D y 3D como representación del subsuelo.
5. Algoritmo de regresión multivariante: Esta técnica se utiliza cuando hay más de una variable predictora en un modelo de regresión multivariante y el modelo se denomina regresión múltiple multivariante. Denominado por los investigadores como uno de los algoritmos de aprendizaje automático supervisado más sencillos, este algoritmo de regresión se utiliza para predecir la variable de respuesta para un conjunto de variables explicativas. Esta técnica de regresión se puede implementar de manera eficiente con la ayuda de las operaciones matriciales y en Python, se puede implementar a través de la biblioteca «numpy» que contiene definiciones y operaciones para el objeto matriz.
Aplicación: La aplicación industrial del algoritmo de regresión multivariante se ve mucho en el sector minorista, donde los clientes hacen una elección en función de una serie de variables como la marca, el precio y el producto. El análisis multivariante ayuda a los responsables de la toma de decisiones a encontrar la mejor combinación de factores para aumentar las visitas a la tienda.
6. Algoritmo de regresión múltiple: Este algoritmo de regresión tiene varias aplicaciones en toda la industria para la fijación de precios de productos, precios inmobiliarios, departamentos de marketing para averiguar el impacto de las campañas. A diferencia de la técnica de regresión lineal, la regresión múltiple, es una clase más amplia de regresiones que abarca regresiones lineales y no lineales con múltiples variables explicativas.
Aplicación: Algunas de las aplicaciones empresariales del algoritmo de regresión múltiple en la industria son en la investigación de las ciencias sociales, el análisis del comportamiento e incluso en la industria de los seguros para determinar el valor de las reclamaciones.
Suscríbete a nuestra Newsletter
Recibe las últimas actualizaciones y ofertas relevantes compartiendo tu email.
0 comentarios