Conceptos básicos de Machine Learning.
Sin duda el campo de la inteligencia artificial y en particular el Machine Learning es uno de los más atractivo en la actualidad. Por eso les dejo un artículo con los principales conceptos que se deben conocer al menos los más básicos.
Un algoritmo o aplicación de ML nos puede ayudar a resolver una infinidad de problemas. Imaginemos resolver un problema muy conocido por todos, detectar si un correo electrónico es SPAM o no.
Para esto necesitamos conocer las FEATURES que no son más que las variables que vamos a analizar, encabenzado, remitente , etc etc.
Una vez teniendo las variables necesitamos nuestros LABEL que es el resultado esperado, en nuestro caso si el correo es SPAM o NO.
Otro concepto importante que necesitamos son los EXAMPLES que no son más que los datos que nos ayudarán a entrenar y probar nuestro programa. Estos examples pueden ser labeled o unlabeled , eso quiere decir que tendremos correos electrónicos marcados como SPAM otros marcados como NO SPAN , estos son los LABELED y otros que no estarán marcados que son en este caso los UNLABELED
Nuestro programa necesitará algo llamado MODEL que es el algoritmo que aprenderá a detectar en el futuro baso en nuestros examples si un correo es spam o no. Los modelos trabajan en 2 fases fundamentales, Training que es cuando se entrenan o aprenden de los datos y el otro es el Inference que es cuando aplican lo aprendido a nueva información.
Los modelos se catalogan principalmente en 2 tipos:
Regression, es cuando el modelo intenta predecir un valor, por ejemplo, respondiendo a preguntas como:
Cual es el valor de una casa en México?
Cual es la probabilidad que llueva hoy?
Estos ejemplos devuelven un valor.
El otro tipo de modelos es llamado Clasifications. Este modelo clasifica la inforamción , las categoriza. Ejemplo:
Este correo es SPAM o NO?
Esta imagen es de un perro, un conejo ?.
Conclusión
Existen estos 5 conceptos que son fundamentales si estás comenzando en el mundo del ML.
Feature: variables a procesar.( cantidad de habitaciones, m2, cant baños)
Label: resultado que obtendremos (precio de la casa)
Model: Algoritmo que aprende y aplica lo aprendido a los datos.
Example: Datos para entrenar nuestro algoritmo, pueden ser datos ya con un label o no.
Regression vs classification: Los modelos pueden devolver un valor (precio de la casa) o clasificar la información( SPAM o NO)
Espero les sirva y dejen cualquier comentario.