Esta tecnología ha influenciado e impulsado varias industrias y mercados. Por ejemplo, las cadenas de retail la emplean para recomendaciones de productos, los proveedores de email la usan para filtrar spam, las redes sociales la aplican en reconocimiento facial y análisis de emociones, y la lista continúa. La industria de la seguridad informática está realizando importantes inversiones en este campo con el fin de fortificar su arsenal contra los cibercriminales. “Hoy en día es muy raro encontrar un proveedor de seguridad que no ofrezca algún producto de machine learning”, puntualiza el ejecutivo.
En el pasado, una gran parte del esfuerzo humano era dirigido hacia el desarrollo de sólidos conocimientos de dominio, los cuales eran luego traducidos en firmas, reglas, listas o patrones de correlación que a su vez pudieran ser integrados en un producto comercializable. Hoy en día, los niveles de protección están recibiendo un refuerzo adicional mediante los análisis predictivo basado en poderosos algoritmos capaces de extraer información de conjuntos de datos aparentemente caóticos y creando relaciones a través del tiempo, el espacio y los comportamientos.
Las Verdades:
La tecnología de machine learning está destinada a conquistar aquellos retos antes inalcanzables para las capacidades humanas y los sistemas estáticos. Machine learning nos brinda una habilidad sin precedentes para interpretar grandes volúmenes de datos desestructurados provenientes de diversas fuentes, incluyendo interacción de usuarios, datos transaccionales, actividad en redes, historiales de phishing y sistemas de detección en puntos finales.
Desafortunadamente, y gracias a su ilimitado potencial y enorme éxito al enfrentar difíciles retos, machine learning produce grandes expectativas, presentándose como una caja mágica capaz de resolver cualquier problema. De esta forma, la tecnología crea esperanzas de desempeño irreales en usuarios no muy bien informados. Usualmente, la aplicación de técnicas de machine learning a la ciberseguridad produce una serie de preconcepciones.
Los siguientes 4 puntos resaltan algunas de estas ideas, las cuales deben ser tenidas en cuenta por los usuarios para evitar decepciones a la hora de adoptar la tecnología de machine learning:
Si su compañía decide invertir en esta tecnología, es importante desarrollar una conciencia de datos a través de toda la organización, especialmente en aquellas áreas involucradas en la detección y mitigación de incidentes. Todos los datos relacionados con la ciberseguridad e incidentes de fraude (normales y anómalos) deben ser clasificados meticulosamente.
Una de las causas más frecuentes de decepción en lo concerniente a machine learning parte de los falsos positivos y la tasa de alertas. El análisis predictivo siempre tiene un costo y puede ser muy frustrante implementar un algoritmo que supuestamente provee un desempeño inigualable, solo para descubrir que está consumiendo toda su capacidad operacional.
Evaluar un modelo de machine learning con base en solo dos ejemplos no representativos es injusto y engañoso. Un modelo de machine learning debe ser evaluado con pruebas estadísticas cuidadosamente diseñadas y empleando muestras significativas de datos. Esto significa que el desempeño debe ser evaluado al aplicar el algoritmo varias veces sobre un conjunto de datos, el cual represente con precisión un problema de la vida real. Al evaluar un modelo de machine learning, pregúntele a su proveedor cómo lo hacen ellos y solicítele un proceso con sus propios datos.
Conclusión
Al ser aplicada correctamente, la tecnología de machine learning aumenta dramáticamente la capacidad de una organización para combatir amenazas sofisticadas, mientras saca mayor provecho de los datos de seguridad y la inteligencia de amenazas.Pero prepárese para evolucionar rápidamente. Nuestros adversarios son inteligentes, y cada día su conocimiento en machine learning aumenta. En poco tiempo estarán listos para tratar de evadir las más avanzadas defensas. Machine learning es capaz de mejorar con el tiempo, solo si las organizaciones están dispuestas a permitir su evolución mediante datos actualizados. Asegúrese de que su infraestructura operacional está al tanto de las predicciones falsas y exitosas del modelo. Esto permitirá ajustarlo y que evolucione más ágilmente. Concluye Javier Vargas.