Antonio Caamaño

Data Mining y Web Mining

El descubrimiento de conocimiento.

lunes, 1 de junio de 2009
Tecnología
Tecnologías de la Información

El “Data Mining” o minería de datos, se define como la extracción no trivial de información implícita, previamente desconocida y potencialmente útil, a partir de datos.

En la actual sociedad de la información, donde la cantidad de datos almacenados se multiplica exponencialmente, la minería de datos es una herramienta fundamental para analizarlos y explotarlos de forma eficaz. El descubrimiento de conocimiento a partir del análisis de los datos, permite analizar eficazmente cualquier objetivo que se proponga una empresa.

La minería de datos hace uso de todas las técnicas que puedan aportar información útil, desde un sencillo análisis gráfico, pasando por métodos estadísticos habitualmente complejos, complementados con métodos y algoritmos del campo de la inteligencia artificial y el aprendizaje automático que resuelven problemas típicos de agrupamiento automático, clasificación, predicción de valores, detección de patrones, asociación de atributos, etc.

Un área que cobra especial interés en la sociedad de la información, es el “Web Mining” o minería de uso de la web, que consiste en extraer información y conocimiento útil específicamente de la actividad de un sitio web, como es el análisis de tráfico (visitas y visitantes), contenidos más accedidos, procedencia del usuario, tipo de usuarios, navegadores y sistemas operativos, reglas de asociación entre páginas y tasas de conversión entre otros.

Cuando su empresa emprenda un nuevo proyecto, recuerde analizar tanta información como le sea posible, con el fin de orientar y corregir eficazmente dicho proyecto.

4 comentarios para “Data Mining y Web Mining”

  1. Hola Antonio,

    Interesante post sobre una disciplina ámpliamente usada en otros países y que aún no se le saca todo el provecho en el nuestro.

    El ‘Data Mining’ es desde mi punto de vista, uno de los aspectos de la ‘Inteligencia de Negocio’ relacionada con el CRM, que más y mejor información puede darnos sobre el comportamiento de nuestros clientes.

    La cultura de la inteligencia está plenamente integrada en mentalidades empresariales sajonas, y estoy convencido que la definición de un modelo más latino, podrá abrir los ojos a empresarios españoles sobre su utilidad para gestionar el cambio y generar nuevas espectativas de negocio.

    No quiero extenderme demasiado, pero creo que tras conceptos como la ‘Inteligencia Competitiva’ y la ‘Inteligencia de negocio’, más utilizados en países como USA o GB nuestros esfuerzos deberían dirigirse hacia un sistema más integrado y transversal como es la ‘Inteligencia Económica’.

    http://tinyurl.com/nqdnjc

    Un saludo,

    Miquel Rovira

  2. Hola Miquel,

    Ciertamente el análisis de los datos, llevan a todo tipo de conclusiones y predicciones por medio de procesos matemáticos y estadísticos.

    Como sabes, los centros de investigación y multinacionales de todos los sectores, utilizan estas tecnologías para conocer patrones y elaborar predicciones, y las grandes empresas de Software como IBM u Oracle entre otras muchas, disponen de herramientas poco utilizadas en España por ser el país de las pymes, y que aun hoy en día, el precio de implantación no suele encajar en empresas de este tamaño, aun sabiendo que les ayudará a conocer mejor como evoluciona y evolucionará su negocio.

    Ahora bien, el “Web Mining” es económico, fácil de implantar y básico para cualquier empresa que desee conocer la evolución de su sitio WEB.

    Adjunto interesante Link, con un supuesto práctico sobre el Ensayo de Medicamentos. http://users.dsic.upv.es/~jorallo/master/seminari.part.III.pdf.

    Muchas gracias por tu visita y comentarios.

    Saludos,
    A. Caamaño

  3. Antonio:

    Tal vez mi comentario sea un poco divergente, pero es que al final, la Red acabará convergiendo. No podemos olvidar en web mining el concepto introducido por Google, ‘search mining’, y dónde su máximo exponente es Google Trends (integrante del Google Zeitgeist). En un artículo reciente de ‘The Economist’ , se anunciaban mejoras significativas en modelos de predicción con incrementos de hasta el 18% en la capacidad explicativa de dichos modelos al incorporar los datos de búsqueda en la red. No es moco de pavo y, aún a riesgo de caer en una falacia ‘ad baculum’, es Hal Varian (Google’s Chief Economist) quien está liderando el proyecto de investigación.

    Un saludo,

    Francisco

    • Hola Francisco,

      Tienes mucha razón en cuanto al liderazgo que Google presenta en todas las áreas de la minería Web. Ahora bien, esa convergencia que predices no la veo tan clara, dado que los cambios que veremos en un futuro muy próximo, requerirán nuevos modelos de evaluación y predicción.

      Ocurrió en su día con la Prensa, la Radio, la Televisión y como no, con Internet; pero es que la red que hoy conocemos, no es más que la punta de un gran iceberg por crear.

      Pienso que cada empresa, debe disponer y analizar cuanta información le sea proporcionada por servidores, google u otros, con el fin de redefinir y mejorar continuamente su estrategia.

      Muchas gracias por tu visita y comentarios.

      Saludos,
      A. Caamaño

Deje un comentario