La Coctelera

Rodolfo Carpintier Santana

El Blog de Infoman. Modelos de negocio del Siglo XXI

22 Febrero 2011

Datamining. Descubre el comportamiento de tu cliente

El concepto de minería de datos es ya antiguo, llevamos hablando de ello casi 20 años, sin embargo, con la aceleración del comercio electrónico, la montaña de datos que recaban, por usuario, las redes sociales más conocidas, esta es como una ola creciente de inusitadas dimensiones.

Sin embargo, todavía un porcentaje pequeño de start-ups entiende el concepto y mucho menos es capaz de aplicarlo en su negocio diario. Es importante saber hacerlo. Puede descubrirte patrones de comportamiento que son claves en tu negocio y que, debidamente satisfechos, pueden aumentar de manera incremental tus ventas.

Es un entorno idóneo para gente con buenos conocimientos matemáticos y estadísticos pero pocas empresas les contratan. Quienes estudian matemáticas, aparte de la docencia, apenas tienen lugar en alguna consultora especializada que les dedica, en general, a la informática.

¿Quienes de vosotros hacéis elaborada minería de datos en vuestra empresa y quien es el/la responsable de ello?

servido por Rodolfo 8 comentarios compártelo

8 comentarios · Escribe aquí tu comentario

olgarusu

olgarusu dijo

Hace poco estuve leyendo sobre planteamientos distintos en el espionaje en la Segunda Guerra Mundial. Lo que decía el artículo es que el problema no es la información, no son los DATOS, sino su INTERPRETACIÓN. El mismo artículo decía que ese fue el problema de Bush con la guerra de Irak: no había mentido sobre las armas, había malinterpretado los datos.

Muchas veces pienso que lo mismo les pasa a las empresas con sus Data Mining y CRM: acumulan montañas de datos, pero no saben interpretarlos. Por eso de momento no he visto a nadie usar los datos que tiene sobre mi.

22 Febrero 2011 | 08:54 AM

Juan Macias

Juan Macias dijo

Hola Rodolfo, yo trabajé un tiempo en DataMining, procesábamos 600Milliones de registros al día (una locura).

Cuando monté nuestra tienda online hace 5 años, lo primero que hice fue instalar Google Analytics, para mi llevar un registro de TODO es realmente importante.

Actualmente, contamos con la ayuda de los chicos de BlueKnow para identificar patrones de comportamiento en los clientes, para aplicarlos al marketing online.

En mi opinión, hace falta gente con conocimiento en estadística, pero sobre todo de marketing, la estadística sin conocimientos de marketing no vale para nada.....

22 Febrero 2011 | 09:00 AM

Juan Macias

Juan Macias dijo

Por cierto, si estáis interesados en Business Intelligence, os recomiendo mirar http://www.pentaho.com/

22 Febrero 2011 | 09:02 AM

aurorissima

aurorissima dijo

Estoy de acuerdo con olgarusu y con Rodolfo.
El Data Mining es muy muy importante en todo tipo de empresas... pero la interpretación de esos datos y su contextualización es aún más importante.
Unos datos muy completos pero descontextualizados o interpretados por alguien que, únicamente, se ciñe a las matemáticas y a modelos estadísticos y/o econométricos, pueden ser incluso dañinos.
Por eso siempre digo que yo llevo mucho tiempo dedicándome al Data Mining y al Gisting = elaboración de informes sucintos, basados en lo observado y "lo aprendido" (experiencia de muchos años), para la posterior toma de decisiones...
Hay que usar los números y los datos... y saber entenderlos, mirar más allá...

22 Febrero 2011 | 09:41 AM

JoSeK

JoSeK dijo

Yo llevo prácticamente toda mi vida trabajando en datamining y áreas relacionadas, tanto a nivel empresarial (primero como consultor en la Agencia Tributaria aplicando DM para detección del fraude fiscal), como en el mundo académico y ahora con nuestra startup BrainSINS, que ofrece recomendación de productos analizando el comportamiento de los usuarios.

Para mi la minería de datos es un tema bastante importante, pero también requiere una gran cantidad de recursos (personas, tiempo, máquinas), que no todo el mundo puede permitirse. Por eso el poder ofrecer servicios que utilicen estas tecnologías pero se ofrezcan vía SaaS es una oportunidad de entrada a este mundo para muchas empresas. Creo que están saliendo muchas iniciativas en esta línea, y seguiremos viendo mucho movimiento en el mercado en los próximos meses.

Ahora bien, para la mayoría de los negocios, un paso previo a la minería de datos debería ser, como comenta Juan, la aplicación de Business Intelligence, para generar cuadros de mando o estadísticas avanzadas que permitan evaluar de una forma más rápida y simple la evaluación del negocio.

La aplicación de minería de datos requiere tener claro un objetivo que extraer de los datos. Mucha gente piensa en la minería de datos como una caja negra a la que nutres de grandes cantidades de datos y devuelve conlocimiento plenamente usable, y la realidad no es así. Hace falta tener claro el problema que se quiere resolver, o al menos una pista (por ejemplo detectar outliers en los logs de navegación para detectar actividad anómala, o patrones "extraños" de compra), hace falta preprocesar y limpiar los datos, hace falta exprimetnar con diversos algoritmos que procesen los datos, "jugar" con parámetros que debes conocer, y al final, como bien comentaban en otros comentarios, se capaces de analizar los resultados y extraer conclusiones.

Todo este proceso lleva a que, además de necesitar personal con los conocimientos adecuados, se necesite invertir una cantidad considerable de recursos en este proceso. Si está más que demostrado que el "le pido a mi sobrino que me haga la web" no funciona, ni te cuento lo mal que funciona este proceso si no se lo pides a las personas adecuadas.

22 Febrero 2011 | 10:32 AM

Josep

Josep dijo

Totalmente de acuerdo y destaco muy especialmente el tercer párrafo:
"""Es un entorno idóneo para gente con buenos conocimientos matemáticos y estadísticos pero pocas empresas les contratan."""

Y como razona perfectamente Josek, es un proceso donde es muy importante invertir una cantidad importante de recursos.

A la pregunta,
"""¿Quienes de vosotros hacéis elaborada minería de datos en vuestra empresa y quien es el/la responsable de ello?"""

En mi caso la respuesta es fácil porque trabajo en una empresa donde nos dedicamos a la labor de datamining de redes de telefonía móvil aplicando tecnologías de inspección de paquetes, de ahí que me haya dedicado a analizar redes de datos de telefonía móvil alrededor del mundo (de momento, remótamente o presencialmente, en los últimos dos años he trabajado con datos de operadores de más de diez países distintos -Asia, Latinoamérica, Europa, Oriente Medio-, y el número de proyectos no para de crecer, para que os hagáis una magnitud del crecimiento de este sector).

Esto significa lidiar con la locura de tratar con millones, cientos de millones, miles de millones de datos distintos a diario y con la necesidad de extraer tendencias, problemas técnicos y otra información relevante de ellos.

Al ser un campo de trabajo muy nuevo (la explosión de las comunicaciones móviles tiene lugar justo ahora), hay una relativa escasez de estudios e información publicada y no hay un "método de trabajo" perfectamente definido y estudiado y analizado, no hay pasos preestablecidos. De modo que es un campo perfecto para la experimentación y la obtención de nuevos resultados.

El tema consiste en "hacer camino al andar", en dedicar muchas horas a "jugar con los datos", combinarlos, obtener resultados, descartar miles y seleccionar unos pocos.

Además de dar cada vez con los resultados adecuados, que sorprenderán o aportarán información extra al cliente, lo complicado muchas veces es la labor didáctica que hay que hacer y va pareja a este trabajo. Muchas veces el cliente (de muchas áreas distintas, ingeniería, marketing, gerencia) no está acostumbrado a trabajar desde un punto de vista estadístico y es importante explicarle el porqué de cada uno de los razonamientos y resultados.

Juan apunta a la necesidad de conocimientos de marketing antetodo. Bien, en mi campo apuntaría a todo lo contrario. Antetodo es importante tener bien claros algunos conceptos estadísticos y saberlos aplicar. Es mejor unos cuantos conceptos de marketing o técnicos claros y bien trabajados desde un punto de vista estadístico, que muchos pero confusamente desarrollados.

En general, en las empresas se exige la creación de "cuadros de mando" y la definición de indicadores y KPIs, sin embargo mi experiencia me lleva a dudar de la validez estadística de muchos de ellos, así como se desarrollan e interpretan. Nosotros mismos a menudo, en las propuestas comerciales que presetamos a los clientes, acostumbramos a definir parámetros estadísticos tales como success rates, contadores y promedios. Sin embargo, estos parámetros son únicamente válidos para definir thresholds o valores umbrales, muchas veces no para describir la naturaleza de lo que miden. La realidad es que a la hora de hacer un análisis de la red, es muy frecuente que yo mismo me aleje de la propuesta original y aplique conceptos más elaborados y no tan sencillos de vender en una propuesta comercial pero mucho más efectivos a la hora de efectuar el trabajo de campo (distribución estadística, mediana y media estadística, varianzas...).

Para simplificar mucho, el análisis "un hombre tiene dos pollos y el otro tiene cero, la media es un pollo por persona", ese conocimiento en realidad no nos aporta información para describir la naturaleza de la situación. Pero esto, que en este caso es simple de ver, cuando se aplica a millones de datos, no se percibe y pasa a formar parte de los cuadros de mando y del proceso de toma de decisiones, pudiendo ser origen de muchas malinterpretaciones.

23 Febrero 2011 | 03:58 AM

Xavier Gost

Xavier Gost dijo

En una stratUp los procesos no estan consolidados, es mas , cambian y deben hacerlo con frecuencia, esto impedira que el cuerpo de datos recogido sea realmente significativo para un analisis estadistico. Yo os recomendaria tecnicas de "data visualization" que con una muestra mucho mas pequeña y ciertas habilidades tecnico-artisticas os pueden llevar a perspectivas sobre vuestro negocio muy interesantes.. aqui una presentacion al respecto en un TED http://www.ted.com/talks/david_mccandless_the_beauty_of_data_visu...

23 Febrero 2011 | 09:25 AM

Lino Bort

Lino Bort dijo

Desde @blueknow ofrecemos algoritmos de Machine Learning como servicio cuyo objetivo principal es el incremento de ventas en el comercio electrónico. Se trata de externalizar la solución a un problema difícil de resolver en la mayoría de las empresas. Las claves son:

- Definición clara del problema a resolver
- Diseño de un producto simple y efectivo
- Background científico
- Dilatada experiencia en el escalado tecnológico de aplicaciones que tratan con grandes volúmenes de datos

El caso que explica Juan (deMartina) es un claro ejemplo de un producto que aumenta un 30% las ventas en un negocio real.

23 Febrero 2011 | 05:06 PM

Los comentarios están cerrados


Sobre mí

Avatar de Rodolfo

Rodolfo Carpintier Santana

Madrid, España
ver perfil »
contacto »

Escribo sobre lo que me llama la atención, sobre lo que me gusta y, en general, sobre negocios de Internet.

Soy Presidente de DAD - Digital Assets Deployment, (http://www.dad.es) la incubadora de Internet







Go to Rodolfo´s Blog in English

Technorati Profile

Add to Technorati Favorites


Buscar

suscríbete

Selecciona el agregador que utilices para suscribirte a este blog (también puedes obtener la URL de los feeds):

¿Qué es esto?

Crea tu blog gratis en La Coctelera