La capacidad para almacenar datos ha crecido en los últimos años a velocidades siderales y ya empieza a expresarse en Terabits pues el Gigabit, como unidad ya se ha quedado pequeña (1 Terabit son 1.024 Gigas; los discos duros de los ordenadores a la venta ya están en los 300-500 Gigas. La capacidad de un CD es de 700 Megas)
Para hacernos una idea de lo que representan las memorias informáticas, pensemos que la famosa Enciclopedia Británica, en papel consta de 32 volúmenes que incluyen en sus 32.640 páginas 100,349 artículos con un total de 55 millones de palabras, cabe en 2 CDs
Si almacenar datos en gigantescas bases es fácil y barato, de momento no es tan fácil sacarles el jugo.
Data Mining
Se denomina Data Mining (o si lo queremos en español, Minería de Datos) a las complejas técnicas encaminadas a extraerle todo el provecho que podamos a las bases de datos. Con unos ejemplos entenderemos con facilidad qué jugo se le puede sacar:
· detección de los hábitos de compra de los clientes de una cadena de supermercados para poder organizar la colocación de los artículos.
· detección de señales de alarma que indiquen que ciertos clientes de un Banco se van a marchar a la competencia y poderles ofrecer una oferta personalizada para intentar retenerlos.
· Detección de los datos y de los hábitos de los visitantes de una página Web.
· El FBI analizará las bases de datos comerciales para detectar terroristas antes de que actúen. Para ello cruzará todas las bases de datos lo que le permitirá saber si una persona fuma, qué talla y tipo de ropa usa, su historial de arrestos, su salario, las revistas a las que está suscrito, los libros que consulta en las Bibliotecas, su altura y peso, sus contribuciones a la Iglesia, grupos políticos u organizaciones no gubernamentales, sus enfermedades, los productos que compra en el supermercado, si tomó clases de vuelo o si tiene cuentas de banco abiertas, entre otros (según nos informa Luis Carlos Molina en http://www.uoc.edu/web/esp/art/uoc/molina1102/molina1102.html)
· Algunas grandes empresas de telecomunicaciones o de Internet poseen Bases con millones de datos personales: AT&T, Sprint, Google, YouTube, ChoicePoint, Amazon, Telefónica, etc.
· A finales de 2006 estaban inscritos más de 800.000 ficheros en la Agencia Española de Protección de datos.
No hay comentarios:
Publicar un comentario