Presentación realizada en ESET SECURITY DAY, Bucaramanga mayo 23 2014, www.eset-la.com
BIG DATA
- Big Data es el conjunto de bases de datos complejas y/o muy grandes, que manejan enormes cantidades de información.
- En el año 2000, 800.000 petabytes (PB) de los datos se almacenan en el mundo. Esperamos que esta cifra llegue a 35 zettabytes (ZB) en 2020.
- El colisionador de partículas cerca de Ginebra Suiza (LHC), genera más de 15 PB de información cada año.
- Facebook tiene almacenado en sus servidores más de 50,000 millones de fotos. Más de 1260 millones de usuarios registrados (1190 millones de los cuales son activos). 350 millones de fotos subidas a diario. 4.75 billones de elementos compartidos diariamente. 20 millones de minutos de uso por día.
- Walmart maneja más de 1 millón de transacciones de clientes por hora, todas almacenadas en bases de datos que ocupan más de 2.5 petabytes (2560 terabytes); dicha cifra es el equivalente a 400 veces el total de información contenida en los libros de la Biblioteca Nacional de Reino Unido.
Existe la oportunidad, con la tecnología apropiada, de analizar dichos datos, para tener una mejor comprensión de nuestro negocio, nuestros clientes y nuestro mercado.
DATA ANALYTICS
- Descubrimiento de útiles, posiblemente inesperados, patrones en los datos.
- AuroraTech
- Social Media.
- Detección de fraude financiero.
- Servicios Financieros.
http://auroratech.com.co/blog/
DIFERENTES PERSPECTIVAS EN EL MANEJO DE LOS DATOS
- Bases de datos: Se concentra en datos estructurados y almacenados en registros (filas).
- AI (aprendizaje de máquina): Se concentra en los métodos complejos (por lo general conjunto de datos pequeño).
- Estadística: Se concentra en los modelos.
COMO PROCESAR GRANDES CANTIDADES DE INFORMACION
¿Podría procesarse información de manera paralela? ¿Proveniente de varios HDD?
El primer problema a resolver es la falla del hardware. Una manera común de evitar la pérdida de datos es a través de la replicación: copias redundantes de los datos se mantienen (RAID)
DATA Vs INFORMACION
La sociedad produce enormes cantidades de datos
Fuentes: negocios, la ciencia, la medicina, la economía, la geografía, el medio ambiente, el deporte, …
Recurso potencialmente valioso
Los datos en bruto son inútiles: Técnicas necesidad de forma automática extraer información de ella
Datos: hechos registrados Información: patrones subyacentes en los datos
Continua leyendo la parte 2:
http://auroratech.com.co/blog/2014/05/24/big-data-data-analytics-y-cloud-parte-2/
Suscribete a nuestro blog. Entra, comenta y comparte: http://www.auroratech.com.co/blog
Carlos Agudelo
Director de Proyectos
AuroraTech
Facebook: http://www.facebook.com/auroratechpymes
Twitter: http://twitter.com/AuroraTechPymes
Blog: http://www.auroratech.com.co/blog
LinkedIn: http://www.linkedin.com/company/auroratech?trk=biz-companies-cym
DECORACION Y ORGANIZACION DE EVENTOS