BIG DATA, DATA ANALYTICS Y CLOUD (parte 1)

Presentación realizada en ESET SECURITY DAY, Bucaramanga mayo 23 2014, www.eset-la.com

 

BIG DATA

  • Big Data es el conjunto de bases de datos complejas y/o muy grandes, que manejan enormes cantidades de información.
  • En el año 2000, 800.000 petabytes (PB) de los datos se almacenan en el mundo. Esperamos que esta cifra llegue a 35 zettabytes (ZB) en 2020.
  • El colisionador de partículas cerca de Ginebra Suiza (LHC), genera más de 15 PB de información cada año.
  • Facebook tiene almacenado en sus servidores más de 50,000 millones de fotos. Más de 1260 millones de usuarios registrados (1190 millones de los cuales son activos). 350 millones de fotos subidas a diario. 4.75 billones de elementos compartidos diariamente. 20 millones de minutos de uso por día.
  • Walmart maneja más de 1 millón de transacciones de clientes por hora, todas almacenadas en bases de datos que ocupan más de 2.5 petabytes (2560 terabytes); dicha cifra es el equivalente a 400 veces el total de información contenida en los libros de la Biblioteca Nacional de Reino Unido.

Big Data 3Vs

 

Existe la oportunidad, con la tecnología apropiada, de analizar dichos datos, para tener una mejor comprensión de nuestro negocio, nuestros clientes y nuestro mercado.

 

DATA ANALYTICS

  • Descubrimiento de útiles, posiblemente inesperados, patrones en los datos.
  • AuroraTech
  • Social Media.
  • Detección de fraude financiero.
  • Servicios Financieros.

http://auroratech.com.co/blog/

 

DIFERENTES PERSPECTIVAS EN EL MANEJO DE LOS DATOS

  • Bases de datos: Se concentra en datos estructurados y almacenados en registros (filas).
  • AI (aprendizaje de máquina): Se concentra en los métodos complejos (por lo general conjunto de datos pequeño).
  • Estadística: Se concentra en los modelos.

 

COMO PROCESAR GRANDES CANTIDADES DE INFORMACION

¿Podría procesarse información de manera paralela? ¿Proveniente de varios HDD?

El primer problema a resolver es la falla del hardware. Una manera común de evitar la pérdida de datos es a través de la replicación: copias redundantes de los datos se mantienen (RAID)

 

DATA Vs INFORMACION

La sociedad produce enormes cantidades de datos

Fuentes: negocios, la ciencia, la medicina, la economía, la geografía, el medio ambiente, el deporte, …

Recurso potencialmente valioso

Los datos en bruto son inútiles: Técnicas necesidad de forma automática extraer información de ella

Datos: hechos registrados Información: patrones subyacentes en los datos

 

Continua leyendo la parte 2:

http://auroratech.com.co/blog/2014/05/24/big-data-data-analytics-y-cloud-parte-2/

 

Suscribete a nuestro blog. Entra, comenta y comparte: http://www.auroratech.com.co/blog

 

Carlos Agudelo

Director de Proyectos

AuroraTech

http://www.auroratech.com.co

Facebook: http://www.facebook.com/auroratechpymes

Twitter:       http://twitter.com/AuroraTechPymes

Blog:         http://www.auroratech.com.co/blog

LinkedIn:    http://www.linkedin.com/company/auroratech?trk=biz-companies-cym

 

DECORACION Y ORGANIZACION DE EVENTOS

Publicidad Marisamo 2014-05-04

Be Sociable, Share!

Leave a Reply

Your email address will not be published. Required fields are marked *