Category Archives: Big Data

BIG DATA, DATA ANALYTICS Y CLOUD (parte 1)

Presentación realizada en ESET SECURITY DAY, Bucaramanga mayo 23 2014, www.eset-la.com

 

BIG DATA

  • Big Data es el conjunto de bases de datos complejas y/o muy grandes, que manejan enormes cantidades de información.
  • En el año 2000, 800.000 petabytes (PB) de los datos se almacenan en el mundo. Esperamos que esta cifra llegue a 35 zettabytes (ZB) en 2020.
  • El colisionador de partículas cerca de Ginebra Suiza (LHC), genera más de 15 PB de información cada año.
  • Facebook tiene almacenado en sus servidores más de 50,000 millones de fotos. Más de 1260 millones de usuarios registrados (1190 millones de los cuales son activos). 350 millones de fotos subidas a diario. 4.75 billones de elementos compartidos diariamente. 20 millones de minutos de uso por día.
  • Walmart maneja más de 1 millón de transacciones de clientes por hora, todas almacenadas en bases de datos que ocupan más de 2.5 petabytes (2560 terabytes); dicha cifra es el equivalente a 400 veces el total de información contenida en los libros de la Biblioteca Nacional de Reino Unido.

Big Data 3Vs

 

Existe la oportunidad, con la tecnología apropiada, de analizar dichos datos, para tener una mejor comprensión de nuestro negocio, nuestros clientes y nuestro mercado.

 

DATA ANALYTICS

  • Descubrimiento de útiles, posiblemente inesperados, patrones en los datos.
  • AuroraTech
  • Social Media.
  • Detección de fraude financiero.
  • Servicios Financieros.

http://auroratech.com.co/blog/

 

DIFERENTES PERSPECTIVAS EN EL MANEJO DE LOS DATOS

  • Bases de datos: Se concentra en datos estructurados y almacenados en registros (filas).
  • AI (aprendizaje de máquina): Se concentra en los métodos complejos (por lo general conjunto de datos pequeño).
  • Estadística: Se concentra en los modelos.

 

COMO PROCESAR GRANDES CANTIDADES DE INFORMACION

¿Podría procesarse información de manera paralela? ¿Proveniente de varios HDD?

El primer problema a resolver es la falla del hardware. Una manera común de evitar la pérdida de datos es a través de la replicación: copias redundantes de los datos se mantienen (RAID)

 

DATA Vs INFORMACION

La sociedad produce enormes cantidades de datos

Fuentes: negocios, la ciencia, la medicina, la economía, la geografía, el medio ambiente, el deporte, …

Recurso potencialmente valioso

Los datos en bruto son inútiles: Técnicas necesidad de forma automática extraer información de ella

Datos: hechos registrados Información: patrones subyacentes en los datos

 

Continua leyendo la parte 2:

http://auroratech.com.co/blog/2014/05/24/big-data-data-analytics-y-cloud-parte-2/

 

Suscribete a nuestro blog. Entra, comenta y comparte: http://www.auroratech.com.co/blog

 

Carlos Agudelo

Director de Proyectos

AuroraTech

http://www.auroratech.com.co

Facebook: http://www.facebook.com/auroratechpymes

Twitter:       http://twitter.com/AuroraTechPymes

Blog:         http://www.auroratech.com.co/blog

LinkedIn:    http://www.linkedin.com/company/auroratech?trk=biz-companies-cym

 

DECORACION Y ORGANIZACION DE EVENTOS

Publicidad Marisamo 2014-05-04

BIG DATA, DATA ANALYTICS Y CLOUD (parte 2)

Presentación realizada en ESET SECURITY DAY, Bucaramanga mayo 23 2014, www.eset-la.com

 

QUE ES CLOUD COMPUTING?

Cloud Computing es la capacidad de usar el poder de otros ordenadores (que se encuentra en otro lugar) y su software, a través de Internet, sin necesidad de poseerlos. Ellos están siendo proporcionados a usted , como un servicio.

Se puede acceder a los datos desde un smartphone, una tableta, un ordenador portátil o una computadora de escritorio – siempre que tengas una conexión a Internet.

Algunas nubes públicas son:

  • Dropbox
  • Google Drive
  • iCloud

 

Se pueden tener nubes privadas:

  • Network Attached Storage
  • Storage Area Network

La computación en nube es rentable. El costo se reduce en gran medida como un gasto inicial y los gastos recurrentes son mucho menores que la computación tradicional.

Costo de mantenimiento se reduce a medida que un tercero mantiene todo lo que se ejecute la nube para almacenar datos.

En pocas palabras, la computación en nube significa obtener el mejor rendimiento del sistema con la mejor relación calidad-precio.

 

TIPOS DE CLOUD COMPUTING

  1. Infraestructura como Servicio (IaaS) es básicamente la compra de hardware de computación en bruto.
  2. Software as a Service (SaaS) es un caso en el que utiliza la aplicación de software completa que se ejecuta en servidores ajenos.
  3. Plataforma como servicio (PaaS) es el caso en el que crear aplicaciones utilizando herramientas basadas en la web para que se ejecutan en el software y el hardware proporcionado por otra empresa.

 

CLOUD COMPUTING PARA PYMES

Cloud Computing se abre como una oportunidad para las PYMES, suministrándoles los servicios informáticos requeridos (Zoho Projects, Email Campaigns, CRM, videoconferencia, etc.) reinventando los negocios y reduciendo costos.

Los dispositivos móviles también está transformando el entorno para las PYMES (BYOD, por ejemplo).

Frente a este escenario, algunas empresas responden con parálisis, miedo a tomar medidas que pueden lamentar. Otros tratan a cabo múltiples proveedores, sólo para frustrarse cuando los beneficios esperados son compensados ​​por la elevada carga administrativa y la falta de la integración entre plataformas.

Para maximizar sus posibilidades de éxito, usted debe elegir a su compañero de ruta sabiamente. AuroraTech está para ayudarlos en este camino.

 

Las actualizaciones ocurren en tiempo real.

La colaboración se acentúa con todas estas herramientas. Los procesos de negocio se aceleran.

La información debe residir en la nube y no en el computador de cada empleado.

Mensajería instantánea (chat) y traducción de idiomas online.

 

¿ES SEGURO?

La idea de toda esta importante información flotando alrededor en el universo puede ponerte nervioso.

Gran parte de los datos se cifran con seguridad, por lo que incluso los empleados de estos servicios no son capaces de entrar en sus archivos. Cada proveedor tiene generalmente servidores de respaldo en varios continentes.

La seguridad de los datos confidenciales es un área muy importante de preocupación. El mal uso de los datos puede crear grandes problemas. Es muy importante estar al tanto de los administradores de datos y su extensión de los derechos de acceso a datos.

 

REFERENCIAS

Mining of massive datasets. Anand Rajaraman, Jure Leskovec, Jeffrey D. Ullman, 2013.

Hadoop: The definitive guide. Tom White. O´Really, 2012.

Data Mining with Rattle and R. Graham Williams. Springer, 2011.

http://infolab.stanford.edu/~ullman/mining/2009/index.html

https://weka.waikato.ac.nz/

 

 

Suscribete a nuestro blog. Entra, comenta y comparte: http://www.auroratech.com.co/blog

 

Carlos Agudelo

Director de Proyectos

AuroraTech

http://www.auroratech.com.co

Facebook: http://www.facebook.com/auroratechpymes

Twitter:       http://twitter.com/AuroraTechPymes

Blog:         http://www.auroratech.com.co/blog

LinkedIn:    http://www.linkedin.com/company/auroratech?trk=biz-companies-cym

 

DECORACION Y ORGANIZACION DE EVENTOS

Publicidad Marisamo 2014-05-04

Bienvenidos a la era de Big Data

Bienvenidos a todos nuestros lectores a la era de Big Data. En este, nuestro primer número de Análisis de Datos, AuroraTech les da la bienvenida. Se preguntarán “¿qué es Big Data?”. La respuesta, para ser digerible, nos debe plantear otras preguntas: ¿Manejamos datos diariamente? ¿qué tantos datos manejamos?  Esta respuesta es muy seguramente sí. Desde el listado de víveres que debemos comprar en el supermercado, hasta las necesidades de nuestros clientes en la oficina, pasando por los varios mensajes de nuestros amigos en las redes sociales. Hoy en día estamos inundados de datos en nuestro diario quehacer. ¿Y qué hacemos con todos esos datos que tenemos a nuestra disposición a diario? Generalmente, muy poco: los almacenamos en nuestro computador, tablet, teléfono móvil, etc., o en su defecto, los acumulamos en pilas de papeles que escasamente volvemos a mirar o no recordamos dónde se encuentran. Pero, además de almacenarlos ¿qué más hacemos con esta cantidad de datos? … Continue reading