SlideShare una empresa de Scribd logo
1 de 19
Unidad Educativa Fiscomisional Don Bosco
Bryan Villarroel
3ro INF
NO SQL: la nueva generación de base de datos
QUE ES NOSQL
 NoSQL es especialmente útil cuando una empresa
necesita acceder y analizar grandes cantidades de
datos no estructurados o datos que se almacenan
de forma remota en varios servidores virtuales en
la nube.
 Los sistemas de bases de datos NoSQL crecieron con
las principales compañías de Internet, como Google,
Amazon, Twitter y Facebook. Estas tenían que
enfrentarse a desafíos con el tratamiento de datos que
las tradicionales RDBMS no solucionaban . Con el
crecimiento de la web en tiempo real existía una
necesidad de proporcionar información procesada a
partir de grandes volúmenes de datos que tenían unas
estructuras horizontales más o menos similares.
ARQUITECTURA
 Típicamente las bases de datos relacionales
modernas han mostrado poca eficiencia en
determinadas aplicaciones que usan los datos de
forma intensiva, incluyendo el indexado de un gran
número de documentos, la presentación de
páginas en sitios que tienen gran tráfico, y en sitios
de streaming audiovisual. Las implementaciones
típicas de RDBMS se han afinado o bien para una
cantidad pequeña pero frecuente de lecturas y
escrituras o para un gran conjunto de
transacciones que tiene pocos accesos de
escritura. Por otro lado NoSQL puede servir gran
cantidad de carga de lecturas y escrituras.
 Las arquitecturas NoSQL frecuentemente aportan
escasas garantías de consistencia, tales como
consistencia de eventos o transaccional restringida
a ítems únicos de datos. Hay dos sistemas que han
sido desplegados y que aportan aislamiento
snapshot para almacenamientos de columna: El
sistema Percolator de Google basado en el sistema
BigTable y el sistema transaccional de Hbase
desarrollado por la universidad de Waterloo.
APACHE CASSANDRA
 Apache Cassandra es una base de datos NoSQL
distribuida y basada en un modelo de
almacenamiento de clave valor, de código abierto
que está escrita en Java. Permite grandes
volúmenes de datos en forma distribuida.
 El modelo de datos de Cassandra consiste en
particionar las filas, que son reorganizadas en
tablas . Las claves primarias de cada tabla tiene
un primer componente que es la clave de partición.
Dentro de una partición, las filas son agrupadas por
las columnas restantes de la clave.
 Las demás columnas pueden ser indexadas por
separado de la clave primaria
 Las tablas se pueden crear, eliminar y alterar en
tiempo de ejecución sin bloquear actualizaciones y
consultas.
VENTAJAS DE CASSANDRA
 Rápidas respuestas aunque la demanda crezca
 Elevadas velocidades de escritura para gestionar
volúmenes de datos incrementales
 Almacenamiento distribuido
 Capacidad de cambiar la estructura de datos cuando los
usuarios demandan más funcionalidad
 Una API sencilla y limpia para tu lenguaje de
programación favorito
 Detección automática de fallos
 No hay un punto de fallo único (cada nodo conoce de los
otros)
 Descentralizada
 Tolerante a fallos
¿QUIÉN USA APACHE CASSANDRA?
Digg
Facebook
Twitter
Rackspace
SimpleGEO
CARACTERISTICAS
 Descentralizado
Todos los nodos del clúster tiene el mismo rol. No hay un
único punto de fallo. Los datos se distribuyen a través del
clúster (por lo que cada nodo contiene datos diferentes).
No existe un nodo maestro por lo que cada nodo puede
dar servicio a cualquier solicitud.
 Soporta replicación y replicación de multiples data
center
Las estrategias de replicación son configurables .
Cassandra está diseñado como un sistema distribuido,
para el despliegue de un gran número de nodos a través
de múltiples centros de datos. La arquitectura distribuida
de Cassandra esta diseñado para desplegarse sobre
multiples data center, tener redundancia y recuperarse
ante desastres.
 Escalabilidad
El rendimiento de leer y escribir aumenta linealmente
a medida que se añaden nuevos nodos. Se pueden
agregar nuevos nodos sin necesidad de interrumpir la
ejecución de la aplicación.
 Tolerancia a fallos
Los datos se replican automáticamente a múltiples
nodos para recuperarse frente a fallos. Cassandra
soporta replicación a través de multiples datacenter.
Se puede reemplazar nodos que presenten fallos sin
tiempo de inactividad o interrupción de la aplicación.
 Consistencia
Se ofrece la elección de el nivel de consistencia para
las lecturas y escrituras.
 Soporte MapReduce
Cassandra esta integrado con Apache Hadoop para
soportar MapReduce. Tambien existe soporte
para Apache Pig y Apache Hive.
 Lenguaje de consulta
Cassandra introduce CQL (Cassandra Query
Language), una alternativa similar a SQL para la
interfaz RPC tradicional. Existen drivers disponibles
para Java (JDBC), Python (DBAPI2), Node.JS
(Helenus), Go (gocql) and C++
INSTALACION DE CASSANDRA
Descargar el instalador de cassandra puedes
encontrarlo en las siguientes páginas
http://cassandra.apache.org/download/
http://www.datastax.com/download
 Ejecutamos en instalador
 Le damos click en siguiente
 Aceptamos los términos de licencia
 Elegimos la ruta donde se guarda la instalación
 Para terminar le damos siguiente para que inicie en
proceso de instalación
Damos click en finalizar la instalación

Más contenido relacionado

La actualidad más candente

Metodologías Para AnáLisis Y DiseñO Orientado A Objetos
Metodologías Para AnáLisis Y DiseñO Orientado A ObjetosMetodologías Para AnáLisis Y DiseñO Orientado A Objetos
Metodologías Para AnáLisis Y DiseñO Orientado A Objetos
hector_h30
 
Clases y objetos de java
Clases y objetos de javaClases y objetos de java
Clases y objetos de java
innovalabcun
 

La actualidad más candente (20)

Introduction to NoSQL
Introduction to NoSQLIntroduction to NoSQL
Introduction to NoSQL
 
2. Configuración OSPF
2. Configuración OSPF2. Configuración OSPF
2. Configuración OSPF
 
Apache HBase™
Apache HBase™Apache HBase™
Apache HBase™
 
The Top 5 Reasons to Deploy Your Applications on Oracle RAC
The Top 5 Reasons to Deploy Your Applications on Oracle RACThe Top 5 Reasons to Deploy Your Applications on Oracle RAC
The Top 5 Reasons to Deploy Your Applications on Oracle RAC
 
Presentacion cassandra
Presentacion cassandraPresentacion cassandra
Presentacion cassandra
 
Extreme replication at IOUG Collaborate 15
Extreme replication at IOUG Collaborate 15Extreme replication at IOUG Collaborate 15
Extreme replication at IOUG Collaborate 15
 
NoSQL databases
NoSQL databasesNoSQL databases
NoSQL databases
 
Tarea1 programacion-distribuida
Tarea1 programacion-distribuidaTarea1 programacion-distribuida
Tarea1 programacion-distribuida
 
PROCESAMIENTO DE CONSULTAS
PROCESAMIENTO DE CONSULTASPROCESAMIENTO DE CONSULTAS
PROCESAMIENTO DE CONSULTAS
 
Hadoop World 2011: Advanced HBase Schema Design - Lars George, Cloudera
Hadoop World 2011: Advanced HBase Schema Design - Lars George, ClouderaHadoop World 2011: Advanced HBase Schema Design - Lars George, Cloudera
Hadoop World 2011: Advanced HBase Schema Design - Lars George, Cloudera
 
Sgbdoo
SgbdooSgbdoo
Sgbdoo
 
Acl ejemplos
Acl ejemplosAcl ejemplos
Acl ejemplos
 
Metodologías Para AnáLisis Y DiseñO Orientado A Objetos
Metodologías Para AnáLisis Y DiseñO Orientado A ObjetosMetodologías Para AnáLisis Y DiseñO Orientado A Objetos
Metodologías Para AnáLisis Y DiseñO Orientado A Objetos
 
Apache Spark and MongoDB - Turning Analytics into Real-Time Action
Apache Spark and MongoDB - Turning Analytics into Real-Time ActionApache Spark and MongoDB - Turning Analytics into Real-Time Action
Apache Spark and MongoDB - Turning Analytics into Real-Time Action
 
Framework Laravel
Framework LaravelFramework Laravel
Framework Laravel
 
Presentacion de Microsoft SQL Server.
Presentacion de Microsoft SQL Server. Presentacion de Microsoft SQL Server.
Presentacion de Microsoft SQL Server.
 
Clases y objetos de java
Clases y objetos de javaClases y objetos de java
Clases y objetos de java
 
Super Sizing Youtube with Python
Super Sizing Youtube with PythonSuper Sizing Youtube with Python
Super Sizing Youtube with Python
 
Unidad 1. Fundamentos de Base de Datos
Unidad 1. Fundamentos de Base de DatosUnidad 1. Fundamentos de Base de Datos
Unidad 1. Fundamentos de Base de Datos
 
Gestores de bases de datos cuadros comparativos
Gestores de bases de datos cuadros comparativosGestores de bases de datos cuadros comparativos
Gestores de bases de datos cuadros comparativos
 

Similar a descarga e instalación de cassandra nosql

Similar a descarga e instalación de cassandra nosql (20)

Nosql
NosqlNosql
Nosql
 
No sql la nueva era
No sql la nueva eraNo sql la nueva era
No sql la nueva era
 
Base de datos
Base de datosBase de datos
Base de datos
 
Base de datos
Base de datosBase de datos
Base de datos
 
Cassandra instalacion y uso
Cassandra instalacion y usoCassandra instalacion y uso
Cassandra instalacion y uso
 
Act4 andrade lesvia
Act4 andrade lesviaAct4 andrade lesvia
Act4 andrade lesvia
 
Base de datos 1
Base de datos 1Base de datos 1
Base de datos 1
 
Principales bases de datos existentes
Principales bases de datos existentesPrincipales bases de datos existentes
Principales bases de datos existentes
 
Presentación1
Presentación1Presentación1
Presentación1
 
Principales bases de datos existentes
Principales bases de datos existentesPrincipales bases de datos existentes
Principales bases de datos existentes
 
Cassandra trabajo2 tv eq5
Cassandra trabajo2 tv eq5Cassandra trabajo2 tv eq5
Cassandra trabajo2 tv eq5
 
Base de datos sánchez erika
Base de datos sánchez erikaBase de datos sánchez erika
Base de datos sánchez erika
 
Base de datos ryjt
Base de datos ryjtBase de datos ryjt
Base de datos ryjt
 
Base de datos
Base de datosBase de datos
Base de datos
 
Base de datos3
Base de datos3Base de datos3
Base de datos3
 
BASES DE DATOS
BASES DE DATOSBASES DE DATOS
BASES DE DATOS
 
Big data y las apis (big data spain)
Big data y las apis (big data spain)Big data y las apis (big data spain)
Big data y las apis (big data spain)
 
Base de datos no sql
Base de datos no sqlBase de datos no sql
Base de datos no sql
 
Bases de datos
Bases de datosBases de datos
Bases de datos
 
Nosql y cassandra
Nosql y cassandraNosql y cassandra
Nosql y cassandra
 

Último

Modulo-Mini Cargador.................pdf
Modulo-Mini Cargador.................pdfModulo-Mini Cargador.................pdf
Modulo-Mini Cargador.................pdf
AnnimoUno1
 
EPA-pdf resultado da prova presencial Uninove
EPA-pdf resultado da prova presencial UninoveEPA-pdf resultado da prova presencial Uninove
EPA-pdf resultado da prova presencial Uninove
FagnerLisboa3
 

Último (15)

Desarrollo Web Moderno con Svelte 2024.pdf
Desarrollo Web Moderno con Svelte 2024.pdfDesarrollo Web Moderno con Svelte 2024.pdf
Desarrollo Web Moderno con Svelte 2024.pdf
 
Modulo-Mini Cargador.................pdf
Modulo-Mini Cargador.................pdfModulo-Mini Cargador.................pdf
Modulo-Mini Cargador.................pdf
 
Refrigerador_Inverter_Samsung_Curso_y_Manual_de_Servicio_Español.pdf
Refrigerador_Inverter_Samsung_Curso_y_Manual_de_Servicio_Español.pdfRefrigerador_Inverter_Samsung_Curso_y_Manual_de_Servicio_Español.pdf
Refrigerador_Inverter_Samsung_Curso_y_Manual_de_Servicio_Español.pdf
 
Presentación de elementos de afilado con esmeril
Presentación de elementos de afilado con esmerilPresentación de elementos de afilado con esmeril
Presentación de elementos de afilado con esmeril
 
EPA-pdf resultado da prova presencial Uninove
EPA-pdf resultado da prova presencial UninoveEPA-pdf resultado da prova presencial Uninove
EPA-pdf resultado da prova presencial Uninove
 
presentacion de PowerPoint de la fuente de poder.pptx
presentacion de PowerPoint de la fuente de poder.pptxpresentacion de PowerPoint de la fuente de poder.pptx
presentacion de PowerPoint de la fuente de poder.pptx
 
Trabajo Mas Completo De Excel en clase tecnología
Trabajo Mas Completo De Excel en clase tecnologíaTrabajo Mas Completo De Excel en clase tecnología
Trabajo Mas Completo De Excel en clase tecnología
 
Avances tecnológicos del siglo XXI y ejemplos de estos
Avances tecnológicos del siglo XXI y ejemplos de estosAvances tecnológicos del siglo XXI y ejemplos de estos
Avances tecnológicos del siglo XXI y ejemplos de estos
 
Presentación guía sencilla en Microsoft Excel.pptx
Presentación guía sencilla en Microsoft Excel.pptxPresentación guía sencilla en Microsoft Excel.pptx
Presentación guía sencilla en Microsoft Excel.pptx
 
Avances tecnológicos del siglo XXI 10-07 eyvana
Avances tecnológicos del siglo XXI 10-07 eyvanaAvances tecnológicos del siglo XXI 10-07 eyvana
Avances tecnológicos del siglo XXI 10-07 eyvana
 
guía de registro de slideshare por Brayan Joseph
guía de registro de slideshare por Brayan Josephguía de registro de slideshare por Brayan Joseph
guía de registro de slideshare por Brayan Joseph
 
Global Azure Lima 2024 - Integración de Datos con Microsoft Fabric
Global Azure Lima 2024 - Integración de Datos con Microsoft FabricGlobal Azure Lima 2024 - Integración de Datos con Microsoft Fabric
Global Azure Lima 2024 - Integración de Datos con Microsoft Fabric
 
PROYECTO FINAL. Tutorial para publicar en SlideShare.pptx
PROYECTO FINAL. Tutorial para publicar en SlideShare.pptxPROYECTO FINAL. Tutorial para publicar en SlideShare.pptx
PROYECTO FINAL. Tutorial para publicar en SlideShare.pptx
 
pruebas unitarias unitarias en java con JUNIT
pruebas unitarias unitarias en java con JUNITpruebas unitarias unitarias en java con JUNIT
pruebas unitarias unitarias en java con JUNIT
 
EL CICLO PRÁCTICO DE UN MOTOR DE CUATRO TIEMPOS.pptx
EL CICLO PRÁCTICO DE UN MOTOR DE CUATRO TIEMPOS.pptxEL CICLO PRÁCTICO DE UN MOTOR DE CUATRO TIEMPOS.pptx
EL CICLO PRÁCTICO DE UN MOTOR DE CUATRO TIEMPOS.pptx
 

descarga e instalación de cassandra nosql

  • 1. Unidad Educativa Fiscomisional Don Bosco Bryan Villarroel 3ro INF NO SQL: la nueva generación de base de datos
  • 2. QUE ES NOSQL  NoSQL es especialmente útil cuando una empresa necesita acceder y analizar grandes cantidades de datos no estructurados o datos que se almacenan de forma remota en varios servidores virtuales en la nube.
  • 3.  Los sistemas de bases de datos NoSQL crecieron con las principales compañías de Internet, como Google, Amazon, Twitter y Facebook. Estas tenían que enfrentarse a desafíos con el tratamiento de datos que las tradicionales RDBMS no solucionaban . Con el crecimiento de la web en tiempo real existía una necesidad de proporcionar información procesada a partir de grandes volúmenes de datos que tenían unas estructuras horizontales más o menos similares.
  • 4. ARQUITECTURA  Típicamente las bases de datos relacionales modernas han mostrado poca eficiencia en determinadas aplicaciones que usan los datos de forma intensiva, incluyendo el indexado de un gran número de documentos, la presentación de páginas en sitios que tienen gran tráfico, y en sitios de streaming audiovisual. Las implementaciones típicas de RDBMS se han afinado o bien para una cantidad pequeña pero frecuente de lecturas y escrituras o para un gran conjunto de transacciones que tiene pocos accesos de escritura. Por otro lado NoSQL puede servir gran cantidad de carga de lecturas y escrituras.
  • 5.  Las arquitecturas NoSQL frecuentemente aportan escasas garantías de consistencia, tales como consistencia de eventos o transaccional restringida a ítems únicos de datos. Hay dos sistemas que han sido desplegados y que aportan aislamiento snapshot para almacenamientos de columna: El sistema Percolator de Google basado en el sistema BigTable y el sistema transaccional de Hbase desarrollado por la universidad de Waterloo.
  • 6. APACHE CASSANDRA  Apache Cassandra es una base de datos NoSQL distribuida y basada en un modelo de almacenamiento de clave valor, de código abierto que está escrita en Java. Permite grandes volúmenes de datos en forma distribuida.
  • 7.  El modelo de datos de Cassandra consiste en particionar las filas, que son reorganizadas en tablas . Las claves primarias de cada tabla tiene un primer componente que es la clave de partición. Dentro de una partición, las filas son agrupadas por las columnas restantes de la clave.  Las demás columnas pueden ser indexadas por separado de la clave primaria  Las tablas se pueden crear, eliminar y alterar en tiempo de ejecución sin bloquear actualizaciones y consultas.
  • 8. VENTAJAS DE CASSANDRA  Rápidas respuestas aunque la demanda crezca  Elevadas velocidades de escritura para gestionar volúmenes de datos incrementales  Almacenamiento distribuido  Capacidad de cambiar la estructura de datos cuando los usuarios demandan más funcionalidad  Una API sencilla y limpia para tu lenguaje de programación favorito  Detección automática de fallos  No hay un punto de fallo único (cada nodo conoce de los otros)  Descentralizada  Tolerante a fallos
  • 9. ¿QUIÉN USA APACHE CASSANDRA? Digg Facebook Twitter Rackspace SimpleGEO
  • 10. CARACTERISTICAS  Descentralizado Todos los nodos del clúster tiene el mismo rol. No hay un único punto de fallo. Los datos se distribuyen a través del clúster (por lo que cada nodo contiene datos diferentes). No existe un nodo maestro por lo que cada nodo puede dar servicio a cualquier solicitud.  Soporta replicación y replicación de multiples data center Las estrategias de replicación son configurables . Cassandra está diseñado como un sistema distribuido, para el despliegue de un gran número de nodos a través de múltiples centros de datos. La arquitectura distribuida de Cassandra esta diseñado para desplegarse sobre multiples data center, tener redundancia y recuperarse ante desastres.
  • 11.  Escalabilidad El rendimiento de leer y escribir aumenta linealmente a medida que se añaden nuevos nodos. Se pueden agregar nuevos nodos sin necesidad de interrumpir la ejecución de la aplicación.  Tolerancia a fallos Los datos se replican automáticamente a múltiples nodos para recuperarse frente a fallos. Cassandra soporta replicación a través de multiples datacenter. Se puede reemplazar nodos que presenten fallos sin tiempo de inactividad o interrupción de la aplicación.  Consistencia Se ofrece la elección de el nivel de consistencia para las lecturas y escrituras.
  • 12.  Soporte MapReduce Cassandra esta integrado con Apache Hadoop para soportar MapReduce. Tambien existe soporte para Apache Pig y Apache Hive.  Lenguaje de consulta Cassandra introduce CQL (Cassandra Query Language), una alternativa similar a SQL para la interfaz RPC tradicional. Existen drivers disponibles para Java (JDBC), Python (DBAPI2), Node.JS (Helenus), Go (gocql) and C++
  • 13. INSTALACION DE CASSANDRA Descargar el instalador de cassandra puedes encontrarlo en las siguientes páginas http://cassandra.apache.org/download/ http://www.datastax.com/download
  • 14.  Ejecutamos en instalador
  • 15.  Le damos click en siguiente
  • 16.  Aceptamos los términos de licencia
  • 17.  Elegimos la ruta donde se guarda la instalación
  • 18.  Para terminar le damos siguiente para que inicie en proceso de instalación
  • 19. Damos click en finalizar la instalación