Diese Präsentation wurde erfolgreich gemeldet.
Wir verwenden Ihre LinkedIn Profilangaben und Informationen zu Ihren Aktivitäten, um Anzeigen zu personalisieren und Ihnen relevantere Inhalte anzuzeigen. Sie können Ihre Anzeigeneinstellungen jederzeit ändern.

Tarea 3 del second period...ok.

284 Aufrufe

Veröffentlicht am

la tabla comparativa

  • Login to see the comments

  • Gehören Sie zu den Ersten, denen das gefällt!

Tarea 3 del second period...ok.

  1. 1. INSTITUTO NACIONAL TEXISTEPEQUEINTEXTOPIC: MINING DATA, BIG DATA, CLOUD COMPUTINGENCARGADO: HJALMAR HERNANDEZINVESTIGADORES:RAFAEL ALBERTO CASTRO ORELLANAWALTER ERNESTO MONTEJO JOVELGRADO: TERCERO CONTADORTAREA NUMERO TRESFECHA: 06 de mayo de 2013BODYMINING DATA BIG DATA CLOUD COMPUTINGSIMILITUDESData Mining, la extracción deinformación oculta ypredecible de grandes basesde datos,Almacena grandescantidades de informacióny datos…es una tendencia tecnológica que estásignificando una gran revolución en todo elmundo. Pero como cualquier fenómeno,presenta sus oportunidades y amenazas que sonimportantes conocer.DIFERENCIAS Big data no se presta bien aser domesticado por lastécnicas de gestión de datosestándar, simplementedebido a sus combinacionesinconsistentes eimpredecibles.VENTAJAS- es unao Reducción de costos: No hay necesidad de
  2. 2. Poderosa tecnología nuevacon gran potencial paraayudar a las compañías aconcentrarse en lainformación más importantede sus Bases de Información-Las herramientas de DataMining predicen futurastendencias ycomportamientos,permitiendo enlos negocios tomar decisionesproactivas.- pueden analizar bases dedatos masivas para brindarrespuesta a preguntas talescomo,"¿Cuáles clientes tienenmás probabilidad deresponder al próximo mailingpromocional, y por qué?- presentar los resultados enformas de tablas, congráficos, reportes, texto,hipertexto, etc-está soportado por trestecnologías que ya estánsuficientemente maduras:Recolección masiva dedatosPotentes computadorascon multiprocesadoresAlgoritmos de Data MiningBRINDA CAPACIDADESCOMO:Predicción automatizada detendencias ycomportamientos. DataMining automatiza el procesode encontrar informaciónpredecible en grandes basesde datos. Preguntas quetradicionalmente requeríanun intenso análisis manual,-Es una referencia a lossistemas que manipulangrandes conjuntos.-aplicado a conjuntos dedatos que superan lacapacidad del softwarehabitual para sercapturados, gestionados yprocesados en un tiemporazonable.-Los tamaños del "big data"se encuentranconstantemente enmovimiento creciente.-el crecimiento constante dedatos como unaoportunidad y reto parainvestigar en el volumen, lavelocidad y la variedad.Gartner continúa usando bigdata como referencia deeste.-Las máquinas modernas,tales como automóviles,trenes, centrales eléctricas yaviones todos se aumenta elnúmero de sensores derecolección constantementegrandes cantidades dedatos. Es común hablar detener miles o incluso cientosde miles de sensores detodo recogiendoinformación sobre elfuncionamiento y lasactividades de una máquina.adquirir hardware y software lo que reducecostos operativos en infraestructura,mantenimiento y energía. La nube es más barataque la instalación y mantenimiento de unservidor propio o contratar los servicios de unproveedor.o Flexibilidad: El servicio de nube se paga deacuerdo a la demanda. Si, por ejemplo, unaempresa los días treinta incrementa elmovimiento de su área contable y financiera porpagos a empleados y proveedores, puededecidir que requiere mayor capacidad deproceso o de almacenamiento de datos, ypagará por una mayor demanda, pero sólo el día30.o Movilidad: Los datos de una empresa al quedaralojados en la nube pueden ser consultados porlos empleados desde cualquier lugar. Estacaracterística está significando un crecimientodel teletrabajo con todos sus efectos de tipoeconómico, social e incluso, inmobiliario.o Focalización: Cloud Computing permite a lascompañías centrarse en su corebusiness,negocio principal. En vez de hacer una altainversión tecnológica en sistemas, una empresapodría invertir en su infraestructura industrial ofísica o en capital humano para proseguir susplanes de expansióno Ecología: Usar la nube en una empresa reduce lahuella de carbono de una empresa al ahorrarrecursos y componentes que pasan de estaralmacenados en componentes físicos a servirtuales. Se ahorra también en consumo deenergía con sus beneficios al medio ambiente.
  3. 3. ahora pueden ser contestadasdirecta y rápidamente desdelos datos.Descubrimientoautomatizadode modelos previamentedesconocidos. Otrosproblemas de descubrimientode modelos incluye detectartransacciones fraudulentasde tarjetas de créditos eidentificar datosanormales que puedenrepresentar errores detipeado en la carga de datos.Las bases de datos pueden sergrandes tanto en profundidadcomo en ancho:Más columnasUn DataMining de altorendimiento permite a losusuarios explorar toda labase de datos, sinpreseleccionar unsubconjunto de variables.Más filas. Muestrasmayores producen menoserrores de estimación ydesvíos, y permite a losusuarios hacer inferenciasacerca de pequeños peroimportantes segmentos depoblación., detección de fraudes,lanzamiento de nuevosproductos, etc.-Los datos enviados desdecientos de miles de sensoresen un avión es de grandesvolúmenes de datos. Sinembargo, el tamaño delconjunto de datos no es tangrande como podríaesperarse. Hasta cien milsensores, cada unaproduciendo un byte deocho leer cada segundo seproducen menos de 3 GB dedatos en una hora de vuelo(100.000 sensores x 60minutos x 60 segundos x 8bytes).-Hay un número crecientede sistemas que generangrandes cantidades de datosmuy simples. Por ejemplo,los medios de transmisiónes la generación de grandesvolúmenes con cantidadescrecientes de metadatosestructurados. Del mismomodo, las empresas detelecomunicaciones tienenque rastrear grandesvolúmenes de llamadas yconexiones a Internet.Incluso si estas dosactividades se combinan, ypeta bytes de datos seproduce, el contenido esmuy estructurado. Como losmotores de búsqueda, comoGoogle y bases de datosrelacionales handemostrado, los conjuntosde datos se pueden analizarmuy rápidamente si elcontenido está bienestructurado. A pesar deque estos datos songrandes, no es "grande" enla misma forma que los
  4. 4. datos procedentes de lossensores de la máquina enel ejemplo anterior.DESVENTAJASLas dificultades máshabituales en estos casos secentran en la captura, elalmacenado,búsqueda,compartición, análisis, yvisualización.El tamaño es unacaracterística de los grandesvolúmenes de datos.La respuesta está en elnúmero de fuentes de datosindependientes, cada unocon el potencial deinteractuar.Otro atributo de los grandesvolúmenes de datos es sutendencia a ser difícil deeliminar lo que la privacidadde un interés común. Porejemplo, es casi imposiblepara purgar todos los datosasociados con un conductorde coche de individuo apartir de datos deautopistas de peaje. Loscaptadores de recuento delnúmero de automóviles yano equilibrar con losregistros de facturaciónindividuales que, a su vez,no se correspondería con lospagos recibidos por laempresa.La centralización de las aplicaciones y elalmacenamiento de los datos origina unainterdependencia de los proveedores deservicios.La disponibilidad de las aplicaciones estáligada a la disponibilidad de accesoa Internet.Los datos "sensibles" del negocio no residenen las instalaciones de las empresas, lo quepodría generar un contexto de altavulnerabilidad para la sustracción o robo deinformación.La confiabilidad de los servicios depende dela "salud" tecnológica y financiera de losproveedores de servicios en nube. Empresasemergentes o alianzas entre empresaspodrían crear un ambiente propicio para elmonopolio y el crecimiento exagerado enlos servicios.4La disponibilidad de servicios altamenteespecializados podría tardar meses o inclusoaños para que sean factibles de serdesplegados en la red.La madurez funcional de las aplicacioneshace que continuamente estén modificandosus interfaces, por lo cual la curva deaprendizaje en empresas de orientación notecnológica tenga unas pendientessignificativas, así como su consumoautomático por aplicaciones.Seguridad. La información de la empresadebe recorrer diferentes nodos para llegar asu destino, cada uno de ellos (y sus canales)son un foco de inseguridad. Si se utilizanprotocolos seguros, HTTPS por ejemplo, la
  5. 5. velocidad total disminuye debido a lasobrecarga que éstos requieren.Escalabilidad a largo plazo. A medida quemás usuarios empiecen a compartir lainfraestructura de la nube, la sobrecarga enlos servidores de los proveedoresaumentará, si la empresa no posee unesquema de crecimiento óptimo puedellevar a degradaciones en el servicio o altosniveles de jitter.
  6. 6. Bibliografíahttp://www.monografias.com/trabajos/datamining/datamining.shtmlhttp://www.anderson.ucla.edu/faculty/jason.frand/teacher/technologies/palace/datamining.htmhttp://mike2.openmethodology.org/wiki/Big_Data_Definition#Big_data_that_is_very_small

×