SlideShare ist ein Scribd-Unternehmen logo
1 von 6
Downloaden Sie, um offline zu lesen
Sistemas y Tecnología de IBM
Un White Paper de IBM
Febrero de 2011
Watson – Un sistema
Diseñado para Respuestas
El futuro del diseño de sistemas optimizados de cargas de trabajo
2 Watson – Un sistema diseñado para Respuestas
Resumen Ejecutivo
Durante el último siglo, IBM ha logrado varios descubrimientos
científicos gracias a su compromiso y su tradición de Grandes
Desafíos. Estos Grandes Desafíos (como ser Deep Blue®,
el cual fue diseñado para enfrentar al campeón mundial en
ajedrez, Gary Kasparov) hacen que la ciencia avance en formas
que se consideraban imposibles anteriormente. Watson es el
último Gran Desafío de IBM Research, diseñado para lograr
descubrimientos en la ciencia del procesamiento de lenguaje
natural por medio de los avances en cuestión y la tecnología de
respuestas.
Watson es un sistema optimizado de cargas de trabajo basado
en arquitectura IBM DeepQA la cual se ejecuta en un clúster
de servidores basados en el procesador IBM® POWER7®.
Después de cuatro años de investigación y desarrollo intensos
por un equipo de investigadores de IBM, Watson compitió en
Jeopardy! en febrero de 2011, rindiendo al nivel de expertos
humanos en términos de precisión, confianza y velocidad contra
dos de los Campeones de Jeopardy! más conocidos y exitosos,
Ken Jennings y Brad Rutter. Este white paper explica el diseño
del sistema optimizado de cargas de trabajo de Watson, por qué
es un emblema del futuro del diseño de sistemas, y por qué esto
representa un nuevo paradigma en computación.
Jeopardy! El desafío de IBM
En 1997, Deep Blue, el sistema de juego de ajedrez
computarizado desarrollado por IBM Research, captó la atención
mundial al competir con éxito contra el campeón en ajedrez Gary
Kasparov. Fue la culminación de un gran desafío para lograr
avances en la ciencia de la computación en una forma que captó
mucho interés popular.
Hoy en día, las compañías están capturando cada vez más
información fundamental de negocios en documentación
en lenguaje natural, por lo que hay un creciente interés en
sistemas optimizados de cargas de trabajo que analizan a fondo
el contenido de preguntas en lenguaje natural para responder
esas preguntas con precisión. Los avances en la tecnología
de respuesta a preguntas (QA) ayudarán cada vez más a los
profesionales a tomar decisiones fundamentales y oportunas en
áreas como la asistencia médica, la inteligencia empresarial, el
descubrimiento de conocimientos, la gestión de conocimientos
empresariales y la asistencia al cliente.
Con QA en mente, IBM se propuso un desafío para construir
un sistema computacional denominado “Watson” (en honor a
Thomas J. Watson, fundador de IBM), el cual pudo competir
al nivel de campeones humanos en tiempo real en el programa
de preguntas de la TV Americana Jeopardy! El programa, el
cual se transmite en los Estados Unidos desde hace más de 25
años, enfrenta a tres concursantes humanos entre sí para que
respondan preguntas en un lenguaje natural rico con respecto
a una amplia gama de tópicos, con penalidades por respuestas
Sistemas y Tecnología de IBM 3
incorrectas. En esta competencia de tres personas, la confianza,
precisión y velocidad de respuesta son de fundamental
importancia, ya que los participantes generalmente dan sus
respuestas en los pocos segundos que le lleva al presentador
leer una pista. Para competir en este juego a niveles de
campeones humanos, un sistema de computación debería
responder aproximadamente un 70 porciento de las preguntas
formuladas con una precisión mayor al 80 porciento en tres
segundos o menos.
Watson representa un impresionante avance en el diseño y la
analítica de sistemas. Ejecuta la tecnología DeepQA de IBM,
un nuevo tipo de capacidad analítica que puede realizar miles
de tareas simultáneas en segundos para brindar respuestas
precisas a las preguntas.
Watson funciona con tecnología del procesador IBM
POWER7, y es un ejemplo de las complejas cargas de trabajo
analíticas que son cada vez más comunes y fundamentales para
el éxito y la competitividad empresariales en el entorno de
muchos datos de hoy en día.
Watson compitió contra dos de los campeones más conocidos
y exitosos de Jeopardy! (Ken Jennings y Brad Rutter) en
una competencia de dos partidas emitidas en tres noches
consecutivas comenzando el 14 de febrero de 2011.
IBM DeepQA
DeepQA es una arquitectura basada en evidencia probabilística
masivamente paralela. Para el Desafío de Jeopardy!, se utilizan
más de 100 técnicas diferentes para analizar el lenguaje natural,
identificar fuentes, encontrar y generar hipótesis, buscar y
marcar evidencia, y unir y clasificar hipótesis. Mucho más
importante que cualquier otra técnica en particular es la forma
en que se combinan todas estas técnicas en DeepQA, de forma
que los enfoques superpuestos puedan aportar sus cualidades y
contribuir a mejoras en precisión, confianza o velocidad.
4 Watson – Un sistema diseñado para Respuestas
DeepQA es una arquitectura que viene junto con una
metodología, aunque no es específica para el Desafío
Jeopardy! IBM comenzó a adaptarla a diferentes aplicaciones
empresariales y problemas de desafíos de exploración, incluida
la medicina, la investigación empresarial y el juego.
Los principios globales en DeepQA son:
1.	 Paralelismo masivo: aproveche un paralelismo masivo en
la consideración de interpretaciones e hipótesis múltiples.
2.	 Muchos expertos: facilite la integración, aplicación y
evaluación contextual de una amplia variedad de analíticas
de preguntas y contenidos probabilísticos vagamente
asociados.
3.	 Valoración de confianza dominante: ningún
componente único se compromete a una respuesta;
todos los componentes producen funciones y confianzas
relacionadas, marcando diferentes interpretaciones
de preguntas y contenidos. Un sustrato subyacente de
procesamiento de confidencias aprende a acumular y
combinar los puntajes.
4.	 Integración de conocimiento superficial y profundo:
equilibre el uso de semántica estricta y semántica
superficial, aprovechando ontologías vagamente formadas.
Velocidad y Escalabilidad Horizontal
DeepQA se desarrolla utilizando Apache UIMA, una
implementación de marco de la Arquitectura de Gestión
de Información No Estructurada. UIMA fue diseñado para
soportar la interoperabilidad y escalabilidad horizontal de
aplicaciones de análisis multimodal y de texto. Todos los
componentes en DeepQA se implementan como anotadores
UIMA. Éstos son los componentes que analizan texto y
producen anotaciones o afirmaciones acerca del texto. Con el
tiempo, Watson evolucionó, por lo que ahora el sistema cuenta
con cientos de componentes. UIMA facilitó una integración,
prueba y evaluación rápidas de componentes.
Las primeras implementaciones de Watson se ejecutaron en un
solo procesador, el cual necesitó de dos horas para responder
a una sola pregunta. No obstante, la computación de DeepQA
es muy paralela, por lo que puede dividirse en una cantidad de
partes independientes, cada una de las cuales puede ejecutarse
por un procesador por separado. UIMA-AS, el cual es parte
de Apache UIMA, permite la escalabilidad horizontal de
aplicaciones UIMA utilizando mensajería asíncrona. Watson
utiliza UIMA-AS para obtener una escalabilidad horizontal
en 2.800 núcleos POWER7 en un clúster de 90 servidores
IBM Power® 750. UIMA_AS gestiona toda su comunicación
entre procesos, utilizando el estándar JMS abierto. La
implementación de UIMA-AS en POWER7 le permitió a
Watson proporcionar respuestas de uno a seis segundos.
Watson tiene aproximadamente 200 millones de páginas con
contenido de lenguaje natural (equivalente a la lectura de 1
millón de libros). Watson utiliza el marco Apache Hadoop
para facilitar el preprocesamiento de grandes volúmenes de
datos para crear conjuntos de datos en la memoria utilizados
durante el tiempo de ejecución. Los anotadores DeepQA
UIMA de Watson fueron implementados como asignadores en
la infraestructura map-reduce de Hadoop, la cual los distribuyó
en todos los procesadores del clúster. Hadoop contribuye
a un óptimo uso del CPU y también brinda herramientas
convenientes para implementar, gestionar y monitorear el
proceso de análisis de datos.
Aprovechar el POWER7
Watson aprovecha el desempeño de procesamiento paralelo
masivo de sus procesadores POWER7 para ejecutar sus
miles de tareas de DeepQA simultáneamente en núcleos de
procesadores individuales. Cada uno de los 90 servidores
IBM Power 750 basados en clústeres cuenta con 32 núcleos
POWER7 ejecutándose a 3.55 GHz. Los servidores ejecutan el
sistema operativo Linux®, y se ubican en 10 bastidores junto
con los nodos I/O y los hubs de comunicación relacionados.
El sistema cuenta con un total combinado de 16 Terabytes
de memoria y puede funcionar a 80 Teraflops (trillones de
operaciones por segundo).
Con su diseño innovador con procesador de 8 núcleos,
POWER7 es ideal para un procesamiento masivamente paralelo
de algoritmos analíticos de Watson. POWER7 también cuenta
con 500 gigabytes con un ancho de banda de comunicaciones
en chip, lo cual contribuye a una eficiencia excepcional de
utilización tanto de la memoria como del procesador. Y debido
a que cada servidor cuenta con 32 núcleos POWER7 de alto
rendimiento con hasta 512 GB de memoria, el Power 750
es una plataforma ideal para el procesador de Watson y los
procesos Java que necesitan de mucha memoria.
Sistemas y Tecnología de IBM 5
Diseñar a Watson en servidores Power 750 disponibles
comercialmente fue una opción intencional para asegurarnos
una adopción más rápida de sistemas optimizados en industrias
como la asistencia médica y los servicios financieros. Esa meta
fue una diferencia fundamental entre Watson y Deep Blue,
la cual era una supercomputadora muy personalizada. Deep
Blue se basaba en una generación anterior de tecnología de
procesadores Power, la cual contaba con un único procesador
POWER2 de 120 MHz. Pero además de los procesadores
POWER2 normales, el desempeño de Deep Blue estaba
incrementado con 480 chips específicos de ajedrez.
El mismo servidor Power 750 utilizado por Watson ya se
implementa en la actualidad por miles de organizaciones en
sistemas optimizados que brindan tanto analíticas complejas
como procesamiento de transacciones. La Universidad Rice de
Houston, Texas, por ejemplo, utiliza los sistemas IBM Power
750 para acelerar la comprensión de la base molecular del
cáncer por medio de la aplicación de tecnologías de análisis
de genomas. Los sistemas POWER7 le han dado a Rice más
flexibilidad y eficiencia, permitiéndoles buscar una mayor
variedad de desafíos de investigación en un solo sistema
que antes era posible. Y GHY International, una sociedad
de corretaje de aduana en Canadá, pasó a un nuevo Power
750 que ejecuta Power AIX®, Power i y Power Linux para
soportar mejor el mayor compromiso de sus clientes con el
comercio internacional. Con la virtualización PowerVM™,
GHY ahora puede implementar nuevas capacidades en tan solo
cinco minutos para soportar las necesidades cambiantes de sus
clientes.
Un sistema diseñado para respuestas
Después de cuatro años de investigación intensa y desarrollo
por un equipo de investigadores de IBM, Watson demostró
su habilidad para competir en Jeopardy! contra jugadores
campeones, con un desempeño al nivel de expertos humanos,
en términos de precisión, confianza y velocidad. El proyecto
avanzó en los campos de analítica de datos no estructurados,
procesamiento de lenguaje natural, y el diseño de sistemas
optimizados de cargas de trabajo. Además de Jeopardy!, la
tecnología con la que cuenta Watson se puede adaptar para
resolver problemas comerciales y sociales (por ejemplo,
diagnóstico de enfermedades, gestión en línea de preguntas
de soporte técnico y análisis gramatical de vastos extractos
de documentos legales) y para impulsar el progreso entre
industrias.
La capacidad de Watson de comprender el significado y
contexto del lenguaje humano, y de procesar información
rápidamente para encontrar respuestas precisas a preguntas
complejas, representa un enorme potencial para transformar la
forma en que las computadoras pueden ayudar a las personas a
cumplir tareas en los negocios y sus vidas personales.
Recicle
POW03061-USEN-00
Para más información
Para obtener más información acerca de Watson, POWER7 y
los sistemas optimizados de cargas de trabajo, entre en contacto
con su representante de marketing de IBM o su IBM Business
Partner, o visite los siguientes sitios web:
• ibm.com/systems/power/advantages/watson
• ibm.com/systems/power
© Copyright IBM Corporation 2011
IBM Systems and Technology Group
Route 100
Somers, NY 10589
Producido en los Estados Unidos de América
Febrero de 2011
Todos los Derechos Reservados
IBM, el logotipo de IBM, ibm.com, Power, POWER7 y DEEP BLUE
son marcas comerciales de International Business Machines Corporation
en los Estados Unidos, otros países o ambos. Si éstos u otros términos
registrados de IBM se marcan en su primera ocurrencia en esta información
con un símbolo de marca registrada (® o ™), estos símbolos indican marcas
comerciales registradas o de derecho consuetudinario de EE.UU., las cuales
son propiedad de IBM en el momento en que se publicó esta información.
Dichas marcas comerciales también pueden ser registradas o de derecho
consuetudinario en otros países. Podrá encontrar una lista de marcas
comerciales de IBM en la página “Información de Derechos de Autor y
Marcas Comerciales” en ibm.com/legal/copytrade.shtml
Otros nombres de compañías, productos o servicios pueden ser marcas
comerciales o de servicios de otros.

Weitere ähnliche Inhalte

Ähnlich wie Watson – un sistema diseñado para respuestas @ibm

Computación distribuida y su aplicación tecnológic
Computación distribuida y su aplicación tecnológicComputación distribuida y su aplicación tecnológic
Computación distribuida y su aplicación tecnológic
simeonhuamanchao
 
Proveedor[1]..
Proveedor[1]..Proveedor[1]..
Proveedor[1]..
blaze0002
 
Sgbd roberto escriche marcelo hualoto
Sgbd roberto escriche marcelo hualotoSgbd roberto escriche marcelo hualoto
Sgbd roberto escriche marcelo hualoto
Kenny24
 

Ähnlich wie Watson – un sistema diseñado para respuestas @ibm (20)

Ibm power linux on power - diseñados con innovación abierta para sacar el m...
Ibm power   linux on power - diseñados con innovación abierta para sacar el m...Ibm power   linux on power - diseñados con innovación abierta para sacar el m...
Ibm power linux on power - diseñados con innovación abierta para sacar el m...
 
Taller 2
Taller 2Taller 2
Taller 2
 
Actividad 1.6: Sistemas de Base de Datos Relacionales
Actividad 1.6: Sistemas de Base de Datos RelacionalesActividad 1.6: Sistemas de Base de Datos Relacionales
Actividad 1.6: Sistemas de Base de Datos Relacionales
 
Sistemas gestores de base de datos relacionales
Sistemas gestores de base de datos relacionalesSistemas gestores de base de datos relacionales
Sistemas gestores de base de datos relacionales
 
Sistemasgestoresdebasededatosrelacionales
SistemasgestoresdebasededatosrelacionalesSistemasgestoresdebasededatosrelacionales
Sistemasgestoresdebasededatosrelacionales
 
Brochure AFL Espanol
Brochure AFL EspanolBrochure AFL Espanol
Brochure AFL Espanol
 
TEMAS RELACIONADOS WEB2
TEMAS RELACIONADOS WEB2TEMAS RELACIONADOS WEB2
TEMAS RELACIONADOS WEB2
 
Oracle
OracleOracle
Oracle
 
Computación distribuida y su aplicación tecnológic
Computación distribuida y su aplicación tecnológicComputación distribuida y su aplicación tecnológic
Computación distribuida y su aplicación tecnológic
 
Computación distribuida y su aplicación tecnológic
Computación distribuida y su aplicación tecnológicComputación distribuida y su aplicación tecnológic
Computación distribuida y su aplicación tecnológic
 
Computación distribuida y su aplicación tecnológic
Computación distribuida y su aplicación tecnológicComputación distribuida y su aplicación tecnológic
Computación distribuida y su aplicación tecnológic
 
Proveedor[1]..
Proveedor[1]..Proveedor[1]..
Proveedor[1]..
 
Paquterías de ofimática
Paquterías de ofimáticaPaquterías de ofimática
Paquterías de ofimática
 
Act 3 inv costos
Act 3 inv costosAct 3 inv costos
Act 3 inv costos
 
Actividad #3. investigar en internet, vía telefónica o vía correo electrónico...
Actividad #3. investigar en internet, vía telefónica o vía correo electrónico...Actividad #3. investigar en internet, vía telefónica o vía correo electrónico...
Actividad #3. investigar en internet, vía telefónica o vía correo electrónico...
 
Sistemas de g base de datos
Sistemas de g base de datosSistemas de g base de datos
Sistemas de g base de datos
 
Sistemas de Gestion de Base de Datos
Sistemas de Gestion de Base de DatosSistemas de Gestion de Base de Datos
Sistemas de Gestion de Base de Datos
 
Sgbd roberto escriche marcelo hualoto
Sgbd roberto escriche marcelo hualotoSgbd roberto escriche marcelo hualoto
Sgbd roberto escriche marcelo hualoto
 
Oracle
OracleOracle
Oracle
 
Base de Datos - Daniela Monsalve
Base de Datos - Daniela MonsalveBase de Datos - Daniela Monsalve
Base de Datos - Daniela Monsalve
 

Mehr von Diego Alberto Tamayo

Mehr von Diego Alberto Tamayo (20)

11 best practices for #mobile device management ( #mdm ) https /www-01.ibm.c...
11 best practices for #mobile device management ( #mdm )  https /www-01.ibm.c...11 best practices for #mobile device management ( #mdm )  https /www-01.ibm.c...
11 best practices for #mobile device management ( #mdm ) https /www-01.ibm.c...
 
Ibm white paper_harnessing_ap_is_and_platforms_0
Ibm white paper_harnessing_ap_is_and_platforms_0Ibm white paper_harnessing_ap_is_and_platforms_0
Ibm white paper_harnessing_ap_is_and_platforms_0
 
1. ibm blockchain explained
1. ibm blockchain explained1. ibm blockchain explained
1. ibm blockchain explained
 
Hybrid connectivity
Hybrid connectivityHybrid connectivity
Hybrid connectivity
 
Ibm systems servidor linux power8 de 1u ibm power system s821 lc un servidor ...
Ibm systems servidor linux power8 de 1u ibm power system s821 lc un servidor ...Ibm systems servidor linux power8 de 1u ibm power system s821 lc un servidor ...
Ibm systems servidor linux power8 de 1u ibm power system s821 lc un servidor ...
 
Blockchain powering the internet of value
Blockchain powering the internet of value  Blockchain powering the internet of value
Blockchain powering the internet of value
 
Blockchain technology amplify your enterprise / IBM
Blockchain technology amplify your enterprise / IBMBlockchain technology amplify your enterprise / IBM
Blockchain technology amplify your enterprise / IBM
 
Blockchain the chain of trust and its potential / IBM
Blockchain the chain of trust and its potential / IBMBlockchain the chain of trust and its potential / IBM
Blockchain the chain of trust and its potential / IBM
 
Blockchain rewires financial markets / IBM
Blockchain  rewires financial markets / IBMBlockchain  rewires financial markets / IBM
Blockchain rewires financial markets / IBM
 
Ibm elastic storage server moderno sistema de almacenamiento definido por s...
Ibm elastic storage server   moderno sistema de almacenamiento definido por s...Ibm elastic storage server   moderno sistema de almacenamiento definido por s...
Ibm elastic storage server moderno sistema de almacenamiento definido por s...
 
Ibm flash system a9000 una solución todo f lash altamente paralela para empre...
Ibm flash system a9000 una solución todo f lash altamente paralela para empre...Ibm flash system a9000 una solución todo f lash altamente paralela para empre...
Ibm flash system a9000 una solución todo f lash altamente paralela para empre...
 
IBM Object Storage and Software Defined Solutions - Cleversafe
IBM Object Storage and Software Defined Solutions - CleversafeIBM Object Storage and Software Defined Solutions - Cleversafe
IBM Object Storage and Software Defined Solutions - Cleversafe
 
COLDCHAIN“Bringing high-quality vaccines and refrigerated medicine to patient...
COLDCHAIN“Bringing high-quality vaccines and refrigerated medicine to patient...COLDCHAIN“Bringing high-quality vaccines and refrigerated medicine to patient...
COLDCHAIN“Bringing high-quality vaccines and refrigerated medicine to patient...
 
Ibm power systems hpc cluster
Ibm power systems hpc cluster Ibm power systems hpc cluster
Ibm power systems hpc cluster
 
Driving client value through hybrid cloud - IBM
Driving client value through hybrid cloud - IBMDriving client value through hybrid cloud - IBM
Driving client value through hybrid cloud - IBM
 
Global location trends 2016 annual report by IBM
Global location trends 2016 annual report by IBMGlobal location trends 2016 annual report by IBM
Global location trends 2016 annual report by IBM
 
Learning to trust artificial intelligence systems accountability, compliance ...
Learning to trust artificial intelligence systems accountability, compliance ...Learning to trust artificial intelligence systems accountability, compliance ...
Learning to trust artificial intelligence systems accountability, compliance ...
 
The ecosystem equation collaboration in the connected economy @harvard biz @i...
The ecosystem equation collaboration in the connected economy @harvard biz @i...The ecosystem equation collaboration in the connected economy @harvard biz @i...
The ecosystem equation collaboration in the connected economy @harvard biz @i...
 
Device democracy -Saving the future of the #InternetOfThings @IBMIBV
Device democracy -Saving the future of the #InternetOfThings  @IBMIBV Device democracy -Saving the future of the #InternetOfThings  @IBMIBV
Device democracy -Saving the future of the #InternetOfThings @IBMIBV
 
The cognitive advantage insights from early adopters on driving business va...
The cognitive advantage   insights from early adopters on driving business va...The cognitive advantage   insights from early adopters on driving business va...
The cognitive advantage insights from early adopters on driving business va...
 

Kürzlich hochgeladen

EPA-pdf resultado da prova presencial Uninove
EPA-pdf resultado da prova presencial UninoveEPA-pdf resultado da prova presencial Uninove
EPA-pdf resultado da prova presencial Uninove
FagnerLisboa3
 
Modulo-Mini Cargador.................pdf
Modulo-Mini Cargador.................pdfModulo-Mini Cargador.................pdf
Modulo-Mini Cargador.................pdf
AnnimoUno1
 

Kürzlich hochgeladen (11)

PROYECTO FINAL. Tutorial para publicar en SlideShare.pptx
PROYECTO FINAL. Tutorial para publicar en SlideShare.pptxPROYECTO FINAL. Tutorial para publicar en SlideShare.pptx
PROYECTO FINAL. Tutorial para publicar en SlideShare.pptx
 
Resistencia extrema al cobre por un consorcio bacteriano conformado por Sulfo...
Resistencia extrema al cobre por un consorcio bacteriano conformado por Sulfo...Resistencia extrema al cobre por un consorcio bacteriano conformado por Sulfo...
Resistencia extrema al cobre por un consorcio bacteriano conformado por Sulfo...
 
Avances tecnológicos del siglo XXI 10-07 eyvana
Avances tecnológicos del siglo XXI 10-07 eyvanaAvances tecnológicos del siglo XXI 10-07 eyvana
Avances tecnológicos del siglo XXI 10-07 eyvana
 
EPA-pdf resultado da prova presencial Uninove
EPA-pdf resultado da prova presencial UninoveEPA-pdf resultado da prova presencial Uninove
EPA-pdf resultado da prova presencial Uninove
 
EL CICLO PRÁCTICO DE UN MOTOR DE CUATRO TIEMPOS.pptx
EL CICLO PRÁCTICO DE UN MOTOR DE CUATRO TIEMPOS.pptxEL CICLO PRÁCTICO DE UN MOTOR DE CUATRO TIEMPOS.pptx
EL CICLO PRÁCTICO DE UN MOTOR DE CUATRO TIEMPOS.pptx
 
Innovaciones tecnologicas en el siglo 21
Innovaciones tecnologicas en el siglo 21Innovaciones tecnologicas en el siglo 21
Innovaciones tecnologicas en el siglo 21
 
Avances tecnológicos del siglo XXI y ejemplos de estos
Avances tecnológicos del siglo XXI y ejemplos de estosAvances tecnológicos del siglo XXI y ejemplos de estos
Avances tecnológicos del siglo XXI y ejemplos de estos
 
pruebas unitarias unitarias en java con JUNIT
pruebas unitarias unitarias en java con JUNITpruebas unitarias unitarias en java con JUNIT
pruebas unitarias unitarias en java con JUNIT
 
Refrigerador_Inverter_Samsung_Curso_y_Manual_de_Servicio_Español.pdf
Refrigerador_Inverter_Samsung_Curso_y_Manual_de_Servicio_Español.pdfRefrigerador_Inverter_Samsung_Curso_y_Manual_de_Servicio_Español.pdf
Refrigerador_Inverter_Samsung_Curso_y_Manual_de_Servicio_Español.pdf
 
How to use Redis with MuleSoft. A quick start presentation.
How to use Redis with MuleSoft. A quick start presentation.How to use Redis with MuleSoft. A quick start presentation.
How to use Redis with MuleSoft. A quick start presentation.
 
Modulo-Mini Cargador.................pdf
Modulo-Mini Cargador.................pdfModulo-Mini Cargador.................pdf
Modulo-Mini Cargador.................pdf
 

Watson – un sistema diseñado para respuestas @ibm

  • 1. Sistemas y Tecnología de IBM Un White Paper de IBM Febrero de 2011 Watson – Un sistema Diseñado para Respuestas El futuro del diseño de sistemas optimizados de cargas de trabajo
  • 2. 2 Watson – Un sistema diseñado para Respuestas Resumen Ejecutivo Durante el último siglo, IBM ha logrado varios descubrimientos científicos gracias a su compromiso y su tradición de Grandes Desafíos. Estos Grandes Desafíos (como ser Deep Blue®, el cual fue diseñado para enfrentar al campeón mundial en ajedrez, Gary Kasparov) hacen que la ciencia avance en formas que se consideraban imposibles anteriormente. Watson es el último Gran Desafío de IBM Research, diseñado para lograr descubrimientos en la ciencia del procesamiento de lenguaje natural por medio de los avances en cuestión y la tecnología de respuestas. Watson es un sistema optimizado de cargas de trabajo basado en arquitectura IBM DeepQA la cual se ejecuta en un clúster de servidores basados en el procesador IBM® POWER7®. Después de cuatro años de investigación y desarrollo intensos por un equipo de investigadores de IBM, Watson compitió en Jeopardy! en febrero de 2011, rindiendo al nivel de expertos humanos en términos de precisión, confianza y velocidad contra dos de los Campeones de Jeopardy! más conocidos y exitosos, Ken Jennings y Brad Rutter. Este white paper explica el diseño del sistema optimizado de cargas de trabajo de Watson, por qué es un emblema del futuro del diseño de sistemas, y por qué esto representa un nuevo paradigma en computación. Jeopardy! El desafío de IBM En 1997, Deep Blue, el sistema de juego de ajedrez computarizado desarrollado por IBM Research, captó la atención mundial al competir con éxito contra el campeón en ajedrez Gary Kasparov. Fue la culminación de un gran desafío para lograr avances en la ciencia de la computación en una forma que captó mucho interés popular. Hoy en día, las compañías están capturando cada vez más información fundamental de negocios en documentación en lenguaje natural, por lo que hay un creciente interés en sistemas optimizados de cargas de trabajo que analizan a fondo el contenido de preguntas en lenguaje natural para responder esas preguntas con precisión. Los avances en la tecnología de respuesta a preguntas (QA) ayudarán cada vez más a los profesionales a tomar decisiones fundamentales y oportunas en áreas como la asistencia médica, la inteligencia empresarial, el descubrimiento de conocimientos, la gestión de conocimientos empresariales y la asistencia al cliente. Con QA en mente, IBM se propuso un desafío para construir un sistema computacional denominado “Watson” (en honor a Thomas J. Watson, fundador de IBM), el cual pudo competir al nivel de campeones humanos en tiempo real en el programa de preguntas de la TV Americana Jeopardy! El programa, el cual se transmite en los Estados Unidos desde hace más de 25 años, enfrenta a tres concursantes humanos entre sí para que respondan preguntas en un lenguaje natural rico con respecto a una amplia gama de tópicos, con penalidades por respuestas
  • 3. Sistemas y Tecnología de IBM 3 incorrectas. En esta competencia de tres personas, la confianza, precisión y velocidad de respuesta son de fundamental importancia, ya que los participantes generalmente dan sus respuestas en los pocos segundos que le lleva al presentador leer una pista. Para competir en este juego a niveles de campeones humanos, un sistema de computación debería responder aproximadamente un 70 porciento de las preguntas formuladas con una precisión mayor al 80 porciento en tres segundos o menos. Watson representa un impresionante avance en el diseño y la analítica de sistemas. Ejecuta la tecnología DeepQA de IBM, un nuevo tipo de capacidad analítica que puede realizar miles de tareas simultáneas en segundos para brindar respuestas precisas a las preguntas. Watson funciona con tecnología del procesador IBM POWER7, y es un ejemplo de las complejas cargas de trabajo analíticas que son cada vez más comunes y fundamentales para el éxito y la competitividad empresariales en el entorno de muchos datos de hoy en día. Watson compitió contra dos de los campeones más conocidos y exitosos de Jeopardy! (Ken Jennings y Brad Rutter) en una competencia de dos partidas emitidas en tres noches consecutivas comenzando el 14 de febrero de 2011. IBM DeepQA DeepQA es una arquitectura basada en evidencia probabilística masivamente paralela. Para el Desafío de Jeopardy!, se utilizan más de 100 técnicas diferentes para analizar el lenguaje natural, identificar fuentes, encontrar y generar hipótesis, buscar y marcar evidencia, y unir y clasificar hipótesis. Mucho más importante que cualquier otra técnica en particular es la forma en que se combinan todas estas técnicas en DeepQA, de forma que los enfoques superpuestos puedan aportar sus cualidades y contribuir a mejoras en precisión, confianza o velocidad.
  • 4. 4 Watson – Un sistema diseñado para Respuestas DeepQA es una arquitectura que viene junto con una metodología, aunque no es específica para el Desafío Jeopardy! IBM comenzó a adaptarla a diferentes aplicaciones empresariales y problemas de desafíos de exploración, incluida la medicina, la investigación empresarial y el juego. Los principios globales en DeepQA son: 1. Paralelismo masivo: aproveche un paralelismo masivo en la consideración de interpretaciones e hipótesis múltiples. 2. Muchos expertos: facilite la integración, aplicación y evaluación contextual de una amplia variedad de analíticas de preguntas y contenidos probabilísticos vagamente asociados. 3. Valoración de confianza dominante: ningún componente único se compromete a una respuesta; todos los componentes producen funciones y confianzas relacionadas, marcando diferentes interpretaciones de preguntas y contenidos. Un sustrato subyacente de procesamiento de confidencias aprende a acumular y combinar los puntajes. 4. Integración de conocimiento superficial y profundo: equilibre el uso de semántica estricta y semántica superficial, aprovechando ontologías vagamente formadas. Velocidad y Escalabilidad Horizontal DeepQA se desarrolla utilizando Apache UIMA, una implementación de marco de la Arquitectura de Gestión de Información No Estructurada. UIMA fue diseñado para soportar la interoperabilidad y escalabilidad horizontal de aplicaciones de análisis multimodal y de texto. Todos los componentes en DeepQA se implementan como anotadores UIMA. Éstos son los componentes que analizan texto y producen anotaciones o afirmaciones acerca del texto. Con el tiempo, Watson evolucionó, por lo que ahora el sistema cuenta con cientos de componentes. UIMA facilitó una integración, prueba y evaluación rápidas de componentes. Las primeras implementaciones de Watson se ejecutaron en un solo procesador, el cual necesitó de dos horas para responder a una sola pregunta. No obstante, la computación de DeepQA es muy paralela, por lo que puede dividirse en una cantidad de partes independientes, cada una de las cuales puede ejecutarse por un procesador por separado. UIMA-AS, el cual es parte de Apache UIMA, permite la escalabilidad horizontal de aplicaciones UIMA utilizando mensajería asíncrona. Watson utiliza UIMA-AS para obtener una escalabilidad horizontal en 2.800 núcleos POWER7 en un clúster de 90 servidores IBM Power® 750. UIMA_AS gestiona toda su comunicación entre procesos, utilizando el estándar JMS abierto. La implementación de UIMA-AS en POWER7 le permitió a Watson proporcionar respuestas de uno a seis segundos. Watson tiene aproximadamente 200 millones de páginas con contenido de lenguaje natural (equivalente a la lectura de 1 millón de libros). Watson utiliza el marco Apache Hadoop para facilitar el preprocesamiento de grandes volúmenes de datos para crear conjuntos de datos en la memoria utilizados durante el tiempo de ejecución. Los anotadores DeepQA UIMA de Watson fueron implementados como asignadores en la infraestructura map-reduce de Hadoop, la cual los distribuyó en todos los procesadores del clúster. Hadoop contribuye a un óptimo uso del CPU y también brinda herramientas convenientes para implementar, gestionar y monitorear el proceso de análisis de datos. Aprovechar el POWER7 Watson aprovecha el desempeño de procesamiento paralelo masivo de sus procesadores POWER7 para ejecutar sus miles de tareas de DeepQA simultáneamente en núcleos de procesadores individuales. Cada uno de los 90 servidores IBM Power 750 basados en clústeres cuenta con 32 núcleos POWER7 ejecutándose a 3.55 GHz. Los servidores ejecutan el sistema operativo Linux®, y se ubican en 10 bastidores junto con los nodos I/O y los hubs de comunicación relacionados. El sistema cuenta con un total combinado de 16 Terabytes de memoria y puede funcionar a 80 Teraflops (trillones de operaciones por segundo). Con su diseño innovador con procesador de 8 núcleos, POWER7 es ideal para un procesamiento masivamente paralelo de algoritmos analíticos de Watson. POWER7 también cuenta con 500 gigabytes con un ancho de banda de comunicaciones en chip, lo cual contribuye a una eficiencia excepcional de utilización tanto de la memoria como del procesador. Y debido a que cada servidor cuenta con 32 núcleos POWER7 de alto rendimiento con hasta 512 GB de memoria, el Power 750 es una plataforma ideal para el procesador de Watson y los procesos Java que necesitan de mucha memoria.
  • 5. Sistemas y Tecnología de IBM 5 Diseñar a Watson en servidores Power 750 disponibles comercialmente fue una opción intencional para asegurarnos una adopción más rápida de sistemas optimizados en industrias como la asistencia médica y los servicios financieros. Esa meta fue una diferencia fundamental entre Watson y Deep Blue, la cual era una supercomputadora muy personalizada. Deep Blue se basaba en una generación anterior de tecnología de procesadores Power, la cual contaba con un único procesador POWER2 de 120 MHz. Pero además de los procesadores POWER2 normales, el desempeño de Deep Blue estaba incrementado con 480 chips específicos de ajedrez. El mismo servidor Power 750 utilizado por Watson ya se implementa en la actualidad por miles de organizaciones en sistemas optimizados que brindan tanto analíticas complejas como procesamiento de transacciones. La Universidad Rice de Houston, Texas, por ejemplo, utiliza los sistemas IBM Power 750 para acelerar la comprensión de la base molecular del cáncer por medio de la aplicación de tecnologías de análisis de genomas. Los sistemas POWER7 le han dado a Rice más flexibilidad y eficiencia, permitiéndoles buscar una mayor variedad de desafíos de investigación en un solo sistema que antes era posible. Y GHY International, una sociedad de corretaje de aduana en Canadá, pasó a un nuevo Power 750 que ejecuta Power AIX®, Power i y Power Linux para soportar mejor el mayor compromiso de sus clientes con el comercio internacional. Con la virtualización PowerVM™, GHY ahora puede implementar nuevas capacidades en tan solo cinco minutos para soportar las necesidades cambiantes de sus clientes. Un sistema diseñado para respuestas Después de cuatro años de investigación intensa y desarrollo por un equipo de investigadores de IBM, Watson demostró su habilidad para competir en Jeopardy! contra jugadores campeones, con un desempeño al nivel de expertos humanos, en términos de precisión, confianza y velocidad. El proyecto avanzó en los campos de analítica de datos no estructurados, procesamiento de lenguaje natural, y el diseño de sistemas optimizados de cargas de trabajo. Además de Jeopardy!, la tecnología con la que cuenta Watson se puede adaptar para resolver problemas comerciales y sociales (por ejemplo, diagnóstico de enfermedades, gestión en línea de preguntas de soporte técnico y análisis gramatical de vastos extractos de documentos legales) y para impulsar el progreso entre industrias. La capacidad de Watson de comprender el significado y contexto del lenguaje humano, y de procesar información rápidamente para encontrar respuestas precisas a preguntas complejas, representa un enorme potencial para transformar la forma en que las computadoras pueden ayudar a las personas a cumplir tareas en los negocios y sus vidas personales.
  • 6. Recicle POW03061-USEN-00 Para más información Para obtener más información acerca de Watson, POWER7 y los sistemas optimizados de cargas de trabajo, entre en contacto con su representante de marketing de IBM o su IBM Business Partner, o visite los siguientes sitios web: • ibm.com/systems/power/advantages/watson • ibm.com/systems/power © Copyright IBM Corporation 2011 IBM Systems and Technology Group Route 100 Somers, NY 10589 Producido en los Estados Unidos de América Febrero de 2011 Todos los Derechos Reservados IBM, el logotipo de IBM, ibm.com, Power, POWER7 y DEEP BLUE son marcas comerciales de International Business Machines Corporation en los Estados Unidos, otros países o ambos. Si éstos u otros términos registrados de IBM se marcan en su primera ocurrencia en esta información con un símbolo de marca registrada (® o ™), estos símbolos indican marcas comerciales registradas o de derecho consuetudinario de EE.UU., las cuales son propiedad de IBM en el momento en que se publicó esta información. Dichas marcas comerciales también pueden ser registradas o de derecho consuetudinario en otros países. Podrá encontrar una lista de marcas comerciales de IBM en la página “Información de Derechos de Autor y Marcas Comerciales” en ibm.com/legal/copytrade.shtml Otros nombres de compañías, productos o servicios pueden ser marcas comerciales o de servicios de otros.