PRESENTACIÓN PERSONAL TESIS AL MOMENTO DE HACER ESTE TRABAJO ERA ANÁLISIS, AHORA ES DISEÑO
INTRO PARA QUE TODOS ESTEMOS SINCRONIZADOS
WEB SEARCH MARKETPLACE USUARIOS FINALES Consumidores finales del producto PUBLICO Fuera de ámbito privado : empresa, etc
PERSONAL WINDOWS VISTA DEKSTOP SEARCH GOOGLE DESKTOP MARKETPLACE ORACLE ENTERPRISE SEARCH: EMAILS, INTRANET CORP GOOGLE APPLIANCE: INTRANET, PDFS, ETC USUARIOS FINALES Consumidores finales del producto PUBLICO Fuera de ámbito privado : empresa, etc
DESARROLLADORES Genéricos, cross problem domain Los usan los desarrolladores, no los usuarios finales TEXTO Corpus : documentos y campos Pensado para páginas web , libros , etc APACHE LUCENE , LUCENE.NET , SOLR , NUTCH , (OTROS)
DESARROLLADORES IGUAL QUE ANTES OBJETOS EL Corpus : OBJETOS Pensado para modelos de dominio y ORMs EJEMPLOS HIBERNATE SEARCH COMPASS LUCENE MODELO HÍBRIDO, HACEN MAPEO A DOCUMENTOS
DESARROLLADORES IGUAL QUE ANTES OBJETOS IGUAL QUE ANTES DIFERENCIA CON LO ANTERIOR PENSADO PARA OBJETOS, NO ES UN HACK HERENCIA, ASOCIACION, POLIMORFISMO ORMS NO DEPENDE DE NINGUNO
PUNTOS CLAVE ARTÍCULO ES ANÁLISIS, HOY HAY DISEÑO FRAMEWORK PARA SEARCH ENGINES HAY MODELOS DE DOMINIO APLICACIONES NUEVAS O EXISTENTES, INTEGRABLE
EL CONTEXTO TIENE 3 PATAS Domain Models Mapeos ORM Sistemas Enterprise
ACTIVIDADES SON LAS COSAS QUE HAY QUE RESOLVER ALGUNAS LAS RESUELVE EL SEARCH OTRAS LAS RESUELVE EL USUARIO
RANKING ESTRUCTURAL FOTO DEL SISTEMA HITS Y PAGERANK FUNCIONAN BIEN WEB, PUEDEN HACERLO EN OBJETOS DEPENDIENTE DEL NEGOCIO SI TENGO UN LINKEDIN VOY A HACER MI PROPIO ALGORITMO DE RELEVANCIA RANKING POR CORRELACIÓN DEPENDE DE LA QUERY PUNTUAL HAY MODELOS DE CLÁSICOS DE IR QUE SE PUEDEN USAR TÉCNICAS DE MATCHING SIEMPRE SON NECESARIAS ES BUENO DAR POSIBILIDAD DE AMPLIARLAS O CAMBIARLAS
Queremos independencia para:
Queremos independencia para:
Polución del código con anotaciones dependientes del framework Requiere acceso al source code para recompilarlo Modificación ’en caliente’ requiere recompilar el código y redesplegar ,
Agrega un arbol en la jungla de XMLs No aporta mucho más a la discusión
Es necesario poder reconocer cambios de estado UNIT OF WORK, CALLBACKS, etc Indexa apenas cambia estado de indexación (posibles valores de los campos indexables) IDX ONLINE: muchas actualizaciones en paralelo necesito mucho recursos o baja concurrencia