O documento discute como o Apache Solr pode ser usado para melhorar a gestão da informação no Drupal. Ele explica o que é o Drupal e o Solr, como o Solr indexa e pesquisa diversos tipos de dados, e como ele pode ser integrado ao Drupal para fornecer funcionalidades avançadas de busca.
Apresentação de Seminário - Universidade Federal de Sergipe
Gestão da informação com apache solr e drupal
1. Gestão da Informação com
Apache Solr e Drupal
Pedro Rocha / SingleView
Sócio Diretor
pedrorocha@singleview.com.br
@pedrogomesrocha
Rio de Janeiro, 13 de Agosto de 2013
2. Sobre o que vamos falar
1. O que é o Drupal
2. O que é o Apache Solr
3. Como o Solr pode te ajudar na Gestão da Informação
4. Possibilidades e cases
5. Como integrá-lo ao Drupal
3. • Desde 2001 atuando com desenvolvimento web e novas tecnologias
• Participei de projetos nas áreas de webdesign, administração de servidores,
programação em Java e PHP, análise de sistemas, arquitetura de software e
gerenciamento de projetos
• Atuante na comunidade internacional de Drupal desde 2007
• Após usar diversas ferramentas como Wordpress, Joomla, Plone, Liferay,
Moodle, CakePHP, Code Igniter, JSF, J2EE, enxerguei um alto potencial no
Drupal e o defini como foco principal de estudos e projetos
• Mantenho módulos do Drupal, colaboro com patches, auxilio com dicas no
blog da SingleView e na lista de discussão da comunidade brasileira de
Drupal, além de apoiar comunidades open source em suas iniciativas
Quem sou
4. Pode ser chocante para muitos, mas o Drupal não é uma linguagem de
programação, nem um framework de código!
Ou seja, não faz sentido algum querer compará-lo com:
• Symfony, Cake PHP, Code Igniter, etc
• Rails, Ruby
• JSF / Java
• Web2py / Python
e tantas outras linguagens e frameworks por ai...
Drupal - Mitos e verdades
5. Se quisermos comparar o Drupal com algum outro projeto da mesma
“categoria”, talvez devamos olhar para:
Isso porque o Drupal é uma plataforma, também chamado de CMS. O
problema com CMS é ser muito vago, conseguindo a proeza de juntar
no mesmo saco projetos extremamente distintos, como os 4 exemplos
acima.
Drupal - Mitos e verdades
11. • Ferramenta para indexação e pesquisa de dados
• Interface web para consultas
• Integração via XML/HTTP/JSON
• Baseado no Apache Lucene
O que é o Apache Solr
13. 1. Indexa diversos tipos de dados
2. Filtros avançados de busca
3. Busca facetada
4. Busca fonética
5. Extensibilidade
Como ele pode te ajudar
14. 1 - Indexa diversos tipos de dados
• Textos pequenos e grandes
• Metadados de arquivos(PDF, DOC, MP3, JPG, etc)
• Coordenadas geográficas
• ...
Como ele pode te ajudar
15. 2 - Filtros avançados de busca
• Filtros condicionais
• Pesquisa com “wildcards”
• Pesquisa por proximidade
• Operadores booleanos
• ...
Como ele pode te ajudar
17. 4 - Busca fonética
Em geral, uma busca se baseia apenas na ortografia, que é
uma sequência de letras, como "J-o-ã-o", existindo alguns
tipos de alternativas simples, como desconsiderar acentos,
etc.
A busca fonética permite buscas como “Thaís” retornarem
“Taís”; “Carol” retornar “Karol”, e por ai em diante.
Como ele pode te ajudar
19. 1. Backend para buscas em sites
2. Backend para buscas em sistemas
3. Data Warehouse
4. Relatórios (data warehouse + busca facetada)
5. Apache Tika
6. Pesquisa em arquivos da rede
7. GED
8. Busca Federada
Possibilidades