SlideShare ist ein Scribd-Unternehmen logo
1 von 24
Downloaden Sie, um offline zu lesen
Introdução OCR
Universidade Lusíada de Angola 
Sistemas Multimídia 
Tema: OCR (Optical Character Recognition) 
Membros: 
● Lewis Gomes 
● Rui Pinto 
● Suely Nassola 
Docente: Dr. Adjah da Cruz
O que é o OCR?
OCR, do inglês Optical Character Recognition Reconhecimento 
Ótico de Caracteres), é um método aplicado de maneira a 
permitir que o conteúdo escrito em um documento no formato 
de imagem seja reconhecido e transformado em um arquivo de 
texto editável.
De onde surgiu 
esse tal de 
OCR?
Em 1950 David Shepard e Louis Tordela começaram a pesquisa do 
procedimento para automação de dados e com ajuda de Harvey Cook 
eles contruiram o “Gismo” o primeiro Software de OCR. 
Em 1953 a IBM obteve uma licença 
da IMR e desenvolveu um software 
próprio classificando-o 
como Optical Character 
Recognition, tornando o termo OCR 
um padrão na indústria para essa 
tecnologia.
Qual tecnologia 
está por trás do 
OCR?
Existem dois principais Sistemas de OCR: 
1 - Matriz de correspondência 
Matriz de correspondência (também conhecido como correspondência de 
padrões) associa o que o scanner percebe como um caracter com um 
conjunto armazenado de padrões de bitmap ou contornos de caracteres. 
Quando uma imagem corresponde a um destes 
bitmaps selecionados dentro de um certo grau de semelhança, o programa 
identifica esta imagem como o caractere de texto equivalente. Uma 
desvantagem evidente deste sistema é que ele só pode ser usado para as 
fontes e tamanhos em seu repertório.
2 - Extração de características 
Extração de recurso também é conhecida como reconhecimento de 
caracteres inteligente (ICR), ou análise de característica topológica. É um 
tipo de reconhecimento óptico de caracteres que não dependem de 
correspondência exata para definir modelos. O programa procura por 
elementos comuns, como espaços abertos, formas fechadas, linhas - 
diagonais que se interceptam e assim por diante.
Como Funciona?
Primeiro, o programa analisa a estrutura da imagem do documento. Ele 
divide a página em elementos como blocos de texto, tabelas, imagens, etc. 
As linhas são divididas em palavras e, então, em caracteres. Uma vez 
separados os caracteres, o programa compara-os com um conjunto de 
imagens padrão.
O segundo passo, consiste em comparar cada caracter com modelos de 
fontes suportadas pelo OCR. Havendo uma certa percentagem de 
coincidência, o caracter é reconhecido. Nos caracteres não reconhecidos, 
é aplicado um segundo processo bem mais minucioso, que consiste em 
analisar geometricamente cada caracter, calculando a altura, largura, e 
combinações de retas, curvas e áreas em branco.
Novamente, é usada a lei da probabilidade: um caracter com uma curva em 
forma de meia lua que continua na forma de uma reta, por exemplo, tem 
uma grande chance de ser um "d" minúsculo por exemplo. Este segundo 
processo é muito mais demorado, pois para cada letra é preciso gerar todo 
um novo conjunto de caracteres gráficos.
Se mesmo com o exame minucioso, não for possível reconhecer o caracter, 
o programa poderá utilizar um corretor ortográfico para corrigir erros 
bobos, ou preencher espaços vazios.
Qual as 
Vantagens?
Já tentou digitar um texto de uma revista para poder reproduzir em 
algum lugar? Se for um texto curto, de uma página recomendo que 
coloque do lado e digite, nosso OCR original, de fábrica, chamado 
cérebro é muito mais rápido do que qualquer outro dispositivo e 
certamente vai fazer o trabalho em menos tempo. Ou seja, para textos 
curtos não vale a pena. 
Mas imagine ter que digitar vários 
textos, ou então um livro ou revista. 
Ai já vale a pena usar o OCR pois 
ele fará o trabalho repetitivo e seu 
trabalho será apenas alimentar o 
scanner ou outro dispositivo de 
captura de imagens qualquer, como 
uma câmara digital.
Qual as 
Desvantagens?
O resultado final depende de muitos parâmetros, há programas de OCR 
que não reconhecem os acentos da língua portuguesa. 
Múltiplas fontes no mesmo texto também causam problemas e 
certamente o texto vai precisar de uma revisão antes de ser utilizado. 
Não suporta todos idiomas nem todos os tipos de fontes.
Podes mencionar 
alguns Softwares 
Existentes?
OCR Convert. 
OCR Terminal Beta. 
Online OCR. 
NewOCR.com. 
Free OCR to Word. 
ABBYY FineReader .
Conclusão 
OCR é um tecnologia que vale apena usar, a poisar que raramente 
pessoas não fazem uso deste recurso talvez por falta de 
informação , é um software que pode se encontrar na net de graça 
e em versões muita avançadas a que pagar uma certa quantia.
E onde foste 
pegar essas 
informações?
http://interfaceinterativa.blogspot.com/2009/02/ocr-voce-sabe-o-que-e-isso.html 
http://www.tecmundo.com.br/google/8862-sistema-ocr-da-google-possui-suporte-a-34-idiomas.htm 
http://www.abbyy.com.br/ocr/ 
http://www.ehow.com.br/funciona-ocr-como_5500/ 
http://www.ibytes.com.br/scanner-le-e-converte-elementos-escuros-da-leitura-em-um-mapa-de-bits/ 
Imagens 
www.Google.pt 
Bibliografia
“A duvida é o Principio da Sabedoria” 
?

Weitere ähnliche Inhalte

Andere mochten auch

Cameras smythe e raniel
Cameras smythe e ranielCameras smythe e raniel
Cameras smythe e ranielpipesmythe
 
Recherche d'emploi et réseaux sociaux
Recherche d'emploi et réseaux sociauxRecherche d'emploi et réseaux sociaux
Recherche d'emploi et réseaux sociauxWebpatron
 
Ashtavakra Gita - Chapter 3 - Test of the Seeker
Ashtavakra Gita - Chapter 3 - Test of the SeekerAshtavakra Gita - Chapter 3 - Test of the Seeker
Ashtavakra Gita - Chapter 3 - Test of the SeekerVinod Kad
 
Depoimentos de clientes da Seeker Tecnologia
Depoimentos de clientes da Seeker TecnologiaDepoimentos de clientes da Seeker Tecnologia
Depoimentos de clientes da Seeker TecnologiaSeeker Tecnologia
 
Les outils de l’UX pour connaître les utilisateurs - MC Casal - YOODx 2017
 Les outils de l’UX pour connaître les utilisateurs - MC Casal - YOODx 2017 Les outils de l’UX pour connaître les utilisateurs - MC Casal - YOODx 2017
Les outils de l’UX pour connaître les utilisateurs - MC Casal - YOODx 2017YOODx
 
Synodiance > Recherche Vocale - SEO Campus Paris - 07/04/2016
Synodiance > Recherche Vocale - SEO Campus Paris - 07/04/2016Synodiance > Recherche Vocale - SEO Campus Paris - 07/04/2016
Synodiance > Recherche Vocale - SEO Campus Paris - 07/04/2016Search Foresight
 
How To Grow Your Way Out Of A Recession
How To Grow Your Way Out Of A RecessionHow To Grow Your Way Out Of A Recession
How To Grow Your Way Out Of A RecessionSite-Seeker, Inc.
 
Working out your Team Role
Working out your Team RoleWorking out your Team Role
Working out your Team RoleNeha Agrawal
 
Understanding Social Media for Business
Understanding Social Media for BusinessUnderstanding Social Media for Business
Understanding Social Media for BusinessSite-Seeker, Inc.
 
Séminaire sur le Programme Exemplaire
Séminaire sur le Programme ExemplaireSéminaire sur le Programme Exemplaire
Séminaire sur le Programme ExemplaireLoïc Hervier
 
Methode de rechercher un emploi via linkedin
Methode de rechercher un emploi via linkedinMethode de rechercher un emploi via linkedin
Methode de rechercher un emploi via linkedinAhmed Oualkadi
 
Reconnaissane de visage expression et genre
Reconnaissane de visage expression et genreReconnaissane de visage expression et genre
Reconnaissane de visage expression et genreFadhila Najah
 

Andere mochten auch (16)

Cameras smythe e raniel
Cameras smythe e ranielCameras smythe e raniel
Cameras smythe e raniel
 
Recherche d'emploi et réseaux sociaux
Recherche d'emploi et réseaux sociauxRecherche d'emploi et réseaux sociaux
Recherche d'emploi et réseaux sociaux
 
handwriting recognition
handwriting recognitionhandwriting recognition
handwriting recognition
 
Ashtavakra Gita - Chapter 3 - Test of the Seeker
Ashtavakra Gita - Chapter 3 - Test of the SeekerAshtavakra Gita - Chapter 3 - Test of the Seeker
Ashtavakra Gita - Chapter 3 - Test of the Seeker
 
Depoimentos de clientes da Seeker Tecnologia
Depoimentos de clientes da Seeker TecnologiaDepoimentos de clientes da Seeker Tecnologia
Depoimentos de clientes da Seeker Tecnologia
 
Les outils de l’UX pour connaître les utilisateurs - MC Casal - YOODx 2017
 Les outils de l’UX pour connaître les utilisateurs - MC Casal - YOODx 2017 Les outils de l’UX pour connaître les utilisateurs - MC Casal - YOODx 2017
Les outils de l’UX pour connaître les utilisateurs - MC Casal - YOODx 2017
 
Synodiance > Recherche Vocale - SEO Campus Paris - 07/04/2016
Synodiance > Recherche Vocale - SEO Campus Paris - 07/04/2016Synodiance > Recherche Vocale - SEO Campus Paris - 07/04/2016
Synodiance > Recherche Vocale - SEO Campus Paris - 07/04/2016
 
Twitter for Business
Twitter for BusinessTwitter for Business
Twitter for Business
 
How To Grow Your Way Out Of A Recession
How To Grow Your Way Out Of A RecessionHow To Grow Your Way Out Of A Recession
How To Grow Your Way Out Of A Recession
 
Working out your Team Role
Working out your Team RoleWorking out your Team Role
Working out your Team Role
 
Introduction to-thucydides
Introduction to-thucydidesIntroduction to-thucydides
Introduction to-thucydides
 
Understanding Social Media for Business
Understanding Social Media for BusinessUnderstanding Social Media for Business
Understanding Social Media for Business
 
Séminaire sur le Programme Exemplaire
Séminaire sur le Programme ExemplaireSéminaire sur le Programme Exemplaire
Séminaire sur le Programme Exemplaire
 
Methode de rechercher un emploi via linkedin
Methode de rechercher un emploi via linkedinMethode de rechercher un emploi via linkedin
Methode de rechercher un emploi via linkedin
 
Linkedin guide premium job seeker
Linkedin guide premium job seekerLinkedin guide premium job seeker
Linkedin guide premium job seeker
 
Reconnaissane de visage expression et genre
Reconnaissane de visage expression et genreReconnaissane de visage expression et genre
Reconnaissane de visage expression et genre
 

Ähnlich wie Introdução OCR

Sistema de Reconhecimento de Placas de Carro (Brasil) - Visão Computacional/O...
Sistema de Reconhecimento de Placas de Carro (Brasil) - Visão Computacional/O...Sistema de Reconhecimento de Placas de Carro (Brasil) - Visão Computacional/O...
Sistema de Reconhecimento de Placas de Carro (Brasil) - Visão Computacional/O...Richiely Paiva
 
Lógica de programação, algoritmos e big data
Lógica de programação, algoritmos e big dataLógica de programação, algoritmos e big data
Lógica de programação, algoritmos e big dataRodrigofn
 
Apresentacao PRODimage Professional
Apresentacao PRODimage ProfessionalApresentacao PRODimage Professional
Apresentacao PRODimage ProfessionalJusto Dantas
 
Corrigindo o vestibular com Python e OpenCV
Corrigindo o vestibular com Python e OpenCVCorrigindo o vestibular com Python e OpenCV
Corrigindo o vestibular com Python e OpenCVRomualdo Andre
 
3 oo-concepts
3 oo-concepts3 oo-concepts
3 oo-conceptsjorge600
 
Apresentação Integração ROS e JADE
Apresentação Integração ROS e JADEApresentação Integração ROS e JADE
Apresentação Integração ROS e JADEPedro Nakibar
 
Programação avançada
Programação avançada Programação avançada
Programação avançada Ilídio Costa
 
Trabalho linguagem python
Trabalho linguagem  pythonTrabalho linguagem  python
Trabalho linguagem pythonBruno Maspoli
 
Resolvendo problemas de inteligência artificial e reconhecimento óptico com php
Resolvendo problemas de inteligência artificial e reconhecimento óptico com phpResolvendo problemas de inteligência artificial e reconhecimento óptico com php
Resolvendo problemas de inteligência artificial e reconhecimento óptico com phpRodrigo Wanderley de Melo Cardoso
 
Paradigmas da programacao apostila
Paradigmas da programacao apostilaParadigmas da programacao apostila
Paradigmas da programacao apostilaNathiele Lacerda
 
Hardware teclado-mouse-scanner
Hardware teclado-mouse-scannerHardware teclado-mouse-scanner
Hardware teclado-mouse-scannersergio.ramiro
 
Introdução a Lógica e Conceitos de Programação.ppt
Introdução a Lógica e Conceitos de Programação.pptIntrodução a Lógica e Conceitos de Programação.ppt
Introdução a Lógica e Conceitos de Programação.pptBrennoPimenta
 
Aula Apresentação de Informática Instrumental - Prof. Rogerio P. C do Nascimento
Aula Apresentação de Informática Instrumental - Prof. Rogerio P. C do NascimentoAula Apresentação de Informática Instrumental - Prof. Rogerio P. C do Nascimento
Aula Apresentação de Informática Instrumental - Prof. Rogerio P. C do NascimentoRogerio P C do Nascimento
 

Ähnlich wie Introdução OCR (20)

Sistema de Reconhecimento de Placas de Carro (Brasil) - Visão Computacional/O...
Sistema de Reconhecimento de Placas de Carro (Brasil) - Visão Computacional/O...Sistema de Reconhecimento de Placas de Carro (Brasil) - Visão Computacional/O...
Sistema de Reconhecimento de Placas de Carro (Brasil) - Visão Computacional/O...
 
1071
10711071
1071
 
Lógica de programação, algoritmos e big data
Lógica de programação, algoritmos e big dataLógica de programação, algoritmos e big data
Lógica de programação, algoritmos e big data
 
Apresentacao PRODimage Professional
Apresentacao PRODimage ProfessionalApresentacao PRODimage Professional
Apresentacao PRODimage Professional
 
3 oo-concepts
3 oo-concepts3 oo-concepts
3 oo-concepts
 
Corrigindo o vestibular com Python e OpenCV
Corrigindo o vestibular com Python e OpenCVCorrigindo o vestibular com Python e OpenCV
Corrigindo o vestibular com Python e OpenCV
 
3 oo-concepts
3 oo-concepts3 oo-concepts
3 oo-concepts
 
Apresentação Integração ROS e JADE
Apresentação Integração ROS e JADEApresentação Integração ROS e JADE
Apresentação Integração ROS e JADE
 
Autômatos
AutômatosAutômatos
Autômatos
 
Programação avançada
Programação avançada Programação avançada
Programação avançada
 
Trabalho linguagem python
Trabalho linguagem  pythonTrabalho linguagem  python
Trabalho linguagem python
 
Rita2
Rita2Rita2
Rita2
 
Resolvendo problemas de inteligência artificial e reconhecimento óptico com php
Resolvendo problemas de inteligência artificial e reconhecimento óptico com phpResolvendo problemas de inteligência artificial e reconhecimento óptico com php
Resolvendo problemas de inteligência artificial e reconhecimento óptico com php
 
Paradigmas da programacao apostila
Paradigmas da programacao apostilaParadigmas da programacao apostila
Paradigmas da programacao apostila
 
Introdução a IA no Azure
Introdução a IA  no AzureIntrodução a IA  no Azure
Introdução a IA no Azure
 
Félix do Carmo e Luís Trigo - Tradutores e máquinas de tradução
Félix do Carmo e Luís Trigo - Tradutores e máquinas de traduçãoFélix do Carmo e Luís Trigo - Tradutores e máquinas de tradução
Félix do Carmo e Luís Trigo - Tradutores e máquinas de tradução
 
Hardware teclado-mouse-scanner
Hardware teclado-mouse-scannerHardware teclado-mouse-scanner
Hardware teclado-mouse-scanner
 
Introdução a Lógica e Conceitos de Programação.ppt
Introdução a Lógica e Conceitos de Programação.pptIntrodução a Lógica e Conceitos de Programação.ppt
Introdução a Lógica e Conceitos de Programação.ppt
 
Tipos de Impressoras
Tipos de ImpressorasTipos de Impressoras
Tipos de Impressoras
 
Aula Apresentação de Informática Instrumental - Prof. Rogerio P. C do Nascimento
Aula Apresentação de Informática Instrumental - Prof. Rogerio P. C do NascimentoAula Apresentação de Informática Instrumental - Prof. Rogerio P. C do Nascimento
Aula Apresentação de Informática Instrumental - Prof. Rogerio P. C do Nascimento
 

Introdução OCR

  • 2. Universidade Lusíada de Angola Sistemas Multimídia Tema: OCR (Optical Character Recognition) Membros: ● Lewis Gomes ● Rui Pinto ● Suely Nassola Docente: Dr. Adjah da Cruz
  • 3. O que é o OCR?
  • 4. OCR, do inglês Optical Character Recognition Reconhecimento Ótico de Caracteres), é um método aplicado de maneira a permitir que o conteúdo escrito em um documento no formato de imagem seja reconhecido e transformado em um arquivo de texto editável.
  • 5. De onde surgiu esse tal de OCR?
  • 6. Em 1950 David Shepard e Louis Tordela começaram a pesquisa do procedimento para automação de dados e com ajuda de Harvey Cook eles contruiram o “Gismo” o primeiro Software de OCR. Em 1953 a IBM obteve uma licença da IMR e desenvolveu um software próprio classificando-o como Optical Character Recognition, tornando o termo OCR um padrão na indústria para essa tecnologia.
  • 7. Qual tecnologia está por trás do OCR?
  • 8. Existem dois principais Sistemas de OCR: 1 - Matriz de correspondência Matriz de correspondência (também conhecido como correspondência de padrões) associa o que o scanner percebe como um caracter com um conjunto armazenado de padrões de bitmap ou contornos de caracteres. Quando uma imagem corresponde a um destes bitmaps selecionados dentro de um certo grau de semelhança, o programa identifica esta imagem como o caractere de texto equivalente. Uma desvantagem evidente deste sistema é que ele só pode ser usado para as fontes e tamanhos em seu repertório.
  • 9. 2 - Extração de características Extração de recurso também é conhecida como reconhecimento de caracteres inteligente (ICR), ou análise de característica topológica. É um tipo de reconhecimento óptico de caracteres que não dependem de correspondência exata para definir modelos. O programa procura por elementos comuns, como espaços abertos, formas fechadas, linhas - diagonais que se interceptam e assim por diante.
  • 11. Primeiro, o programa analisa a estrutura da imagem do documento. Ele divide a página em elementos como blocos de texto, tabelas, imagens, etc. As linhas são divididas em palavras e, então, em caracteres. Uma vez separados os caracteres, o programa compara-os com um conjunto de imagens padrão.
  • 12. O segundo passo, consiste em comparar cada caracter com modelos de fontes suportadas pelo OCR. Havendo uma certa percentagem de coincidência, o caracter é reconhecido. Nos caracteres não reconhecidos, é aplicado um segundo processo bem mais minucioso, que consiste em analisar geometricamente cada caracter, calculando a altura, largura, e combinações de retas, curvas e áreas em branco.
  • 13. Novamente, é usada a lei da probabilidade: um caracter com uma curva em forma de meia lua que continua na forma de uma reta, por exemplo, tem uma grande chance de ser um "d" minúsculo por exemplo. Este segundo processo é muito mais demorado, pois para cada letra é preciso gerar todo um novo conjunto de caracteres gráficos.
  • 14. Se mesmo com o exame minucioso, não for possível reconhecer o caracter, o programa poderá utilizar um corretor ortográfico para corrigir erros bobos, ou preencher espaços vazios.
  • 16. Já tentou digitar um texto de uma revista para poder reproduzir em algum lugar? Se for um texto curto, de uma página recomendo que coloque do lado e digite, nosso OCR original, de fábrica, chamado cérebro é muito mais rápido do que qualquer outro dispositivo e certamente vai fazer o trabalho em menos tempo. Ou seja, para textos curtos não vale a pena. Mas imagine ter que digitar vários textos, ou então um livro ou revista. Ai já vale a pena usar o OCR pois ele fará o trabalho repetitivo e seu trabalho será apenas alimentar o scanner ou outro dispositivo de captura de imagens qualquer, como uma câmara digital.
  • 18. O resultado final depende de muitos parâmetros, há programas de OCR que não reconhecem os acentos da língua portuguesa. Múltiplas fontes no mesmo texto também causam problemas e certamente o texto vai precisar de uma revisão antes de ser utilizado. Não suporta todos idiomas nem todos os tipos de fontes.
  • 19. Podes mencionar alguns Softwares Existentes?
  • 20. OCR Convert. OCR Terminal Beta. Online OCR. NewOCR.com. Free OCR to Word. ABBYY FineReader .
  • 21. Conclusão OCR é um tecnologia que vale apena usar, a poisar que raramente pessoas não fazem uso deste recurso talvez por falta de informação , é um software que pode se encontrar na net de graça e em versões muita avançadas a que pagar uma certa quantia.
  • 22. E onde foste pegar essas informações?
  • 23. http://interfaceinterativa.blogspot.com/2009/02/ocr-voce-sabe-o-que-e-isso.html http://www.tecmundo.com.br/google/8862-sistema-ocr-da-google-possui-suporte-a-34-idiomas.htm http://www.abbyy.com.br/ocr/ http://www.ehow.com.br/funciona-ocr-como_5500/ http://www.ibytes.com.br/scanner-le-e-converte-elementos-escuros-da-leitura-em-um-mapa-de-bits/ Imagens www.Google.pt Bibliografia
  • 24. “A duvida é o Principio da Sabedoria” ?