SlideShare ist ein Scribd-Unternehmen logo
1 von 10
Carlos Coelho (43483) Filipe Oliveira (43520) Hugo Panão (43446) Rui Costa (43460) UNICODE
ASCII O código ASCII (American Standard Code for InformationInterchange ) surgiu nos anos 60 e é usado pela maior parte da indústria de computadores para troca de informação. Cada caracter é representado por um código de 8 bits (128 caracteres possíveis, de 0 a 127) baseado no código inglês. Os códigos ASCII representam texto em computadores, equipamentos de comunicação, entre outros dispositivos que trabalham com texto. O que é o código ASCII ? A memória do computador interpreta todos os dados sob a forma numérica (0 e 1). Cada caracter possui o seu equivalente em código numérico: Os códigos 0 a 31 não são caracteres. São caracteres de controlo porque permitem fazer acções como:  regresso à linha (CR)  Bip sonoro (BEL)  Os códigos 65 a 90 representam as maiúsculas  Os códigos 97 a 122 representam as minúsculas
ISO A ISO (InternationalOrganization for Standardization), é uma entidade que coordena a normalização de 170 países. Fundada em 1947, em Genebra, na Suíça, a ISO aprova normas internacionais em todos os campos técnicos, excepto na electricidade e electrónica, cuja responsabilidade é da IEC (InternationalElectrotechnicalCommission), fundada em 1906. Em Portugal, a entidade que coordena as normalizações da ISO é o Instituto Português da Qualidade (IPQ). Uma das normas de codificação de caracteres em fontes é o ISO 8859, sendo que o ISO 8859-1 é uma codificação de caracteres do alfabeto latino. Mais tarde, passou a ser gerida pela ISO e pela IEC. Exemplo da tabela de codificação ISO 8859-1 (latin 1), incluindo os nomes dos símbolos e foi usada bastante tempo nos países da Europa Ocidental.
ISO 10646 Norma que define o UCS (Universal CharacterSet), existem vários formatos de codificação de caracteres que se baseiam nesta norma. A ISO 10646 é utilizada tanto em 16 como em 32bits. Tem perto de 100 mil caracteres, identificados inequivocamente e que representam letras, números e ideogramas.
UNICODE É um padrão utilizado para permitir aos computadores representarem e manipularem eficazmente texto. Contêm cerca de 100mil caracteres Possui apenas código em 16bits, no entanto consegue aceder a imensos caracteres de 32 bits, através da ISO 10646 (também conhecida com UCS), com a qual partilha “dados”. É “gerido” pela Unicode Consurtium. Possui vários tipos de “transformação” como o UTF-8 ou UTF-16. Tem diversas aplicações, como Sistemas Operativos, Correio Electrónico, para a qual é o padrão.
UCS-2 (2-byte Universal CharacterSet)  é um protocolo de codificação que foi substituído pelo UTF-16 na versão 2.0 do Unicode. O UCS-2  é forma de codificação é idêntica à do UTF-16, excepto que este não suporta “pares substitutos” e, portanto, só se pode codificar caracteres no intervalo  U+0000 até U+FFFF. Como consequência, é uma codificação de comprimento fixo que codifica os caracteres sempre em 16-bit. Tal como acontece com UTF-16, existem três esquemas de codificação (UCS-2, UCS-2BE, UCS-2LE).Devido às semelhanças, tanto técnicas como de compatibilidade o UCS-2 e o UTF-16 são facilmente confundidos. Para ambas as UTF-16 e UCS-2, todos os 65.536 pontos de código, excluindo a 2.048 pontos código especiais, são atribuídos códigos de correspondência um-para-um com o 16-bit, não inteiros negativos e com os mesmos valores. Assim, ponto de código U +0000 é codificado como o número 0, e U + FFFF é codificado como 65535 (que é FFFF16 em hexadecimal).
UCS-4 é um protocolo para a codificação de caracteres Unicode que usa exactamente 32 bits para cada ponto de código Unicode. Todos os outros formatos de transformação Unicode usam codificação de comprimento variável. UCS-4 é suficiente para representar todo o código Unicode, que tem 1114112 (= 220 + 216) pontos de código e, portanto, requer apenas até 10FFFF hexadecimal. Algumas pessoas consideram que é um desperdício de reserva como um grande espaço de código para o mapeamento de um conjunto relativamente pequeno de pontos de código, portanto, uma forma nova codificação, UTF-32, foi proposto. UTF-32 é um subconjunto da UCS-4 que usa 32-bit codificar valores apenas no 0 a 10FFFF espaço de código. Assim UCS-4, e UTF-32 são idênticos, excepto que o padrão UTF-32 tem adicional semântica Unicode.
UTF-8 (8-bit Unicode TransformationFormat) é um tipo de codificação Unicode de comprimento variável. Representar qualquer caracter universal padrão. Por esta razão, está lentamente a ser adoptado como tipo de codificação universal, usando por exemplo na maioria dos sites bem como nos emails.  UTF-8 usa um a quatro bytes por caracter, dependendo do símbolo. É necessário apenas um byte para codificar os 128 caracteres ASCII . São necessários dois bytes para  caracteres Latinos.. São também usados dois bytes para representar caracteres dos alfabetos Grego, Hebraico entre outros. São necessários três bytes para o resto do Plano Multilingual Básico. Existem ainda outros caracteres que necessitam de quatro bytes.
Carlos Coelho (43483) Filipe Oliveira (43520) Hugo Panão (43446) Rui Costa (43460) FIM

Weitere ähnliche Inhalte

Andere mochten auch

.Net e arquiteturas modernas - qconsp 2011 - vinicius quaiato
.Net e arquiteturas modernas - qconsp 2011 - vinicius quaiato.Net e arquiteturas modernas - qconsp 2011 - vinicius quaiato
.Net e arquiteturas modernas - qconsp 2011 - vinicius quaiatoVinicius Quaiato
 
Compiladores e interpretadores
Compiladores e interpretadoresCompiladores e interpretadores
Compiladores e interpretadoresVictor Antoniazzi
 
Arquitetura de Software
Arquitetura de SoftwareArquitetura de Software
Arquitetura de SoftwareSaulo Arruda
 
Paradigmas de Linguagens de Programação - Classificações
Paradigmas de Linguagens de Programação - ClassificaçõesParadigmas de Linguagens de Programação - Classificações
Paradigmas de Linguagens de Programação - ClassificaçõesAdriano Teixeira de Souza
 
Mini-curso Arquiteturas Paralelas
Mini-curso Arquiteturas ParalelasMini-curso Arquiteturas Paralelas
Mini-curso Arquiteturas ParalelasDeivid Martins
 
Padrões-09 - Padrões Criacionais - Factory Method
Padrões-09 - Padrões Criacionais - Factory MethodPadrões-09 - Padrões Criacionais - Factory Method
Padrões-09 - Padrões Criacionais - Factory MethodEduardo Nicola F. Zagari
 
Aula 1 de Linguagens de Programação ISPGS
Aula 1 de Linguagens de Programação ISPGSAula 1 de Linguagens de Programação ISPGS
Aula 1 de Linguagens de Programação ISPGSEugenio Dianguila
 
Compilador-Analisador Léxico com FLEX + Linguagem C
Compilador-Analisador Léxico com FLEX + Linguagem C Compilador-Analisador Léxico com FLEX + Linguagem C
Compilador-Analisador Léxico com FLEX + Linguagem C Aldisio Medeiros
 
Aula 1 apresentação - conteudo programático
Aula 1   apresentação - conteudo programáticoAula 1   apresentação - conteudo programático
Aula 1 apresentação - conteudo programáticoLCCIMETRO
 
Iniciando Programação em C: Dicas, Ideias e Colocando a Mão na Massa
Iniciando Programação em C: Dicas, Ideias e Colocando a Mão na MassaIniciando Programação em C: Dicas, Ideias e Colocando a Mão na Massa
Iniciando Programação em C: Dicas, Ideias e Colocando a Mão na MassaLhaís Rodrigues
 
Aula 04 arquitetura de computadores
Aula 04   arquitetura de computadoresAula 04   arquitetura de computadores
Aula 04 arquitetura de computadoresDaniel Moura
 
Arquitetura de dispositivos móveis
Arquitetura de dispositivos móveis Arquitetura de dispositivos móveis
Arquitetura de dispositivos móveis Italo Andrade
 
Plataforma de compiladores .NET (“Roslyn”), C# 6 e Visual Studio “14”
Plataforma de compiladores .NET (“Roslyn”), C# 6 e Visual Studio “14”Plataforma de compiladores .NET (“Roslyn”), C# 6 e Visual Studio “14”
Plataforma de compiladores .NET (“Roslyn”), C# 6 e Visual Studio “14”Rogério Moraes de Carvalho
 
Aula 3 compiladores e interpretadores
Aula 3   compiladores e interpretadoresAula 3   compiladores e interpretadores
Aula 3 compiladores e interpretadoresLCCIMETRO
 
Plataforma de compiladores .NET, C# 6 e Visual Studio 2015
Plataforma de compiladores .NET, C# 6 e Visual Studio 2015Plataforma de compiladores .NET, C# 6 e Visual Studio 2015
Plataforma de compiladores .NET, C# 6 e Visual Studio 2015Rogério Moraes de Carvalho
 
Português (leitura, interpretação e múltiplas linguagens)
Português (leitura, interpretação e múltiplas linguagens)Português (leitura, interpretação e múltiplas linguagens)
Português (leitura, interpretação e múltiplas linguagens)FelipePereiradaSilva
 
Aula de Introdução - JAVA
Aula de Introdução  - JAVAAula de Introdução  - JAVA
Aula de Introdução - JAVAMoises Omena
 
Exercícios Resolvidos - Arquitetura e Organização de Computadores
Exercícios Resolvidos - Arquitetura e Organização de ComputadoresExercícios Resolvidos - Arquitetura e Organização de Computadores
Exercícios Resolvidos - Arquitetura e Organização de ComputadoresRonildo Oliveira
 

Andere mochten auch (20)

.Net e arquiteturas modernas - qconsp 2011 - vinicius quaiato
.Net e arquiteturas modernas - qconsp 2011 - vinicius quaiato.Net e arquiteturas modernas - qconsp 2011 - vinicius quaiato
.Net e arquiteturas modernas - qconsp 2011 - vinicius quaiato
 
Compiladores e interpretadores
Compiladores e interpretadoresCompiladores e interpretadores
Compiladores e interpretadores
 
Arquitetura de Software
Arquitetura de SoftwareArquitetura de Software
Arquitetura de Software
 
Compiladores 7
Compiladores 7Compiladores 7
Compiladores 7
 
Paradigmas de Linguagens de Programação - Classificações
Paradigmas de Linguagens de Programação - ClassificaçõesParadigmas de Linguagens de Programação - Classificações
Paradigmas de Linguagens de Programação - Classificações
 
Mini-curso Arquiteturas Paralelas
Mini-curso Arquiteturas ParalelasMini-curso Arquiteturas Paralelas
Mini-curso Arquiteturas Paralelas
 
Padrões-09 - Padrões Criacionais - Factory Method
Padrões-09 - Padrões Criacionais - Factory MethodPadrões-09 - Padrões Criacionais - Factory Method
Padrões-09 - Padrões Criacionais - Factory Method
 
Paradigmas de Linguagem
Paradigmas de LinguagemParadigmas de Linguagem
Paradigmas de Linguagem
 
Aula 1 de Linguagens de Programação ISPGS
Aula 1 de Linguagens de Programação ISPGSAula 1 de Linguagens de Programação ISPGS
Aula 1 de Linguagens de Programação ISPGS
 
Compilador-Analisador Léxico com FLEX + Linguagem C
Compilador-Analisador Léxico com FLEX + Linguagem C Compilador-Analisador Léxico com FLEX + Linguagem C
Compilador-Analisador Léxico com FLEX + Linguagem C
 
Aula 1 apresentação - conteudo programático
Aula 1   apresentação - conteudo programáticoAula 1   apresentação - conteudo programático
Aula 1 apresentação - conteudo programático
 
Iniciando Programação em C: Dicas, Ideias e Colocando a Mão na Massa
Iniciando Programação em C: Dicas, Ideias e Colocando a Mão na MassaIniciando Programação em C: Dicas, Ideias e Colocando a Mão na Massa
Iniciando Programação em C: Dicas, Ideias e Colocando a Mão na Massa
 
Aula 04 arquitetura de computadores
Aula 04   arquitetura de computadoresAula 04   arquitetura de computadores
Aula 04 arquitetura de computadores
 
Arquitetura de dispositivos móveis
Arquitetura de dispositivos móveis Arquitetura de dispositivos móveis
Arquitetura de dispositivos móveis
 
Plataforma de compiladores .NET (“Roslyn”), C# 6 e Visual Studio “14”
Plataforma de compiladores .NET (“Roslyn”), C# 6 e Visual Studio “14”Plataforma de compiladores .NET (“Roslyn”), C# 6 e Visual Studio “14”
Plataforma de compiladores .NET (“Roslyn”), C# 6 e Visual Studio “14”
 
Aula 3 compiladores e interpretadores
Aula 3   compiladores e interpretadoresAula 3   compiladores e interpretadores
Aula 3 compiladores e interpretadores
 
Plataforma de compiladores .NET, C# 6 e Visual Studio 2015
Plataforma de compiladores .NET, C# 6 e Visual Studio 2015Plataforma de compiladores .NET, C# 6 e Visual Studio 2015
Plataforma de compiladores .NET, C# 6 e Visual Studio 2015
 
Português (leitura, interpretação e múltiplas linguagens)
Português (leitura, interpretação e múltiplas linguagens)Português (leitura, interpretação e múltiplas linguagens)
Português (leitura, interpretação e múltiplas linguagens)
 
Aula de Introdução - JAVA
Aula de Introdução  - JAVAAula de Introdução  - JAVA
Aula de Introdução - JAVA
 
Exercícios Resolvidos - Arquitetura e Organização de Computadores
Exercícios Resolvidos - Arquitetura e Organização de ComputadoresExercícios Resolvidos - Arquitetura e Organização de Computadores
Exercícios Resolvidos - Arquitetura e Organização de Computadores
 

Ähnlich wie Unicode

Fique ninja na codificação de caracteres
Fique ninja na codificação de caracteresFique ninja na codificação de caracteres
Fique ninja na codificação de caracteresSebastian Webber
 
Unicode: Os segredos da Codificação de Caracteres
Unicode: Os segredos da Codificação de CaracteresUnicode: Os segredos da Codificação de Caracteres
Unicode: Os segredos da Codificação de CaracteresDouglas V. Pasqua
 
Aula 11 – Informação e a sua Representação
Aula 11 – Informação e a sua RepresentaçãoAula 11 – Informação e a sua Representação
Aula 11 – Informação e a sua RepresentaçãoVitor Hugo Melo Araújo
 
A Informação E Dados.pptx
A Informação E Dados.pptxA Informação E Dados.pptx
A Informação E Dados.pptxPatrícia Melo
 
A Informação e sua representação- Parte 1 Sistemas de numeração e conversão d...
A Informação e sua representação- Parte 1 Sistemas de numeração e conversão d...A Informação e sua representação- Parte 1 Sistemas de numeração e conversão d...
A Informação e sua representação- Parte 1 Sistemas de numeração e conversão d...Patrícia Melo
 
Redes - Enderecamento IP
Redes - Enderecamento IPRedes - Enderecamento IP
Redes - Enderecamento IPLuiz Arthur
 
O básico que ainda deveríamos entender sobre Unicode e encondings
O básico que ainda deveríamos entender sobre Unicode e encondingsO básico que ainda deveríamos entender sobre Unicode e encondings
O básico que ainda deveríamos entender sobre Unicode e encondingsThiago Colares
 
Aula sobre bite e byte
Aula sobre bite e byteAula sobre bite e byte
Aula sobre bite e bytegastaovalle
 
Radiotelegrafia código morse
Radiotelegrafia   código morseRadiotelegrafia   código morse
Radiotelegrafia código morseFmoreira4
 
Componentes de Sistemas de Comunicação
Componentes de Sistemas de ComunicaçãoComponentes de Sistemas de Comunicação
Componentes de Sistemas de ComunicaçãoMauro
 
Aula02 - Sistemas Numéricos computacionais
Aula02 - Sistemas Numéricos computacionaisAula02 - Sistemas Numéricos computacionais
Aula02 - Sistemas Numéricos computacionaisJorge Ávila Miranda
 

Ähnlich wie Unicode (18)

PTM - Unicode
PTM - UnicodePTM - Unicode
PTM - Unicode
 
PTM - UNICODE
PTM - UNICODEPTM - UNICODE
PTM - UNICODE
 
PTM - Unicode
PTM - UnicodePTM - Unicode
PTM - Unicode
 
Fique ninja na codificação de caracteres
Fique ninja na codificação de caracteresFique ninja na codificação de caracteres
Fique ninja na codificação de caracteres
 
Unicode: Os segredos da Codificação de Caracteres
Unicode: Os segredos da Codificação de CaracteresUnicode: Os segredos da Codificação de Caracteres
Unicode: Os segredos da Codificação de Caracteres
 
Sistemas de numeração
Sistemas de numeraçãoSistemas de numeração
Sistemas de numeração
 
Códigos BCD, Gray e ASCII
Códigos  BCD, Gray e ASCIICódigos  BCD, Gray e ASCII
Códigos BCD, Gray e ASCII
 
Aula 11 – Informação e a sua Representação
Aula 11 – Informação e a sua RepresentaçãoAula 11 – Informação e a sua Representação
Aula 11 – Informação e a sua Representação
 
A Informação E Dados.pptx
A Informação E Dados.pptxA Informação E Dados.pptx
A Informação E Dados.pptx
 
A Informação e sua representação- Parte 1 Sistemas de numeração e conversão d...
A Informação e sua representação- Parte 1 Sistemas de numeração e conversão d...A Informação e sua representação- Parte 1 Sistemas de numeração e conversão d...
A Informação e sua representação- Parte 1 Sistemas de numeração e conversão d...
 
Redes - Enderecamento IP
Redes - Enderecamento IPRedes - Enderecamento IP
Redes - Enderecamento IP
 
O básico que ainda deveríamos entender sobre Unicode e encondings
O básico que ainda deveríamos entender sobre Unicode e encondingsO básico que ainda deveríamos entender sobre Unicode e encondings
O básico que ainda deveríamos entender sobre Unicode e encondings
 
Aula sobre bite e byte
Aula sobre bite e byteAula sobre bite e byte
Aula sobre bite e byte
 
Radiotelegrafia código morse
Radiotelegrafia   código morseRadiotelegrafia   código morse
Radiotelegrafia código morse
 
Ze E Jorge
Ze E JorgeZe E Jorge
Ze E Jorge
 
Componentes de Sistemas de Comunicação
Componentes de Sistemas de ComunicaçãoComponentes de Sistemas de Comunicação
Componentes de Sistemas de Comunicação
 
Aula02 - Sistemas Numéricos computacionais
Aula02 - Sistemas Numéricos computacionaisAula02 - Sistemas Numéricos computacionais
Aula02 - Sistemas Numéricos computacionais
 
Redes sem FIO
Redes sem FIORedes sem FIO
Redes sem FIO
 

Unicode

  • 1. Carlos Coelho (43483) Filipe Oliveira (43520) Hugo Panão (43446) Rui Costa (43460) UNICODE
  • 2. ASCII O código ASCII (American Standard Code for InformationInterchange ) surgiu nos anos 60 e é usado pela maior parte da indústria de computadores para troca de informação. Cada caracter é representado por um código de 8 bits (128 caracteres possíveis, de 0 a 127) baseado no código inglês. Os códigos ASCII representam texto em computadores, equipamentos de comunicação, entre outros dispositivos que trabalham com texto. O que é o código ASCII ? A memória do computador interpreta todos os dados sob a forma numérica (0 e 1). Cada caracter possui o seu equivalente em código numérico: Os códigos 0 a 31 não são caracteres. São caracteres de controlo porque permitem fazer acções como: regresso à linha (CR) Bip sonoro (BEL) Os códigos 65 a 90 representam as maiúsculas Os códigos 97 a 122 representam as minúsculas
  • 3. ISO A ISO (InternationalOrganization for Standardization), é uma entidade que coordena a normalização de 170 países. Fundada em 1947, em Genebra, na Suíça, a ISO aprova normas internacionais em todos os campos técnicos, excepto na electricidade e electrónica, cuja responsabilidade é da IEC (InternationalElectrotechnicalCommission), fundada em 1906. Em Portugal, a entidade que coordena as normalizações da ISO é o Instituto Português da Qualidade (IPQ). Uma das normas de codificação de caracteres em fontes é o ISO 8859, sendo que o ISO 8859-1 é uma codificação de caracteres do alfabeto latino. Mais tarde, passou a ser gerida pela ISO e pela IEC. Exemplo da tabela de codificação ISO 8859-1 (latin 1), incluindo os nomes dos símbolos e foi usada bastante tempo nos países da Europa Ocidental.
  • 4.
  • 5. ISO 10646 Norma que define o UCS (Universal CharacterSet), existem vários formatos de codificação de caracteres que se baseiam nesta norma. A ISO 10646 é utilizada tanto em 16 como em 32bits. Tem perto de 100 mil caracteres, identificados inequivocamente e que representam letras, números e ideogramas.
  • 6. UNICODE É um padrão utilizado para permitir aos computadores representarem e manipularem eficazmente texto. Contêm cerca de 100mil caracteres Possui apenas código em 16bits, no entanto consegue aceder a imensos caracteres de 32 bits, através da ISO 10646 (também conhecida com UCS), com a qual partilha “dados”. É “gerido” pela Unicode Consurtium. Possui vários tipos de “transformação” como o UTF-8 ou UTF-16. Tem diversas aplicações, como Sistemas Operativos, Correio Electrónico, para a qual é o padrão.
  • 7. UCS-2 (2-byte Universal CharacterSet) é um protocolo de codificação que foi substituído pelo UTF-16 na versão 2.0 do Unicode. O UCS-2 é forma de codificação é idêntica à do UTF-16, excepto que este não suporta “pares substitutos” e, portanto, só se pode codificar caracteres no intervalo U+0000 até U+FFFF. Como consequência, é uma codificação de comprimento fixo que codifica os caracteres sempre em 16-bit. Tal como acontece com UTF-16, existem três esquemas de codificação (UCS-2, UCS-2BE, UCS-2LE).Devido às semelhanças, tanto técnicas como de compatibilidade o UCS-2 e o UTF-16 são facilmente confundidos. Para ambas as UTF-16 e UCS-2, todos os 65.536 pontos de código, excluindo a 2.048 pontos código especiais, são atribuídos códigos de correspondência um-para-um com o 16-bit, não inteiros negativos e com os mesmos valores. Assim, ponto de código U +0000 é codificado como o número 0, e U + FFFF é codificado como 65535 (que é FFFF16 em hexadecimal).
  • 8. UCS-4 é um protocolo para a codificação de caracteres Unicode que usa exactamente 32 bits para cada ponto de código Unicode. Todos os outros formatos de transformação Unicode usam codificação de comprimento variável. UCS-4 é suficiente para representar todo o código Unicode, que tem 1114112 (= 220 + 216) pontos de código e, portanto, requer apenas até 10FFFF hexadecimal. Algumas pessoas consideram que é um desperdício de reserva como um grande espaço de código para o mapeamento de um conjunto relativamente pequeno de pontos de código, portanto, uma forma nova codificação, UTF-32, foi proposto. UTF-32 é um subconjunto da UCS-4 que usa 32-bit codificar valores apenas no 0 a 10FFFF espaço de código. Assim UCS-4, e UTF-32 são idênticos, excepto que o padrão UTF-32 tem adicional semântica Unicode.
  • 9. UTF-8 (8-bit Unicode TransformationFormat) é um tipo de codificação Unicode de comprimento variável. Representar qualquer caracter universal padrão. Por esta razão, está lentamente a ser adoptado como tipo de codificação universal, usando por exemplo na maioria dos sites bem como nos emails. UTF-8 usa um a quatro bytes por caracter, dependendo do símbolo. É necessário apenas um byte para codificar os 128 caracteres ASCII . São necessários dois bytes para caracteres Latinos.. São também usados dois bytes para representar caracteres dos alfabetos Grego, Hebraico entre outros. São necessários três bytes para o resto do Plano Multilingual Básico. Existem ainda outros caracteres que necessitam de quatro bytes.
  • 10. Carlos Coelho (43483) Filipe Oliveira (43520) Hugo Panão (43446) Rui Costa (43460) FIM