El documento describe las diferencias entre HTML y XML. HTML se utiliza para dar formato y presentar información en un navegador web, mientras que XML se utiliza para describir y estructurar información de una manera que puede procesarse fácilmente y compartirse entre diferentes aplicaciones. XML no reemplaza a HTML, sino que lo complementa al separar la información de su formato.
1. HTML, siglas de HyperText Markup Language («lenguaje de marcado de
hipertexto»), hace referencia al lenguaje de marcadopredominante para la
elaboración de páginas web que se utiliza para describir la estructura y el
contenido en forma de texto, así como para complementar el texto con
objetos tales como imágenes. El HTML se escribe en forma de «etiquetas»,
rodeadas por corchetes angulares (<,>). HTML también puede describir,
hasta un cierto punto, la apariencia de un documento, y puede incluir
un script (por ejemplo JavaScript), el cual puede afectar el comportamiento
de navegadores web y otros procesadores de HTML.
HTML también sirve para referirse al contenido del tipo de MIME text/html o
todavía más ampliamente como un término genérico para el HTML, ya sea
en forma descendida del XML (como XHTML 1.0 y posteriores) o en forma
descendida directamente de SGML (como HTML 4.01 y anteriores).
2. La primera descripción de HTML disponible públicamente fue un documento
llamado HTML Tags (Etiquetas HTML), publicado por primera vez en Internet por Tim
Berners-Lee en 1991. Describe 22 elementos que incluyen el diseño inicial y
relativamente simple de HTML. Trece de estos elementos todavía existen en HTML 4.
Berners-Lee consideraba a HTML una ampliación de SGML, pero no fue formalmente
reconocida como tal hasta la publicación de mediados de 1993, por la IETF, de una
primera proposición para una especificación de HTML: el boceto Hypertext Markup
Language de Berners-Lee y Dan Connolly, el cual incluía una Definición de Tipo de
Documento SGML para definir la gramática. El boceto expiró luego de seis meses,
pero fue notable por su reconocimiento de la etiqueta propia del
navegador Mosaic usada para insertar imágenes sin cambio de línea, que reflejaba la
filosofía del IETF de basar estándares en prototipos con éxito. De la misma manera,
el boceto competidor de Dave Raggett HTML+ (Hypertext Markup Format) (Formato
de Marcaje de Hipertexto), de finales de 1993, sugería estandarizar características ya
implementadas, como las tablas.
3. Los elementos son la estructura básica de HTML. Los elementos tienen dos
propiedades básicas: atributos y contenido. Cada atributo y contenido tiene ciertas
restricciones para que se considere válido al documento HTML. Un elemento
generalmente tiene una etiqueta de inicio (por ejemplo, <nombre-de-elemento>) y
una etiqueta de cierre (por ejemplo, </nombre-de-elemento>). Los atributos del
elemento están contenidos en la etiqueta de inicio y el contenido está ubicado entre
las dos etiquetas (por ejemplo, <nombre-de-
elemento atributo="valor">Contenido</nombre-de-elemento>). Algunos elementos,
tales como <br>, no tienen contenido ni llevan una etiqueta de cierre. Debajo se listan
varios tipos de elementos de marcado usados en HTML.
Estructura general de una línea de código en el lenguaje de etiquetas HTML.
El marcado estructural describe el propósito del texto.
Por ejemplo, <h2>Golf</h2> establece «Golf» como un encabezamiento de segundo
nivel, el cual se mostraría en un navegador de una manera similar al título «Marcado
HTML» al principio de esta sección. El marcado estructural no define cómo se verá el
elemento, pero la mayoría de los navegadores web han estandarizado el formato de
los elementos. Puede aplicarse un formato específico al texto por medio de hojas de
estilo en cascada.
4. La mayoría de los atributos de un elemento son pares nombre-valor,
separados por un signo de igual «=» y escritos en la etiqueta de
comienzo de un elemento, después del nombre de éste. El valor
puede estar rodeado por comillas dobles o simples, aunque ciertos
tipos de valores pueden estar sin comillas en HTML (pero no en
XHTML). De todas maneras, dejar los valores sin comillas es
considerado poco seguro. En contraste con los pares nombre-
elemento, hay algunos atributos que afectan al elemento
simplemente por su presencia (tal como el atributoismap para el
elemento img).
5. El HTML se preocupa por formatear datos y para ello son las etiquetas que tiene el lenguaje, para
formatear la información que se desea mostrar.
El desarrollo del HTML estuvo marcado la competencia entre los distintos visores del mercado.
Cada uno quería ser el mejor e inventaba etiquetas nuevas que a la larga entraban a formar parte
del estándar del W3C, como la etiqueta <FRAME>.
Procesar la información en HTML es inviable, por estar mezclada con los estilos y las etiquetas
que formatean la información.
El HTML (HyperText Markup Language) por otro lado ha sido concebido para mostrar información,
determinar cómo actúa y que hace. Su función radica en ayudarnos a darle formato a los diversos
contenidos de una página.
Resumiendo, el XML sirve para describir información y el HTML sirve para darle formato y
presentarla a través de un navegador. O sea que el XML no es ni será nunca un reemplazo del
HTML sino un complemento que sirve para manejar la información separada del formato.
6. XML, siglas en inglés de eXtensible Markup Language ('lenguaje de
marcas extensible'), es un lenguaje de marcas desarrollado por el World Wide Web
Consortium (W3C). Deriva del lenguaje SGML y permite definir la gramática de
lenguajes específicos (de la misma manera que HTML es a su vez un lenguaje
definido por SGML)para estructurar documentos grandes. A diferencia de otros
lenguajes XML da soporte a bases de datos, siendo útil cuándo varias aplicaciones se
deben comunicar entre sí o integrar información. (Bases de datos Silberschatz).
XML no ha nacido sólo para su aplicación en Internet, sino que se propone como un
estándar para el intercambio de información estructurada entre diferentes
plataformas. Se puede usar en bases de datos, editores de texto, hojas de cálculo y
casi cualquier cosa imaginable.
XML es una tecnología sencilla que tiene a su alrededor otras que la complementan y
la hacen mucho más grande y con unas posibilidades mucho mayores. Tiene un
papel muy importante en la actualidad ya que permite la compatibilidad entre
sistemas para compartir la información de una manera segura, fiable y fácil.
7. XML proviene de un lenguaje inventado por IBM en los años setenta,
llamado GML (Generalized Markup Language), que surgió por la necesidad que tenía la
empresa de almacenar grandes cantidades de información. Este lenguaje gustó a la ISO,
por lo que en 1986 trabajaron para normalizarlo, creando SGML (Standard Generalized
Markup Language), capaz de adaptarse a un gran abanico de problemas. A partir de él se
han creado otros sistemas para almacenar información.
En el año 1989 Tim Berners Lee creó la web, y junto con ella el lenguaje HTML. Este
lenguaje se definió en el marco de SGML y fue de lejos la aplicación más conocida de este
estándar. Los navegadores web sin embargo siempre han puesto pocas exigencias al
código HTML que interpretan y así las páginas web son caóticas y no cumplen con
la sintaxis. Estas páginas web dependen fuertemente de una forma específica de lidiar con
los errores y las ambigüedades, lo que hace a las páginas más frágiles y a los
navegadores más complejos.
Otra limitación del HTML es que cada documento pertenece a un vocabulario fijo,
establecido por el DTD. No se pueden combinar elementos de diferentes vocabularios.
Asimismo es imposible para un intérprete (por ejemplo un navegador) analizar el
documento sin tener conocimiento de su gramática (del DTD). Por ejemplo, el navegador
sabe que antes de una etiqueta <div> debe haberse cerrado cualquier <p> previamente
abierto. Los navegadores resolvieron esto incluyendo lógica ad hoc para el HTML, en vez
de incluir un analizador genérico. Ambas opciones, de todos modos, son muy complejas
para los navegadores.
8. <?xml version="1.0" encoding="UTF-8" ?> <!DOCTYPE
Edit_Mensaje SYSTEM "Edit_Mensaje.dtd"> <Edit_Mensaje>
<Mensaje> <Remitente> <Nombre>Nombre del
remitente</Nombre> <Mail> Correo del remitente </Mail>
</Remitente> <Destinatario> <Nombre>Nombre del
destinatario</Nombre> <Mail>Correo del destinatario</Mail>
</Destinatario> <Texto> <Asunto> Este es mi documento con una
estructura muy sencilla no contiene atributos ni entidades...
</Asunto> <Parrafo> Este es mi documento con una estructura
muy sencilla no contiene atributos ni entidades... </Parrafo>
</Texto> </Mensaje> </Edit_Mensaje>
9. Es extensible: Después de diseñado y puesto en producción, es posible extender
XML con la adición de nuevas etiquetas, de modo que se pueda continuar utilizando
sin complicación alguna.
El analizador es un componente estándar, no es necesario crear un analizador
específico para cada versión de lenguaje XML. Esto posibilita el empleo de cualquiera
de los analizadores disponibles. De esta manera se evitan bugs y se acelera el
desarrollo de aplicaciones.
Si un tercero decide usar un documento creado en XML, es sencillo entender su
estructura y procesarla. Mejora la compatibilidad entre aplicaciones. Podemos
comunicar aplicaciones de distintas plataformas, sin que importe el origen de los
datos, es decir, podríamos tener una aplicación en Linux con una base de datos
Postgres y comunicarla con otra aplicación en Windows y Base de Datos MS-SQL
Server.
Transformamos datos en información, pues se le añade un significado concreto y los
asociamos a un contexto, con lo cual tenemos flexibilidad para estructurar
documentos.
10. El XML se preocupa por estructurar la información que pretende almacenar. La
estructura la marca la lógica propia de la información.
El desarrollo del XML está siendo llevado a cabo con rigor, siempre ajustado a lo que
marca el estándar que desarrolla el W3C, entidad que está desarrollando el XML con
más diligencia que las empresas con intereses particulares.
En XML se puede procesar la información con mucha facilidad, porque todo está
ordenado de una manera lógica, así mismo el formateo de la información para que se
pueda entender bien por el usuario es viable a través de un pequeño procesamiento,
a través de hojas de estilos o similares.
El XML (eXtensive Markup Language) es un lenguaje que fue concebido para
describir información. Su función principal es ayudarnos a organizar contenidos y eso
hace que los documentos XML sean portables hacia diferentes tipos de aplicaciones.
Resumiendo, el XML sirve para describir información y el HTML sirve para darle
formato y presentarla a través de un navegador. O sea que el XML no es ni será
nunca un reemplazo del HTML sino un complemento que sirve para manejar la
información separada del formato.
Otra característica del XML es que es un lenguaje que puede extenderse. Al trabajar
con documentos XML podemos determinar nuestros propios tags y estructura de
documentos para trabajar.