Conceptos básicos



¿Qué es WWW?

El servicio Web o WWW es una nueva forma de representar la información en Internet basada en páginas. Una página WWW puede incluir tres tipos de información: texto, gráficos e hipertexto. Un hipertexto es texto resaltado que el usuario puede activar para cargar otra página WWW. La diferencia entre un documento hipertexto y un documento normal consiste en que el hipertexto contiene, además de la información, una serie de enlaces o conexiones con otros documentos relacionados, de manera que el lector puede pasar de un tema a otro y volver al documento original en el momento en que le interese.

Las principales ventajas del servicio WWW son tres. Primera, que puede combinar texto y gráficos. Segunda, que los hiperenlaces permiten cargar páginas de cualquier otro servidor conectado a Internet, da igual que esté localizado en España o en Australia. Y, tercera, que la creación de páginas WWW es bastante sencilla mediante el lenguaje HTML.

El gran éxito de Web no se debe solamente al empleo del hipertexto. Es normal encontrar que los documentos WWW están compuestos de texto y gráficos, y los enlaces con otros documentos pueden ser palabras clave subrayadas o resaltadas en el texto, pero también la totalidad de una imagen o incluso partes de ella (como un mapa "sensible", que permite acceder a información sobre una ciudad haciendo un "click" del ratón sobre un determinado detalle del plano). Las últimas versiones de los programas navegadores (y la mayor rapidez de las telecomunicaciones) permiten integrar en un mismo documento texto, gráficos, sonidos o, incluso animaciones de vídeo. Estos documentos compuestos son los que reciben el nombre de hipermedia.

(PC WORLD Junio 1995)

Inicio

¿Qué es HTML?

HTML, HyperText Markup Language, es un lenguaje simple utilizado para crear documentos de hipertexto para WWW. No es un lenguaje de descripción de página como Postcript; HTML no permite definir de forma estricta la apariencia de una página, aunque una utilización algo desviada hace que se utilice en ocaciones como un lenguaje de presentación. Además, la presentación de la página es muy dependiente del browser (o programa navegador) utilizado: el mismo documento no produce el mismo resultado en la pantalla si se visualiza con un browser en modo línea, Mosaic o Netscape, o sea, HTML se limita a describir la estructura y el contenido de un documento, y no el formato de la página y su apariencia.

Una de las claves del éxito de WWW, aparte de lo atractivo de su presentación es sin duda, su organización y coherencia. Todos los documentos WWW comparten un mismo aspecto y una única interfaz, lo que facilita enormemente su manejo por parte de cualquier persona. Esto es posible porque el lenguaje HTML, en que están escritos los documentos, no solo permite establecer hiperenlaces entre diferentes documentos, sino que es un "lenguaje de descripción de página" independiente de la plataforma en que se utilice. Es decir un documento HTML contiene toda la información necesaria sobre su aspecto y su interacción con el usuario, y es luego el browser que utilicemos el responsable de asegurar que el documento tenga un aspecto coherente, independientemente del tipo de estación de trabajo desde donde estemos efectuando la consulta.

Su simplicidad es tal que no es necesario utilizar un editor particular. Su gran permisividad exige rigor y atención en la estructura de documentos con el fin de que éstos se visualicen correctamente al margen del contexto y el browser utilizado.

Por tanto, como hemos visto, HTML es un lenguaje muy sencillo que nos permite preparar documentos Web insertando en el texto de los mismos una serie de marcas (tags) que controlan los diferentes aspectos de la presentación y comportamiento de sus elementos.

Para escribir HTML lo único que se necesita es un editor de texto ASCII, como EDIT del MS-DOS o el Bloc de notas de Windows. Las marcas o tags que controlan el comportamiento del documento son fragmentos de texto encerrados entre los signos "mayor que" y "menor que" (<marca>). Existen diferentes tipos de marcas: algunas controlan simplemente la presentación del texto del documento; otras, la forma en que se incluirán en él imágenes; otras, finalmente, los hiperenlaces con documentos o con diferentes partes del mismo documento. Existen una serie de programas que ayudan en la elaboración de documentos HTML, como HTMLED (shareware) o HTML Assistant, ambos para Windows, pero no son imprescindibles para escribir el código. Lo que si es necesario es un programa cliente WWW, tal como Mosaic, o Netscape, para probar el documento a medida que lo vamos desarrollando.

Las marcas funcionan muchas veces por parejas, una para indicar el inicio de enlace o formato, y otra para señalar el final. La marca de inicio consiste en una letra o una palabra (por ejemplo, estas son marcas de inicio: <B>, <TITLE>). La marca de final es la misma letra o palabra precedida por la barra inclinada o "slash" (es decir,</B>, </TITLE>). Existen, no obstante, algunas marcas que no requieren su pareja de cierre, como <BR> (que fuerza un salto de línea). Es importante señalar que las marcas, en general pueden estar indistintamente en mayúsculas o en minúsculas.

Como todo lenguaje, está en constante evolución. La versión en curso es la versión 2.0 pero existe ya un proyecto para la versión 3.0.

Inicio

Evolución del lenguaje

El lenguaje HTML nace en 1991 de manos de Tim Bernes-Lee del CERN como un sistema hipertexto con el único objetivo de servir como medio de transmisión de información entre físicos de alta energía como parte de la iniciativa WWW. En 1993 Dan Connelly escribe el primer DTD (Document Type Definition) de SGML describiendo el lenguaje. En 1994 el sistema había tenido tal aceptación que la especificación se había quedado ya obsoleta. Por aquel entonces WWW y Mosaic eran casi sinónimos debido a que el browser Mosaic del NCSA (National Center for Supercomputing Applications) era el más extendido debido a las mejoras que incorporaba. Es entonces cuando nace el HTML 2.0 en un draft realizado también por Dan Connelly. El crecimiento exponencial que comienza a sufrir el sistema lleva a organizar la First International WWW Conference en Mayo de 1994. El principal avance de 2.0 de HTML es la incorporación de los llamados forms, formularios que permiten que el usuario cliente envie información al servidor y ésta sea recogida y procesada allí. Precisamente con este fin, NCSA presenta la especificación del CGI, Common Gateway Interface, versión 1.0 que define un interfaz entre programas ejecutables y el sistema WWW. Con la incorporación de los forms, aparecen por primera vez campos donde el usuario puede escribir, menús "pull-down" y los denominados "radio-buttons" integrados en páginas WWW.

Desde entonces, el lenguaje ha seguido creciendo como algo dinámico, como una lengua humana, algo vivo, siendo modificado sobre todo por las personas que lo utilizan. Asi, una evolución en el lenguaje suele surgir de una propuesta que es adoptada por algunos clientes (browsers). Con el uso se ve si es eficiente y es adoptada y si es así, finalmente se incorpora al estándar. De este modo, a finales de 1993 se comienza a hablar de HTML+ propuesto por Dave Raggett, de HEP Labs, en Bristol que evoluciona a un nuevo draft de Marzo de 1994 para la versión HTML 3.0 incorporando nuevas posibilidades como la realización de tablas complejas, control de proceso de formatos e incorporación de expresiones matemáticas.

El testigo pasa del browser Mosaic al Netscape, que incorpora nuevas mejoras. Aunque el equipo de Netscape anuncia desde el principio que su browser trata HTML 3.0, lo cierto es que no se adapta al estándar. Por el momento, el único browser de HTML 3.0 es experimental y recibe el nombre de Arena. El lenguaje de Netscape, el más utilizado en la actualidad, incorpora etiquetas no definidas en HTML 3.0, y tiene algunas diferencias con algunas de las definidas, por ejemplo en la realización de tablas. Por otra parte, hasta la versión 2.0, recién aparecida, no permitía el empleo de expresiones matemáticas (al escribir este artículo el autor aún no ha analizado la versión 2.0). Y como gran idea propone la incorporación de un tipo MIME experimental que permite la actualización dinámica de documentos, del que se hablará en el apartado dedicado a la programación de CGI. Por ello, en "los ambientes" se ha comenzado a denominar este lenguaje de Netscape como NHTML 1.1 para diferenciarlo de la verdadera propuesta de HTML 3.0.

Inicio

Clientes y servidores WWW

Para poder utilizar el servicio Web se necesitan dos partes. Por un lado, la empresa o institución que quiere facilitar su información tiene que crear páginas WWW, siguiendo el estándar definido por el lenguaje HTML, y ponerlas a disposición del público en Internet, en lo que se llama un servidor WWW. Por otro lado, el usuario que quiere acceder a dichas páginas tiene que utilizar un programa (cliente WWW) que lea las páginas WWW e interprete su siginificado (por ejemplo, un hiperenlace). Estos programas navedores o clientes WWW son los que permiten al ordenador del usuario interpretar el lenguaje HTML.

Existen numerosos programas gratuitos, y algunos comerciales, para leer los documentos WWW. El más conocido es probablemente el Mosaic, del Centro Nacional de Aplicaciones de Supercomputación (NCSA) de los Estados Unidos, del que existen versiones para diferentes plataformas (UNIX, Mac, Windows). Otros programas muy difundidos son Netscape (cuya versión beta es de libre disposición y que resulta más rápido que Mosaic), Cello, WinWeb o MacWeb (para Macintosh). Las capacidades de los diferentes navegadores pueden variar de uno a otro programa: aunque la mayor parte permiten el uso de gráficos como enlaces, quedan algunos como Lynx, para DOS, Unis o VMS) que sólo funcionan en modo texto.

(PC WORLD Junio 1995)

Inicio

Protocolo de direccionamiento de documentos. El URL

Interconectar documentos por todo el planeta sobreentiende un medio único de identificación en la red Internet. La dirección única de un documento en WWW es llamada URL -Uniform Resource Locator- y se compone de los siguientes elementos:
Menos frecuentemente esta dirección prodrá completarse con otros elementos:
La sintáxis mínima utilizada para representar el URL de un documento es la siguiente:
protocolo://nombre_del_servidor/
cuando no se especifica un nombre de fichero se acudirá al fichero predeterminado del servidor, habitualmente la home page.
La sintáxis que se encuentra habitualmente es:
protocolo://nombre_del_servidor/directorio/subdirectorio/nombre_del _documento
La sintáxis completa es:
protocolo://username;password@nombre_del_servidor:puerto/directorio/subdirectorio//nombre_del _documento?argumentos
Se observará también en ciertas direcciones la presencia del signo tilde ( ~ ) delante del nombre de un directorio. Se trata de home pages personales, posibilidad ofrecida a los usuarios que tienen una cuenta en la máquina servidor.
Ejemplos de URL:
http://www.fnac.fr http://www.ra.net/routing.arbiter/NFSNET/NFS.transition.html http://www.in2p3.fr/~dupont/jean.dupont.html
Inicio

Indice

Facultad de Informática de la Universidad de Las Palmas de Gran Canaria