Sitio de Ciencia-Ficcion - MalaCiencia - Un poco más sobre URLs

En el artículo anterior, uno de vosotros me animó a explicar el resto de cosas que puede tener una URL, y que no mencioné por no extenderme demasiado (con lo visto, ya era suficiente para ver la diferencia entre una URL y una dirección IP) Así que, vamos a ello.

Había explicado que una URL, en el caso más genérico, identifica un recurso en la red. Siendo más específicos, podemos decir que entre otras cosas, identifica un fichero en un ordenador. La URL nos dice también cómo acceder al recurso, es decir, qué protocolo utilizar. Nos quedamos con tres elementos básicos de la URL: el protocolo (lo que va antes de ://) la máquina (identificada por su dirección IP o por su nombre de dominio) el puerto (tras :, aparentemente opcional, aunque implícito si no aparece) y el recurso (tras el siguiente /, también opcional, aunque se configura un recurso por defecto)

Fijaos que intento evitar la palabra fichero y referirme siempre a recursos. Esto es porque no todos los recursos son ficheros. Pensemos en un buscador cualquiera (como Google, por ejemplo) Uno introduce sus palabras de búsqueda, y tras pulsar la tecla Enter o clicar el botón correspondiente, vamos a la siguiente página, que es una lista de resultados. Imagino que no pensaréis que dichas páginas existen en forma de ficheros en los servidores de Google, Yahoo, o el que sea, y que cientos de currantes han creado todas las páginas posibles, para todas las combinaciones de palabras posibles. Es obvio que algún programa genera en ese momento la página que vemos, y que ésta no tiene existencia real en ningún disco duro (salvo en alguna caché) Fijaos también que en este caso, en la página con la lista de resultados, la URL que vemos en la cajita de direcciones es muy larga, con símbolos raros, y que aparecen las palabras que habéis tecleado.

Bien, eso es otro fragmento que puede aparecer en la URL, y que se denomina query string (que podríamos traducir como cadena de consulta) Esta query string aparece tras la ruta, precedida del símbolo de interrogación de cierre ?. Habitualmente (sobre todo en el caso de HTTP) consiste en parejas de tipo nombre=valor separados por el símbolo &, donde nombre sería el nombre de un parámetro, y valor su valor. Si buscáis algo en Google, por ejemplo, veréis que la URL de la página de resultados comienza por http://www.google.es/search (si estáis en España, si no, el sufijo será diferente, como .com, .mx, .ar, etc.) tras lo cual sigue la interrogación, y luego la query string. En ella podemos observar un parámetro llamado q, con los términos de búsqueda. Fijaos que los espacios en blanco han sido sustituidos por el símbolo de sumar +, y que algunos caracteres (como eñes o vocales acentuadas) han sido sustituidos por una misteriosa secuencia de símbolos de porcentaje (%) seguidos de letras o números. Esto es porque en una URL no puede aparecer cualquier caracter, por lo que si queremos transmitir algún parámetro con uno de estos caracteres prohibidos, hay que transformarlos (y el servidor, se ocupa de recuperarlos nuevamente)

Un recurso también puede ser un fragmento de otro recurso (por ejemplo, una sección en una página HTML) Para identificar un fragmento de un recurso, se coloca el carácter al final de la URL (que identifica el recurso padre) seguido del identificador del fragmento. Si váis a cualquier artículo más o menos completo de la Wikipedia (por ejemplo, el relativo a URL) veréis que tras una breve introducción aparece una tabla de contenidos, consistente en varios enlaces. Estos enlaces llevan a secciones de la propia página, y si ponéis el puntero sobre ellos, veréis que la URL es la misma que la de la página, pero seguida del caracter y un nombre. Si clicais sobre cualquiera de ellos, os desplazaréis por la página sin que ésta se recargue.

Finalmente, hay otro elemento que puede aparecer en una URL, pero esta vez, delante del identificador de la máquina (tras el ://) Un recurso puede estar protegido, y sólo ser accesible a determinados usuarios, de forma que necesitamos autenticarnos. Si intentamos acceder a un recurso de este estilo mediante nuestro navegador, y la autenticación se realiza mediante nombre de usuario y contraseña, nos aparecerá una pequeña ventanita pidiendo dichos datos (ventanita que pinta el propio navegador, no la página, por lo que su apariencia varía de un navegador a otro, y es consistente con la de éste y la plataforma) En las aplicaciones web no es habitual, ya que la autenticación suele hacerse mediante un formulario HTML, integrado estéticamente en el diseño de la página. Sin embargo es algo que se puede hacer, y que sí es muy habitual en el caso de utilizar FTP. Si queremos, podemos evitar que aparezca la ventanita, añadiendo el nombre de usuario y la contraseña en la propia URL. Para ello, justo después del :// se coloca el nombre de usuario, seguido del carácter de dos puntos (:) la contraseña, el carácter arroba (@) y finalmente el resto de la URL (máquina, puerto, etc.) Así, nos quedaría algo de este tipo: http://usuario:contraseña@dominio.com/recurso.

Como la contraseña aparecerá en la URL, y puede que no queramos que sea tan visible (y que quede guardada en algún registro de direcciones accedidas) podemos no ponerla, y utilizar sólo el nombre de usuario. En este caso, tras el nombre de usuario iría directamente la arroba, y luego el resto de la URL. El navegador nos mostrará igualmente la ventanita, pero con el nombre de usuario ya puesto, aunque esto ya depende del navegador: Opera lo hace así, Firefox muestra la ventana sin rellenar (al menos, en la versión 2) y Explorer, directamente no soporta añadir usuario y contraseña a la URL (al menos, en la versión 6)

Llegados a este punto, no puedo evitar mencionar una curiosidad sobre la arroba (que también es una antigua unidad de masa) Os habréis dado cuenta que la forma usuario@dominio es igual que la utilizada para una dirección de correo electrónico. Esta misma sintaxis se utiliza para otros protocolos y aplicaciones (como el telnet) Y es que en inglés, al simbolito en cuestión se le denomina at, que dependiendo del contexto se puede traducir como en o a. Por tanto, fulanito@gmail.com (por ejemplo) se puede leer como fulanito en gmail.com. ¿A que ahora tiene más sentido lo de la arroba? Dejo a los filólogos e historiadores, el cómo surgió dicho simbolito, y cómo adquirió distintos significados.

Publicado originalmente en MalaCiencia el 17 de abril de 2008

Comentar este artículo

Este artículo ha sido leído 633 veces desde el 19/04/08

Para una referencia más amplia sobre URL puedes consultar:

Las opiniones expresadas en los artículos son de exclusiva responsabilidad del colaborador firmante, y no reflejan, salvo adhesión explícita, los puntos de vista del resto de colaboradores ni de la administración del Sitio.