1. Introducción a Internet. ¿Qué es Internet?. ¿Cómo se - Lan Bide

1. Introducción a Internet.
¿Qué es Internet?.
¿Cómo se interconectan las redes?.
Direcciones y nombres de máquinas.
¿Cómo acceder a Internet?.
¿Qué está permitido en Internet?.
2. Terminal Remota: Telnet.
¿Qué es Telnet?.
¿Para qué podemos usar Telnet?.
3. Correo Electrónico: Mail.
¿Qué es el Mail?.
¿Cómo es una dirección de correo?.
Otras Características adicionales.
4. Transferencias de ficheros: FTP.
¿Para qué sirve el FTP?.
¿Qué es el servicio FTP anonymous?.
¿Qué se puede encontrar en un ordenador con servicio FTP anonymous?.
Transferencias de ficheros entre micros.
¿Cuáles son los comandos FTP más importantes?.
5. Búsqueda de ficheros: Archie.
¿Qué es Archie?.
¿Para qué se utiliza Archie?.
¿Qué tipo de preguntas puede contestar Archie?.
Cosas a tener en cuenta antes de utilizar Archie.
¿Qué hace Archie?.
¿Donde hay servidores Archie?.
¿Cómo utilizar Archie haciendo Telnet a un servidor Archie?.
Lista de los comandos más utilizados en un servidor Archie.
¿Cómo utilizar Archie por correo electrónico?.
6. Noticias a través de la red: News.
La aplicación News.
¿Qué son los grupos de noticias de USENET?.
Retransmisión de noticias a través de la red.
Organización de las noticias.
¿Qué puede hacerse con un lector de noticias?.
Los grupos de noticias que los nuevos usuarios deberían leer.
Estrategias para leer los grupos de News.
7. Búsqueda de personas: Finger y X500.
El comando Finger.
El directorio X500.
¿Cómo se haya estructurada la información en el directorio?.
¿Cómo funcionan las aplicaciones X500?.
8. Búsquedas en Bases de Datos: WAIS
¿Qué es WAIS?.
¿Cómo trabaja WAIS?.
¿Cómo formular una búsqueda WAIS?.
9. Exploración de la red: Gopher y WWW.
A través de Internet: Gopher.
Hipertexto en Internet: WWW.
Introducción a Internet
¿Qué es Internet?.
Internet es una red internacional de ordenadores que nació hace unos 20 años en EEUU. Internet surgió
de una sola red de ordenadores llamada ARPAnet, creada experimentalmente por el Departamento de
Defensa americano para unir sus centros de investigación militar. Las normas o protocolos que estos
ordenadores utilizaban para comunicarse se conocen como protocolos TCP/IP (Transfer Control
Protocol/Internet Protocol).
La filosofía era que cada computadora en la red pudiera hablar con otra en iguales condiciones, y sin que
importaran las diferencias entre ambas. Los fabricantes de productos para Internet comenzaron a
desarrollarlos para distintos tipos de máquinas, respondiendo así a una creciente demanda de mercado.
Esto fue atractivo para distintas instituciones como centros de investigación y universidades en las que no
se exigía que todas las computadoras fueran del mismo fabricante.
Hace tan solo diez años aparecen estaciones de trabajo y redes de área local (Ethernet, sobre todo). Se
creó una nueva de- manda que supone conectar una red local entera a la red ARPAnet, de forma que todas
las máquinas en la red local tuvieran acceso a las facilidades de ARPAnet y no fueran únicamente
máquinas individuales las que se conectasen. Al mismo tiempo otras organizaciones comenzaron a
construir sus propias redes usando los mismos protocolos que ARPAnet (TCP/IP). Es el caso por ejemplo
de NSFnet (National Science Foundation Network).
Hoy en día Internet comprende gran cantidad de redes a nivel mundial. A groso modo, Internet
comprende redes de casi todos los países, las redes de cada país a su vez, forman un conjunto de redes
regionales, y así hay sucesivas subdivisiones.
Un equipo conectado a Internet, a cualquiera de sus subredes, es capaz de comunicarse con cualquier otro
conectado a cualquier subred de Internet. Los equipos pueden estar en cualquier parte del mundo, y
pueden ser desde grandes estaciones multiusuario (Unix, VMS, MV, ...) hasta un ordenador personal (Pc,
Macintosh, ...).
RedIris entre otras cosas ofrece diversos servicios de comunicaciones. Entre ellos la infraestructura de
comunicaciones necesaria para la transferencia de datos entre diversas redes españolas. El troncal que
soporta los servicios de transporte de RedIris es una red X.25 denominada ARTIX.
Las redes que hemos visto, no sirven solo como transporte en España de la red Internet y sus protocolos
TCP/IP, sino que en ella además coexisten otras redes a través de distintos protocolos de comunicaciones
como DECNET y OSI.
Internet como se ha visto, es en realidad una red de redes, y es así como debemos entenderla. A diferencia
de otras privadas no hay un organismo único al que todos los usuarios o redes pagan por estar conectados.
Sino que cada organización gestiona su parte. Los administradores de las redes se reúnen y deciden como
conectar sus redes fundando así interconexiones entre redes. De esta forma, una organización local, paga
o adopta acuerdos para conectarse a través de una red regional, y esta a su vez se integrará en la red
nacional.
El concepto de que Internet no es una red sino una colección de redes no significa mucho para el usuario
final. El usuario puede ver Internet como un sistema telefónico. Así si debe llamarse a alguien en
Inglaterra, poco nos importa como interactúa la Bristish Telecom y Telefónica española para proveer el
servicio. Solo nos interesa conocer exactamente el número telefónico completo que debemos marcar y ya
podremos charlar con la otra persona. Solo en el caso de que haya problemas al establecer la llamada nos
preocuparemos de que la compañía intente solucionarlos.
En Internet ocurre igual solo que en vez de dar con el número telefónico hay que localizar una dirección
de ordenador.
¿Cómo se interconectan las redes?.
Para que dos máquinas establezcan comunicación, estas deben intercambiar información. La información
se agrupa en paquetes, cada paquete no es sino una tira de bits. Estos paquetes pueden atravesar varias
redes hasta llegar a la máquina de destino.
En las redes modernas el proceso de comunicación entre dos máquinas es complejo, de manera que la
tarea se divide en varias partes en forma de niveles. En cada nivel se solucionan determinados problemas.
Cada nivel se aprovecha de lo realizado por el que está en su nivel inferior.
El nivel más externo, llamado de aplicación, es el que más interesa al usuario. En el nivel de aplicación se
encuentran los programas con los que el usuario hace uso de la red.
Resulta fácil entender que a través de un cable podamos conectar dos máquinas, y que los datos puedan ir
de un sitio a otro. Pero, en Internet esto no es así, y se complica, ya que como sabemos, podemos mandar
o recibir datos hacia/desde diversos sitios alrededor del mundo. Pero..., ¿como se realiza esto?
En primer lugar los mensajes que se envían los ordenadores se agrupan en uno o varios paquetes con
información. Cada paquete consta de su dirección de origen y destino. Un conjunto de paquetes forma un
mensaje, podemos considerar el significado de mensaje muy parecido al que recibe en la comunicación
humana.
Al contrario de como podría pensarse los mensajes que intercambian dos máquinas en Internet son
simples, e incluso fácilmente entendibles en algunas aplicaciones como la mensajería electrónica.
Por otro lado, Internet es un conjunto de redes. Todas ellas están conectadas mediante un conjunto de
computadoras especializadas, conocidas como routers. Si las computadoras están en la misma red local,
es la propia red la que sirve de soporte para que dos máquinas intercambien paquetes y si no, son los
routers los encargados de retransmitir los paquetes, de modo que estos viajen a través de otras redes y
lleguen a la red de destino.
A una oficina de correos le llega el correo del área que tiene asignada. Cada carta tiene, al menos, la
dirección de destinatario. Si la carta tiene una dirección local que entre dentro del ámbito de la oficina, no
se necesita consultar a otras oficinas para saber a donde dirigir la carta. Esta se envía directamente al
destinatario.
Si no, se decide cual será la siguiente estación de correos a la que dirigir la carta (buscando la forma más
rápida o menos costosa, seguramente) y mandar el correo a esta estación. Esta a su vez lo manda hacia
otra y así hasta que alcanza su destino, de manera que cada estación sabe como reenviar cada carta a otra
estación aunque no conozca la ruta completa.
Del mismo modo, una computadora manda los paquetes a la red, si su dirección es local los paquetes
llegan directamente a la máquina de destino a través de la red local. Si la dirección es de una máquina en
otra red un router toma los paquetes, mira la dirección hacia donde van y decide a que router mandarle los
paquetes, y así sucesivamente hasta que los datos llegan a la computadora de destino pueden atravesar
varias redes y routers.
Cada router o subestación no tiene una conexión con todas las demás. Siguiendo con el ejemplo, para
enviar una carta de Toledo a Girona no es necesario que un camión de correos vaya directamente desde
Toledo a Girona, si no que hay una jerarquía de subestaciones. La subestación de Toledo mandará el
correo a Madrid, (en el irían cartas tanto para Barcelona o Bilbao), de Madrid a Barcelona, y así hasta
llegar a Girona.
El hecho es que una subestación no tiene por que tener comunicación directa con todas las demás, ni tan
siquiera saber la ruta completa que seguirá la carta, solo sabe que cartas que vayan fuera de la provincia
de Toledo deben ser enviadas por ejemplo a Madrid. De forma parecida se establecen las rutas para
paquetes y se establecen los enlaces entre redes.
Direcciones y nombres de máquinas.
Como el proceso de comunicación entre dos máquinas en la red lleva consigo un intercambio de paquetes.
Cada máquina tiene una dirección única en Internet, de modo que para que un paquete llegue a una
máquina, basta con que en él se especifique la dirección de destino de ésta. Las direcciones tienen el
formato de cuatro números de 0 a 255 separados por puntos. Una dirección Internet es por ejemplo
150.214.70.2. Todos los paquetes con destino a esa máquina tendrán como dirección de destino
150.214.70.2 . Este número es conocido como dirección Internet o número IP.
¡No se preocupe!, pues no tendrá que recordar estos números cuando quiera que un programa en su
ordenador establezca una conexión con otro en una máquina a través de Internet. Aunque en la red se
trabaje con estos números, para cada máquina existe un nombre que seguramente le será más fácil de
recordar.
Este nombre es equivalente a la dirección Internet o dirección IP. Así el nombre equivalente para el
número 150.214.70.3 es "platea.pntic.mec.es". En este distinguimos entre el nombre del ordenador
propiamente dicho "platea", el subdomino "pntic" y el dominio "mec.es" que identifica la red en que se
encuentra el ordenador. Así, sabemos que "platea" es una máquina que pertenece a la red del PNTIC del
MEC, y que forma parte de todas las redes españolas "es".
Se ha visto, de forma somera como se comunican los ordenadores a través de una red. Normalmente estos
procesos deberían pasar inadvertidos para el usuario. De ello se encargan las distintas aplicaciones o
programas que utilizan la red, estos son cada vez más sofisticados y potentes, creando la ilusión de que
hay cosas que se están realizando en modo local, cuando en realidad se están utilizando recursos de
máquinas remotas (discos, CPU, aplicaciones,...).
¿Cómo acceder a Internet?.
En primer lugar debemos resaltar que la red Internet es de ámbito académico, científico e investigador.
Aunque existe una gran demanda por parte de empresas privadas para conectarse a Internet, abarcando en
la actualidad una parte significativa de esta.
El PNTIC dispone de una red propia, inserta en el MEC integrada en Internet, de manera que cualquier
profesor perteneciente al ámbito MEC y si actúa dentro de los ámbitos académico, científico o
investigador, puede solicitar conexión a "Platea" y por añadidura a Internet. Hay prioridades como los
profesores de los Proyectos de Innovación Educativa Atenea y Mercurio, para más información póngase
en contacto con los Servicios Centrales del PNTIC (Madrid).
En el caso de que la conexión física pueda llevarse a cabo, su ordenador podrá estar conectado a la red.
Pero, es necesario además que su equipo disponga de una interfaz de red (conexión Ethernet). El CPR de
ña zona, si puede, le asesorará sobre las distintas posibilidades que con su ordenador podrá tener al estar
conectado.
Solo queda instalar en el ordenador al que usted tenga acceso, el software adecuado para entrar en el
mundo de Internet. Parte de este software será comentado posteriormente.
¿Qué está permitido en Internet?.
Internet es algo más que una red, es una red de redes, y cada una puede tener sus propias normas. Decir
aquello que está permitido hacer es complejo, fundamentalmente por que varía de un sitio a otro y por que
está relacionado con normas éticas y políticas.
Hay algunas normas básicas que siempre debieran tenerse en mente, sobre todo en cuanto al respeto y
consideración con el resto de los usuarios de la red.
En la situación actual no hay mecanismos reales que fuercen a los usuarios a un uso adecuado de la red.
En estas circunstancias, solo nos queda esperar que los usuarios individuales hagan un uso racional de los
recursos comunes y que tengan en cuenta a los demás compañeros.
Recomendaciones para el uso de Internet
Cualquier persona que haga uso de Internet debería tener en cuenta lo siguiente:
La red es compartida por mucha gente. El trato correcto y respeto hacia los demás, en todos los sentidos,
es indispensable.
Tenga cuidado de los cables y del interfaz que le conecta a la red, una conexión incorrecta puede causarle
problemas a usted y a otros usuarios.
Procure utilizar la red, si le es posible en horas de menos uso, usted saldrá ganando pues todo irá más
rápido. Tenga esto en cuenta, sobre todo si el volumen de información que pase por la red es elevado.
Intente primero utilizar los recursos más cercanos. Le ahorrará molestias a usted y al resto de usuarios. No
tiene sentido traerse un fichero que reside en un ordenador en EEUU si podemos traérnoslo de otro en
España.
Utilice la red solo dentro de los ámbitos: investigación, académico o científico.
Si adquiere software o cualquier información a través de red, lea la licencia para su uso. Además, en este
sentido debemos de tener en consideración lo siguiente: Internet, no es una red de ámbito nacional, sino
de ámbito global, de modo que cuando pasemos cualquier tipo de software o información a través de los
límites nacionales, entran en vigor las leyes de exportación y la leyes locales cambian.
3. ¿Qué es el Mail?.
Mucha gente que utiliza la red comenzó precisamente por utilizar el correo electrónico (e-mail). Después
de un principio un poco confuso, en el que se enviaron unos cuantos mensajes (la mayoría seguidos por
una llamada telefónica para saber si habían llegado correctamente), muchos de los usuarios del correo
electrónico acabaron por encontrarse a gusto en el sistema, y algunos sintieron curiosidad por probar otros
programas de red.
En apariencia el correo electrónico es una forma rápida de enviar y recibir "cartas", o su equivalente
electrónico.
Su principal virtud es que nos permite enviar mensajes a cualquier parte del mundo. Para ello basta con
que el usuario de destino tenga cuenta en una máquina que esté en Internet.
Normalmente al usuario se le avisa de que le ha llegado correo al entrar en la computadora en la cual
tiene definido su buzón. Suele ser una máquina multiusuario con la que se conecta, y que le informa de
los mensajes que le llegaron. Metodologías mas modernas, permiten incluso que el correo sea tratado
directamente desde un ordenador personal en su despacho.
Tener un buzón en el que recibir el correo, no es ni más ni menos que ser propietario de una cuenta en una
máquina de Internet. Si usted dispone de una de estas cuentas, entonces posiblemente puede enviar y
recibir correo a cualquier parte del mundo.
Difiere del correo tradicional en varias cosas:
No es necesario pagar por cada mensaje que enviamos.
Es bastante más rápido.
El documento que se envía es electrónico y no en papel.
Los medios de transmisión son electrónicos, normalmente a través de los medios que componen Internet.
Una misma copia del mensaje es fácil de distribuir a varios receptores simultáneos. El emisor y el
receptor no deben ponerse de acuerdo en un instante, para que el emisor pueda enviar su mensaje y el
receptor recibirlo. Sino que se entiende que el emisor manda su mensaje y que cuando llegue, en algún
instante el receptor entra en su máquina y ésta le avisa de que le ha llegado un mensaje de tal persona. En
ocasiones esto supone una ventaja en cuanto a que en comunicaciones a larga distancia puede haber
diferencias horarias que dificulten bastante que el emisor y el receptor estén trabajan- do o incluso
despiertos a la misma hora.
El correo electrónico, no es una aplicación única de Internet, o de los protocolos TCP/IP, sino que existe
en muchas otras re- des, algunas veces utilizando la misma infraestructura de comunicaciones.
Así, en ocasiones, es necesario enviar correo electrónico a un usuario que no esté en Internet, para ello
existen unas máquinas específicas llamadas pasarelas o gateways de correo que permiten enviar correo
entre distintos sistemas. Existen pasarelas conocidas, para redes Bitnet, Compuserve, Fidonet, UUCP, etc.
¿Cómo es una dirección de correo?.
Lo principal a la hora de mandar correo electrónico es saber la dirección del que va a ser el receptor del
mensaje.
La forma habitual de dirección de correo está compuesta de un nombre de receptor y el nombre de la
máquina en la que recibe el correo, separado por una @.
Ejemplo: [email protected] Otro ejemplo: [email protected]
El nombre del receptor suele ser el nombre de usuario (username) utilizado al entrar en la máquina en la
que tiene su cuenta (buzón). Por ejemplo: si yo sé que algún profesor recibe su correo en una máquina
llamada platea o roble y que su nombre de usuario es fulanito, probablemente su dirección de correo será:
[email protected], o [email protected],mec,es , aunque esto no tiene porque ser siempre
así.
Otras características adicionales.
Además de enviar y recibir mensajes hay otras características que añaden más funcionalidad al sistema de
correo electrónico. Veamos las más comunes:
- Definir un alias. Consiste en asociar un sobrenombre más corto a una dirección de correo que utilizamos
con frecuencia.
- Carpetas. Si el volumen de mensajes es elevado puede ser casi imprescindible organizar los mensajes,
por temas, por usuarios, ... Es por ello posible definir carpetas en las que meter mensajes de un mismo
tipo. Es parecido al sistema de organizar los ficheros en directorios.
- Retransmisión de mensajes. Consiste en reenviar el correo que recibimos en nuestra cuenta hacia otra
dirección de correo.
- Réplica. Es una opción para responder a un mensaje basándonos en otro que previamente hemos
recibido, de modo que permite tomar datos del mensaje recibido (la dirección del emisor y el tema al
menos), para enviar un mensaje de respuesta.
- Lista de distribución. Es un concepto importante. Una lista de distribución es una lista de usuarios que
reciben información por correo electrónico sobre algún tema. Es posible a través de correo electrónico,
suscribirse a una de estas listas, de modo que recibiremos información por correo sobre el tema que
hallamos escogido de acuerdo con la lista de distribución a la que nos hallamos suscrito. Normalmente
estas listas de distribución son creadas mediante la característica 'definir alias' antes vista. Especificando
más de un usuario para un alias, así el alias se refiere a una lista de direcciones en vez de a una sola
dirección como se había visto.
Excepto para temas concretos, la utilidad News (que veremos después) es más conveniente. Si aun con
ello, existe una lista de distribución a la que quiere suscribirse póngase en contacto con nosotros.
- Inclusión de ficheros. Es posible incluir ficheros de texto en un mensaje que queremos enviar. A veces
esto es necesario, pero recordemos que la forma natural para transferir ficheros es usar FTP , aunque esto
no es siempre posible (sobre todo porque se ha de conocer el password de la cuenta a la que enviar el
fichero).
Los ficheros deben ser de texto, y contener solo caracteres ASCII estándar para que lleguen inalterados
junto con el mensaje. Se pueden enviar ficheros binarios pero hace falta codificarlos (mediante
UUENCODE o BINHEX).
El comando Finger.
Introducimos este comando no como una manera propia de búsqueda de personas si no como una
pequeña utilidad para saber algo más sobre un usuario. Si sabemos la dirección de correo de un usuario,
normalmente es fácil contactar con él mediante correo electrónico por ejemplo. Pero en Unix y en muchas
implementaciones de TCP/IP se nos permite saber un poco más sobre un usuario de un sistema. Finger se
emplea de la siguiente forma:
finger <dirección_de_correo>
y obtiene información sobre dicho usuario, tal como:
Nombre completo.
Última vez que entró en el sistema.
Su directorio por defecto en la máquina remota.
Si ha leído el correo.
Su plan (lo que tiene previsto hacer).
Además se tiene la posibilidad de listar los usuarios que actualmente estén conectados a un sistema:
finger @<nombre_de_máquina>
Da una lista de los usuarios que se encuentran conectados al sistema.
En algunas ocasiones y por motivos de seguridad algunas máquinas no responderán a las preguntas
"finger".
El directorio X500.
Como ocurre con las compañías telefónicas, sería muy interesante disponer de algún sistema que
permitiera buscar información sobre personas conectadas a la red. Vamos a ver como se ha solucionado
este problema en Internet, en realidad se ha adoptado un sistema que no es nativo de TCP/IP, los
protocolos de Internet sino del popular modelo OSI.
El directorio X500 es una base de datos global sobre objetos tales como personas y organizaciones. Puede
compararase con un listín telefónico que abarca todo el mundo. La información típica que suele
encontrarse son números de teléfono y direcciones de correo electrónico.
Como el tamaño del directorio X500 es enorme, este se halla distribuido a lo largo de todo el mundo en
una serie de computadoras llamadas DSAs (Directory System Agents) o agentes del sistema de directorio.
Es en estos DSA donde reside la información. Normalmente estos DSA contienen solo la información de
la organización a la que pertenecen. De manera que si es necesario consultar información sobre otras
organizaciones o entidades, cooperan entre si para disponer de dicha información. Las máquinas que
acceden a los DSA para hacer las consultas se denominan DUAs (Directory User Agents) o agentes de
usuario. El usuario realiza la pregunta y el DUA se encarga de obtener los datos a partir de un DSA (para
ello, posiblemente este DSA cooperará con otros DSA).
¿Cómo se haya estructurada la información en el directorio?.
El directorio es un conjunto de entradas que contienen información sobre un objeto. Una entrada es una
colección de atributos en el que cada uno describe un aspecto del mismo.
En el caso de una entrada para persona, el nombre de una entrada es típicamente el atributo
CommonName, pero no resultará suficiente ... Piense que en un sistema distribuido por todo el mundo tal
como este, la forma de nombrar las entradas no puede ser tan simple.
El nombre deberá ser único. Por ello, el directorio está estructurado como un árbol. En cada nodo del
árbol hay un atributo. El nombre completo del objeto está compuesto por la serie de atributos que se
forman al recorrer el árbol desde el nodo raíz hasta llegar al objeto.
En cada nivel del árbol consideramos un atributo, veamos cuales son:
País [Country (c)]
Organización [Organization (o)]
Unidad organizacional [Organizational Unit (ou)]
Nombre [CommonName (cn)]
La jerarquía, queda así organizada de la siguiente forma. En el nivel más alto tenemos países (Country
(c)), por debajo de este organizaciones (Organization (o)) y bajo este uno o más niveles de unidades
organizacionales (OrganizationalUnits (ou)). Estos países, organizaciones y suborganizaciones son
también entradas en el directorio. Finalmente está el nombre de la persona u organización que suele
abreviarse como cn (CommonName).
Cada objeto en esta jerarquía queda definido de forma única por la serie de atributos obtenidos al recorrer
el árbol desde el nodo raíz hasta llegar al objeto. Por ejemplo:
cn=Manuel Fernández, o=Universidad de Cadiz, ou= Servicio Central de Informatica, c=ES
es un nombre único de entrada para el directorio X500 , y es conocido como Nombre Distinguido. Existe
una nomenclatura que permite prescindir de los nombres de atributo llamada Nombre Amigable:
Manuel Fernández, Universidad de Cadiz, Servicio Central de Informatica, ES
¿Cómo funcionan las aplicaciones X500?.
Generalmente existen dos métodos de consulta, dependiendo de la cantidad de información que
conozcamos acerca del objeto.
Sabiendo los datos más o menos precisos (c,o,ou,cn) podemos especificar el Nombre Amigable del
objeto, incluso aunque sea aproximado, y muy posiblemente podamos dar con la persona u organización
que pretendemos, para conocer más características sobre ella.
En el ejemplo anterior, puede obtenerse igual resultado ante una consulta tanto si damos los datos
concretos, como si por ejemplo hubiésemos dado como Nombre Amigable:
Manuel Fernández, uca, es
Si sabemos más bien poco sobre el objeto de la búsqueda, nos dedicaremos a hojear (browse) por el
directorio X500 (como con un listín telefónico). En primer lugar deberemos determinar el país.
Normalmente se nos presenta una lista de todos y elegiremos uno. De la misma forma se nos presentará
una lista de organizaciones dentro de ese país para elegir una, y así sucesiva- mente hasta encontrar la/s
unidad/es organizacional/es y el nombre. Llegando a obtener el nombre del objeto en cuestión.
Una vez determinado el nombre del objeto por un método o por otro podremos consultar otros atributos
como el teléfono, dirección de correo, localización, su foto, ...
Las aplicaciones que nos permiten el acceso al servicio de directorio son bastante simples de utilizar, y no
vamos aquí a entrar en más detalle.
El acceso al servicio de directorio puede hacerse mediante Telnet a ocelote.cica.es, dando como login
"director". Automáticamente entramos en la aplicación, y se nos presenta una pantalla de ayuda. (Véase el
ejemplo que dimos en el apartado de Telnet ).
Así mismo existen aplicaciones que le permiten desde su estación de trabajo acceder al directorio. Están
disponibles para PC (Swix y PiXie) y para Mac (MaX500) entre otras.
¿Qué es WAIS?.
Las siglas WAIS vienen de Wide Area Information Server (Servidor de Información de Area Amplia).
Con WAIS podemos buscar información a través de material indexado y localizar artículos basándonos
en su contenido. De esta forma WAIS nos permite encontrar, a través de toda Internet, archivos que
contengan los grupos de palabras que nosotros le indiquemos.
WAIS es una herramienta muy útil para trabajar con colecciones de datos, sin importar mucho el formato
que tenga la información presentada. De hecho, durante el proceso de búsqueda, el servicio no mira los
datos sino únicamente un índice . Una vez encontrada la información buscada, se limita a presentarla tal y
como ha sido grabada por quien ha construido la base de datos.
La información que WAIS es capaz de localizar puede ser prácticamente cualquier cosa, texto, ficheros de
sonido, imágenes, todo aquello que nos podamos imaginar. Esa información puede residir en cualquier
lugar y en muy diferentes tipos de ordena- dores, pero, para nosotros esto es totalmente transparente. En
ningún momento necesitamos recordar ni saber donde está ni cómo acceder a esa información, WAIS
hace la búsqueda por nosotros. Simplemente se le indica lo que se quiere y él intenta encontrar el
material.
Para que sea más fácil buscar a través de este servicio y tener acceso a todo tipo de bases de datos se han
ideado una serie de ficheros llamados "sources" (fuentes). Cada uno de ellos se podría decir que es un
apunte a una biblioteca donde hay acumula- da información sobre algún tema especifico. O para ser más
exactos, en cada una de esas "fuentes" se guarda información sobre:
¿Cual es la máquina que mantiene esa base de datos?
¿Cómo contactar con dicha máquina para hacer consultas?
Una pequeña descripción del tipo de artículo o documento que puede obtenerse consultando esa base de
datos.
La dirección de correo electrónico de una persona de contacto, por si hubiese algún problema.
En WAIS siempre utilizaremos el mismo método de búsqueda independientemente de la Base de Datos a
la que accedamos. Una búsqueda a través de WAIS sería tan simple como decir búscame artículos
relacionados con esto en esta biblioteca. Entonces, WAIS buscará, entre todos los documentos que
figuran en dicha biblioteca, aquella información relacionada con lo que desea. Nos proporcionará una
relación de los ficheros que ha encontrado, y si se desea, los traerá para que los podamos leer, ver, oír,
según de lo que se trate.
¿Cómo trabaja WAIS?.
Para hacer disponible un documento a través de un servidor WAIS , alguien tiene que molestarse en crear
el índice que más tarde el servidor utilizará en sus búsquedas. Desde el punto de vista de un usuario, un
servidor es una fuente de información a la que puede localizarse desde cualquier otra maquina que tenga
acceso a la red.
Para el caso de un fichero de texto, cada palabra que lo compone está indexada. De este modo, cuando se
solicita una búsqueda a un servidor WAIS este contacta con los servidores que manejan las "fuentes" (o
bibliotecas) que se le indican, requiriendo a cada uno de ellos para que busque en sus índices el conjunto
de palabras que previamente hemos indicado. Como resultado, el servidor WAIS envía una relación de
los documentos que parecen ajustarse más a esa búsqueda; junto con una puntuación para cada fichero, la
cual informa de lo ajustado que es ese fichero al que se busca (en opinión del servidor). La puntuación
esta normalizada, o sea, que al mejor documento se le asigna el valor máximo que es 1000, y a partir de
ahí a los restantes se les da una puntuación de manera proporcional.
Si por ejemplo, se decide hacer la búsqueda de todos aquellos documentos que contengan "art
contemporary", WAIS buscará en cada índice y contará cuantas veces aparece la palabra "art", y la
palabra "contemporary" en cada documento. Las sumas de ese recuento se sopesan (sin dar importancia al
propio significado de la palabra), convirtiéndose en la puntuación de ese documento. Después de que
WAIS haya buscado en todas las "fuentes", da una lista de los documentos que más puntuación han
obtenido en el recuento, limitando la lista a unos 15 o 50 documentos como máximo (esto depende del
cliente WAIS utilizado). Si, por último, quiere ver alguno de estos documentos, basta seleccionarlo para
que WAIS lo muestre.
WAIS está diseñado para trabajar con diferentes tipos de bases de datos, pero de manera que el usuario no
tenga necesidad de aprender el manejo de cada una de ellas. Está pensado para que requiera el mínimo
esfuerzo para el que lo utiliza. Por ello, se ha simplificado de manera que:
Las consultas se realizan en lenguaje natural (en Inglés). Simplemente seleccionando aquellas palabras o
términos que describan concretamente el tema en el que está interesado.
Se le dice, que fuentes ha de consultar, pudiendo utilizar múltiples fuentes en una misma pregunta.
Una vez recibido el resultado de una consulta, si se encuentra algún documento relevante que interesa, se
puede relanzar la misma pregunta consultando de nuevo a las mismas fuentes, pero especificando ahora
que el contenido de los nuevos textos debe ser parecido al de esos documentos que se acaban de mirar.
Utilizar WAIS es tan fácil como seguir esos tres puntos. Ya se preocupará el propio protocolo de WAIS
de contactar con las fuentes, traducirles la pregunta y una vez reciba la respuesta, volverla a traducir a un
lenguaje que nos sea fácil de entender.