1. Introducción a Internet. ¿Qué es Internet?. ¿Cómo se interconectan las redes?. Direcciones y nombres de máquinas. ¿Cómo acceder a Internet?. ¿Qué está permitido en Internet?. 2. Terminal Remota: Telnet. ¿Qué es Telnet?. ¿Para qué podemos usar Telnet?. 3. Correo Electrónico: Mail. ¿Qué es el Mail?. ¿Cómo es una dirección de correo?. Otras Características adicionales. 4. Transferencias de ficheros: FTP. ¿Para qué sirve el FTP?. ¿Qué es el servicio FTP anonymous?. ¿Qué se puede encontrar en un ordenador con servicio FTP anonymous?. Transferencias de ficheros entre micros. ¿Cuáles son los comandos FTP más importantes?. 5. Búsqueda de ficheros: Archie. ¿Qué es Archie?. ¿Para qué se utiliza Archie?. ¿Qué tipo de preguntas puede contestar Archie?. Cosas a tener en cuenta antes de utilizar Archie. ¿Qué hace Archie?. ¿Donde hay servidores Archie?. ¿Cómo utilizar Archie haciendo Telnet a un servidor Archie?. Lista de los comandos más utilizados en un servidor Archie. ¿Cómo utilizar Archie por correo electrónico?. 6. Noticias a través de la red: News. La aplicación News. ¿Qué son los grupos de noticias de USENET?. Retransmisión de noticias a través de la red. Organización de las noticias. ¿Qué puede hacerse con un lector de noticias?. Los grupos de noticias que los nuevos usuarios deberían leer. Estrategias para leer los grupos de News. 7. Búsqueda de personas: Finger y X500. El comando Finger. El directorio X500. ¿Cómo se haya estructurada la información en el directorio?. ¿Cómo funcionan las aplicaciones X500?. 8. Búsquedas en Bases de Datos: WAIS ¿Qué es WAIS?. ¿Cómo trabaja WAIS?. ¿Cómo formular una búsqueda WAIS?. 9. Exploración de la red: Gopher y WWW. A través de Internet: Gopher. Hipertexto en Internet: WWW. Introducción a Internet ¿Qué es Internet?. Internet es una red internacional de ordenadores que nació hace unos 20 años en EEUU. Internet surgió de una sola red de ordenadores llamada ARPAnet, creada experimentalmente por el Departamento de Defensa americano para unir sus centros de investigación militar. Las normas o protocolos que estos ordenadores utilizaban para comunicarse se conocen como protocolos TCP/IP (Transfer Control Protocol/Internet Protocol). La filosofía era que cada computadora en la red pudiera hablar con otra en iguales condiciones, y sin que importaran las diferencias entre ambas. Los fabricantes de productos para Internet comenzaron a desarrollarlos para distintos tipos de máquinas, respondiendo así a una creciente demanda de mercado. Esto fue atractivo para distintas instituciones como centros de investigación y universidades en las que no se exigía que todas las computadoras fueran del mismo fabricante. Hace tan solo diez años aparecen estaciones de trabajo y redes de área local (Ethernet, sobre todo). Se creó una nueva de- manda que supone conectar una red local entera a la red ARPAnet, de forma que todas las máquinas en la red local tuvieran acceso a las facilidades de ARPAnet y no fueran únicamente máquinas individuales las que se conectasen. Al mismo tiempo otras organizaciones comenzaron a construir sus propias redes usando los mismos protocolos que ARPAnet (TCP/IP). Es el caso por ejemplo de NSFnet (National Science Foundation Network). Hoy en día Internet comprende gran cantidad de redes a nivel mundial. A groso modo, Internet comprende redes de casi todos los países, las redes de cada país a su vez, forman un conjunto de redes regionales, y así hay sucesivas subdivisiones. Un equipo conectado a Internet, a cualquiera de sus subredes, es capaz de comunicarse con cualquier otro conectado a cualquier subred de Internet. Los equipos pueden estar en cualquier parte del mundo, y pueden ser desde grandes estaciones multiusuario (Unix, VMS, MV, ...) hasta un ordenador personal (Pc, Macintosh, ...). RedIris entre otras cosas ofrece diversos servicios de comunicaciones. Entre ellos la infraestructura de comunicaciones necesaria para la transferencia de datos entre diversas redes españolas. El troncal que soporta los servicios de transporte de RedIris es una red X.25 denominada ARTIX. Las redes que hemos visto, no sirven solo como transporte en España de la red Internet y sus protocolos TCP/IP, sino que en ella además coexisten otras redes a través de distintos protocolos de comunicaciones como DECNET y OSI. Internet como se ha visto, es en realidad una red de redes, y es así como debemos entenderla. A diferencia de otras privadas no hay un organismo único al que todos los usuarios o redes pagan por estar conectados. Sino que cada organización gestiona su parte. Los administradores de las redes se reúnen y deciden como conectar sus redes fundando así interconexiones entre redes. De esta forma, una organización local, paga o adopta acuerdos para conectarse a través de una red regional, y esta a su vez se integrará en la red nacional. El concepto de que Internet no es una red sino una colección de redes no significa mucho para el usuario final. El usuario puede ver Internet como un sistema telefónico. Así si debe llamarse a alguien en Inglaterra, poco nos importa como interactúa la Bristish Telecom y Telefónica española para proveer el servicio. Solo nos interesa conocer exactamente el número telefónico completo que debemos marcar y ya podremos charlar con la otra persona. Solo en el caso de que haya problemas al establecer la llamada nos preocuparemos de que la compañía intente solucionarlos. En Internet ocurre igual solo que en vez de dar con el número telefónico hay que localizar una dirección de ordenador. ¿Cómo se interconectan las redes?. Para que dos máquinas establezcan comunicación, estas deben intercambiar información. La información se agrupa en paquetes, cada paquete no es sino una tira de bits. Estos paquetes pueden atravesar varias redes hasta llegar a la máquina de destino. En las redes modernas el proceso de comunicación entre dos máquinas es complejo, de manera que la tarea se divide en varias partes en forma de niveles. En cada nivel se solucionan determinados problemas. Cada nivel se aprovecha de lo realizado por el que está en su nivel inferior. El nivel más externo, llamado de aplicación, es el que más interesa al usuario. En el nivel de aplicación se encuentran los programas con los que el usuario hace uso de la red. Resulta fácil entender que a través de un cable podamos conectar dos máquinas, y que los datos puedan ir de un sitio a otro. Pero, en Internet esto no es así, y se complica, ya que como sabemos, podemos mandar o recibir datos hacia/desde diversos sitios alrededor del mundo. Pero..., ¿como se realiza esto? En primer lugar los mensajes que se envían los ordenadores se agrupan en uno o varios paquetes con información. Cada paquete consta de su dirección de origen y destino. Un conjunto de paquetes forma un mensaje, podemos considerar el significado de mensaje muy parecido al que recibe en la comunicación humana. Al contrario de como podría pensarse los mensajes que intercambian dos máquinas en Internet son simples, e incluso fácilmente entendibles en algunas aplicaciones como la mensajería electrónica. Por otro lado, Internet es un conjunto de redes. Todas ellas están conectadas mediante un conjunto de computadoras especializadas, conocidas como routers. Si las computadoras están en la misma red local, es la propia red la que sirve de soporte para que dos máquinas intercambien paquetes y si no, son los routers los encargados de retransmitir los paquetes, de modo que estos viajen a través de otras redes y lleguen a la red de destino. A una oficina de correos le llega el correo del área que tiene asignada. Cada carta tiene, al menos, la dirección de destinatario. Si la carta tiene una dirección local que entre dentro del ámbito de la oficina, no se necesita consultar a otras oficinas para saber a donde dirigir la carta. Esta se envía directamente al destinatario. Si no, se decide cual será la siguiente estación de correos a la que dirigir la carta (buscando la forma más rápida o menos costosa, seguramente) y mandar el correo a esta estación. Esta a su vez lo manda hacia otra y así hasta que alcanza su destino, de manera que cada estación sabe como reenviar cada carta a otra estación aunque no conozca la ruta completa. Del mismo modo, una computadora manda los paquetes a la red, si su dirección es local los paquetes llegan directamente a la máquina de destino a través de la red local. Si la dirección es de una máquina en otra red un router toma los paquetes, mira la dirección hacia donde van y decide a que router mandarle los paquetes, y así sucesivamente hasta que los datos llegan a la computadora de destino pueden atravesar varias redes y routers. Cada router o subestación no tiene una conexión con todas las demás. Siguiendo con el ejemplo, para enviar una carta de Toledo a Girona no es necesario que un camión de correos vaya directamente desde Toledo a Girona, si no que hay una jerarquía de subestaciones. La subestación de Toledo mandará el correo a Madrid, (en el irían cartas tanto para Barcelona o Bilbao), de Madrid a Barcelona, y así hasta llegar a Girona. El hecho es que una subestación no tiene por que tener comunicación directa con todas las demás, ni tan siquiera saber la ruta completa que seguirá la carta, solo sabe que cartas que vayan fuera de la provincia de Toledo deben ser enviadas por ejemplo a Madrid. De forma parecida se establecen las rutas para paquetes y se establecen los enlaces entre redes. Direcciones y nombres de máquinas. Como el proceso de comunicación entre dos máquinas en la red lleva consigo un intercambio de paquetes. Cada máquina tiene una dirección única en Internet, de modo que para que un paquete llegue a una máquina, basta con que en él se especifique la dirección de destino de ésta. Las direcciones tienen el formato de cuatro números de 0 a 255 separados por puntos. Una dirección Internet es por ejemplo 150.214.70.2. Todos los paquetes con destino a esa máquina tendrán como dirección de destino 150.214.70.2 . Este número es conocido como dirección Internet o número IP. ¡No se preocupe!, pues no tendrá que recordar estos números cuando quiera que un programa en su ordenador establezca una conexión con otro en una máquina a través de Internet. Aunque en la red se trabaje con estos números, para cada máquina existe un nombre que seguramente le será más fácil de recordar. Este nombre es equivalente a la dirección Internet o dirección IP. Así el nombre equivalente para el número 150.214.70.3 es "platea.pntic.mec.es". En este distinguimos entre el nombre del ordenador propiamente dicho "platea", el subdomino "pntic" y el dominio "mec.es" que identifica la red en que se encuentra el ordenador. Así, sabemos que "platea" es una máquina que pertenece a la red del PNTIC del MEC, y que forma parte de todas las redes españolas "es". Se ha visto, de forma somera como se comunican los ordenadores a través de una red. Normalmente estos procesos deberían pasar inadvertidos para el usuario. De ello se encargan las distintas aplicaciones o programas que utilizan la red, estos son cada vez más sofisticados y potentes, creando la ilusión de que hay cosas que se están realizando en modo local, cuando en realidad se están utilizando recursos de máquinas remotas (discos, CPU, aplicaciones,...). ¿Cómo acceder a Internet?. En primer lugar debemos resaltar que la red Internet es de ámbito académico, científico e investigador. Aunque existe una gran demanda por parte de empresas privadas para conectarse a Internet, abarcando en la actualidad una parte significativa de esta. El PNTIC dispone de una red propia, inserta en el MEC integrada en Internet, de manera que cualquier profesor perteneciente al ámbito MEC y si actúa dentro de los ámbitos académico, científico o investigador, puede solicitar conexión a "Platea" y por añadidura a Internet. Hay prioridades como los profesores de los Proyectos de Innovación Educativa Atenea y Mercurio, para más información póngase en contacto con los Servicios Centrales del PNTIC (Madrid). En el caso de que la conexión física pueda llevarse a cabo, su ordenador podrá estar conectado a la red. Pero, es necesario además que su equipo disponga de una interfaz de red (conexión Ethernet). El CPR de ña zona, si puede, le asesorará sobre las distintas posibilidades que con su ordenador podrá tener al estar conectado. Solo queda instalar en el ordenador al que usted tenga acceso, el software adecuado para entrar en el mundo de Internet. Parte de este software será comentado posteriormente. ¿Qué está permitido en Internet?. Internet es algo más que una red, es una red de redes, y cada una puede tener sus propias normas. Decir aquello que está permitido hacer es complejo, fundamentalmente por que varía de un sitio a otro y por que está relacionado con normas éticas y políticas. Hay algunas normas básicas que siempre debieran tenerse en mente, sobre todo en cuanto al respeto y consideración con el resto de los usuarios de la red. En la situación actual no hay mecanismos reales que fuercen a los usuarios a un uso adecuado de la red. En estas circunstancias, solo nos queda esperar que los usuarios individuales hagan un uso racional de los recursos comunes y que tengan en cuenta a los demás compañeros. Recomendaciones para el uso de Internet Cualquier persona que haga uso de Internet debería tener en cuenta lo siguiente: La red es compartida por mucha gente. El trato correcto y respeto hacia los demás, en todos los sentidos, es indispensable. Tenga cuidado de los cables y del interfaz que le conecta a la red, una conexión incorrecta puede causarle problemas a usted y a otros usuarios. Procure utilizar la red, si le es posible en horas de menos uso, usted saldrá ganando pues todo irá más rápido. Tenga esto en cuenta, sobre todo si el volumen de información que pase por la red es elevado. Intente primero utilizar los recursos más cercanos. Le ahorrará molestias a usted y al resto de usuarios. No tiene sentido traerse un fichero que reside en un ordenador en EEUU si podemos traérnoslo de otro en España. Utilice la red solo dentro de los ámbitos: investigación, académico o científico. Si adquiere software o cualquier información a través de red, lea la licencia para su uso. Además, en este sentido debemos de tener en consideración lo siguiente: Internet, no es una red de ámbito nacional, sino de ámbito global, de modo que cuando pasemos cualquier tipo de software o información a través de los límites nacionales, entran en vigor las leyes de exportación y la leyes locales cambian. 3. ¿Qué es el Mail?. Mucha gente que utiliza la red comenzó precisamente por utilizar el correo electrónico (e-mail). Después de un principio un poco confuso, en el que se enviaron unos cuantos mensajes (la mayoría seguidos por una llamada telefónica para saber si habían llegado correctamente), muchos de los usuarios del correo electrónico acabaron por encontrarse a gusto en el sistema, y algunos sintieron curiosidad por probar otros programas de red. En apariencia el correo electrónico es una forma rápida de enviar y recibir "cartas", o su equivalente electrónico. Su principal virtud es que nos permite enviar mensajes a cualquier parte del mundo. Para ello basta con que el usuario de destino tenga cuenta en una máquina que esté en Internet. Normalmente al usuario se le avisa de que le ha llegado correo al entrar en la computadora en la cual tiene definido su buzón. Suele ser una máquina multiusuario con la que se conecta, y que le informa de los mensajes que le llegaron. Metodologías mas modernas, permiten incluso que el correo sea tratado directamente desde un ordenador personal en su despacho. Tener un buzón en el que recibir el correo, no es ni más ni menos que ser propietario de una cuenta en una máquina de Internet. Si usted dispone de una de estas cuentas, entonces posiblemente puede enviar y recibir correo a cualquier parte del mundo. Difiere del correo tradicional en varias cosas: No es necesario pagar por cada mensaje que enviamos. Es bastante más rápido. El documento que se envía es electrónico y no en papel. Los medios de transmisión son electrónicos, normalmente a través de los medios que componen Internet. Una misma copia del mensaje es fácil de distribuir a varios receptores simultáneos. El emisor y el receptor no deben ponerse de acuerdo en un instante, para que el emisor pueda enviar su mensaje y el receptor recibirlo. Sino que se entiende que el emisor manda su mensaje y que cuando llegue, en algún instante el receptor entra en su máquina y ésta le avisa de que le ha llegado un mensaje de tal persona. En ocasiones esto supone una ventaja en cuanto a que en comunicaciones a larga distancia puede haber diferencias horarias que dificulten bastante que el emisor y el receptor estén trabajan- do o incluso despiertos a la misma hora. El correo electrónico, no es una aplicación única de Internet, o de los protocolos TCP/IP, sino que existe en muchas otras re- des, algunas veces utilizando la misma infraestructura de comunicaciones. Así, en ocasiones, es necesario enviar correo electrónico a un usuario que no esté en Internet, para ello existen unas máquinas específicas llamadas pasarelas o gateways de correo que permiten enviar correo entre distintos sistemas. Existen pasarelas conocidas, para redes Bitnet, Compuserve, Fidonet, UUCP, etc. ¿Cómo es una dirección de correo?. Lo principal a la hora de mandar correo electrónico es saber la dirección del que va a ser el receptor del mensaje. La forma habitual de dirección de correo está compuesta de un nombre de receptor y el nombre de la máquina en la que recibe el correo, separado por una @. Ejemplo: [email protected] Otro ejemplo: [email protected] El nombre del receptor suele ser el nombre de usuario (username) utilizado al entrar en la máquina en la que tiene su cuenta (buzón). Por ejemplo: si yo sé que algún profesor recibe su correo en una máquina llamada platea o roble y que su nombre de usuario es fulanito, probablemente su dirección de correo será: [email protected], o [email protected],mec,es , aunque esto no tiene porque ser siempre así. Otras características adicionales. Además de enviar y recibir mensajes hay otras características que añaden más funcionalidad al sistema de correo electrónico. Veamos las más comunes: - Definir un alias. Consiste en asociar un sobrenombre más corto a una dirección de correo que utilizamos con frecuencia. - Carpetas. Si el volumen de mensajes es elevado puede ser casi imprescindible organizar los mensajes, por temas, por usuarios, ... Es por ello posible definir carpetas en las que meter mensajes de un mismo tipo. Es parecido al sistema de organizar los ficheros en directorios. - Retransmisión de mensajes. Consiste en reenviar el correo que recibimos en nuestra cuenta hacia otra dirección de correo. - Réplica. Es una opción para responder a un mensaje basándonos en otro que previamente hemos recibido, de modo que permite tomar datos del mensaje recibido (la dirección del emisor y el tema al menos), para enviar un mensaje de respuesta. - Lista de distribución. Es un concepto importante. Una lista de distribución es una lista de usuarios que reciben información por correo electrónico sobre algún tema. Es posible a través de correo electrónico, suscribirse a una de estas listas, de modo que recibiremos información por correo sobre el tema que hallamos escogido de acuerdo con la lista de distribución a la que nos hallamos suscrito. Normalmente estas listas de distribución son creadas mediante la característica 'definir alias' antes vista. Especificando más de un usuario para un alias, así el alias se refiere a una lista de direcciones en vez de a una sola dirección como se había visto. Excepto para temas concretos, la utilidad News (que veremos después) es más conveniente. Si aun con ello, existe una lista de distribución a la que quiere suscribirse póngase en contacto con nosotros. - Inclusión de ficheros. Es posible incluir ficheros de texto en un mensaje que queremos enviar. A veces esto es necesario, pero recordemos que la forma natural para transferir ficheros es usar FTP , aunque esto no es siempre posible (sobre todo porque se ha de conocer el password de la cuenta a la que enviar el fichero). Los ficheros deben ser de texto, y contener solo caracteres ASCII estándar para que lleguen inalterados junto con el mensaje. Se pueden enviar ficheros binarios pero hace falta codificarlos (mediante UUENCODE o BINHEX). El comando Finger. Introducimos este comando no como una manera propia de búsqueda de personas si no como una pequeña utilidad para saber algo más sobre un usuario. Si sabemos la dirección de correo de un usuario, normalmente es fácil contactar con él mediante correo electrónico por ejemplo. Pero en Unix y en muchas implementaciones de TCP/IP se nos permite saber un poco más sobre un usuario de un sistema. Finger se emplea de la siguiente forma: finger <dirección_de_correo> y obtiene información sobre dicho usuario, tal como: Nombre completo. Última vez que entró en el sistema. Su directorio por defecto en la máquina remota. Si ha leído el correo. Su plan (lo que tiene previsto hacer). Además se tiene la posibilidad de listar los usuarios que actualmente estén conectados a un sistema: finger @<nombre_de_máquina> Da una lista de los usuarios que se encuentran conectados al sistema. En algunas ocasiones y por motivos de seguridad algunas máquinas no responderán a las preguntas "finger". El directorio X500. Como ocurre con las compañías telefónicas, sería muy interesante disponer de algún sistema que permitiera buscar información sobre personas conectadas a la red. Vamos a ver como se ha solucionado este problema en Internet, en realidad se ha adoptado un sistema que no es nativo de TCP/IP, los protocolos de Internet sino del popular modelo OSI. El directorio X500 es una base de datos global sobre objetos tales como personas y organizaciones. Puede compararase con un listín telefónico que abarca todo el mundo. La información típica que suele encontrarse son números de teléfono y direcciones de correo electrónico. Como el tamaño del directorio X500 es enorme, este se halla distribuido a lo largo de todo el mundo en una serie de computadoras llamadas DSAs (Directory System Agents) o agentes del sistema de directorio. Es en estos DSA donde reside la información. Normalmente estos DSA contienen solo la información de la organización a la que pertenecen. De manera que si es necesario consultar información sobre otras organizaciones o entidades, cooperan entre si para disponer de dicha información. Las máquinas que acceden a los DSA para hacer las consultas se denominan DUAs (Directory User Agents) o agentes de usuario. El usuario realiza la pregunta y el DUA se encarga de obtener los datos a partir de un DSA (para ello, posiblemente este DSA cooperará con otros DSA). ¿Cómo se haya estructurada la información en el directorio?. El directorio es un conjunto de entradas que contienen información sobre un objeto. Una entrada es una colección de atributos en el que cada uno describe un aspecto del mismo. En el caso de una entrada para persona, el nombre de una entrada es típicamente el atributo CommonName, pero no resultará suficiente ... Piense que en un sistema distribuido por todo el mundo tal como este, la forma de nombrar las entradas no puede ser tan simple. El nombre deberá ser único. Por ello, el directorio está estructurado como un árbol. En cada nodo del árbol hay un atributo. El nombre completo del objeto está compuesto por la serie de atributos que se forman al recorrer el árbol desde el nodo raíz hasta llegar al objeto. En cada nivel del árbol consideramos un atributo, veamos cuales son: País [Country (c)] Organización [Organization (o)] Unidad organizacional [Organizational Unit (ou)] Nombre [CommonName (cn)] La jerarquía, queda así organizada de la siguiente forma. En el nivel más alto tenemos países (Country (c)), por debajo de este organizaciones (Organization (o)) y bajo este uno o más niveles de unidades organizacionales (OrganizationalUnits (ou)). Estos países, organizaciones y suborganizaciones son también entradas en el directorio. Finalmente está el nombre de la persona u organización que suele abreviarse como cn (CommonName). Cada objeto en esta jerarquía queda definido de forma única por la serie de atributos obtenidos al recorrer el árbol desde el nodo raíz hasta llegar al objeto. Por ejemplo: cn=Manuel Fernández, o=Universidad de Cadiz, ou= Servicio Central de Informatica, c=ES es un nombre único de entrada para el directorio X500 , y es conocido como Nombre Distinguido. Existe una nomenclatura que permite prescindir de los nombres de atributo llamada Nombre Amigable: Manuel Fernández, Universidad de Cadiz, Servicio Central de Informatica, ES ¿Cómo funcionan las aplicaciones X500?. Generalmente existen dos métodos de consulta, dependiendo de la cantidad de información que conozcamos acerca del objeto. Sabiendo los datos más o menos precisos (c,o,ou,cn) podemos especificar el Nombre Amigable del objeto, incluso aunque sea aproximado, y muy posiblemente podamos dar con la persona u organización que pretendemos, para conocer más características sobre ella. En el ejemplo anterior, puede obtenerse igual resultado ante una consulta tanto si damos los datos concretos, como si por ejemplo hubiésemos dado como Nombre Amigable: Manuel Fernández, uca, es Si sabemos más bien poco sobre el objeto de la búsqueda, nos dedicaremos a hojear (browse) por el directorio X500 (como con un listín telefónico). En primer lugar deberemos determinar el país. Normalmente se nos presenta una lista de todos y elegiremos uno. De la misma forma se nos presentará una lista de organizaciones dentro de ese país para elegir una, y así sucesiva- mente hasta encontrar la/s unidad/es organizacional/es y el nombre. Llegando a obtener el nombre del objeto en cuestión. Una vez determinado el nombre del objeto por un método o por otro podremos consultar otros atributos como el teléfono, dirección de correo, localización, su foto, ... Las aplicaciones que nos permiten el acceso al servicio de directorio son bastante simples de utilizar, y no vamos aquí a entrar en más detalle. El acceso al servicio de directorio puede hacerse mediante Telnet a ocelote.cica.es, dando como login "director". Automáticamente entramos en la aplicación, y se nos presenta una pantalla de ayuda. (Véase el ejemplo que dimos en el apartado de Telnet ). Así mismo existen aplicaciones que le permiten desde su estación de trabajo acceder al directorio. Están disponibles para PC (Swix y PiXie) y para Mac (MaX500) entre otras. ¿Qué es WAIS?. Las siglas WAIS vienen de Wide Area Information Server (Servidor de Información de Area Amplia). Con WAIS podemos buscar información a través de material indexado y localizar artículos basándonos en su contenido. De esta forma WAIS nos permite encontrar, a través de toda Internet, archivos que contengan los grupos de palabras que nosotros le indiquemos. WAIS es una herramienta muy útil para trabajar con colecciones de datos, sin importar mucho el formato que tenga la información presentada. De hecho, durante el proceso de búsqueda, el servicio no mira los datos sino únicamente un índice . Una vez encontrada la información buscada, se limita a presentarla tal y como ha sido grabada por quien ha construido la base de datos. La información que WAIS es capaz de localizar puede ser prácticamente cualquier cosa, texto, ficheros de sonido, imágenes, todo aquello que nos podamos imaginar. Esa información puede residir en cualquier lugar y en muy diferentes tipos de ordena- dores, pero, para nosotros esto es totalmente transparente. En ningún momento necesitamos recordar ni saber donde está ni cómo acceder a esa información, WAIS hace la búsqueda por nosotros. Simplemente se le indica lo que se quiere y él intenta encontrar el material. Para que sea más fácil buscar a través de este servicio y tener acceso a todo tipo de bases de datos se han ideado una serie de ficheros llamados "sources" (fuentes). Cada uno de ellos se podría decir que es un apunte a una biblioteca donde hay acumula- da información sobre algún tema especifico. O para ser más exactos, en cada una de esas "fuentes" se guarda información sobre: ¿Cual es la máquina que mantiene esa base de datos? ¿Cómo contactar con dicha máquina para hacer consultas? Una pequeña descripción del tipo de artículo o documento que puede obtenerse consultando esa base de datos. La dirección de correo electrónico de una persona de contacto, por si hubiese algún problema. En WAIS siempre utilizaremos el mismo método de búsqueda independientemente de la Base de Datos a la que accedamos. Una búsqueda a través de WAIS sería tan simple como decir búscame artículos relacionados con esto en esta biblioteca. Entonces, WAIS buscará, entre todos los documentos que figuran en dicha biblioteca, aquella información relacionada con lo que desea. Nos proporcionará una relación de los ficheros que ha encontrado, y si se desea, los traerá para que los podamos leer, ver, oír, según de lo que se trate. ¿Cómo trabaja WAIS?. Para hacer disponible un documento a través de un servidor WAIS , alguien tiene que molestarse en crear el índice que más tarde el servidor utilizará en sus búsquedas. Desde el punto de vista de un usuario, un servidor es una fuente de información a la que puede localizarse desde cualquier otra maquina que tenga acceso a la red. Para el caso de un fichero de texto, cada palabra que lo compone está indexada. De este modo, cuando se solicita una búsqueda a un servidor WAIS este contacta con los servidores que manejan las "fuentes" (o bibliotecas) que se le indican, requiriendo a cada uno de ellos para que busque en sus índices el conjunto de palabras que previamente hemos indicado. Como resultado, el servidor WAIS envía una relación de los documentos que parecen ajustarse más a esa búsqueda; junto con una puntuación para cada fichero, la cual informa de lo ajustado que es ese fichero al que se busca (en opinión del servidor). La puntuación esta normalizada, o sea, que al mejor documento se le asigna el valor máximo que es 1000, y a partir de ahí a los restantes se les da una puntuación de manera proporcional. Si por ejemplo, se decide hacer la búsqueda de todos aquellos documentos que contengan "art contemporary", WAIS buscará en cada índice y contará cuantas veces aparece la palabra "art", y la palabra "contemporary" en cada documento. Las sumas de ese recuento se sopesan (sin dar importancia al propio significado de la palabra), convirtiéndose en la puntuación de ese documento. Después de que WAIS haya buscado en todas las "fuentes", da una lista de los documentos que más puntuación han obtenido en el recuento, limitando la lista a unos 15 o 50 documentos como máximo (esto depende del cliente WAIS utilizado). Si, por último, quiere ver alguno de estos documentos, basta seleccionarlo para que WAIS lo muestre. WAIS está diseñado para trabajar con diferentes tipos de bases de datos, pero de manera que el usuario no tenga necesidad de aprender el manejo de cada una de ellas. Está pensado para que requiera el mínimo esfuerzo para el que lo utiliza. Por ello, se ha simplificado de manera que: Las consultas se realizan en lenguaje natural (en Inglés). Simplemente seleccionando aquellas palabras o términos que describan concretamente el tema en el que está interesado. Se le dice, que fuentes ha de consultar, pudiendo utilizar múltiples fuentes en una misma pregunta. Una vez recibido el resultado de una consulta, si se encuentra algún documento relevante que interesa, se puede relanzar la misma pregunta consultando de nuevo a las mismas fuentes, pero especificando ahora que el contenido de los nuevos textos debe ser parecido al de esos documentos que se acaban de mirar. Utilizar WAIS es tan fácil como seguir esos tres puntos. Ya se preocupará el propio protocolo de WAIS de contactar con las fuentes, traducirles la pregunta y una vez reciba la respuesta, volverla a traducir a un lenguaje que nos sea fácil de entender.
© Copyright 2024