Informática

Guía de
Buscadores

y
Búsqueda en Internet


2ª edición
2003

Editado por
Técnica Administrativa
http://www.cyta.com.ar


Adina
González Bonorino

Daniela
Rodríguez





Dedicamos este trabajo a
nuestras compañeras de biblioteca,
sin cuyo apoyo no hubiéramos podido
desarrollar la presente guía.





Esta guía ha sido elaborada con la finalidad de hacerles llegar una herramienta útil para la navegación en la gran red de información que es Internet.
No es una novedad que esta red ofrece prácticamente toda la información que podamos imaginar, el secreto está en "saber buscar".
Para ayudarlos en sus búsquedas, surgió esta pequeña pero muy completa guía sobre los buscadores más consultados a nivel nacional e internacional.
Además, explicamos los operadores a utilizar para elaborar estrategias de búsqueda y obtener así los mejores resultados.

 

 

· ¿Qué son los motores, los índices y los metabuscadores?

Existen tres tipos de buscadores, por un lado tenemos los índices temáticos, también llamados catálogos, directorios o buscadores por categorías; por otro, los más difundidos motores de búsqueda o buscadores por contenido; y los metabuscadores, que busca en varios motores a la vez.
La diferencia fundamental es que los índices temáticos mantienen su base de datos "manualmente" utilizando empleados o internautas para la inclusión de direcciones, en cambio los motores de búsqueda y los metabuscadores emplean un robot, es decir, se valen de un potente programa que recorre la Web recopilando e indizando todo texto que encuentra, conformando así una enorme base de datos.
La ventaja de los motores y metabuscadores es la gran cantidad de información que recogen y la constante actualización de sus bases de datos. La desventaja, es lo difícil que resulta encontrar lo que se desea si no se domina el lenguaje de interrogación.
Los índices temáticos se estructuran por temas o categorías principales que contienen subcategorías. La ventaja, es que es muy fácil hallar la información buscada (si ésta se encuentra en la base de datos), descendiendo por los árboles temáticos (de una categoría a otra subcategoría), o usando palabras clave en los cuadros de búsqueda existentes en la página principal o dentro de los distintos niveles. La desventaja consiste en que no siempre está actualizada y las bases de datos son más pequeñas que las de un motor de búsqueda. Otra diferencia interesante es que aquellos índices que además ofrecen servicios (como e-mail, publicidad, noticias, etc.) y que tienen el respaldo de entidades comerciales, son conocidos como portales.

· ¿Qué es lo que se quiere buscar?

Antes de comenzar cualquier búsqueda es conveniente poner en claro lo que nos interesaría encontrar en Internet, determinar claramente un objetivo.
Luego traducir este objetivo a palabras claves o frases cortas que definan bien el tema (tenga en cuenta la posible necesidad de traducir todo al inglés en caso de que el buscador no permita la elección del idioma). Tenga presente también los sinónimos de sus palabras claves.
No se desanime si en el primer intento no encuentra satisfactoriamente lo que busca, intente de varias maneras y en varios buscadores.

· Variables a tener en cuenta en la elección de buscadores

A través de varios estudios se ha tratado de establecer medidas típicas de evaluación para discernir qué herramienta es la más acertada para las necesidades específicas de información.
De acuerdo al estudio de Chu y Rosenthal (1996) estas medidas a investigar serían: composición de los índices, se estudia la cobertura y actualización; capacidad de búsqueda, prestaciones de los buscadores (operadores booleanos y de truncamiento, frases, refinamiento); ejecución de la recuperación de información, precisión, exhaustividad y tiempo de respuesta; y esfuerzo del usuario, interfaz del sistema.
Estudios posteriores (Gordon y Pathak, 1999) se focalizaron en los parámetros de precisión y exhaustividad y reflexionaron sobre el concepto de "documento relevante" analizando 7 motores. La conclusión a la que arribaron establece que el ideal de búsqueda es la que encuentra un equilibrio entre la precisión de los resultados y la exhaustividad de los mismos, como también, que es el interesado quien establece si los documentos recuperados son relevantes o no.
El investigador Sherman (2000) propuso una guía en donde recomienda distintos buscadores según el tipo de información a recuperar, un resumen del listado sería:

 

Si deseamos encontrar... Motor recomendado
Una amplia revisión sobre una materia determinada Looksmart
Una materia determinada usando una frase corta Infoseek
Un tema empleando palabras raras o desconocidas AltaVista
Páginas en un idioma determinado AltaVista
Páginas publicadas en una fecha determinada AltaVista
Un conjunto de documentos y luego refinar la búsqueda Infoseek
Documentos sobre ciudades, compañías, etc. Excite
Un directorio con enlaces de calidad About

Sin embargo, todas estas investigaciones no determinan una metodología acabada para el análisis de los buscadores por que se basan en criterios excesivamente subjetivos. Concluimos que la evaluación definitiva responde exclusivamente del usuario. La relevancia, grado de acierto, pertinencia de los documentos recuperados dependerá del grado de conocimiento de las prestaciones (lenguaje de interrogación, o estrategia de búsqueda) que poseen los distintos buscadores.

· Comienza la búsqueda

La búsqueda puede hacerse a partir de una palabra, la combinación de varias palabras, una frase textual o un título, o la combinación de estos elementos.

· ¿Cómo combino las palabras o frases?

1. Booleanos: es una búsqueda especializada a partir de un sistema lógico desarrollado por el matemático George Boole (1815-64) que consiste en el uso de tres expresiones:
AND: muestra los enlaces que contienen los dos elementos buscados. Algunos buscadores usan los símbolos + ó & (historia AND argentina)
OR: el resultado de la búsqueda es mucho más amplia que la anterior pues trae enlaces con uno u otro elemento, suele usarse para unir sinónimos (automóvil OR car)
NOT: excluye una palabra, puede reemplazarse por los signos - ó !. Hay que tener cuidado pues en algunos buscadores se usa precedido por el AND, mientras que en otros no (Alta Vista: "vino AND NOT rojo", Northern Light: "library NOT university")
También pueden usarse los paréntesis para realizar búsquedas más complejas: "library AND NOT (university or school)"

2. Posicionales: miden las distancias entre los términos que se intentan localizar.
NEAR: trae los registros que contiene las dos palabras claves siempre que no superen los 80 caracteres de distancia entre sí.
FOLLOWED BY: las palabras deben aparecer en el orden en que fueron escritas (no es muy usado).
PHRASE: se usan comillas para obtener la frase tal cual se ingresó.
ADJ: trae las dos palabras, una seguida de la otra, sin otros caracteres entre ellas. Se puede escribir ADJ o usar un guión entre las palabras sin dejar espacio.

3. De exactitud o truncamiento: son signos que reemplazan a un carácter o grupo de caracteres, son muy útiles cuando se desconoce el modo correcto de escritura de un término.
SUBSTRINGS: es el signo que reemplaza a varios caracteres al final de la palabra. Comúnmente se usa el asterisco (*) o el signo pesos ($)
big* big, bigger, biggest
COMPLET WORD: esta función se encuentra por defecto en la mayoría de los buscadores, solamente en Lycos se puede agregar un punto (.) al final de la palabra para aclarar que allí termina.

· Uso de minúsculas, mayúsculas y acentos

Como no todos los buscadores e índices diferencian unos de otros, les sugerimos respetar las mayúsculas y los acentos. A continuación incluimos a modo de ejemplo un cuadro en el que representamos los resultados obtenidos en distintos buscadores:

Ejemplo

Terra

A.Vista

Lycos

"Río de la Plata"

-

32.143

23

"río de la plata"

1319

33.902

23

"RIO DE LA PLATA"

122.508

3.210

184.545

 

· ¿Qué puedo hacer con lo que encontré?

Se puede imprimir haciendo uso de la opción que ofrece el programa que opera Internet, se puede grabar en un disquete o como un archivo en el disco rígido, o guardar en Favoritos quedando guardado en un listado dentro del programa operador que permitirá el acceso rápido a la página seleccionada.

· Buscadores especializados

Son los buscadores que se limitan a un tema en concreto, recogen todo sobre lo que de ese tema existe en la red.
En esta categoría se encuentran los directorios académicos temáticos, generados por universidades, bibliotecas o centros de investigación, cuya característica principal es la alta calidad en los links seleccionados. (por ejemplo www.uces.edu.ar/campus/biblioteca/listado.php posee links relacionados con las carreras dictadas en la universidad).
Existen los llamados vortals (nombre que deriva de la contracción de las palabras inglesas vertical portal), estos sitios se focalizan en un tema, tipo de recurso o región geográfica (por ejemplo www.achoo.com es un sitio dedicado a médicos, www.vortalexperts.com compila vortals dedicados a educación, negocios, arte, salud, medicina, gobierno, historia, medio ambiente, etc.).

1. ABOUT

Directorio temático ordenado por categorías, los contenidos son menores pues son personas quienes han compilado los sitios. Aparte de las categorías tiene un cuadro de búsquedas que acepta el uso de comillas para las frases y los símbolos + y - para la inclusión o exclusión de términos.

fig30.gif (51958 bytes)
Sitio: www.about.com

 

2. ALL THE WEB

Como cualquier motor de búsqueda, en su página principal se halla el cuadro de escritura. Aquí mismo se pueden usar:
· Operadores booleanos: AND, OR, AND NOT y RANK, este último significa "preferiblemente incluye"
· Frases: con el uso de comillas
· Inclusión o exclusión de palabras: con los signos + y -.
· Keywords: estos prefijos sirven para especificar la función de la palabra ingresada: site: busca el sitio escrito, url: ubica la palabra en alguna parte del url, link: rastrea sitios que contengan el link ingresado, tittle: busca por título de la página, language: por idioma.

 

La búsqueda avanzada contiene las mismas opciones aquí descritas pero están ordenadas a lo largo de la página. Incluye otras opciones muy específicas como búsqueda por tamaño de archivo.

 

3. ALTAVISTA

Es un motor de búsqueda que contiene millones de páginas Web actualizadas constantemente por un robot.

 

Las búsquedas pueden hacerse usando el lenguaje natural ya que es capaz de interpretar los espacios y signos entre las palabras, además permite el uso de operadores para refinar la búsqueda.

 

· Inclusión o exclusión de palabras: son los signos + ó - antepuestos a las palabras que se quiera incluir o excluir respectivamente del resultado.
· Frase: se encierra entre comillas lo que se desea buscar exactamente como fue ingresado.
· Uso de mayúsculas: conviene el uso de minúsculas. Si se ingresa california, traerá como resultado: California, california y CALIFORNIA, mientras que si se tipea California buscará únicamente los registros que contengan la palabra California.
· Truncamiento: permite el uso del asterisco (*) para truncar palabras.
· Lenguaje: Alta Vista ofrece un menú desplegable con idiomas
· Funciones: para buscar más específicamente, se puede anteponer a la palabra buscada la función o posición que la misma deberá desempeñar dentro del registro:
title:texto la/s palabra/s o frase debe figurar únicamente en el título.
url: texto la/s palabra/s debe aparecer en el url
link:texto Alta Vista deberá encontrar aquellas páginas que contengan links con el texto ingresado
image:nombre trae aquellas páginas con imágenes cuyos nombres coincidan con el requerido
· Proximidad: desde la búsqueda avanzada existe el operador NEAR, que puede reemplazarse por el signo ~

4. DOGPILE

Metabuscador que presenta en un página inicial un breve directorio y un cuadro de escritura para incluir la búsqueda. Permite el uso de los operadores booleanos como sus símbolos (AND/+, NOT/-, OR). Debajo de este cuadro se encuentra ADVANCED SEARCH, en donde nuevamente aparecen los operadores booleanos y la lista de buscadores a usar. Los resultados se presentan agrupados por los buscadores.

 

5. EXCITE

Índice que contiene bases sobre páginas Web, noticias, mapas, páginas amarillas, servicio meteorológico, direcciones de correo electrónico, etc. de actualización constante.

 

Su sistema de búsqueda es simple pues ofrece un cuadro al inicio de la página principal que acepta ciertos operadores:
· Inclusión o exclusión de palabras: se opera con los ya explicados signos + y -.
· Operadores booleanos: AND, OR y AND NOT son usados solos o combinados con paréntesis para realizar búsquedas complejas.

 

6. GOOGLE

Otro difundido motor de búsqueda desde cuya página principal se encuentra el cuadro de búsqueda básica. Por defecto usa el operador AND entre las palabras ingresadas, también permite:
· Inclusión o exclusión de palabras: usando los signos + o -.
· Frases: usando las comillas
· Sinónimos y plurales: Google busca las palabras del modo en que fueron escritas, conviene incluir en la misma búsqueda los sinónimos o plurales

 

El sitio ofrece búsquedas por imágenes, por directorio o noticias. También cuenta con ADVANCED SEARCH en donde se repiten las opciones de búsqueda antes descritas, ahora ordenadas y con explicaciones. Presenta ciertas opciones útiles tales como buscar en un tipo de formato determinado, que las palabras sean encontradas en el título de la página, URL, links o en el texto, diferentes idiomas, etc.

 

 

7. INFOSEEK

Es otro índice ahora conocido como GO.com, de constante actualización permite realizar búsquedas por categorías o usar el cuadro de búsqueda, como utiliza la base de GOOGLE acepta los mismos parámetros que este motor.

 

8. LOOKSMART

Página que presenta un cuadro de búsqueda para palabras claves y una pequeña lista de tópicos para la búsqueda por categorías. No reconoce los operadores booleandos OR o NOT pero busca automáticamente con el AND.

 

9. LYCOS

Como en los buscadores anteriores, la base de Lycos está armada gracias a un robot informático que la mantiene actualizada permanentemente y la ordena por categorías. Se puede buscar desde el cuadro en blanco que encabeza la página.
· Inclusión o exclusión de palabras: usando los signos + y -
· Frases: encerradas entre comillas
· Limitador: agregando un punto al final de una palabra, Lycos entiende que allí termina, y no la buscará como cadena de caracteres. Se trunca con el signo pesos ($)

fig4.gif (10450 bytes)
Sitio: www.lycos.com

 

Debajo de este cuadro de búsqueda se encuentra el link ADVANCED SEARCH que remite a una ventana en donde se pueden seleccionar los términos a buscar usando los operadores booleanos y otros limitadores ordenados en cuatro áreas:
· Content: determina el tipo de documento a buscar
· Page field: aclara el título, URL u Host que se necesita
· Language: determina el idioma
· Link referrals: busca páginas con un link determinado

 

10. METACRAWLER

Metabuscador que presenta un directorio ordenado por categorías, en el cuadro de búsqueda se pueden usar los operadores AND/+, NOT/- y OR.

 

Desde la página de búsqueda avanzada se distinguen las opciones para el criterio de búsqueda (any, all, phrase), los buscadores a utilizar y el tiempo de búsqueda.

 

11. MSN

Portal que permite búsquedas por palabras claves desde el cuadro de texto en la página principal. A través del link SEARCH se accede a un directorio temático y otros recursos.

 

ADVANCED SEARCH es la hoja en donde se puede especificar la función de las palabras a buscar (AND, OR, palabras en el título, URL, stemming o truncador automático), modo de visualización, limitación por región, idioma, tipo de página o archivo.
En cada caso ofrece explicaciones sobre el uso.

 

12. NORTHERN LIGHT

Este motor de búsqueda contiene artículos de revistas cuyo contenido se actualiza constantemente.
Para la búsqueda se puede utilizar el lenguaje natural, pero puede afectar la relevancia de los resultados. Por esto es conveniente usar:
· Operadores booleanos: AND, OR y NOT, más los paréntesis para fórmulas de búsquedas
· Frases: encerradas entre comillas
· Inclusión o exclusión de palabras: con los signos + y -.
· Truncamiento: para reemplazar una serie de letras que se desconocen al final de una palabra, usar el asterisco (*). Para reemplazar UNA sola letra en una palabra, usar el signo de por ciento (%), por ejemplo: gene%logy, trae como resultado genealogy y geneology.
· Funciones: para determinar los campos de búsqueda:
URL:texto para una dirección en Internet
TITLE:texto para limitarse al título
COMPANY:texto para limitarse a compañías o empresas
PUB:texto para buscar una colección específica por título de colección

 

Por encima del cuadro de escritura se encuentran las opciones: Power Search, Business Search, Search News e Investext Search que permiten una búsqueda más exhaustiva.

 

13. OVERTURE

Motor de búsqueda que ofrece en su página inicial un cuadro en el que se ingresan las palabras a buscar. Reconoce los operadores boléanos AND (aunque lo usa por defecto) y NOT. Tiene un listado de categorías, además posee filtro para contenidos adultos.

 

14. YAHOO

Es uno de los índices temáticos más completos que se pueden consultar en la red dado que se actualiza casi diariamente.
La estructura de este directorio permite buscar por las categorías que se presentan en la página de apertura. También existen cuadros de búsqueda en la pantalla principal o dentro de cada categoría.

fig8.gif (24262 bytes)
Sitio: www.yahoo.com

 

En estos espacios es donde se puede buscar usando:
· Operadores booleanos: AND, OR y AND NOT
· Frases: utilizando las comillas
· Truncamiento: usar el asterisco (*) al final de la palabra
· Inclusión o exclusión de palabras: con los signos + y - antepuestos a las palabras.
· Funciones: para que la palabra ingresada sea buscada sólo en partes determinadas del documento.
t:texto para el título
u:texto para documentos tipo URL
· Combinaciones: Yahoo permite combinar todos los elementos antes descritos
· Tiempo: se puede determinar la antigüedad de las páginas que uno desea visualizar

También existe la posibilidad de realizar una Advanced Search, y a su vez, haciendo clic en el link More Options se accede a más opciones de búsqueda.

 

OTROS BUSCADORES

· ARGENTINOS

1. ARNET

Se puede buscar por palabras claves, usar los signos + y - para la inclusión o exclusión de palabras y usar las comillas para determinar las frases a buscar.

 

2. CARAYGARAY

Permite buscar en Argentina y México.
Para buscar sólo acepta los operadores booleanos AND y OR, no reconoce el NOT o el AND NOT, como tampoco los signos + y -.

 

3. GRIPPO

Buscador argentino que abarca páginas Web, clasificados, foros, etc. en Argentina, América Latina e Israel.
Acepta de los operadores booleanos sólo el AND y trunca las palabras por defecto.

 

 

 

4. LA BRUJULA

Cuenta con información sobre Argentina y ofrece solo un cuadro de búsqueda que acepta los operadores booleanos en castellano: Y, O y NO.

 

5. TERRA

Portal que posee el link BUSCADOR dentro de los servicios. Se puede buscar por un índice de categorías o escribir las palabras claves en el cuadro de búsqueda, evitando las palabras de uso frecuente como artículos o preposiciones. Utiliza el operador AND por defecto, permite el uso del signo - para la exclusión de términos. No distingue entre mayúsculas o minúsculas. No tiene un buscador avanzado pero tiene una sección con sitios argentinos.

 

6. UBBI (www.ubbi.com)

Portal que presenta categorías temáticas y un cuadro de búsqueda en la pantalla principal. La hoja de búsqueda avanzada y los operadores son iguales que en GOOGLE pues usa su motor y su base. UBBI sería el paralelo de GOOGLE ARGENTINA, sólo que el primero tiene información del diario Clarín y los otros miembros de la cadena del Grupo Clarín.

fig16.gif (8542 bytes)
Sitio: www.ubbi.com

 

 

· ESPAÑOLES

1. BUSCADOR EN INTERNET DE WEBS EN ESPAÑOL

Motor en cuyo cuadro de búsqueda acepta el lenguaje natural o el asterisco (*) para reemplazar varias letras o el signo de interrogación (?) para reemplazar solo una. Además las comillas son útiles para hacer búsquedas literales. Desde la búsqueda detallada se puede determinar si lo que se busca son todas la palabras o algunas de ellas. Del mismo modo se opera si son palabras claves, palabras del título, o palabras del URL.

fig18.gif (27792 bytes)
Sitio: www.biwe.es

 

2. INSPECTOR DE TELEPOLIS

Indice en español. Como tal tiene un listado de categorías a través del cual se puede navegar. Desde el cuadro de búsqueda se puede escribir con el lenguaje natural, o armando ecuaciones booleanas (AND, OR y NOT). Las frases se encierran entre comillas y se trunca con un asterisco (*).

 

3. OZÚ

Es un buscador netamente español, a tal grado que acepta la letra ñ y los acentos. Se maneja con comillas para delimitar frases. Sólo usa dos operadores booleanos en español (Y, O), también se pueden usar los signos + y -.

fig20.gif (13213 bytes)
Sitio: www.ozu.es

 

 

 

 

4. SOL

Es la versión española de Alta Vista, por lo tanto es un motor de búsqueda. En la pantalla principal aparece el cuadro de búsqueda.
Une las palabras con AND por defecto si no se aclara nada de antemano. Se pueden formular búsquedas separando las palabras con comas sin espacios entre sí y encerrándolas entre paréntesis, creando así set de búsquedas, por ejemplo: (biblioteca, libros).
Acepta los signos + y - para incluir o excluir palabras, frases o sets. El uso del asterisco es bastante particular pues reemplaza varios caracteres colocándolo tanto al final como en el medio de una palabra, por ejemplo: li*ro traerá como resultado libro, litro, librero, ligero, limonero.

fig23.gif (50443 bytes)
Sitio: www.sol.es

 

 

 

BUSCADOR

TIPO

AND

OR

NOT

TRUNC

FRASE

NEAR

ABOUT

Indice

+

 

-

 

"..."

 
ALL THE WEB

Motor

and,+

or

and not,-

 

"..."

 
ALTAVISTA

Motor

+

 

-

*

"..."

near,~

ARNET

Portal

+

 

-

 

"..."

 
BIWE

Motor

     

*,?

"..."

 
CARAYGARAY

Portal

and

or

       
DOGPILE

Metab.

and,+

or

not,-

     
EXITE

Portal

and,+

or

and not,-

     
GOOGLE

Motor

and,+

     

"..."

 
GRIPPO

Portal

and

         
INFOSEEK

Indice

and,+

or

not,-

 

"..."

[...]

LA BRUJULA

Indice

y

o

no

     
LOOK SMART

Motor

and

ir

not

     
LYCOS

Motor

+

 

-

$

"..."

 
METACRAWLER

Metab.

and,+

or

not,-

     
MSN

Portal

and

or

       
NOR. LIGHT

Motor

and,+

or

not,-

*,%

"..."

 
OVERTURE

Motor

and

 

not

     
OZU

Indice

y,+

o

-

 

"..."

 
SOL

Motor

+

 

-

*

   
TELEPOLIS

Indice

and

or

not

*

"..."

 
TERRA

Indice

and,+

 

-

     
UBBI

Portal

and,+

     

"..."

 
YAHOO

Portal

and,+

or

not,-

*

"..."

 

 


Bibliografía

 

Alta Vista : help : main search [en línea]. [s.l.] : Alta Vista Co., 2000. http://doc.altavista.com/help/search/seaarch_help.shtml [Consulta: 22 feb. 2000]

BIWE : ayuda y trucos para buscar en BIWE [en línea]. [s.l.] : BIWE, 1998. http://www.biwe.es/ayudaBusq.html [Consulta: 13 mar. 2000]

Díez Ferreira, Miguel Angel. "Buscadores temáticos" [en línea]. iWorld. Enero 1998. http://www.idg.es/iworld/199801/articulos/btematicos.asp [Consulta: 10 feb. 2000]

Go Network : help [en línea]. California : Go.com, 2000. http://infoseek.go.com [Consulta: 22 feb. 2000]

Ibáñez, Alvaro. "Cómo buscar y encontrar información en Internet" [en línea]. iWorld. 1997. http://www.idg.es/especial/buscar.html [Consulta: 6 mar. 2000]

Internet search tool details [en línea]. Berkeley : Sun Site, 2000. http://sunsite.berkeley.edu/Help/searchdetail.html [Consulta: 22 feb. 2000]

Lycos search [en línea]. Massachusetts : Lycos Inc., 2000. http://lycos.com/help/search-help.html [Consulta: 22 feb. 2000]

Martínez Méndez, Francisco Javier. Aproximación general a la evaluación de la recuperación de información mediante motores de búsqueda en Internet. Scire, 7 (ene.-jun.2001): 11-31

Northern Light search help [en línea]. Cambridge : Northern Light Technology, 2000. http://www.northernlight.com/docs/search_help_optimize.html [Consulta: 22 feb. 2000]

What is Exite search? [en línea]. California : Home Co., 2000. http://excite.com/info/search_help [Consulta: 3 mar. 2000]

Wilkas, Lenore R. An introduction to search engines. Journal of the Society of Pediatric Nurses 6 (2001): 149

Yahoo! search advanced syntax [en línea]. Santa Clara : Yahoo, 2000. http://search.yahoo.com/search/syntax? [Consulta: 22 feb. 2000]


Arriba