sábado, mayo 16, 2009

Google, ¿no soy tu tipo?

Criticar cualquier aspecto de Google Search parece que es un tema sacrílego, pero la realidad es, como Google ha demostrado muchas veces, que todo es mejorable a pesar de que algunos piensen que con ser mejor que Live.com ya es suficiente. Vaya por delante que me gusta más Google que Live y eso lo han visto todos los que han venido a una de mis charlas pues es mi página de inicio, pero eso no quita para que no haya cosas mejorables. Así que.. ahí va un par de cosas que me parecen un cagada y que creo que sería mejorable.

¿Preferencia o Castración?

Mi mala leche comenzó cuando, ignorante e infeliz de mí, pensé que estaba haciendo tunning del pagerank para mis resultados. Y seleccioné la opción de "Dar preferencia a los resultados en inglés"


Dando "preferencia al inglés"

La realidad es que no es un proceso de "dar preferencia", es una castración de todos los contenidos que Google ha catalogado como en otros idiomas. Así, si busco pdfs en un dominio aparecen infinatmente menos. ¿Es sólo una mala elección del termino?


Sólo hay 2 pdfs

¿Es eso todo lo que hay? Pues evidentemente no. Si buscamos ficheros pdfs en el sitio de pdf "eliminando la preferencia de resultados en inglés" aparecen muchos más.


615 pdfs

¿Son estos todos los documentos pdf que hay en el sitio en cuestión? Pues la respuesta es No.

Si nos fijamos en la imagen anterior se puede ver que Google es bastante listo pues reconoce el formato de fichero lo muestra con una etiqueta a la izqueirda y, dependiendo del tipo de archivo muestra un menú especial. Por ejemplo, para los pdfs, puede aparecer un menú para ver como html.

¿Eres tú mi tipo?

Sin embargo, a pesar de que Google reconoce el tipo de archivo, cuando se busca con la acción filetype:pdf no ha buscado por tipo sino por extensión. ¿Cómo?. Sí, eso, busca por extensión.

En este sitio es posible detectar una aplicación para descargar ficheros que tiene una extensión ".do" y que devuleve ficheros pdf. Como se pueve ver en la imagen siguiente Google reconoce el tipo de fichero devuelto y nos muestra la etiqueta.


Ficheros pdf no devuletos con filetype:pdf

Es decir, a los ficheros pdf que se obtienen con filetype:pdf habría que añadir los ficheros pdf devueltos por download.do.

¿Y qué hace Live?

Pues Live.com sí busca por el tipo de fichero, así que mostrará todos los ficheros que él tenga catalogados como PDF independientemente de la URL y la extensión. Otras cosas las hará rematadamente mal si quieres, pero esto lo hace bien.


Live.com busca por filetype

De 2 he pasado a 1.350 documentos PDFs. Si no hubiera seguido enredando me habría quedado sin dar de comer a la FOCA en un pis pas y resulta que había más de mil ficheros PDF. Además Live, en las preferencias me queda más clara la opción.


Dar preferencias frente a Limitar resultados

Sí, Google está muy bien, pero no es perfecto y puede ser mejorado.

Saludos Malignos!

8 comentarios:

FilEMASTER dijo...

la que te va a caer...

Anónimo dijo...

Chema, dosifica, tienes que dejar que la asimilación cuaje poco a poco, si no es tontería.

Anónimo dijo...

Eso, eso que no se diga que solo te metes con el OpenOffice, hay que ir también a por los que son más grandes.

Personalmente también prefiero google (ya sería raro otra cosa mirando los porcentajes de uso)

Respecto a los tipos de ficheros no suelo usar la "filetype:" cuando busco pdf pongo pdf como término de búsqueda, funciona aceptablemente.

Los idiomas siempre me desesperan finalmente lo he dejado con firefox dando preferencia al ingles, así que al escribir en la barra de direcciones algo que no sea una URL usa google en ingles. Luego tengo googles.es con la palabra goes y google.com con go de palabra clave. Todo cubierto en los dos idiomas que entiendo más o menos.

FILEMASTER2 dijo...

PUES YO SIEMRPE HUSO EL MICROSOFT WINDOWS LIVE SEARCH, EL EL MEJOR BUSCADOR QUE AHI EN EL INTERNETE.

FilEMASTER dijo...

xDDDDDDDDDDDD

en realidad siempre uso google xD

Juanga dijo...

Alguien debería probar también a buscar en Google marcando "solo paginas en español", de una página en español que NO esté alojada en España.

El resultado: que no sale. Otra "mala explicación" de una opción de búsqueda ;) Y todos sabemos que mucha gente la marca, porque el inglés no va con ellos.

TheSur dijo...

en las busquedas filtradas con google, dependiendo del orden de los parametros de fitrado... te buscs o no te busca,

No es lo mismo
allinurl:download site:awwww
que..
site:awwww allinurl:download

(0 resultados, 463 resultados)

/ts~

n00b dijo...

A mí una cosa que me gusta notablemente más es el buscador de imágenes.

Entrada destacada

Infraestructuras Críticas y Sistemas Industriales: Auditorías de Seguridad y Fortificación de @0xWord

Desde hoy está disponible a la venta un nuevo libro de 0xWord centrado en la seguridad de los Sistemas Industriales y las Infraestructuras...

Entradas populares