Google, los resultados de una búsqueda constante

¿Quieres saber cómo Google está a punto de cambiar tu vida?
Pasé por la sala de conferencias Uagadugú el jueves por la mañana. Es aquí, en el Mountain View, California, sede de la empresa de Internet más poderosa del mundo. Un cuarto lleno de tres docenas de ingenieros, gerentes de producto y ejecutivos, que se encontraban indagando la forma de hacer que su motor de búsqueda fuera aún más inteligente.


Este año, Google presentará 550 o más mejoras en sus algoritmos de búsqueda, y cada uno se analizará en una reunión como ésta. Las decisiones que se tomen terminarán afectando los resultados que se obtiene al utilizar el motor de búsqueda de Google para buscar cualquier cosa.

Se podría pensar, que después de una década de sólida posición dominante en el mercado de búsquedas, Google podría relajarse. Después de todo, tiene un mando del 65% del mercado y sigue siendo la única compañía cuyo nombre es sinónimo de búsqueda.

Pero Google no está dispuesta a dormirse en sus laureles, porque sus competidores tampoco se quieren dejar vencer.

En los últimos cinco años, un montón de empresas han desafiado a Google:

Facebook lanzó el primer ataque, con su idea de que algunas personas prefieren recibir la información de sus amigos, que de una fórmula en el anonimato. Twitter introdujo el concepto de búsqueda en tiempo real. Yelp ayuda a la gente a encontrar restaurantes, tintorerías y hasta niñeras.

En conjunto, todos apuntan a que el mercado de la búsqueda no esté dominado por un solo motor, sino que se incorpore una gran variedad de empresas y servicios.

Sin embargo, la mayor amenaza de Google se puede encontrar a 850 millas al norte: Bing. Microsoft, ha implementado este renovado y renombrado motor de búsqueda – con un nombre que evoca el descubrimiento.

La nueva imagen, junto con una campaña publicitaria de $100 millones, ayudó a impulsar la participación de Microsoft en el mercado de búsquedas en EE.UU. a partir del 8% inicial al 11% actual; una cifra que aumentará más del doble, una vez que se apruebe un acuerdo entre Bing y Yahoo.

El equipo de Bing se ha centrado en ciertos casos, donde los algoritmos de Google no siempre satisfacen. Por ejemplo, mientras que Google hace un gran trabajo para buscar en la web pública, la variedad de horarios de vuelos y tarifas, Microsoft compró Farecast – un sitio web que rastrea las tarifas aéreas el tiempo real e incorpora los datos en los resultados de Bing. Microsoft ha hecho adquisiciones similares en salud y otros sectores comerciales.

Sin embargo, cuando se trata de la simple tarea de tomar un término de búsqueda y ver los resultados más relevantes, Google sigue estando a la delantera. Pero también creo que se  puede llegar al punto, de que la gente se acostumbrará a explotar un motor de búsqueda diferente para algunos tipos de consultas específicas.

«El algoritmo es extremadamente importante en la búsqueda, pero no es lo único», dice Brian MacDonald, vicepresidente de Microsoft. «Usted compra un coche por razones más allá que sólo el motor.»

El poder de Google, perfeccionado durante incontables interacciones, posee la habilidad aparentemente mágica para interpretar las peticiones de los buscadores, no importa cuan torpe o mal escrito esté. Google tiene la capacidad de dar calidad a la búsqueda, y es un proceso que durante años la empresa ha guardado celosamente.

Los avances de Google

La historia del algoritmo de Google comienza con el PageRank, el sistema inventado en 1997 por el cofundador Larry Page, cuando era estudiante de postgrado en Stanford. Google se convirtió rápidamente en el motor de búsqueda de mayor éxito en la Web.
La búsqueda Web es un proceso de varias partes. En primer lugar, Google rastrea la web para recoger el contenido de cada sitio accesible. Estos datos se desglosan en un índice (organizado por la palabra, al igual que el índice de un libro de texto), una manera de encontrar una página en función de su contenido. Cada vez que un usuario escribe una consulta, se lee el índice de páginas relevantes, y se retorna una lista que habitualmente es consultada por cientos de miles, o millones de usuarios. La parte más complicada, sin embargo, es el proceso de clasificación, para determinar cuáles de estas páginas pertenecen a la cabeza de la lista.

PageRank estima entonces algunos atributos de una página Web, que se pueden utilizar para ayudar a determinar su relevancia. Algunas de las señales parecen obvias. El título es una de ellas; Otra son las palabras que forman el enlace real de la conexión de una página a otra.  Más tarde las señales incluyen atributos como la actualidad y la localización (Google conoce las coordenadas geográficas en bruto de buscadores y favorece los resultados locales). El motor de búsqueda utiliza en la actualidad más de 200 señales para mejorar el posicionamiento de sus resultados.

«Hemos descubierto una cosa muy ingeniosa desde el principio», dice Singhal. «La gente cambia las palabras en sus consultas. Así que si alguien dice, «fotos de perros», y luego dice, «fotos de cachorros», eso sirve para determinar que las palabras perros y cachorros son intercambiables. Estamos aprendiendo de nuevo la semántica de los humanos y ese fue un gran avance».

Pero había sin embargo obstáculos en el sistema de Google, porque las palabras se podían prestar para diferentes interpretaciones, por ejemplo un perro caliente podría leerse como un cachorro en ebullición. El problema se resolvió a finales de 2002, basados en el filósofo Ludwig Wittgenstein y su teorías de que las palabras se definen por el contexto.

A medida que Google rastrea los archivados y miles de millones de documentos y páginas Web, analiza que palabras están cerca las unas de las otras. «Hot dog» se encuentra en las búsquedas que también contenían «pan» y «mostaza». Eso ayudó a entender lo que el algoritmo de «hot dog»  y millones de otros términos, realmente querían decir.

Cambios y más cambios

Cada dos años hay un cambio importante en el sistema – una especie de equivalente a una nueva versión de Windows. «Nuestro trabajo es cambiar básicamente los motores de un avión que está volando a 1.000 kilómetros por hora y 30.000 pies sobre la Tierra», dice Singhal.

En el año 2001, se incorporaron nuevas señales sobre el nuevo sistema, que distingue entre las páginas comerciales y no comerciales, proporcionando mejores resultados para los usuarios que quieren ir de compras. Ese mismo año, un ingeniero llamado Krishna Bharat, pensando que los vínculos de las autoridades reconocidas deberían tener más peso, concibió una potente señal que confiere una credibilidad adicional a las referencias de los sitios de los expertos.

Google alienta estos avances, cada año y tiene una feria de demostración interna llamada CSI – Crazy. Pero en su mayor parte, el proceso de mejora se da través de los malos resultados, para determinar lo que no funciona. Una búsqueda sin éxito se convirtió en una leyenda: En algún momento de 2001, Singhal se enteró de los malos resultados cuando la gente escribía su nombre «Audrey Fino». Google remitía a sitios italianos que hablaban de Audrey Hepburn. «Nos dimos cuenta de que se trataba igualmente de un nombre. Pero no se tenía la inteligencia en el sistema para hacer la diferenciación»

El fracaso llevó a Singhal a una búsqueda de varios años, para mejorar la forma en que el sistema trata los nombres – que representan el 8% de todas las búsquedas-. Para ello tuvo que dominar el arte del «bi-grama de rotura» – es decir, la separación de varias palabras en unidades discretas. Por ejemplo, «Nueva York» representa dos palabras que van de la mano (un bi-gramo). Pero hasta que las tres palabras: «New York Times»,  indican claramente un tipo diferente de búsqueda, cambia la consulta.» Los seres humanos pueden hacer estas distinciones al instante, pero Google no tenía esa capacidad».

Mike Siwek ilustra cómo Google logra esto. «Está claro que las señales determinan la selección de estos sitios: una conexión bi-grama de la figura de un nombre, puede ser un sinónimo o una ubicación geográfica. «Se debe reconstruir esta consulta desde el punto de vista de un ingeniero». Explica Singhal. «Nosotros podemos ahora calcular que en la búsqueda «Abogado Siwek», la palabra abogado no es un apellido y y la palabra Siwek no es un segundo nombre. Así como tampoco la palabra abogado es una ciudad en Michigan. Un abogado es un abogado «.

Se trata de conseguir, desde el interior del motor de búsqueda de Google, los datos generados por los miles de millones de búsquedas: una roca es una roca.

Y Google sigue mejorando. Recientemente el ingeniero Maureen Heymans, diseñó un nuevo algoritmo de búsqueda para nombres de personas, que busca la inicial del segundo nombre o el apellido cuando la persona no la conoce.

Todos estos cambios pasan y están pasando por un proceso de pruebas. Google emplea a cientos de personas en todo el mundo para que se sienten frente al ordenador de su casa y juzguen los resultados de las consultas. Sin embargo, Google también tiene un ejército más grande de probadores – sus miles de millones de usuarios- casi todos ellos sin darse cuenta que participan en sus experimentos de calidad constante.

Esta flexibilidad, la capacidad de agregar señales, modificar el código subyacente y al instante los resultados de la prueba, es la razón por la que Google dice que puede resistir cualquier competencia de Bing, Twitter o Facebook.

De hecho, en los últimos seis meses, Google ha realizado más de 200 mejoras, algunas de las cuales parecen imitar – incluso superar – las ofertas de sus competidores. Una de ellas es el tiempo real de búsqueda. Cuando alguien consulta un tema de interés actual, entre los 10 enlaces azules Google coloca «últimos resultados» a partir de fuentes de noticias, blogs, o tweets.
«Nos fijamos en los retweets, ¿cuántas personas siguen a la persona o el tema, y si el tweet es orgánico o robótico,» dice Singhal. «Sabemos cómo hacer esto, porque lo hemos estado haciendo durante una década».

Junto con la búsqueda en tiempo real, Google ha introducido otras nuevas características, incluyendo un servicio llamado gafas, que utiliza las imágenes captadas por los teléfonos de los usuarios, como consultas de búsqueda. Con una cámara fotográfica y reconocimiento de voz, un teléfono inteligente se convierte en los ojos y los oídos. Si las señales correctas se encuentran, cualquier cosa puede ser objeto de consulta.

A pesar de estos avances, otras empresas como Bing tienen un enfoque más frío sobre el papel de la búsqueda, ya que consideran que en algún punto, la gente va a querer más de lo que el algoritmo de Google puede proporcionar. «Si no tenemos un cambio de paradigma, va a ser muy, muy difícil competir con los ganadores actuales», dice Harry Shum, director de Microsoft en el desarrollo las principales investigaciones. «Pero nuestra opinión es que habrá un cambio de paradigma».

Aún así, incluso si hay tal cambio, los algoritmos de Google probablemente serán capaces de incorporar eso también. Es por eso que Google es un competidor temible, que ha construido una máquina, lo suficientemente ágil, como para absorber casi cualquier planteamiento que amenace su liderazgo; al mismo tiempo que ofrece resultados de alta calidad que sus competidores no han podido todavía igualar.

Traducido y editado por Periodista Digital
Equipo Mipagina.net

Fuente: Steven Levy (steven_levy@wired.com)

Share the Post:

Entradas relacionadas

Querido lector

Entérateprimero de las últimas tendencias y artículos de Internet es mercadeo.