Sinopse
O Google é realmente uma empresa multinacional de capital aberto construída em torno do imensamente popular mecanismo de busca na Internet da empresa.As raízes do Google retornam a 1995, quando dois estudantes universitários, Larry Page e Sergey Brin, se conheceram na Universidade de Stanford e colaboraram em um projeto de investigação que, com o tempo, passaria a ser o mecanismo de busca na Internet do Google. O BackRub (como era conhecido na época devido à sua análise de backlinks) estimulou a curiosidade sobre o trabalho de pesquisa da faculdade, mas não obteve nenhuma oferta dos principais fornecedores do portal.Destemidos, os fundadores reuniram fundos suficientes para começar e, em setembro de 1998, começaram as operações do escritório localizado na garagem na área de Menlo Park, na Califórnia. No mesmo ano, a PC Magazine colocou o Google em seus cem principais sites da Internet e SE's para 1998.O Google foi escolhido devido à sua semelhança com o termo googol - um número específico que compreende o número 1 seguido de cem zeros -, referindo-se à grande quantidade de informações no planeta. Missão auto-declarada do Google: 'organizar as informações do mundo e torná-las universalmente acessíveis e úteis'.Nos primeiros anos de negociação, a competição de mecanismos de busca na Internet do Google incluía AltaVista, Excite, Lycos e Yahoo. Em alguns anos, porém, o Google se tornou tão mais popular que seu nome se transformou em verbo para a realização de uma pesquisa na Web; indivíduos são tão propensos a dizer que 'pesquisaram' algumas informações quanto dizem que procuraram por elas.Sempre que você se senta no seu PC e realiza uma pesquisa no Google, recebe rapidamente um resumo dos resultados de toda a web. Então, como exatamente o Google localiza páginas da Web que correspondem à sua consulta de pesquisa e decide a ordem em que os resultados do mecanismo de pesquisa são exibidos?Os três principais aspectos para fornecer resultados de mecanismos de pesquisa são: rastreamento, veiculação e indexação.O rastreamento pode ser o processo pelo qual o Googlebot descobre páginas atualizadas e novas a serem inseridas no índice do Google.O Google utiliza um grande grupo de computadores para buscar (ou 'rastrear') grandes quantidades de páginas on-line. Este programa que implementa a recuperação é conhecido como Googlebot (também chamado de bot, spider ou robô). O Googlebot utiliza processos algorítmicos: os programas de computador decidem quais sites rastrear e com que frequência e quantas páginas da web recuperar em cada site.A operação de rastreamento do Google começa com um resumo dos URLs do site, gerados a partir de suas operações de rastreamento anteriores e complementados com os dados do Mapa do Site fornecidos pelo Web Masters. À medida que o Googlebot rastreia todos esses sites, ele pega links em todas as páginas da Web e os adiciona à sua lista de páginas da Web a serem rastreadas. Sites recém-criados, alterações nos sites atuais e links mortos são anotados e utilizados para atualizar o índice do Google.O Googlebot avalia cada uma das páginas da Web que rastreia para poder compilar um enorme índice de cada palavra que observa e sua posição em todas as páginas. Além disso, processa as informações contidas nos principais atributos e tags de conteúdo, por exemplo, atributos ALT e Tags de título.Sempre que os usuários inserem uma consulta de pesquisa, os computadores do Google pesquisam em seu índice as páginas da web correspondentes e recuperam os resultados que acreditam serem os mais relevantes para os consumidores. A relevância depende de mais de 200 facetas, entre as quais o PageRank da página confirmada que discutiremos agora.