Tire o máximo a partido do seu conteúdo

Tire o máximo a partido do seu conteúdo

(Parte 1 de 4)

Tire o máximo partido do seu conteúdo Um manual para editores da Web

Conteúdo

Introdução 2 Uma breve introdução à pesquisa na Web 3 Novidades na pesquisa na Web do Google? 4 O Google vai encontrar o seu Web site? 5

O Google vai indexar o seu Web site? 6

Controlar o que o Google indexa 7

Robots.txt versus meta tags 9 Controlar o armazenamento em cache e snippets 10

O seu Web site apresenta conteúdo exclusivo e útil? 1 Aumentar a visibilidade: práticas recomendadas 12

Centro para webmasters 13 Sitemaps 14

Perguntas frequentes 15 Glossário 19

Introdução

Se procura visibilidade, a Internet é o lugar ideal. Pergunte a qualquer anunciante que tenha aumentado as vendas utilizando anúncios on-line, a um blogger cuja popularidade o tenha levado à publicação de um livro ou a um jornal que tenha ampliado o seu público ao nível internacional graças ao aumento de tráfego.

Recebemos frequentemente perguntas sobre como funciona a pesquisa na Web e como os editores da Web podem maximizar a sua visibilidade na Internet.

Preparámos este folheto para o ajudar a compreender como um mecanismo de pesquisa ”percepciona” o seu conteúdo, e como pode afi nar a sua presença na Web, disponibilizando o que pretende que seja visualizado – e ocultando o que deseja manter oculto.

Desde sugestões de webmasters e ferramentas on-line a um manual passoa-passo com perguntas frequentes, este folheto foi desenvolvido tanto para pequenos editores da Web como para proprietários de grandes Web sites.

Assim como a própria Internet evoluiu drasticamente na última década, a abordagem do próprio Google em relação à pesquisa na Web e o seu relacionamento com os proprietários de Web sites também evoluíram. Criámos diversas ferramentas para ajudar os webmasters a maximizar a visibilidade do seu conteúdo, bem como a controlar a forma como as suas páginas da Web são indexadas. Mas há sempre mais que podemos fazer e por isso esperamos que este folheto o incentive a partilhar connosco os seus comentários e as informarnos sobre o que podemos fazer para tornar a Web um lugar ainda melhor para utilizadores e editores.

- A equipa de webmasters do Google

Uma breve introdução à pesquisa na Web: como funciona

De forma simples, pode imaginar a Web como um enorme livro, com um índice de grandes dimensões que indica exactamente onde é que tudo está localizado.

O Google tem um grupo de computadores – o “Googlebot” – que estão continuamente a “rastrear” (a navegar ) bilhões de páginas na Web. Este processo de rastreio é algorítmico: os programas de computador determinam quais os Web sites que devem ser rastreados, com que frequência e quantas páginas de cada Web site devem ser analisadas. Não aceitamos pagamento para rastrear um Web site com maior frequência; além disso, mantemos a parte de pesquisa perfeitamente independente do nosso serviço de publicidade Google AdWords.

O processo de rastreio do Google inicia com uma lista de URLs de páginas da Web. À medida que o Googlebot navega nestes Web sites, ele detecta os links de cada página e adiciona-os à sua lista de páginas a serem rastreadas. O Googlebot faz uma cópia de cada uma das páginas que rastreia, a fi m de compilar um índice de grande proporção de todas as palavras que visualiza. Esta lista também indica o local onde cada palavra surge em cada página.

Quando um utilizador insere um termo de pesquisa, as nossas máquinas pesquisam no índice páginas relacionadas com o mesmo e apresentam ao utilizador os resultados mais relevantes. A relevância é defi nida por mais de 200 factores, sendo um deles o “PageRank” da página. O PageRank é uma medida de “importância” de uma página com base nos links provenientes de outras páginas. Em resumo, cada página que possua um link para uma página XYZ aumenta o PageRank dessa página XYZ.

Antes da pesquisa

Durante a pesquisa

Rastrear a webCalcular o PageRank

Submeter termo de pesquisa

Verifi car índice

Apresentar resultados Resultados de posicionamento Seleccionar documentos

O que há de novo na pesquisa na Web do Google?

Embora os princípios básicos da pesquisa na Web tenham permanecido constantes, o Google está continuamente a trabalhar no sentido de melhorar os resultados de pesquisa.

Por exemplo, o que é que há de diferente na pesquisa na Web, desde os últimos cinco anos? Bem, para começar, está muito mais rápida.

Além disso, em comparação a cincos anos atrás, os nossos sistemas de rastreio e indexação estão muito mais inteligentes. Por exemplo, agora navegamos continuamente na Web e programamos visitas a cada página de forma mais inteligente a fi m de manter o conteúdo sempre actualizado. Esta abordagem mais efi ciente considera o facto do Web site de um jornal on-line, por exemplo, precisar de ser rastreado com maior frequência do que um Web site estático que seja actualizado uma vez por mês . Para mais, permitimos ainda que os webmasters controlem com que frequência os seus Web sites são rastreados utilizando as nossas ferramentas para webmasters. De um modo geral, isto resulta num índice mais actualizado e abrangente.

Ainda que actualmente a pesquisa na Web esteja mais rápida e mais efi ciente do que nunca, os principais factores para determinar a visibilidade de um Web site nos resultados de pesquisa do Google têm sido uma prioridade desde o dia em que o nosso mecanismo de pesquisa foi inaugurado:

O Google vai encontrar o Web site? (página 5) O Google vai indexar o Web site? (página 6) O Web site apresenta conteúdo exclusivo e útil? (página 1)

O Google vai encontrar o Web seu site?

A inclusão nos resultados de pesquisa do Google é gratuita e simples; nem sequer é necessário enviar o seu Web site para o Google. Na verdade, a grande maioria dos Web sites relacionados nos nossos resultados de pesquisa não são enviados manualmente para inclusão, mas localizados e adicionados automaticamente quando o Googlebot rastreia a Web.

Embora o Google rastreie bilhões de páginas, é inevitável que alguns Web sites não sejam visualizados. Quando isto acontece, geralmente é devido a um dos seguintes motivos:

o Web site não está associado através de links incluídos noutros Web sites na Web; o Web site foi iniciado depois da conclusão do mais recente rastreio do Google;

o Web site estava temporariamente indisponível ou recebemos uma mensagem de erro quando o tentamos rastrear.

Com as ferramentas para webmasters do Google, como o Sitemaps, poderá verifi car se o Web site está incluído no índice do Google ou se recebemos erros quando o tentamos rastrear (consulte a página 14). Também poderá utilizar estas ferramentas para adicionar o seu URL manualmente ao índice do Google, ou fornecer ao Google um Sitemap com mais informações sobre o seu conteúdo. Isso irá ajudar a encontrar novas secções e conteúdos do seu Web site.

O Google vai indexar o seu Web site?

Por vezes, os webmasters descobrem que os seus Web sites não estão a aparecer nos resultados de pesquisa. O problema poderá estar relacionado com a “capacidade de indexação”, ou seja, a capacidade de o Google fazer ou não uma cópia de uma página da Web para inclusão nos nossos resultados de pesquisa.

Estrutura e conteúdo Uma razão para a não inclusão nos resultados de pesquisa está relacionada com a estrutura e o conteúdo da página. Por exemplo, uma página que requer que o utilizador preencha um formulário pode não ser indexada pelo Google. Da mesma forma, uma página utilizando “conteúdo dinâmico” (Flash, JavaScript, frames ou URLs criados dinamicamente) pode não ser indexada facilmente pelos mecanismos de pesquisa. Se quiser confi rmar que é este o problema do seu Web site, tente visualizá-lo num navegador de texto, como o Lynx, ou num navegador com imagens, Javascript e Flash desactivados, o que indicará se todo o seu conteúdo está acessível ou não.

do conteúdo de cada imagem no texto. Isto permiteque os mecanismos de pesquisa

Se o seu Web site utilizar muitas imagens, certifi que-se de que inclui uma descrição indexem a imagem correctamente e disponibiliza a imagem para acesso por parte dos utilizadores com problemas na visualização. Também poderá utilizar o texto alternativo da imagem e nomes de arquivos descritivos, como mostrado neste exemplo (que é uma imagem de um logotipo de uma empresa intitulada “Buffy’s House of Pies” - algo como “Casa de tortas do Buffy”):

<img src=”buffyshouseofpies.jpg” alt=”Bem-vindo a Buffy’s House of Pies!”>

URLs Um outro obstáculo poderia ser o próprio URL. Se houver IDs de sessão ou vários parâmetros no URL ou se o URL efectuar vários redireccionamentos, é possível que o Google não consiga indexar a página.

Servidor e rede Problemas com o servidor ou com a rede podem impedir o acesso a determinadas páginas do seu Web site. Ao utilizar as ferramentas disponíveis no Centro para webmasters do Google, os editores podem ver a lista das páginas que não puderam ser acedidas pelo Googlebot. Para saber mais sobre o Centro para webmasters, consulte a página 13.

Protocolo de exclusão de robôs Por vezes, as páginas são bloqueadas pelo Protocolo de exclusão de robôs, um padrão técnico que permite que os editores da Web dêem indicação aos mecanismos de pesquisa para não indexar o conteúdo do Web site (consulte a página 7). Se o seu Web site não estiver a ser exibido nos resultados de pesquisa do Google, verifi que se o robots.txt ou uma meta tag não estão a bloquear o acesso aos nossos rastreadores.

Controlar o que o Google indexa

Cada editor da Web tem um objectivo diferente em relação ao que está a tentar alcançar na Internet. Editores de alguns jornais, por exemplo, optaram por disponibilizar o acesso gratuito aos seus artigos mais recentes, oferecendo um serviço premium pago para acesso aos arquivos anteriores. Alguns querem visibilidade em todas as propriedades de um mecanismo de pesquisa (como o Google Mobile, o Google Imagens, etc.), enquanto outros preferem aparecer apenas nos resultados de pesquisa na Web.

Os mecanismos de pesquisa respeitam os desejos dos editores – afi nal de contas, o conteúdo é deles. No entanto, não podemos adivinhar estes desejos, de forma que é essencial que os webmasters nos informem como desejam que o seu conteúdo seja indexado. Isto pode ser feito através do Protocolo de exclusão de robôs, uma especifi cação técnica bem defi nida que informa aos mecanismos de pesquisa qual o Web site ou partes do mesmo que não devem ser pesquisáveis, bem como quais partes que devem permanecer visíveis nos resultados de pesquisa.

(Parte 1 de 4)

Comentários