Controlando o Googlebot: Guia de tags, diretivas e atributos

Controlando o Googlebot: Guia de tags, diretivas e atributos
Controlando o Googlebot: Guia de tags, diretivas e atributos

O Google tem inúmeras tags que impactam diretamente como o crawler se comporta no site. Como (e se deve) indexar, seguir ou não um link, traduzir, etc. É muito importante para quem trabalha com SEO ter o conhecimento e como utilizar corretamente cada uma delas.

Periodicamente são adicionadas novas opções, porém as vezes as explicações do site oficial são vagas. Então, traduzo esse guia feito pela SEO Jedi Zlata Verzhbitskaia lá pro SEO Power Suite

Meta tag Robots

A meta tag Robots afeta diretamente como o site é mostrado na página de resultado. São colocanas no header de uma página HTML e nela você pode configurar as diretivas (nofollow, noindex, etc) para o google.

Observação: Para que todas as tags robots funcionem, não incluam páginas que estão definidas no robots.txt. Caso contrário, o Google pode não vê-las.

As diretivas da tag Robots são:

All

A tag All está implícita por padrão se não for especificada nenhuma diretiva na página. Você pode declarar explicitamente ou não – nada vai mudar. A tag all diz ao google que a página está totalmente disponível para indexação: todo o seu conteúdo pode ser rastreado e indexado, e todos os links dessa página podem ser seguidos.

Exemplo

<meta name="robots" content="all">

NoIndex

A tag noindex previna que a página apareça na SERP. O Google ainda a rastreará e seguirá todos os links da página se nenhuma outra diretiva estiver implícita

Você pode usar essa tag para esconder certas páginas da indexação – páginas que podem conter dados privados, páginas de login, ainda em construção, etc.

Exemplo

<meta name="robots" content="noindex">

Nofollow

A tag nofollow não permite que os rastreadores do Google sigam nenhum link na página. Ainda assim, o Google poderá indexar e exibir na SERP.

Exemplo

<meta name="robots" content="nofollow">

Se você precisar ocultar a página da SERP e impedir o rastreamento de qualquer link que ela tenha, você poderá combinar as tags nofollow e noindex, assim:

<meta name="robots" content="noindex, nofollow">

None

Esta tag é a mesma coisa que nofollow e noindex combinados. Você pode usar para impedir que a página apareça na SERP e que qualquer um dos seus links sejam seguidos.

Exemplo

<meta name="robots" content="none">

Noarchive

Provavelmente você já se deparou com uma página que o Google guardou em cache e te exibiu após você tentar acessar uma página indisponível.

Imagem de como é o cache do google, exemplificado no site Caminhos e Vinhos sem utilizar a tag noarchive

Se você quiser impedir que o Google mostre uma cópia em cache da sua página, adicione a tag noarchive.

Use essa tag se você quiser impedir o acesso a uma determinada página caso essa página esteja indisponível, ou quando utilizarem o comando cache:

Exemplo

<meta name="robots" content="noarchive">

Nositelinkssearchbox

O Google pode exibir sua caixa de pesquisa de sitelinks internos diretamente da SERP. Assim, as pessoas podem fazer pesquisas no site sem visitar diretamente o site.

Exemplo de sitelinksearchbox no site do pinterest

Se você quer impedir que o Google insira esta caixa de busca e quer que seus usuários acessem seu site antes de fazer qualquer busca, coloque a tag nositelinkssearchbox no HTML da sua página inicial.

Exemplo

<meta name="robots" content="nositelinkssearchbox">

Indexifembedded

Aqui está uma novidade! Se você adicionar a tag indexifembedded em sua página, o conteúdo dessa página poderá ser indexado se estiver incorporado em alguma outra página por meio de iframe ou semelhantes.

Observação: A tag indexifembedded só funciona em conjunto com a tag noindex, pois a própria página não deve ser indexada. O conteúdo das páginas só é indexado quando é incorporado em outro lugar.

Por que você pode precisar dessa tag? Isso é o que o Google diz sobre o assunto:

A tag indexifembedded aborda um problema comum que afeta especialmente media publishers: embora eles possam querer que seu conteúdo seja indexado quando incorporado em páginas de terceiros, eles não querem necessariamente que suas páginas de mídia sejam indexadas por conta própria.

John Mueller falou um pouco mais em seu twitter:

Um caso de uso “comum” (é novo, então não há nada comum ainda :)) seriam widgets ou conteúdo incorporado, onde você tem uma URL especial para incorporação que não deseja indexar, mas ainda deseja permitir a página de incorporação para usá-la para indexação. Por exemplo, incorporações de vídeo.

John Mueller

O que isso realmente significa? Digamos que você tenha a página A com algum tipo de mídia com pouco contexto. Esta página A tem uma tag noindex. Se você incorporar o conteúdo da página A à uma página B, este conteúdo não será indexado, portanto, a página B também não será totalmente indexada Mas se você adicionar uma tag indexifembedded a página A, o conteúdo incorporado será indexado na página B. Portanto, a página B é totalmente indexada.

Exemplo

<meta name="robots" content="noindex, indexifembedded">

Notranslate

A tag notranslate impede que o Google traduzia o snippet da sua página para o idioma da consulta de pesquisa. Se você não usar essa tag, o Google traduzirá o snippet da página e todo o conteúdo da página quando clicada. Além disso, o Google traduzirá automaticamente todos os links clicados nessa página.

O ponto é que toda a interação com o seu site nesse caso estará passando pelo Google Tradutor. Embora a evolução da qualidade da tradução é constante, alguma confusão pode acontecer.

Observação: Tradução automática agora está disponível para traduzir os resultados da pesquisa em inglês para indonésio, hindi, canarês, malaio, tâmil, telugu. Mas com certeza em breve novos idiomas serão adicionados.

Portanto, se o seu conteúdo é sensível à tradução, recomendo que seja adicionada a tag notranslate para limitar as ações do google. E, por sua vez, você pode criar várias versões linguísticas do seu site para conquistar clientes de outros países.

Exemplo

<meta name="robots" content="notranslate">

Noimageindex

Essa tag impede que o Google indexe quaisquer imagens na página e as exiba na SERPs.

Exemplo

<meta name="robots" content="noimageindex">

Unavailable_after: [date/time]

Essa tag não permite que o Google mostre a página na SERPs após uma data específica.

Você pode usar essa tag em algumas páginas relacionadas a eventos (ofertas de temporada, descontos, campanhas promocionais etc.), que se tornarão irrelevantes após uma determinada data.

Exemplo

<meta name="robots" content="unavailable_after: 2022-04-23">

Nosnippet

Aplique a tag nosnippet se não quiser que sua página tenha um trecho em destaque de texto ou vídeo. Lembre-se de que o snippet de imagem ainda pode ser exibido na SERP.

Por que você pode precisar disso? Digamos que sua página tenha um snippet em destaque e, se esse snippet fornecer todas as informações necessárias diretamente na SERP, talvez o usuário não precise visitar seu site. Por exemplo, este é um caso comum se pesquisarmos no Google por letras de músicas:

Imagem da SERP com a letra da música Barbie Girl

Os usuários podem obter suas informações da SERP, para que não precisem ir a nenhum outro lugar. Isso significa que sua página de onde o conteúdo é retirado não recebe o tráfego que poderia obter. Ainda assim, usar a tag nosnippet pode ser arriscado, pois os snippets de seus concorrentes podem superá-lo e obter mais atenção. Escolha com cautela

Exemplo

<meta name="robots" content="nosnippet">

Max-snippet: [number]

Essa tag instrui o Google sobre quantos caracteres ele pode usar na meta descrição do snippet. Você pode definir o número exato, bem como:

  • 0 — se você não quiser que sua página tenha um snippet (igual a nosnippet);
  • -1 — se você não quiser limitar o Google e deixá-lo escolher o tamanho do snippet por conta própria.

O Google seguirá essas tags caso não receba permissões específicas de uso de conteúdo. Isso inclui marcar sua página com dados estruturados ou fornecer ao Google um contrato de licença. Ambas as diretivas são mais poderosas do que as tags específicas de snippets, portanto, certifique-se de não aplicá-las se precisar configurar limites de snippets.

Exemplo

<meta name="robots" content="max-snippet:20">

Max-image-preview: [setting]

A tag max-image-preview permite que você escolha o tamanho da imagem a ser exibida nas SERPs. Se você não usar essa tag, o Google usará o tamanho de imagem padrão.

Três opções para configurar nessa tag:

  • none: um snippet não incluirá uma imagem;
  • standard: a imagem terá um tamanho padrão;
  • largue: a imagem pode ser grande, até a largura do viewport

Essa tag se aplica a todos os tipos de resultados de pesquisa, a menos que você tenha concedido permissões específicas ao Google (como quando seu conteúdo é um AMP ou uma versão canônica de um artigo ou quando você tem um contrato de licença com o Google).

Exemplo

<meta name="robots" content="max-image-preview:standard">

Max-video-preview: [number]

Essa tag permite especificar a duração exata (segundos) de um snippet de visualização de vídeo.

Opções especiais para configuração:

  • 0 — esta opção mostra uma imagem estática no lugar de um vídeo. O tamanho da imagem depende do que você especifica com a tag max-image-preview;
  • -1 — sem limites na visualização da duração do vídeo.

Assim como todas as tags relacionadas a snippets, o max-video-preview se aplica a todos os tipos de resultados de pesquisa.

Exemplo

<meta name="robots" content="max-video-preview:9">

Valores Rel para qualificação de link

Essas tags, ou, para ser claro, atributos rel na tag <a>, são usadas para regular os relacionamentos de links entre as páginas. Os atributos Rel são diretivas in line e são colocadas no corpo de um documento HTML na linha relevante.

Por enquanto, o Google tem os seguintes valores rel:

rel=”nofollow”

Observação: Anteriormente neste post, mencionei a metatag de robôs nofollow. O valor nofollow rel que vou descrever agora é uma coisa diferente e não tem nada em comum com a metatag robots. Não misture.

O Nofollow foi introduzido inicialmente para marcar links pagos gerados pelo usuário e os links aos quais você simplesmente não deseja que o Google associe seu site. Os links marcados como nofollow não passam PageRank e não permitem que o Google rastreasse a página vinculada do seu site.

O fato é que rel=”nofollow” mudou muito desde o dia em que foi introduzido. Em 2019, o Google confirmou que trata os links nofollow como uma dica – assim, os rastreadores do Google agora podem decidir se devem visitar esses links (leia-se para distribuir PageRank) ou não por conta própria.

Então, como você deve usar nofollow hoje em dia? Utilize esta tag nos links das páginas com as quais você não deseja compartilhar o PageRank por qualquer motivo. Podem ser páginas de seus concorrentes ou páginas às quais você não deseja que o Google associe seu site. Ao mesmo tempo, não é a melhor ideia criar links para páginas obviamente de baixa qualidade, mesmo com links nofollow, pois eles ainda dão ao Google a oportunidade de visitar a página vinculada.

Exemplo

<a rel="nofollow" href="https://mysite.com/my_page">texto ancôra</a>

rel=”ugc”

O Google recomenda usar rel=”ugc” com os links para conteúdo gerado pelo usuário. Esta é uma tag relativamente nova (anteriormente, nofollow era recomendado para UGC).

Aplique essa tag se não tiver certeza sobre a qualidade do conteúdo gerado pelo usuário. Esse tipo de conteúdo é realmente difícil de ficar de olho para ter certeza sobre qualquer coisa, então mantenha suas páginas no lado seguro.

Exemplo

<a rel="ugc" href="https://mysite.com/my_page">my anchor</a>

Ainda assim, os SEOs têm certas preocupações se você usar amplamente o atributo rel=”ugc”. Uma das razões para isso é a declaração do Google que diz:

Se você deseja reconhecer e recompensar colaboradores confiáveis, remova esse atributo dos links postados por membros ou usuários que fizeram contribuições consistentes de alta qualidade ao longo do tempo.

Isso implica a ideia de que, ao contrário do nofollow, o Google pode tratar os links rel=”ugc” como algo não muito valioso

Imagem humorística comparando o link nofollow com ugc

rel=”sponsored”

O atributo rel=”sponsored” é recomendado para links pagos e afiliados.

Essa tag também é nova; anteriormente, o Google recomendava aplicar nofollow para esse tipo de link.

Na verdade, rel=”nofollow” ainda é aceitável para links pagos, então você não precisa alterar manualmente os atributos em suas páginas. Ainda assim, é melhor marcar novos links pagos como patrocinados.

Exemplo

<a rel="sponsored" href="https://mysite.com/my_page">texto âncora</a>

Uma boa pergunta é por que o Google precisa dos novos atributos quando nofollow ainda é aceitável para todos os tipos de links. Provavelmente a ideia é que o Google vai tratar esses atributos (dicas, como diz o Google) de forma diferente.
Também é interessante que o Google sugira exemplos de uso de vários valores rel ao mesmo tempo. Assim:

<p>Eu odeio queijo <a rel="ugc nofollow" href="https://cheese.example.com/blue_cheese">Azul</a>.</p>

Ou assim:

<p>Eu odeio queijo <a rel="ugc sponsored" href="https://cheese.example.com/blue_cheese">Azul</a>.</p>

Isso só pode significar que o Google os tratará de maneira diferente, com certeza. Ainda não está claro qual será (ou é) essa diferença, mas essas tags sinalizam algo para o Google.

Resumindo

O google adora adicionar novas tags com o tempo, ou alterar as recomendações das tags já existentes. Por isso, sempre que tiver alguma atualização esse post será atualizado.

Qualquer dúvida deixe seu comentário ou entre em Contato

Leave a Comment

Comments

No comments yet. Why don’t you start the discussion?

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *