
L’indexation d’un site dans Google Actualités offre des perspectives de trafic gratuit extrêmement intéressantes, en particulier pour les sites proposant de l’actualité fraîche et variée. Sur les sites de news majeurs, le pourcentage du trafic moteur en provenance de Google Actualités peut aller jusqu’à 70% du trafic moteur global ! Il est donc stratégique pour un site de news d’y être présent, et idéalement en bonne place.
Pour y parvenir, il faut réunir un certain nombre de critères techniques mais aussi éditoriaux. Cela demande des compétences rares, et donc chères. Dans ce premier article, je traiterai des critères techniques.
Respecter ces critères est particulièrement stratégique pour les contenus dont l’attrait à une durée de vie inférieure ou égale à 30 jours (ou contenu chaud).
Mais d’expérience, on se rend compte que Google Actualités indexe parfois aussi du contenu plus froid. Il peut donc être intéressant de respecter ces critères de manière plus générale dans un site et pas seulement pour la/les sections actu.
Etre référencé dans Google Actualités
Pour être référencé sur Google Actualités, il faut simplement en faire la demande à Google via un formulaire dédié. Mais avant de faire cette demande, il faut vérifier que le site/blog a soumettre est éditorialement et techniquement conforme au cahier des charges de Google Actualités : un site qui ne le serait pas pourra être accepté (si la qualité de son contenu le justifie) mais ne sera pas ou peu crawlé ; ne générant ainsi pas de trafic.
Voici les critères de base pour être indexé.
Chaque article doit disposer de sa page web dédiée
Proscrire les pages listant plusieurs « brèves », les listes d’articles ne pointant pas vers la page dédiée à chaque news et les pages contenant le contenu intégral de plusieurs articles. Ces types d’articles seront systématiquement refusés par Google Actualités.
Chaque article doit disposer d’un identifiant unique présent dans son url
L’url doit contenir un ID unique composé d’au moins trois chiffres (Attention : le nombre ne doit pas être composé d’un ID à quatre chiffres ressemblant à une année). Il n’est pas obligatoire que cet ID soit présent en fin d’url, mais il doit être présent.
Les urls ne contenant pas d’ID ne sont tout simplement pas crawlées.
Exemples d’urls à id conformes pour Google Actualités
www.monsite.com/actu/1234/titre-article.html
www.monsite.com.actu/titre-article-1234.html
Google avait communiqué en février 2009 sur le fait que ce critère n’était plus obligatoire. Si cela n’est plus le cas aux USA (ce qui reste à confirmer), il n’en est rien en France : toute page web ne disposant pas d’un ID dans son url est toujours ignorée par le spider de Google Actualités.
L’article doit être en ligne au moins 30 jours
C’est la durée d’indexation des articles dans Google Actualités. La commande « site: » dans Google Actualités permet de savoir combien d’articles d’un site sont indexés. Au-delà de 30 jours, les articles ne remontent plus dans les pages de résultat.
L’optimisation des images
Les images (et en particulier l’image d’illustration principale de l’article) doivent être non cliquables. Il existe cependant des techniques de contournement pour disposer d’un zoom sur les images sans passer par un lien classique :)
Pour disposer d’une vignette à coté de son article dans les pages de Google Actualités, il faut respecter un format qui permette à Google de la générer sans recadrage. Pour cette raison, il faut afficher un visuel d’illustration principal de l’article dont la taille correspond à un facteur multiplicateur de 60×80 en mode portrait, ou 80×60 en mode paysage.
Les images doivent être en gif ou jpeg uniquement et les attributs height et width de la balise img doivent être remplis dans le code (au moins la largeur OU la hauteur). Il en est de même pour l’attribut alt (ou description courte de l’image).
Les articles illustrés d’une image en PNG ne permettront pas la génération d’une vignette dans les pages de résultat de Google Actualités.
Le non respect des guidelines images n’entraînera pas une non indexation des articles. En revanche, il sera alors impossible que les articles soient illustrés d’une vignette. Or, on sait bien que les articles illustrés ont un taux de clic plus fort…
Si la créa impose un format d’image non compatible avec le format demandé par Google, il existe là encore des astuces pour contourner. Je vous laisse y réfléchir…
Le balisage sémantique
Un balisage sémantique correct est beaucoup plus important pour le positionnement dans Google Actualités que pour Google « classique ».
Le titre doit être contenu dans une balise H1, le chapô (optionnel) dans une balise H2.
Vous pouvez utiliser des balises H3 et suivantes si souhaité, mais cela ne vous aidera pas pour Google Actualités.
A mon avis, l’absence de H1 est particulièrement pénalisante pour le positionnement dans Google Actualités.
Le contenu textuel de l’article
S’il n’existe pas de longueur idéale pour être bien positionné sur Google Actualités, il existe en revanche une longueur minimale pour être indexé.
Les articles dont le texte n’atteint pas 1200 caractères (espace et chapô compris) seront la plupart du temps rejetés (mais parfois indexés, sans qu’il semble y avoir une raison pour que l’indexation soit effective dans un cas et pas dans un autre…). Il est possible que Google Actualités soit plus souple sur ce critère avec les sources disposant d’un fort ranking score (j’y reviendrai).
Attention, il s’agit du texte de l’article « nu », sans prise en compte du reste du contenu textuel de la page, des blocs de rebond, de confort, de bookmarking social, etc.
En général, Google se réfère à la balise /h2 (ou, à défaut /H1) pour identifier le début de l’article et à la date ou à la signature de l’article pour en identifier la fin.
La présence d’un chapô n’est pas obligatoire mais cependant recommandée par Google. S’il est présent, il ne doit pas être cliquable.
Google Actualités recommande également :
- d’afficher la date et l’heure de publication de l’article (ceux-ci ne doivent pas être cliquables)
- d’afficher le nom de la rubrique initiale de publication de l’article, ou les thèmes associés (ceux-ci ne doivent pas être cliquables)
Le titre de l’article
Il doit être court, plus court que la longueur max. autorisée pour Google « classique » : 60 caractères max. Dans la pratique, un titre « passe » souvent jusqu’à 70 caractères espaces compris. En cas de dépassement, le titre sera tronqué dans les pages de Google Actualités, mais cela n’entrainera pas la non indexation de l’article.
Comme pour Google classique, le titre est un élément très important pour le positionnement. Sur Google Actualités, il a même un poids encore plus important.
L’équation a résoudre pour bien choisir son titre est celle de la part de l’optimisation « SEO » versus celle du teasing purement éditorial. En effet, du CTR est dépendant le classement de l’article, et donc sa remontée éventuelle en homepage. Pour trouver le bon mix, il faut, selon son site/blog et sa cible tester, tester, tester, et encore tester…
La densité de mots clés
Celle-ci ne semble avoir aucune incidence ni sur l’indexation, ni sur le positionnement.
Google donne un certain nombre d’informations sur les contraintes techniques liées à Google Actualités sur son aide en ligne dédiée
Le Sitemap News
L’expérience montre qu’il améliore grandement le taux d’inclusion des articles : Google n’a plus à trouver lui-même sur le site quels sont les nouveaux contenus d’actualités à indexer : ils lui sont fournis directement à la publication.
Il est possible de soumettre le Sitemap news comme n’importe quel Sitemap « classique » via le Google Webmaster Tools. Il est souhaitable également d’ajouter son url dans le Sitemap index du site.
Ne doivent être incluses dans le Sitemap que des urls d’articles de type « actu », dont la date de publication est inférieure à 30 jours. On peut éventuellement y adjoindre des pages de listes d’actu. La mise à jour du fichier doit se faire si possible en temps réel, à la création d’un nouvel article.
Le Sitemap ne doit pas contenir plus de 1 000 urls (si besoin, il faudra créer plusieurs Sitemaps news).
L’urlset diffère de celui du Sitemap « classique » :
Voici le détail des balises renseignables :
J’aurai tendance à penser que le fait de remplir la meta keywords a un petit impact positif en terme de ranking, mais cela reste plus à l’état de ressenti qu’à l’état de preuve.
L’ensemble des recommandations Google relatives aux Sitemap news sont disponibles en ligne sur l’ aide aux éditeurs
Pour y parvenir, il faut réunir un certain nombre de critères techniques mais aussi éditoriaux. Cela demande des compétences rares, et donc chères. Dans ce premier article, je traiterai des critères techniques.
Respecter ces critères est particulièrement stratégique pour les contenus dont l’attrait à une durée de vie inférieure ou égale à 30 jours (ou contenu chaud).
Mais d’expérience, on se rend compte que Google Actualités indexe parfois aussi du contenu plus froid. Il peut donc être intéressant de respecter ces critères de manière plus générale dans un site et pas seulement pour la/les sections actu.
Etre référencé dans Google Actualités
Pour être référencé sur Google Actualités, il faut simplement en faire la demande à Google via un formulaire dédié. Mais avant de faire cette demande, il faut vérifier que le site/blog a soumettre est éditorialement et techniquement conforme au cahier des charges de Google Actualités : un site qui ne le serait pas pourra être accepté (si la qualité de son contenu le justifie) mais ne sera pas ou peu crawlé ; ne générant ainsi pas de trafic.
Voici les critères de base pour être indexé.
Chaque article doit disposer de sa page web dédiée
Proscrire les pages listant plusieurs « brèves », les listes d’articles ne pointant pas vers la page dédiée à chaque news et les pages contenant le contenu intégral de plusieurs articles. Ces types d’articles seront systématiquement refusés par Google Actualités.
Chaque article doit disposer d’un identifiant unique présent dans son url
L’url doit contenir un ID unique composé d’au moins trois chiffres (Attention : le nombre ne doit pas être composé d’un ID à quatre chiffres ressemblant à une année). Il n’est pas obligatoire que cet ID soit présent en fin d’url, mais il doit être présent.
Les urls ne contenant pas d’ID ne sont tout simplement pas crawlées.
Exemples d’urls à id conformes pour Google Actualités
www.monsite.com/actu/1234/titre-article.html
www.monsite.com.actu/titre-article-1234.html
Google avait communiqué en février 2009 sur le fait que ce critère n’était plus obligatoire. Si cela n’est plus le cas aux USA (ce qui reste à confirmer), il n’en est rien en France : toute page web ne disposant pas d’un ID dans son url est toujours ignorée par le spider de Google Actualités.
L’article doit être en ligne au moins 30 jours
C’est la durée d’indexation des articles dans Google Actualités. La commande « site: » dans Google Actualités permet de savoir combien d’articles d’un site sont indexés. Au-delà de 30 jours, les articles ne remontent plus dans les pages de résultat.
L’optimisation des images
Les images (et en particulier l’image d’illustration principale de l’article) doivent être non cliquables. Il existe cependant des techniques de contournement pour disposer d’un zoom sur les images sans passer par un lien classique :)
Pour disposer d’une vignette à coté de son article dans les pages de Google Actualités, il faut respecter un format qui permette à Google de la générer sans recadrage. Pour cette raison, il faut afficher un visuel d’illustration principal de l’article dont la taille correspond à un facteur multiplicateur de 60×80 en mode portrait, ou 80×60 en mode paysage.
Les images doivent être en gif ou jpeg uniquement et les attributs height et width de la balise img doivent être remplis dans le code (au moins la largeur OU la hauteur). Il en est de même pour l’attribut alt (ou description courte de l’image).
Les articles illustrés d’une image en PNG ne permettront pas la génération d’une vignette dans les pages de résultat de Google Actualités.
Le non respect des guidelines images n’entraînera pas une non indexation des articles. En revanche, il sera alors impossible que les articles soient illustrés d’une vignette. Or, on sait bien que les articles illustrés ont un taux de clic plus fort…
Si la créa impose un format d’image non compatible avec le format demandé par Google, il existe là encore des astuces pour contourner. Je vous laisse y réfléchir…
Le balisage sémantique
Un balisage sémantique correct est beaucoup plus important pour le positionnement dans Google Actualités que pour Google « classique ».
Le titre doit être contenu dans une balise H1, le chapô (optionnel) dans une balise H2.
Vous pouvez utiliser des balises H3 et suivantes si souhaité, mais cela ne vous aidera pas pour Google Actualités.
A mon avis, l’absence de H1 est particulièrement pénalisante pour le positionnement dans Google Actualités.
Le contenu textuel de l’article
S’il n’existe pas de longueur idéale pour être bien positionné sur Google Actualités, il existe en revanche une longueur minimale pour être indexé.
Les articles dont le texte n’atteint pas 1200 caractères (espace et chapô compris) seront la plupart du temps rejetés (mais parfois indexés, sans qu’il semble y avoir une raison pour que l’indexation soit effective dans un cas et pas dans un autre…). Il est possible que Google Actualités soit plus souple sur ce critère avec les sources disposant d’un fort ranking score (j’y reviendrai).
Attention, il s’agit du texte de l’article « nu », sans prise en compte du reste du contenu textuel de la page, des blocs de rebond, de confort, de bookmarking social, etc.
En général, Google se réfère à la balise /h2 (ou, à défaut /H1) pour identifier le début de l’article et à la date ou à la signature de l’article pour en identifier la fin.
La présence d’un chapô n’est pas obligatoire mais cependant recommandée par Google. S’il est présent, il ne doit pas être cliquable.
Google Actualités recommande également :
- d’afficher la date et l’heure de publication de l’article (ceux-ci ne doivent pas être cliquables)
- d’afficher le nom de la rubrique initiale de publication de l’article, ou les thèmes associés (ceux-ci ne doivent pas être cliquables)
Le titre de l’article
Il doit être court, plus court que la longueur max. autorisée pour Google « classique » : 60 caractères max. Dans la pratique, un titre « passe » souvent jusqu’à 70 caractères espaces compris. En cas de dépassement, le titre sera tronqué dans les pages de Google Actualités, mais cela n’entrainera pas la non indexation de l’article.
Comme pour Google classique, le titre est un élément très important pour le positionnement. Sur Google Actualités, il a même un poids encore plus important.
L’équation a résoudre pour bien choisir son titre est celle de la part de l’optimisation « SEO » versus celle du teasing purement éditorial. En effet, du CTR est dépendant le classement de l’article, et donc sa remontée éventuelle en homepage. Pour trouver le bon mix, il faut, selon son site/blog et sa cible tester, tester, tester, et encore tester…
La densité de mots clés
Celle-ci ne semble avoir aucune incidence ni sur l’indexation, ni sur le positionnement.
Google donne un certain nombre d’informations sur les contraintes techniques liées à Google Actualités sur son aide en ligne dédiée
Le Sitemap News
L’expérience montre qu’il améliore grandement le taux d’inclusion des articles : Google n’a plus à trouver lui-même sur le site quels sont les nouveaux contenus d’actualités à indexer : ils lui sont fournis directement à la publication.
Il est possible de soumettre le Sitemap news comme n’importe quel Sitemap « classique » via le Google Webmaster Tools. Il est souhaitable également d’ajouter son url dans le Sitemap index du site.
Ne doivent être incluses dans le Sitemap que des urls d’articles de type « actu », dont la date de publication est inférieure à 30 jours. On peut éventuellement y adjoindre des pages de listes d’actu. La mise à jour du fichier doit se faire si possible en temps réel, à la création d’un nouvel article.
Le Sitemap ne doit pas contenir plus de 1 000 urls (si besoin, il faudra créer plusieurs Sitemaps news).
L’urlset diffère de celui du Sitemap « classique » :
Voici le détail des balises renseignables :
J’aurai tendance à penser que le fait de remplir la meta keywords a un petit impact positif en terme de ranking, mais cela reste plus à l’état de ressenti qu’à l’état de preuve.
L’ensemble des recommandations Google relatives aux Sitemap news sont disponibles en ligne sur l’ aide aux éditeurs