Soumettre mon site d’actualités
Nos recommandations techniques pour que votre site soit présent sur le volet Actualités de Qwant.
Afin de permettre à notre user-agent d’identifier les sites et pages web qui correspondent à des articles d’actualité, votre site doit prendre en compte les recommandations suivantes :
1 – Votre site doit supporter les formats RSS XML (sitemap-news, rss 2.0, atom, rss 1 / rdf) ou utiliser une plateforme d’hébergement externe de flux.
2 – Les URL de vos rubriques actualités doivent être fixes : si elles changent régulièrement, nos robots auront des difficultés à explorer vos contenus.
3 – Les URL de vos articles doivent être uniques : une seule URL pour un article. Nous détectons le contenu dupliqué, et de tels sites se verront dégradés.
4 – Les titres, les descriptions et l’horodatage de publication de vos articles doivent respecter les consignes suivantes afin d’être facilement identifiables par notre crawler :
- Pour les titres et les descriptions, nous vous recommandons les metas opengraph (og:title ,og:description). Pour le titre, la balise H1 sera prioritaire à la meta opengraph.
- L’horodatage se fait via les balises DC.date.issued, DC.Date.Created, article:modified_time, article:published_time, article:modified_time, toutes les autres formes de dates ne seront pas prises en compte.
5 – Le texte d’ancrage pointant vers votre article doit correspondre au titre de votre article et de la page.
6 – Veillez à ce que votre contenu soit bien accessible : l’accès aux liens ne doit pas être bloqué par des spécifications d’en-tête HTML, un fichier robots.txt ou par une balise meta.
7 – Nous n’interprétons pas le javascript. En effet, notre crawler Qwantify-News ne suit pas les liens comme le crawler web : il se rend sur la page indiquée dans le flux RSS, récupère son contenu et en extrait les éléments (title, description, body).
8 – Dans l’hypothèse où votre site est disponible en plusieurs langues, vous avez deux possibilités : soit un flux RSS par langue, soit un unique flux RSS qui précise le paramètre language pour chaque article.
Exemple sur un sitemap-news :
<news:publication>
<news:name>Journal L’Exemple</news:name>
<news:language>fr</news:language>
</news:publication>
9 – Attention aux problèmes d’encodage provenant de la différence entre l’encodage du serveur et l’encodage précisé dans la page (charset). Par exemple, veillez à ce que votre site ne précise pas dans son <html> un encodage de type ISO-8859 alors qu’il envoie du CP-1252 (serveur Windows IIS).
10 – Vous pouvez inclure du contenu multimédia type vidéo YouTube, Dailymotion ou Vimeo. En revanche, nous ne gérons pas les contenus audio.