donnees.gc.ca : commentaires de CultureLibre.ca

Le gouvernement du Canada invite des commentaires des internautes dans le cadre de sa 1ère année de son initiative de gouvernement ouvert. En premier lieu, je copie mes commentaires envoyés ce matin, puis j’inclus ici-bas des informations complémentaires sur les pratiques restrictives du gouvernement Canadien sur l’indexation de ses documents dans Internet.

Vous avez jusqu’au 9 septembre pour contribuer des commentaires. Je vous invite à y inscrire vos propres réflexions, ou simplement copier-coller mes commentaires.

Je vous félicite pour votre excellente initiative et les réalisations jusqu’à date. Ce commentaire concerne le 2e point de la consultation, il s’agit d’un commentaire sur les 12 engagements dans le cadre du Plan d’action.

Voici : il est essentiel de modifier les paramètres d’indexation des pages des sites gouvernementaux pour refléter les réalités d’une approche d’un gouvernement ouvert. Spécifiquement, il est primordial de modifier les fichiers « robots.txt » associés aux domaines du gouvernement du Canada (site:.gc.ca). C’est une chose de diffuser ses données et documents dans internet, mais c’est une autre de les rendre repérables par les divers engins de recherche du Web. Actuellement, le gouvernement du Canada impose des barrières aux programmes d’indexation du web, ce qui pose préjudice aux droits des citoyens d’accéder (repérer l’information).

Il va sans dire que l’appareil gouvernemental est un système complexe et mon commentaire vous concerne en partie. D’autres départements sont probablement plus concernés par la pratique gouvernementale de « cacher » des documents sur le web des moteurs de recherche. Je désire saisir l’opportunité que vous m’offrez de m’exprimer pour passer ce commentaire.

Ainsi, ce commentaire pourrait se retrouver au sein des « Norme sur l’optimisation des sites Web et des applications pour appareils mobile » sous l’égide du point 8 « GCWeb » du plan d’action. Elle pourrait aussi figurer parmi le point 1 « Directive sur le gouvernement ouvert » du plan d’action. J’ai tenté de retrouver dans la documentation citée à quel endroit le gouvernement émet des directives concernant la gestion de l’indexation par des engins de recherche externes, sans succès. Peu importe dans quel cadre s’inscrit mon commentaire, il va sans dire que tous les Canadiennes, tous les Canadiens et tous les citoyens du Web vont bénéficier directement d’une publication ouverte ET d’une indexation libre de votre documentation.

Pour des compléments d’information, je vous invite à visiter cette page de mon blogue :
http://www.culturelibre.ca/2013/08/28/donnees-gc-ca-commentaires-de-culturelibre-ca/

COMPLÉMENT D’INFORMATION
Le 6 juin 2013, une assistante de recherche a effectué la recherche suivante sur Google:
site:gc.ca robots.txt
Elle a passée les 10 premières pages en revue et a noté les sites qui interdisait l’indexation de leurs pages par des robots d’engins de recherche (suivez ce lien vers la page Wikipedia qui explique le protocole d’exclusion des engins de recherche). Voici les « pires » exemples d’exclusion. Les Canadiennes, Canadiens et autres citoyens d’internet ne peuvent pas repérer ces documents par des recherches dans leur engin de recherche préféré :

Site:

Protocole d’exclusion de Robots:

Ce qui est caché:

http://decisions.fca-caf.gc.ca

http://decisions.fct-cf.gc.ca

User-agent: *

Disallow: /

Jugements de la cour fédérale, plusieurs contre le gouvernement du Canada \ Federal court cases, many of which are vs. Canada.

http://cradpdf.drdc-rddc.gc.ca

# go away
User-agent: *
Disallow: /

Rapports du department de la Défense \ Defence Research and Development Canada reports.

http://sage-geds.tpsgc-pwgsc.gc.ca

http://sage-geds.gc.ca

User-Agent: *
Disallow: /

La bibliothèque numérique des documents gouvernementaux \ The Government Electronic Directory Services of federal public servants across Canada.

http://www.pc.gc.ca

User-agent: *
Disallow: /apps/

Parks Canada.

http://dsp-psd.pwgsc.gc.ca

http://dsp-psd.communication.gc.ca

User-agent: *
Disallow: /

Publications du gouvernement du Canada \ Government of Canada Publications which are very difficult to search and obtain actual document.

http://www.sararegistry.gc.ca

User-agent: *
Disallow: /

Espèces en voie de disparition, un repertoire public \ Species at Risk Public Registry.

http://atlas.nrcan.gc.ca

User-agent: *
Disallow: http://atlas.nrcan.gc.ca/site/francais/
Disallow: http://atlas.rncan.gc.ca/site/english/
Disallow: http://atlas.gc.ca/
Disallow: http://www.atlas.gc.ca/
Disallow: http://www.atlas.rncan.gc.ca/
Disallow: http://www.atlas.nrcan.gc.ca/

Presque toutes les pages de Ressources Naturelles Canada \ Almost all pages on Natural Resources Canada.

http://www.cse-cst.gc.ca

# User-agent: *
# Dissallow: /

Communications Security Establishment Canada.

Ce contenu a été mis à jour le 2013-08-28 à 9 h 42 min.