C2i — D4 : Organiser la recherche d’informations à l’ère du numérique

C2I La recherche d’informations

Cours en ligne

Universite-Nantes

Universite-Paris-7-Diderot

Universite-Paris-10-Nanterre-la-Defense

Universite-Paris-Sud-Orsay

Domaine 4 — C2i (Certificat Informatique et Internet)

  • Compétence D4.1 Rechercher de l’information avec une démarche adaptée
  • Compétence D4.2 Évaluer les résultats d’une recherche
  • Compétence D4.3 Récupérer et référencer une ressource numérique en ligne
  • Compétence D4.4 Organiser une veille informationnelle

Dans le monde numérique, l’usager est confronté à une masse d’informations pléthoriques et peu vérifiées, étant produites et diffusées par tous. Les informations accessibles ne sont pas toujours stables dans le temps, certaines se présentant même comme des flux d’information diffusée en continu. Dans ce contexte, l’usager met en place une démarche de recherche adaptée et évalue avec discernement la qualité des informations qu’il trouve. Il exploite les informations et ressources pour documenter ses propres productions en les référençant conformément aux usages et compte tenu de leur potentielle instabilité. Il met en place une veille au moyen d’outils d’agrégation de flux, et organise ses références de façon à pouvoir y accéder en situation nomade.

Ressources créées dans le cadre des TD de l’université de Nantes (Sciences et Techniques / Psychologie) et réutilisées pour les TD de Paris Diderot (SCRIPT), Paris Nanterre (Droit et Science Politique), Paris SUD (IUT dOrsay, Dep. informatique)

D4 : Organiser la recherche d’informations à l’ère du numérique

la majeure partie des ressources en ligne font partie du web invisible (ou web profond).
→ Pages accessibles qu’après authentification
→ Pages dynamiques qui sont composées à partir de données stockées dans des bases de données.

Les outils de recherches

Un catalogue de bibliothèque donne accès aux notices bibliographiques des documents qu’elle contient. Elle est organisée selon des champs : auteur, titre, éditeur, collection, ISBN, année de publication, type de publication, résumé, mots-sujet, etc.

Un portail documentaire de bibliothèque centralise l’accès à un ensemble de services liés à la recherche d’information.

Un annuaire de recherche est un outil de recherche qui répertorie des sites web sélectionnés pour leur qualité par des spécialistes du domaine. Les sites sont organisés dans une hiérarchie de catégories.

Un moteur de recherche est un outil permettant de retrouver des pages web à partir d’une requête.

• moissonnage
→ les pages du web sont parcourues et indexées automatiquement par un robot.
→ Ne moissonne pas le web invisible.

• indexation automatique
→ les pages sont analysées pour en extraire les mots significatifs.
→ N’indexe pas tous les format (ex : format doc).

• interrogation en fonction d’une requête
→ les mots clés de la requête sont comparés aux mots extraits par l’indexation et une liste de pages web sélectionnées est affichée par ordre de pertinence.
→ L’ordre des réponses d’un moteur à une requête tient compte de la pertinence thématique (choix + ordre des mots clés) + popularité (nbr liens + nbr de clics)

Recherche avancée

Une requête est exprimée avec des critères (ex : mots clés) qui peuvent être combinés avec des opérateurs

ET, AND, + , rend tous les critères obligatoires.

OU, OR il suffit que l’un des critères soit vérifié.

SAUF, NOT, , permet de signaler un mot-clé non souhaité.

* (troncature) qui permet de ne donner que le début d’un mot-clé pour inclure virtuellement toutes les terminaisons possibles.
→ ex : informat* -> recherche informatique informaticien informaticienne information informations informatif etc.

 » «  (guillemets) pour rechercher une expression exacte (à la lettre près avec les espaces compris).

Évaluation d’une ressource :

• Pertinence → répond au besoin d’information

• Qualité :

– fiabilité de la source → Processus de validation de l’information
– notoriété de l’auteur → activité, affiliation, reconnaissance
– fraîcheur → date de création, mise à jour et fréquence
– l’objectif → éducatif, politique, commercial etc.
– public visé → grand public, spécialiste, enfants etc.

• Présentation → rédaction, lisibilité, accessibilité

Remarque : Une ressource web est éphémère et instable. → Possibilité d’enregistrer une page web en local.

Processus de validation de l’information

Traditionnel : relecture par les pairs, validation préalable
→ les sources d’information traditionnelles (ex : publications scientifiques, sites institutionnels)

Original : modération après publication
→ les sources émergeant de structures collectives plus ou moins formelles (ex : Wikipédia)

Inexistant : aucune validation
→ les sources informelles (ex : Blog, sites web personnels, commerciaux ou d’opinion)

La référence à une ressource en ligne

Auteur. Date. Titre [Support]. Adresse de la ressource. (consulté le …)

Auteur → l’organisme ou la personne physique dans le cas d’une page personnelle.
Date → celle de la dernière mise à jour si elle est connue.
Titre → celui de la page d’accueil du site.
Support → il s’écrit entre crochets ; on trouve : [En ligne] [CD-ROM] [Enr. sonore], etc.
Adresse de la ressource → c’est l’URL. (permalien)
Date de consultation par l’usager → elle s’écrit (consulté le jour mois année).

L’URL de la ressource

Exemple : c2i.education.fr/IMG/document.pdf

Le domaine : « .fr »
→ (.fr = français, .com = commercial, .org = organisation)

le nom de domaine : « education.fr »

Le sous-domaine : « c2i »
→ l’éventuel sous-domaine est indiqué en préfixe du nom de domaine suivi d’un point

le nom et l’extension du fichier : « document.pdf »
→ le fichier est dans le dossier « IMG »

La veille informationnelle consiste à se tenir au courant de l’actualité d’un domaine ou d’un sujet.
→ agréger les flux d’actualités diffusés par différents sites.
→ s’abonner à des lettres d’information ou newsletters.
→ suivre un ou plusieurs veilleurs sur un système de microblogage.
→ paramétrer des notifications pour être prévenu par courriel de nouveaux événements.

L’agrégateur de flux

Un flux d’informations sur le web est une succession d’articles ou de contenus multimédia (podcasts) diffusés à une même URL sur le web. On parle aussi de fil d’actualité ou de fil d’information.
→ La liste des titres des articles ou contenus par ordre chronologique inverse.

La syndication de contenus est le procédé qui consiste à récupérer les informations d’un site web pour les intégrer dans un autre.
→ Le flux RSS (Real Simple Syndication) désigne la technologie la plus répandue de flux web.
→ Le flux Atom est une autre technologie possible

Un agrégateur de flux permet d’afficher dans un même espace toutes les actualités en provenance différents flux d’informations du web. Cela peut-être :

• un service en ligne qui présente les flux dans des « blocs » disposés sur une page web.
→ ex : Netvibes, iGoogle

• un logiciel à installer en local qui présente les flux comme une liste de courriels
→ ex : Mozilla Thunderbird

La lettre d’information

Une lettre d’information électronique, ou newsletter, diffuse régulièrement par courriel des informations sur un sujet donné.
Pour cela on s’abonne à une liste de diffusion où seuls les propriétaires de la liste peuvent envoyer des messages et les abonnés ne peuvent que recevoir les messages ainsi diffusés. L’abonnement et le désabonnement est automatisé par un logiciel (robot) auquel on passe commande par courriel.

Le Microblogage

Les plateformes de microblogage permettent aux usagers de publier des messages très courts ou tweets destinés à informer les usagers qui les « suivent » de leur propre actualité, ou de celle du domaine qui les intéresse.

Les « veilleurs » professionnels d’un domaine sont à l’écoute des flux d’information des sites d’actualité de leur domaine. Ils sélectionnent les informations intéressantes et rédigent un tweet qui décrit brièvement l’information et intègre un lien vers l’article complet. Ainsi les usagers qui les suivent reçoivent une sélection de l’actualité du domaine.

Source et licence

Source : Nathalie Denos et Karine Silini, le 31 août 2011. Accueil portail des C2i [En ligne] (consulté le 5/02/2013) — Synthèse, créée par Édouard Dullin sous licence 

Laisser un commentaire