mardi 15 janvier 2013

La critique de l'histoire numérique sur le web





Kelly Schrum, "Surfing for the Past: How to Separate the Good from the Bad," AHA Perspectives (May 2003) [standard]
Cohen, Daniel J. and Roy Rosenzweig.  Web of lies? Historical knowledge on the Internet.”  First Monday (December 2005). [standard]
Edward L. Ayers, "Doing scholarship on the Web: ten years if triumphs -- and a disappointment", Journal of scholarly publishing, vol. 35, no. 3, 2004, pp. 143-47 [court] 



               Kelly Schrum part du constat que l’historien doit faire face à une masse écrasante d’informations de nature historique disséminée sur le web (Voir les “archives de l’infini”) ce qui le contraint à redéfinir ses stratégies de sélection. Il y a également des enjeux pédagogiques dans la mesure où les étudiants recourent massivement au WEB et pas toujours avec la distance critique nécessaire. Il relève ainsi trois familles de questionnement face à un site à prétention historique: Qui est à l’origine du site ? Dans quel but a t-il été crée (A qui est-il destiné ?) ?  Quel est sa crédibilité (A quels autres sites est-il lié?) ?  
Kelly Schrum suggère de “s’outiller” afin de s’orienter correctement dans ce maquis d’informations de valeurs inégales. Faute de quoi il suggère de contourner la difficulté en passant par les bons portails (sites de références). Ce qui revient à opter pour les « catalogues » par opposition aux algorithmes…


                Fort bien. L’on peut cependant se demander en quoi cette « méthode critique » diffère tant de celle définie par Langlois et Seignobos au début du XX siècle. Antoine Prost en proposait une synthèse[1].  Le souci des faits en histoire est celui de l’administration de la « preuve » donc de la référence. Une affirmation doit pouvoir être vérifiée. L’historien doit pouvoir en faire la critique externe (caractéristiques du document), la  Critique interne (cohérence du texte), la critique de sincérité (les intentions du témoin a t-il des raisons conscientes ou pas de déformer le témoignage ?) et enfin la critique d’exactitude (erreurs, situation objective du témoin. Sa position Impliquait-elle des biais ?).

                La question de fond n’est-elle pas alors : les ressources du Web remettent-elle en cause les fondements de la démarche critique en Histoire ? Et si la réponse apportée est vraisemblablement négative pour des raisons de simple bon sens, la question devient : en quoi Internet change les conditions de l’examen critique ?

                Daniel J. Cohen et Roy Rosenzweig pointent les limites des moteurs de recherche tel que Google («a swift locator of people and information ») et les réticences de nombreux historiens à rentrer de plein pied dans le monde du numérique arguant des chausse-trappes dans lesquelles tombent la plupart des étudiants. Comme Kelly Schrum, ils insistent sur la nécessité de nouveaux outils de recherche (automated methods for mining historical knowledge digitally) tel H.Bot. Mais maîtriser ces outils algorythmiques suppose d’avoir une bonne connaissance pratique du fonctionnement du net. D’autre part se pose la question de la pertinence des méthodes d’analyse mathématiques. Au fond la question déjà posée dans ce séminaire reste « une base de donnée étant un silo auquel on peut poser des questions ; comment faire en sorte que les questions traversent les silos ? Les auteurs jugent très bonne la capacité de H-bot à répondre de façon pertinente à des questions historiques. Soit mais l’article étant rédigé en 2005, on a du mal aujourd’hui à trouver trace de H-bot sur le net. Est-on passé à autre chose ?  Ils soulignent cependant la « naïveté » de H-bot. Faut-il s’en étonner ?  Ils rappellent opportunément que la notion problématique de vérité historique n’est pas la même dans le monde académique et sur le Web. Sur le Web c’est une affaire de consensus fut-il changeant. Pour les chercheurs ce sont les travaux les plus récents et reconnus par la communauté des historiens qui font foi. Ce point est à mes yeux, crucial, et nous retrouvons ici les limites intrinsèques des encyclopédies en ligne comme Wikipédia. La vérité a-t-elle valeur démocratique ? Est-elle détenue par le plus grand nombre ? Faute d’être complètement insaisissable (sinon à quoi bon exercer le métier d’historien) une vérité historique est « construite » donc fuyante et capricieuse ("People don't realize how hard it is to nail the simplest things," Lars Mahinske, chercheur pour l’Encyclopedia Britannica). Et si elle est établie par la communauté (la validation des pairs se substituant à la « preuve » administrée, problématique en sciences humaines), elle ne l’est souvent qu’à titre provisoire, de nouvelles sources ou questionnement pouvant à tout moment chambouler l’édifice.
                Ce consensus autour des faits historiques comme faisant foi pose donc problème à l’historien. Au début d’une recherche sur un sujet précis, l’on est souvent tenté de faire un état des lieux de la connaissance sur le web. Fort bien, mais le processus de recherche ne commencera réellement qu’à partir du moment où nous trouverons les travaux de référence sur la question et c’est clairement les limites d’internet faute d’outils adaptés. La question que nous pouvons nous poser serait aussi : dans la mesure ou des outils algorithmiques de type H.bot permettent de retrouver de façon pertinente un certain nombre de faits ou matériaux historiques, ne nous limitent-ils pas à une approche triviale, factualiste de l’histoire ?  Le danger est que ces outils nous amène par leur nature même (multiple choice) à une vision réductrice et naïve de l’histoire.
                Derrière cette question, Daniel J. Cohen et Roy Rosenzweig pointent aussi les limites de la recherche en intelligence artificielle qui est loin de répondre aujourd’hui aux espoirs et aux fantasmes qu’elle a pu susciter dans le passé. Nous sommes très loin d’approcher les capacités d’un cerveau électronique comme HAL dans 2001 l’odyssée de l’espace ! Mais si de tels outils ne nous apparaitront jamais comme « intelligent » ils peuvent cependant nous faire gagner un temps précieux en discriminant et en présélectionnant les informations sur le net, fusse de façon imparfaite et incomplète. They are dumb but fast machines ! Toutefois les techniques d’analyse de texte peuvent à l’évidence apporter beaucoup à l’historien en termes de compréhension cette fois.  En bref les méthodes quantitatives peuvent être au service de réponses qualitatives.   


[1] Prost Antoine, Douze leçons sur l’histoire, Paris, Seuil, 1996.

Aucun commentaire:

Enregistrer un commentaire