samedi 11 novembre 2017

De l’usage des analyses de correspondances pour l’histoire politique




Ce billet entend reprendre la réflexion engagée sur  l’usage d’une base de données en histoire sociale et politique : Fichoz. Pour un accès direct se reporter aux billets précédents : https://histoireetressources.blogspot.fr/2017/11/linterdisciplinarite-au-service-dun.html
Pour une compréhension plus détaillée, voir A global introduction to Fichoz , Dedieu Jean-Pierre, http://www.fichoz.org/

L’accent est mis ici sur l’exportation et l’exploitation de données une fois que celles-ci aient été codifiées pour un traitement quantitatif. En particulier, nous tenterons de montrer ici l’intérêt heuristique d’utiliser de larges échantillons afin de procéder à des analyses de correspondances.  
Qu’est-ce que l’analyse de correspondances ? L’analyse des correspondances multiples (ACM) est la méthode factorielle (au sens français du terme) adaptée aux tableaux dans lesquels un ensemble d’individus (en lignes) est décrit par un ensemble de variables qualitatives (en colonnes). Un exemple typique de ces données est celui des enquêtes d’opinion. L'ACM est très utilisée par les sociologues s'inspirant de Pierre Bourdieu pour étudier un « champ » spécifique. Mais plutôt que de se livrer à une description théorique de cette démarche (tache ô combien ardue pour les non spécialistes, moi y compris), j’entends ici faire le compte rendu d’un test effectué sur un échantillon issu de ma propre base de données et construit à partir d’un questionnement précis. Dix heures de travail ont certes été nécessaires – avec le tutorat technique de Jean Pierre Dedieu – pour développer une méthode d’analyse qui toutefois peut être en partie routinisée avec de la pratique et de l’expérience. Autant le dire tout de suite, les résultats de notre analyse sont assez bluffants - y compris pour JP Dedieu fin connaisseur de ces méthodes – et surtout riches de promesses.
Nul n’a besoin d’insister ici sur la complexité du fait politique en Afrique ou ailleurs. L’homo politicus ne peut être séparé des identités ethnique, sociale, religieuse, économique et familiale qui le constituent. Nous avons une concaténation de rôles sociaux certes distincts, mais où dans chacun d'eux l’individu assume simultanément tous les autres, ce qui nous oblige à rassembler des données sur son action dans chacun de ces domaines avant d'opiner. L’idée est donc ici de rassembler un ensemble de marqueurs biographiques soigneusement sélectionnés sur un vaste ensemble d’individus afin de voir comment certains facteurs poussant à la politisation peuvent être corrélés entre eux et en particulier de voir comment ils interagissent.  

Comment procéder ?

Prenons le cas par exemple du Bloc démocratique camerounais (BDC) parti politique camerounais crée le 20 juin 1951 par le Dr Louis Paul Aujoulat, missionnaire laïque, fondateur d’AD LUCEM Cameroun, cofondateur des IOM, ministre aux multiples portefeuilles ministériels sous la 4ème République, promoteur de l’action catholique et initiateur d’une transformation de la société politique camerounaise par la cooptation de ses élites instruites. Le BDC est donc un parti proche de l’administration coloniale, proche des cercles catholiques (en rupture cependant avec la ligne réactionnaire de Mgr Lefebvre et Mgr Graffin) et rassemblait pour l’essentiel des notables et des fonctionnaires du Nyong et Sanaga. Le but ici est de comprendre comment se structure le groupe de BDCistes par à l’ensemble des individus repéré dans la base.  

La première étape consiste à attraper à la volée l’ensemble des données qui nous intéresse (« on-the-way coding »). Pour cela, je me suis appuyer sur ma nomenclature des facteurs de politisations, document qui rassemble les catégories construites à partir des données empiriques.

Nous avons d’abord créé deux groupes de références: 
BDC1: appartenance BDC (membres et cadres). (90 individus)
BDC0: autres appartenances partisanes ou pas d'appartenance connue (le reste de la base soit 4800 individus environ)

Le deuxième marqueur est ethnique.
TR01: Groupe Beti (qui représente les populations du centre Cameroun catholique)
TR70: Autre africain
TR80: Européen et assimilés

Le troisième marqueur est l’appartenance à une association traditionnelle révélatrice d’une certaine conscience ethnique ou, à tout le moins, conscience d’intérêts particularistes ou communautaires.
ATR0: membre d’une association traditionnelle
ATR1: non membre

Le quatrième marqueur est la proximité avec les ressources administratives. Ce facteur étant essentiel au vue du caractère supposément prébendier du BDC, nous avons construit un gradient cumulatif.
RA00: pas d'accès connu
RA01: Proximité avec l’administration locale (Chefferies, associations régionales, conseil des notables, comité de village, conseil municipal, emploi de mairie, …)
RA02: Proximité avec les centres de décision nationaux camerounais (Parlements, commissions…)
RA03: RA01 + RA02
RA04: Proximité avec les centres de décision français au Cameroun (Haut-commissariat, administration régionale)
RA05: RA03 + RA04
RA06 : Proximité avec les centres de décisions impériaux et métropolitains (Parlements, commissions, ministères…)
RA07: Tout cumulé

Le cinquième marqueur est la proximité avec des personnalités politiques de premier plan (Hors UPC). Derrière cette catégorie se profile l’ombre de la figure tutélaire du Dr Aujoulat, véritable clé d’accès aux ressources de l’Etat colonial.
PLP0
PLP1

La deuxième étape consiste à exporter les données au format Tab puis CSV 


Nettoyé de ses scories, le fichier peut être ensuite exporté vers le logiciel Orange Canvas Python 3.7 pour le traitement statistique. Une fois le fichier reloadé, on dépose différents modules de traitement statistique. On sélectionne les données dans le data table et on applique un code de couleur pour plus de lisibilité. A ce stade, on peut sélectionner des groupes de données pour un traitement spécifique. Par exemple dans TR80exclue, nous avons enlevé les acteurs européens.


Le module Distributions nous permet de relever rapidement ce qui est saillant : ici clairement l’accès aux personnalités politiques de premier ordre hors UPC est privilégié au BDC par rapport aux autres groupes.


De même, le module Distributions confirme sans surprise la surreprésentation relative des Bétis au sein du BDC (ce n’était en rien un parti tribaliste) par rapport au groupe BDC0. Ce point est à retenir pour l’analyse de correspondances qui va suivre. Il en de même pour l’appartenance aux associations traditionnels. Mais ici il est important de relever un biais important créé par le choix de nos catégories. L’appartenance des BDCistes au Kolo Béti formé le 8avril 1956 est postérieure au déclin rapide du BDC après la défaite d’Aujoulat face à André Marie Mbida en janvier 1956.  Nous aurions dû à ce stade davantage tenir compte de la chronologie (opération possible avec Fichoz) et mettre à part le Kolo Béti qui correspond à la retribalisation des élites Ewondo et Béti après l’échec du Courant d’Union Nationale qui entendait agréger les forces politiques progressistes avant le vote de la loi cadre Deferre en décembre 1956.  




De même, nous constatons que l’accès aux ressources de niveau 2 et 3 est fort pour les BDCistes, non significatif pour l’accès aux ressources de niveau local (RA01) et quasi exclusif pour l’accès des ressources de niveau impérial (RA07) cumulés avec TOUTES les autres ressources administratives.

Passons à un autre niveau d’analyse avec FreeViz. L’analyse peut être multifactorielle comme le montre la distribution des acteurs suivant quatre axes. 






Ici nous remarquons que l’accès aux ressources administratives est très structurant pour le BDC alors l’appartenance ethnique ne l’est pas sauf au niveau régional et national cumulé (RA03, Flèche). 

Pour une meilleure lisibilité, le module d’analyse de correspondance nous permet de mettre en relation les différents facteurs qui sont corrélés entre eux. Cependant la lecture sur un plan est loin d’être intuitive pour le non initié, aussi nous allons donc procéder par étape.
Le schéma suivant positionne nos deux catégories principales qui s’opposent BDC0 et BDC1 (Le taux de variance est donc de 100% sur l’axe 1)
Zone de Texte: Analyse de correspondance 1 
 

Ajoutons maintenant le facteur ethnique. Nous sommes toujours sur un axe. BDC1 « tire » vers lui le fait d’être Beti mais pas exclusivement.  

Analyse de correspondance 2

Nous pouvons faire de même avec les autres facteurs.  L’accès aux ressources administratives RA est très structurant pour le BDC et son cumul (RA07) quasi exclusif. Idem pour la proximité avec les principaux leaders politiques PLP (dont un grand nombre sont issus des rangs du BDC c’est-à-dire coopté par Aujoulat lui-même)
Analyse de correspondance 3
Analyse de correspondance 4



Croisons  maintenant plusieurs critères. Cumulons BDC, PLP, et RA pour obtenir une distribution à deux dimensions. 
Analyse de correspondance 5

Nous voyons que PLP1 est très fortement corrélé à RA03 c’est-à-dire le cumul des ressources administratives locales et nationales. La lecture sur l’axe 1 (un taux de variance de 33%) suggère qu’émarger au BDC est très important pour accéder à RA02 et supérieur (BDC1 en position intermédiaire entre RA01 et RA02).
Analyse de correspondance 6


De façon tout à fait remarquable, l’introduction du critère ethnique (TR1) comme troisième facteur ne change en rien la distribution.  Le critère ethnique pèse peu par rapport à PLP et RA.

Quelle est l’influence de l’appartenance à une association traditionnelle (ATR1) pour l’accès aux ressources administratives par rapport à BDC1 ? La distribution 7 montre  que  ATR1 pèse plus que BDC1 pour l’accès à RA01 et RA02.
Analyse de correspondance 7



En revanche dès que l’on introduit l’accès aux personnalités politiques (PLP1) tout change, confirmant l’importance des relations interpersonnelles dans l’accès aux ressources. Tout se passe comme si émarger au BDC ne vaut que parce que cela permet d’accéder à des personnalités qui compte dans l’échiquier politique.
Analyse de correspondance 8


Voici maintenant  la distribution complète qui nous permet d’apprécier l’influence de chaque facteur sur les autres. Comme pour la lecture d’un tableau de maître, nous voyons apparaitre deux lignes de fuite, deux ensembles fortement corrélés autour de BDC1: l’un correspond à l’ensemble des ressources administratives corrélé par l’accès aux personnalités politiques influentes (l’ « écurie Aujoulat ») et un autre ensemble structuré autour de ressources plus locales (associations traditionnelles,  chefferies, notabilités locales).  



  Analyse de correspondance 9

 
La concordance des résultats obtenus avec ce que l’on savait déjà du BDC est tout à fait remarquable et montre que ce type de méthode est tout à fait pertinent dans le cadre de nos recherches sur les processus de politisation.
Les perspectives qui s’ouvrent sont immenses car il est possible de cartographier des ensembles complexes et d’évaluer le poids de certains marqueurs, comparativement à d’autres, dans un contexte historique donné et bien délimité. Ce test mérite toutefois que j’affine un certain nombre de mes catégories (ethniques notamment –un vrai casse-tête), mais aussi que je prenne davantage en compte la périodisation au moins dans l’interprétation des résultats.
Nous quittons donc ici l’analyse micro-historique des parcours individuels (étape pourtant indispensable à la compréhension des phénomènes politiques) pour essayer de comprendre la structure interne d’un échantillon d’acteur PAR RAPPORT au reste de la base. Je ne saurai trop insister sur ce point : toute approche statistique ne peut être effectuée que sur une base comparatiste, et j’ai compris récemment que quand bien même elle ne l’est pas explicitement, les chiffres obtenus ne prennent sens que par rapport à une référence implicite (moyenne, médiane ect…).  La deuxième chose à retenir – assez évidente mais cruciale – est que les résultats obtenus ne reflètent que l’état de nos sources. La question de la « preuve » en matière d’histoire, ô combien problématique pour les historiens, reste ici entière compte tenu de l’état de nos données, lacunaires, fragmentées mais fort heureusement variées et nombreuses. Est-ce un faux problème pour autant, comme semble le suggérer d’aucuns? Pour ma part, j’estime qu’au vu du questionnement qui est le mien, il y a des méthodes qui sont plus pertinentes que d’autres, bien que toutes soient incapables de prendre en compte l’ensemble de la complexité de la vie sociale. Les approches ethnographiques ou prosopographiques par exemple ne permettent pas de révéler au-delà d’une certaine « évidence » certains liens qui peuvent se tisser entre les individus. Trop souvent, le chercheur se contente d’étayer, voire d’ « illustrer », par des cas concrets ses intuitions et ses interprétations. On peut pourtant aller au-delà il me semble. Mais une difficulté surgit automatiquement quand on s’essaye à des méthodes quantitatives : la maitrise les biais produits par le traitement informatique – les éliminer restant souvent vains. Seule la connaissance fine du matériau historique permet de procéder de manière mesurée et critique.

Aucun commentaire:

Enregistrer un commentaire