Ce billet entend reprendre la réflexion engagée sur l’usage d’une base de données en histoire
sociale et politique : Fichoz. Pour un accès direct se reporter aux
billets précédents : https://histoireetressources.blogspot.fr/2017/11/linterdisciplinarite-au-service-dun.html
Pour une
compréhension plus détaillée, voir A
global introduction to Fichoz , Dedieu Jean-Pierre, http://www.fichoz.org/
L’accent est
mis ici sur l’exportation et l’exploitation de données une fois que celles-ci
aient été codifiées pour un traitement quantitatif. En particulier, nous
tenterons de montrer ici l’intérêt heuristique d’utiliser de larges
échantillons afin de procéder à des analyses de correspondances.
Qu’est-ce que
l’analyse de correspondances ? L’analyse des correspondances multiples
(ACM) est la méthode factorielle (au sens français du terme) adaptée aux
tableaux dans lesquels un ensemble d’individus (en lignes) est décrit par un
ensemble de variables qualitatives (en colonnes). Un exemple typique de ces
données est celui des enquêtes d’opinion. L'ACM est très utilisée par les
sociologues s'inspirant de Pierre Bourdieu pour étudier un « champ »
spécifique. Mais plutôt que de se livrer à une description théorique de cette démarche (tache ô combien ardue pour les non
spécialistes, moi y compris), j’entends ici faire le compte rendu d’un test
effectué sur un échantillon issu de ma propre base de données et construit à
partir d’un questionnement précis. Dix heures de travail ont certes été
nécessaires – avec le tutorat technique de Jean Pierre Dedieu – pour développer
une méthode d’analyse qui toutefois peut être en partie routinisée avec de la
pratique et de l’expérience. Autant le dire tout de suite, les résultats de
notre analyse sont assez bluffants - y compris pour JP Dedieu fin connaisseur
de ces méthodes – et surtout riches de promesses.
Nul n’a besoin
d’insister ici sur la complexité du fait politique en Afrique ou ailleurs. L’homo politicus ne peut être séparé des
identités ethnique, sociale, religieuse, économique et familiale qui le
constituent. Nous avons une concaténation de rôles sociaux certes distincts,
mais où dans chacun d'eux l’individu assume simultanément tous les autres, ce
qui nous oblige à rassembler des données sur son action dans chacun de ces
domaines avant d'opiner. L’idée est donc ici de rassembler un ensemble de
marqueurs biographiques soigneusement sélectionnés sur un vaste ensemble
d’individus afin de voir comment certains facteurs poussant à la politisation
peuvent être corrélés entre eux et en particulier de voir comment ils
interagissent.
Comment
procéder ?
Prenons le cas
par exemple du Bloc démocratique camerounais (BDC) parti politique camerounais
crée le 20 juin 1951 par le Dr Louis Paul Aujoulat, missionnaire laïque,
fondateur d’AD LUCEM Cameroun, cofondateur des IOM, ministre aux multiples
portefeuilles ministériels sous la 4ème République, promoteur de
l’action catholique et initiateur d’une transformation de la société politique
camerounaise par la cooptation de ses élites instruites. Le BDC est donc un
parti proche de l’administration coloniale, proche des cercles catholiques (en
rupture cependant avec la ligne réactionnaire de Mgr Lefebvre et Mgr Graffin) et
rassemblait pour l’essentiel des notables et des fonctionnaires du Nyong et
Sanaga. Le but ici est de comprendre comment se structure le groupe de BDCistes
par à l’ensemble des individus repéré dans la base.
La première
étape consiste à attraper à la volée l’ensemble des données qui nous
intéresse (« on-the-way coding »). Pour cela, je me suis appuyer sur
ma nomenclature des facteurs de politisations, document qui rassemble les
catégories construites à partir des données empiriques.
Nous avons d’abord
créé deux groupes de références:
BDC1:
appartenance BDC (membres et cadres). (90 individus)
BDC0: autres
appartenances partisanes ou pas d'appartenance connue (le reste de la base soit
4800 individus environ)
Le deuxième
marqueur est ethnique.
TR01: Groupe
Beti (qui représente les populations du centre Cameroun catholique)
TR70: Autre
africain
TR80: Européen
et assimilés
Le troisième marqueur
est l’appartenance à une association traditionnelle révélatrice d’une certaine
conscience ethnique ou, à tout le moins, conscience d’intérêts particularistes
ou communautaires.
ATR0: membre
d’une association traditionnelle
ATR1: non
membre
Le quatrième
marqueur est la proximité avec les ressources administratives. Ce facteur étant
essentiel au vue du caractère supposément prébendier du BDC, nous avons
construit un gradient cumulatif.
RA00: pas
d'accès connu
RA01: Proximité
avec l’administration locale (Chefferies, associations régionales, conseil des
notables, comité de village, conseil municipal, emploi de mairie, …)
RA02: Proximité
avec les centres de décision nationaux camerounais (Parlements, commissions…)
RA03: RA01 +
RA02
RA04: Proximité avec les centres de décision français au Cameroun
(Haut-commissariat, administration régionale)
RA05: RA03 + RA04
RA06 : Proximité avec les centres de décisions impériaux et
métropolitains (Parlements, commissions, ministères…)
RA07: Tout
cumulé
Le cinquième
marqueur est la proximité avec des personnalités politiques de premier plan
(Hors UPC). Derrière cette catégorie se profile l’ombre de la figure tutélaire
du Dr Aujoulat, véritable clé d’accès aux ressources de l’Etat colonial.
PLP0
PLP1
La deuxième étape
consiste à exporter les données au format Tab puis CSV
Nettoyé de ses
scories, le fichier peut être ensuite exporté vers le logiciel Orange Canvas
Python 3.7 pour le traitement statistique. Une fois le fichier reloadé, on dépose différents modules de
traitement statistique. On sélectionne les données dans le data table et on applique un code de couleur pour plus de
lisibilité. A ce stade, on peut sélectionner des groupes de données pour un
traitement spécifique. Par exemple dans TR80exclue, nous avons enlevé les
acteurs européens.
Le module Distributions nous permet de relever
rapidement ce qui est saillant : ici clairement l’accès aux personnalités
politiques de premier ordre hors UPC est privilégié au BDC par rapport aux
autres groupes.
De même, le module Distributions
confirme sans surprise la surreprésentation relative des Bétis au sein du BDC
(ce n’était en rien un parti tribaliste) par rapport au groupe BDC0. Ce point
est à retenir pour l’analyse de correspondances qui va suivre. Il en de même
pour l’appartenance aux associations traditionnels. Mais ici il est important
de relever un biais important créé par le choix de nos catégories.
L’appartenance des BDCistes au Kolo Béti formé le 8avril 1956 est postérieure
au déclin rapide du BDC après la défaite d’Aujoulat face à André Marie Mbida en
janvier 1956. Nous aurions dû à ce stade
davantage tenir compte de la chronologie (opération possible avec Fichoz) et
mettre à part le Kolo Béti qui correspond à la retribalisation des élites Ewondo
et Béti après l’échec du Courant d’Union Nationale qui entendait agréger les
forces politiques progressistes avant le vote de la loi cadre Deferre en
décembre 1956.
De même, nous constatons
que l’accès aux ressources de niveau 2 et 3 est fort pour les BDCistes, non
significatif pour l’accès aux ressources de niveau local (RA01) et quasi
exclusif pour l’accès des ressources de niveau impérial (RA07) cumulés avec
TOUTES les autres ressources administratives.
Passons à un autre niveau d’analyse avec FreeViz. L’analyse
peut être multifactorielle comme le montre la distribution des acteurs suivant
quatre axes.
Ici nous remarquons que l’accès aux ressources
administratives est très structurant pour le BDC alors l’appartenance ethnique
ne l’est pas sauf au niveau régional et national cumulé (RA03, Flèche).
Pour une meilleure lisibilité, le module d’analyse de correspondance
nous permet de mettre en relation les différents facteurs qui sont corrélés
entre eux. Cependant la lecture sur un plan est loin d’être intuitive pour le
non initié, aussi nous allons donc procéder par étape.
Le schéma suivant positionne nos deux catégories principales
qui s’opposent BDC0 et BDC1 (Le taux de variance est donc de 100% sur l’axe 1)
Ajoutons maintenant le facteur ethnique. Nous sommes
toujours sur un axe. BDC1 « tire » vers lui le fait d’être Beti mais
pas exclusivement.
Analyse de correspondance 2
Nous pouvons faire de même avec les autres facteurs. L’accès aux ressources administratives RA est
très structurant pour le BDC et son cumul (RA07) quasi exclusif. Idem pour la
proximité avec les principaux leaders politiques PLP (dont un grand nombre sont
issus des rangs du BDC c’est-à-dire coopté par Aujoulat lui-même)
Analyse de correspondance 3
Analyse de correspondance 4
Croisons maintenant
plusieurs critères. Cumulons BDC, PLP, et RA pour obtenir une distribution à
deux dimensions.
Analyse de correspondance 5
Nous voyons que PLP1 est très fortement corrélé à RA03
c’est-à-dire le cumul des ressources administratives locales et nationales. La
lecture sur l’axe 1 (un taux de variance de 33%) suggère qu’émarger au BDC est
très important pour accéder à RA02 et supérieur (BDC1 en position intermédiaire
entre RA01 et RA02).
Analyse de correspondance 6
De façon tout à fait remarquable, l’introduction du critère
ethnique (TR1) comme troisième facteur ne change en rien la distribution. Le critère ethnique pèse peu par rapport à
PLP et RA.
Quelle est l’influence de l’appartenance à une association
traditionnelle (ATR1) pour l’accès aux ressources administratives par rapport à
BDC1 ? La distribution 7 montre que ATR1
pèse plus que BDC1 pour l’accès à RA01 et RA02.
Analyse de correspondance 7
En revanche dès que l’on introduit
l’accès aux personnalités politiques (PLP1) tout change, confirmant
l’importance des relations interpersonnelles dans l’accès aux ressources. Tout
se passe comme si émarger au BDC ne vaut que parce que cela permet d’accéder à
des personnalités qui compte dans l’échiquier politique.
Analyse de correspondance 8
Voici maintenant la
distribution complète qui nous permet d’apprécier l’influence de chaque facteur
sur les autres. Comme pour la lecture d’un tableau de maître, nous voyons
apparaitre deux lignes de fuite, deux ensembles fortement corrélés autour
de BDC1: l’un correspond à l’ensemble des ressources administratives corrélé par
l’accès aux personnalités politiques influentes (l’ « écurie
Aujoulat ») et un autre ensemble structuré autour de ressources plus
locales (associations traditionnelles,
chefferies, notabilités locales).
La concordance des résultats
obtenus avec ce que l’on savait déjà du BDC est tout à fait remarquable et
montre que ce type de méthode est tout à fait pertinent dans le cadre de nos
recherches sur les processus de politisation.
Les perspectives qui s’ouvrent
sont immenses car il est possible de cartographier des ensembles complexes et
d’évaluer le poids de certains marqueurs, comparativement à d’autres, dans un
contexte historique donné et bien délimité. Ce test mérite toutefois que
j’affine un certain nombre de mes catégories (ethniques notamment –un vrai
casse-tête), mais aussi que je prenne davantage en compte la périodisation au
moins dans l’interprétation des résultats.
Nous quittons
donc ici l’analyse micro-historique des parcours individuels (étape pourtant
indispensable à la compréhension des phénomènes politiques) pour essayer de
comprendre la structure interne d’un échantillon d’acteur PAR RAPPORT au reste
de la base. Je ne saurai trop insister sur ce point : toute approche
statistique ne peut être effectuée que sur une base comparatiste, et j’ai
compris récemment que quand bien même elle ne l’est pas explicitement, les
chiffres obtenus ne prennent sens que par rapport à une référence implicite
(moyenne, médiane ect…). La deuxième
chose à retenir – assez évidente mais cruciale – est que les résultats obtenus
ne reflètent que l’état de nos sources. La question de la « preuve »
en matière d’histoire, ô combien problématique pour les historiens, reste ici
entière compte tenu de l’état de nos données, lacunaires, fragmentées mais fort
heureusement variées et nombreuses. Est-ce un faux problème pour autant,
comme semble le suggérer d’aucuns? Pour ma part, j’estime qu’au vu du
questionnement qui est le mien, il y a des méthodes qui sont plus pertinentes
que d’autres, bien que toutes soient incapables de prendre en compte l’ensemble
de la complexité de la vie sociale. Les approches ethnographiques ou
prosopographiques par exemple ne permettent pas de révéler au-delà d’une
certaine « évidence » certains liens qui peuvent se tisser entre les
individus. Trop souvent, le chercheur se contente d’étayer, voire
d’ « illustrer », par des cas concrets ses intuitions et ses
interprétations. On peut pourtant aller au-delà il me semble. Mais une
difficulté surgit automatiquement quand on s’essaye à des méthodes
quantitatives : la maitrise les biais produits par le traitement
informatique – les éliminer restant souvent vains. Seule la connaissance fine
du matériau historique permet de procéder de manière mesurée et critique.