samedi 11 novembre 2017

De l’usage des analyses de correspondances pour l’histoire politique




Ce billet entend reprendre la réflexion engagée sur  l’usage d’une base de données en histoire sociale et politique : Fichoz. Pour un accès direct se reporter aux billets précédents : https://histoireetressources.blogspot.fr/2017/11/linterdisciplinarite-au-service-dun.html
Pour une compréhension plus détaillée, voir A global introduction to Fichoz , Dedieu Jean-Pierre, http://www.fichoz.org/

L’accent est mis ici sur l’exportation et l’exploitation de données une fois que celles-ci aient été codifiées pour un traitement quantitatif. En particulier, nous tenterons de montrer ici l’intérêt heuristique d’utiliser de larges échantillons afin de procéder à des analyses de correspondances.  
Qu’est-ce que l’analyse de correspondances ? L’analyse des correspondances multiples (ACM) est la méthode factorielle (au sens français du terme) adaptée aux tableaux dans lesquels un ensemble d’individus (en lignes) est décrit par un ensemble de variables qualitatives (en colonnes). Un exemple typique de ces données est celui des enquêtes d’opinion. L'ACM est très utilisée par les sociologues s'inspirant de Pierre Bourdieu pour étudier un « champ » spécifique. Mais plutôt que de se livrer à une description théorique de cette démarche (tache ô combien ardue pour les non spécialistes, moi y compris), j’entends ici faire le compte rendu d’un test effectué sur un échantillon issu de ma propre base de données et construit à partir d’un questionnement précis. Dix heures de travail ont certes été nécessaires – avec le tutorat technique de Jean Pierre Dedieu – pour développer une méthode d’analyse qui toutefois peut être en partie routinisée avec de la pratique et de l’expérience. Autant le dire tout de suite, les résultats de notre analyse sont assez bluffants - y compris pour JP Dedieu fin connaisseur de ces méthodes – et surtout riches de promesses.
Nul n’a besoin d’insister ici sur la complexité du fait politique en Afrique ou ailleurs. L’homo politicus ne peut être séparé des identités ethnique, sociale, religieuse, économique et familiale qui le constituent. Nous avons une concaténation de rôles sociaux certes distincts, mais où dans chacun d'eux l’individu assume simultanément tous les autres, ce qui nous oblige à rassembler des données sur son action dans chacun de ces domaines avant d'opiner. L’idée est donc ici de rassembler un ensemble de marqueurs biographiques soigneusement sélectionnés sur un vaste ensemble d’individus afin de voir comment certains facteurs poussant à la politisation peuvent être corrélés entre eux et en particulier de voir comment ils interagissent.  

Comment procéder ?

Prenons le cas par exemple du Bloc démocratique camerounais (BDC) parti politique camerounais crée le 20 juin 1951 par le Dr Louis Paul Aujoulat, missionnaire laïque, fondateur d’AD LUCEM Cameroun, cofondateur des IOM, ministre aux multiples portefeuilles ministériels sous la 4ème République, promoteur de l’action catholique et initiateur d’une transformation de la société politique camerounaise par la cooptation de ses élites instruites. Le BDC est donc un parti proche de l’administration coloniale, proche des cercles catholiques (en rupture cependant avec la ligne réactionnaire de Mgr Lefebvre et Mgr Graffin) et rassemblait pour l’essentiel des notables et des fonctionnaires du Nyong et Sanaga. Le but ici est de comprendre comment se structure le groupe de BDCistes par à l’ensemble des individus repéré dans la base.  

La première étape consiste à attraper à la volée l’ensemble des données qui nous intéresse (« on-the-way coding »). Pour cela, je me suis appuyer sur ma nomenclature des facteurs de politisations, document qui rassemble les catégories construites à partir des données empiriques.

Nous avons d’abord créé deux groupes de références: 
BDC1: appartenance BDC (membres et cadres). (90 individus)
BDC0: autres appartenances partisanes ou pas d'appartenance connue (le reste de la base soit 4800 individus environ)

Le deuxième marqueur est ethnique.
TR01: Groupe Beti (qui représente les populations du centre Cameroun catholique)
TR70: Autre africain
TR80: Européen et assimilés

Le troisième marqueur est l’appartenance à une association traditionnelle révélatrice d’une certaine conscience ethnique ou, à tout le moins, conscience d’intérêts particularistes ou communautaires.
ATR0: membre d’une association traditionnelle
ATR1: non membre

Le quatrième marqueur est la proximité avec les ressources administratives. Ce facteur étant essentiel au vue du caractère supposément prébendier du BDC, nous avons construit un gradient cumulatif.
RA00: pas d'accès connu
RA01: Proximité avec l’administration locale (Chefferies, associations régionales, conseil des notables, comité de village, conseil municipal, emploi de mairie, …)
RA02: Proximité avec les centres de décision nationaux camerounais (Parlements, commissions…)
RA03: RA01 + RA02
RA04: Proximité avec les centres de décision français au Cameroun (Haut-commissariat, administration régionale)
RA05: RA03 + RA04
RA06 : Proximité avec les centres de décisions impériaux et métropolitains (Parlements, commissions, ministères…)
RA07: Tout cumulé

Le cinquième marqueur est la proximité avec des personnalités politiques de premier plan (Hors UPC). Derrière cette catégorie se profile l’ombre de la figure tutélaire du Dr Aujoulat, véritable clé d’accès aux ressources de l’Etat colonial.
PLP0
PLP1

La deuxième étape consiste à exporter les données au format Tab puis CSV 


Nettoyé de ses scories, le fichier peut être ensuite exporté vers le logiciel Orange Canvas Python 3.7 pour le traitement statistique. Une fois le fichier reloadé, on dépose différents modules de traitement statistique. On sélectionne les données dans le data table et on applique un code de couleur pour plus de lisibilité. A ce stade, on peut sélectionner des groupes de données pour un traitement spécifique. Par exemple dans TR80exclue, nous avons enlevé les acteurs européens.


Le module Distributions nous permet de relever rapidement ce qui est saillant : ici clairement l’accès aux personnalités politiques de premier ordre hors UPC est privilégié au BDC par rapport aux autres groupes.


De même, le module Distributions confirme sans surprise la surreprésentation relative des Bétis au sein du BDC (ce n’était en rien un parti tribaliste) par rapport au groupe BDC0. Ce point est à retenir pour l’analyse de correspondances qui va suivre. Il en de même pour l’appartenance aux associations traditionnels. Mais ici il est important de relever un biais important créé par le choix de nos catégories. L’appartenance des BDCistes au Kolo Béti formé le 8avril 1956 est postérieure au déclin rapide du BDC après la défaite d’Aujoulat face à André Marie Mbida en janvier 1956.  Nous aurions dû à ce stade davantage tenir compte de la chronologie (opération possible avec Fichoz) et mettre à part le Kolo Béti qui correspond à la retribalisation des élites Ewondo et Béti après l’échec du Courant d’Union Nationale qui entendait agréger les forces politiques progressistes avant le vote de la loi cadre Deferre en décembre 1956.  




De même, nous constatons que l’accès aux ressources de niveau 2 et 3 est fort pour les BDCistes, non significatif pour l’accès aux ressources de niveau local (RA01) et quasi exclusif pour l’accès des ressources de niveau impérial (RA07) cumulés avec TOUTES les autres ressources administratives.

Passons à un autre niveau d’analyse avec FreeViz. L’analyse peut être multifactorielle comme le montre la distribution des acteurs suivant quatre axes. 






Ici nous remarquons que l’accès aux ressources administratives est très structurant pour le BDC alors l’appartenance ethnique ne l’est pas sauf au niveau régional et national cumulé (RA03, Flèche). 

Pour une meilleure lisibilité, le module d’analyse de correspondance nous permet de mettre en relation les différents facteurs qui sont corrélés entre eux. Cependant la lecture sur un plan est loin d’être intuitive pour le non initié, aussi nous allons donc procéder par étape.
Le schéma suivant positionne nos deux catégories principales qui s’opposent BDC0 et BDC1 (Le taux de variance est donc de 100% sur l’axe 1)
Zone de Texte: Analyse de correspondance 1 
 

Ajoutons maintenant le facteur ethnique. Nous sommes toujours sur un axe. BDC1 « tire » vers lui le fait d’être Beti mais pas exclusivement.  

Analyse de correspondance 2

Nous pouvons faire de même avec les autres facteurs.  L’accès aux ressources administratives RA est très structurant pour le BDC et son cumul (RA07) quasi exclusif. Idem pour la proximité avec les principaux leaders politiques PLP (dont un grand nombre sont issus des rangs du BDC c’est-à-dire coopté par Aujoulat lui-même)
Analyse de correspondance 3
Analyse de correspondance 4



Croisons  maintenant plusieurs critères. Cumulons BDC, PLP, et RA pour obtenir une distribution à deux dimensions. 
Analyse de correspondance 5

Nous voyons que PLP1 est très fortement corrélé à RA03 c’est-à-dire le cumul des ressources administratives locales et nationales. La lecture sur l’axe 1 (un taux de variance de 33%) suggère qu’émarger au BDC est très important pour accéder à RA02 et supérieur (BDC1 en position intermédiaire entre RA01 et RA02).
Analyse de correspondance 6


De façon tout à fait remarquable, l’introduction du critère ethnique (TR1) comme troisième facteur ne change en rien la distribution.  Le critère ethnique pèse peu par rapport à PLP et RA.

Quelle est l’influence de l’appartenance à une association traditionnelle (ATR1) pour l’accès aux ressources administratives par rapport à BDC1 ? La distribution 7 montre  que  ATR1 pèse plus que BDC1 pour l’accès à RA01 et RA02.
Analyse de correspondance 7



En revanche dès que l’on introduit l’accès aux personnalités politiques (PLP1) tout change, confirmant l’importance des relations interpersonnelles dans l’accès aux ressources. Tout se passe comme si émarger au BDC ne vaut que parce que cela permet d’accéder à des personnalités qui compte dans l’échiquier politique.
Analyse de correspondance 8


Voici maintenant  la distribution complète qui nous permet d’apprécier l’influence de chaque facteur sur les autres. Comme pour la lecture d’un tableau de maître, nous voyons apparaitre deux lignes de fuite, deux ensembles fortement corrélés autour de BDC1: l’un correspond à l’ensemble des ressources administratives corrélé par l’accès aux personnalités politiques influentes (l’ « écurie Aujoulat ») et un autre ensemble structuré autour de ressources plus locales (associations traditionnelles,  chefferies, notabilités locales).  



  Analyse de correspondance 9

 
La concordance des résultats obtenus avec ce que l’on savait déjà du BDC est tout à fait remarquable et montre que ce type de méthode est tout à fait pertinent dans le cadre de nos recherches sur les processus de politisation.
Les perspectives qui s’ouvrent sont immenses car il est possible de cartographier des ensembles complexes et d’évaluer le poids de certains marqueurs, comparativement à d’autres, dans un contexte historique donné et bien délimité. Ce test mérite toutefois que j’affine un certain nombre de mes catégories (ethniques notamment –un vrai casse-tête), mais aussi que je prenne davantage en compte la périodisation au moins dans l’interprétation des résultats.
Nous quittons donc ici l’analyse micro-historique des parcours individuels (étape pourtant indispensable à la compréhension des phénomènes politiques) pour essayer de comprendre la structure interne d’un échantillon d’acteur PAR RAPPORT au reste de la base. Je ne saurai trop insister sur ce point : toute approche statistique ne peut être effectuée que sur une base comparatiste, et j’ai compris récemment que quand bien même elle ne l’est pas explicitement, les chiffres obtenus ne prennent sens que par rapport à une référence implicite (moyenne, médiane ect…).  La deuxième chose à retenir – assez évidente mais cruciale – est que les résultats obtenus ne reflètent que l’état de nos sources. La question de la « preuve » en matière d’histoire, ô combien problématique pour les historiens, reste ici entière compte tenu de l’état de nos données, lacunaires, fragmentées mais fort heureusement variées et nombreuses. Est-ce un faux problème pour autant, comme semble le suggérer d’aucuns? Pour ma part, j’estime qu’au vu du questionnement qui est le mien, il y a des méthodes qui sont plus pertinentes que d’autres, bien que toutes soient incapables de prendre en compte l’ensemble de la complexité de la vie sociale. Les approches ethnographiques ou prosopographiques par exemple ne permettent pas de révéler au-delà d’une certaine « évidence » certains liens qui peuvent se tisser entre les individus. Trop souvent, le chercheur se contente d’étayer, voire d’ « illustrer », par des cas concrets ses intuitions et ses interprétations. On peut pourtant aller au-delà il me semble. Mais une difficulté surgit automatiquement quand on s’essaye à des méthodes quantitatives : la maitrise les biais produits par le traitement informatique – les éliminer restant souvent vains. Seule la connaissance fine du matériau historique permet de procéder de manière mesurée et critique.

L'interdisciplinarité au service d'un projet complexe

Transcription de ma communication pour la 2ème Journée d'Etude des doctorants du CESSMA sur l’interdisciplinarité : défis méthodologiques et enjeux de positionnement pour le jeune chercheur. 2ème axe : Quelles approches méthodologiques construire pour garantir une cohérence globale ? Du fait d’un cadre méthodologique à géométrie variable, le jeune chercheur gagné à l’interdisciplinarité procède de façon intuitive et expérimentale. Si l’emprunt à des « méthodes mixtes » peut s’avérer utile et même nécessaire, quels problèmes cela pose-t-il sur le terrain comme après les enquêtes ? Il s’agira en outre de discuter du rôle d’accompagnement de l’équipe encadrante pour orienter au mieux les choix méthodologiques des jeunes chercheurs.

 http://ed483.univ-lyon2.fr/fr/appel-a-communication-pour-la-2eme-journee-d-etude-des-doctorants-du-cessma-740650.kjsp

Avant toute chose, je voudrais remercier les organisateurs de cette journée d’études pour l’invitation. Pour moi, participer à cet évènement tombait sous le sens compte tenu de l’importance de l’interdisciplinarité - ou pluridisciplinarité, terme d’ailleurs que je préfère - pour mon sujet d’études.  Parler de « processus de politisation » est une question éminemment complexe qui peut être abordé de différentes façons comme j’ai pu le constater à Anvers pour un colloque sur les Subaltern political knowledges.
Dans un premier temps, contextualiser mon sujet vous permettra, je pense, de saisir l’état de mes sources et de mesurer l’ampleur des problèmes que cela pose. Dans un deuxième temps, nous aborderons frontalement les questions méthodologiques car l’interdisciplinarité selon moi est une pratique, une « discipline » au sens de l’exigence d’ aller chercher des concepts et des méthodes de travail là où ils se trouvent, qu’elle qu’en soit la « discipline » académique.

Le Cameroun est d’une grande diversité ethnique et culturelle avec des ensembles précoloniaux très divers : sociétés segmentaires et acéphales dans le centre et le sud, micro-Etat administré chez les Bamouns, chefferies très structurées politiquement dans le bamiléké, élites côtières instruites, Lamidats islamisés dans la moitié  nord du pays. Après avoir été un protectorat allemand, le Cameroun été placé sous mandat international sous l’égide de la SDN puis de l’ONU. Dès lors, le territoire a été administré par les Anglais dans sa partie occidentale et par les Français dans sa partie orientale, la plus importante. A cause de ce statut international, le Cameroun a fait l’objet d’une intense concurrence missionnaire, catholique et protestante : Missions anglaises, allemandes, américaine et françaises. Avec une conséquence immédiate et décisive dans le développement précoce du mouvement nationaliste : le taux d’alphabétisation dans le sud était le plus élevé de l’Afrique subsaharienne francophone.
De cette multiplicité des centres de décision, vous comprendrez aisément que l’état des sources disponibles présente une grande diversité - une chance pour croiser les regards ! -  mais cela reste très fragmenté et éclaté géographiquement. Un vrai défi pour la collecte.

D’autre part, le moins qu’on puisse dire est que l’historiographie sur la décolonisation au Cameroun – à de rares exceptions - reste encore aujourd’hui très polarisée, avec d’une part l’ébauche d’un roman national camerounais qui minore singulièrement le rôle tenu par le mouvement nationaliste – voire même le déni de la guerre néocoloniale qui s’ensuivit à l’orée de l’Indépendance. Déni qui du reste est aussi présent du côté français. Enfin et par contre coup, nous avons assisté dans les années 2000 à l’émergence d’une contre-histoire qui glorifiait le rôle tenu par les nationalistes, au mépris souvent de la complexité des situations.  A côté, il existe bien des contributions scientifiques de qualité mais souvent très limités dans leur champ d’études. Dans sa dimension politique et historique, cette historiographie reste pauvre.
Or de nombreuses études ont montré la complexité du politique en Afrique et ailleurs. Ici au CESSMA, vous le savez mieux qu’ailleurs. S‘intéresser à l’ensemble des pratiques sociales, dont le politique n'est au fond qu'une requalification selon Lagroye, implique donc une approche pluridisciplinaire : contributions en histoire sociale, urbaine, économique, militaire, religieuse, en sociologie politique, en anthropologie et en science politique.
Enfin, il n’est pas trop besoin, je pense, d’insister sur l’état lacunaire de mes sources : c’est notre lot à tous. Mais je me dois de pointer du doigt l’état lamentable des archives nationales camerounaises ainsi que les lourdes contraintes personnelles qui m’ont poussé à prendre des options méthodologiques radicales.  Je vais vous les décrire maintenant en essayant de montrer comment elles peuvent tenir compte – de façon toujours très imparfaite - de cette exigence pluridisciplinaire.

En premier lieu, je digitalise tout : archives orales et écrites, primaires ou secondaires, ce qui offre l’immense avantage de travailler en tout lieu avec mon PC.
En second lieu, cette approche pluridisciplinaire se reflète dans la bibliographie. Je vous l’ai dit, les livres d’histoire de qualité sur le Cameroun sont rares. Mais beaucoup d’anthropologues et de politistes se sont intéressés au Cameroun. J’utilise Zotéro, pas seulement comme un outil de référencement mais comme un moyen de planifier intelligemment mon travail. En essayant de préserver la notion de plaisir ! Pour cela, j’ai donné un statut à tous les documents que j’utilise : il y a d’abord ceux que je recherche, puis ceux qui sont à ma disposition et qui n’ont pas encore été traités. J’applique alors à ces deux catégories un ordre de priorité. Enfin il y a ceux qui ont été traités : j’indique alors le type de lecture (intégrale, partielle, recherche ponctuelle) et le type de traitement appliqué : simple annotation, le tagging et stockage dans la base de données. Voyons cela dans le détail.

 Je passe rapidement sur le tagging. J’utilise la cartographie mentale Thebrain comme un bloc note amélioré qui me permet de lier entre elles toutes les idées, concepts, pratiques sociales qui sont investiguées. Chaque idée correspond à un tag qui permet d’accéder rapidement aux notes correspondantes, aux références utilisées et surtout aux pièces d’archives. En quelques clics, on est au plus près de la source. Cet outil puissant m’a été fort utile pour gérer la complexité du projet de mon mémoire de master.

Mais pour la thèse ça ne suffisait pas. Comment recoller les pièces éparses d’une histoire morcelée pour en retisser la trame sociale ? Comment rendre compte de la complexité du théâtre politique dans sa chronologie à travers l’ensemble des parcours individuels et des pratiques sociales observées? Comment mettre en évidence la profonde ambivalence des acteurs politiques, les effets d’appartenance multiple, l’imbrication des réseaux formels et informels, la plasticité des identités, les effets de circulation ainsi que la multiscalarité des relations ?
C’est alors que je suis tourné vers Jean Pierre Dedieu un historien moderniste concepteur de la base Fichoz. Fichoz est un système qui fonctionne sous Filemaker et qui permet le stockage de données pour l’histoire sociale. Ici, l’histoire sociale doit être comprise dans son acception la plus large : toute information qui se réfère ou traite d’interactions entre individus, collectifs et objets culturels (artefacts). L’individu acteur ne peut se concevoir que globalement. L’homo politicus ne peut être séparé des identités ethnique, sociale, religieuse, économique et familiale qui le constituent. Les approches plurielles permettent de mieux appréhender cette complexité. Nous avons une concaténation de rôles sociaux certes distincts, mais où dans chacun d'eux l’individu assume simultanément tous les autres, ce qui nous oblige à rassembler des données sur son action dans chacun de ces domaines avant d'opiner. Comment procéder ?   (Cette partie reprend des extraits de mon billet « About Fichoz a relationnal database » - du coup c’est en français -  elle-même objet d’une communication sous forme de poster scientifique pour le colloque de Bournemouth The connected past :  the future of past networks)

La première étape, assez fastidieuse mais toujours passionante, est de transformer chaque source en données c’est-à-dire atomiser l’information en action de façon à ce qu’elle soit compréhensible en elle-même. Une action recouvre donc cinq dimensions : qui ? (le sujet), Quoi ? (le prédicat), Où ? Quand ? et de façon très significative Avec qui ? ce qui impose de définir une classe de relation.
 Bien entendu, les références, les notes contextuelles sont très importantes. L’exigence historique nécessite que toutes les informations implicites soient préservées dans le mode de saisie. C’est très important afin de recoller ensuite les pièces éparses, dans une approche prosopographique par exemple. On ne catégorise pas à ce stade et c’est un point important par rapport à d’autres bases de données type SQL. Avec un avantage évident qui est la flexibilité : les requêtes se font en langage naturel. On peut récupérer rapidement l’information sous n’importe quel angle que l’on juge pertinent.
Nous avons à côté des actions, des sous-systèmes comme celui qui permet le géo-référencement, les regroupements ponctuels d’acteurs et le Diem qui rassemble des informations de type encyclopédique sur les concepts, institutions et notions clés. Mais il y a énormément de choses que je n’ai pas encore exploré.

La deuxième étape est l’augmentation de la base (enhancement en anglais) en appliquant à l’ensemble des actions un code explicite qui permet de lever toute ambiguïté, tout l’implicite contenu dans une information accrochée à son contexte d’énonciation. Dans cet exemple tous les chefs de canton ou de groupement vont être codé CCISTA.
Le “on the way coding” est très différent puisqu’il catégorise un ensemble d’actions, d’acteurs, de documents et de lieux suivant des critères établies par l’historien lui-même. On peut donc rassembler et mobiliser sous un même marqueur des ensembles complexes de données. Ici nous avons labellisé un ensemble d’acteurs ayant été fonctionnaires à Yaoundé avant la loi cadre Deferre.

Troisième étape : combiner les données augmentées et interroger la base. Imaginons que nous voulons repérer les chefs administratifs dans le Nyong et Sanaga qui émargent à la fois à des groupes politiques prébendiers et clientélistes comme le BDC et qui sympathise d’une manière ou d’une autre avec le mouvement nationaliste. Bref nous voulons voir apparaitre les chefs Ewondo qui font preuve d’ambivalence politique. Nous tapons dans notre requête : CCIS** comme permanent coding, *UPC et *BDC comme on the way coding et nous obtenons ces trois noms.  
Nous pouvons alors nous livrer à une étude prosopographique en accédant directement  aux notes biographiques ou à une analyse des correspondances si l’échantillon est plus large.  On peut alors faire apparaitre des caractéristiques communes qui nous auraient échappé par une lecture plus classique, plus linéaire des sources.

Enfin la quatrième étape consiste à extraire des données et les exporter vers des logiciels divers afin de les exploiter de différentes façons : SIG, Excel, Pajek ect… Dans l’exemple qui suit, nous avons croisé les données de l’armée française, qui a cartographié dans le bamiléké les actes de subversion avec les cartes d’implantation de la culture du café exploités par les autochtones eux-mêmes. A minima, la carte suggère une forte corrélation entre les zones de rébellion et la question foncière. Donc le rapport aux chefferies locales qui avaient tout pouvoir dans la distribution des terres.

Le codage m’a en outre amené à référencer et à catégoriser tous les possibles facteurs de politisation tels qu’ils apparaissent en vrac dans la base. L’apport d’une science politique est ici essentiel mais a vite montré ses limites face aux données empiriques car trop européocentré. Aussi, je n’ai pas hésité à modéliser les processus de politisation en enrichissant un schéma classique de Perrineau et Mayer sur l’offre et la demande politique, de façon à ce que ça colle avec ce que je peux observer. Fondamentalement, le fil rouge de mon étude est l’ambivalence politique. Pourquoi les comportements  politiques ne correspondent pas toujours au crédo politique ? Une question au passage très actuelle. 

 Enquêtes ethnographiques, approches prosopographiques, approches spatiales, sociologie des réseaux, sociologie politique …  Cette variété d’approches méthodologiques peut enthousiasmer certains historiens et en décontenancer d’autres comme j’ai pu le constater il y a quelques jours lors d’un colloque à Anvers sur les subaltern political knowledge.   De plus ça prend beaucoup de temps, ça demande une formation solide – jamais achevée et  souvent très incomplète  - et surtout beaucoup d’enthousiasme, chose qui je pense nous réunit tous aujourd’hui. Merci de votre attention.
 

mardi 11 juillet 2017

« The ways to politics in Cameroon » About Fichoz, a relational database

Invited to the international multi-disciplinary conference The connected past: The Future of Past Networks? at Bournemouth University (UK) on August 24-25th 2017, I had to produce a scientific poster that aims to explore the use of network research in the study of the human past. This is a good opportunity to present methods I developed over the past three years. This is what this blog is all about for that matter.

Why Fichoz? Coping with complexity and fragmented material 

The historiography of decolonization in Cameroon is particularly fragmented and polarized. Consequently, the endeavor has failed, with very few exceptions, to go beyond the classical oppositions of ethnicity/social classes, urban/rural, resistance/cooperation, youth/seniority and educated/non-educated people. While some scholars have unveiled the complexity of the ways to politics in contemporary Africa, Cameroon remains strikingly undocumented when it comes to shedding light on embedded social activities and ambivalent postures of various actors. The goal of my study is to cross point of views and highlight cases of politicizing masses in an African colonial setting – not only amongst the elites – with a special effort on taking into account the mix of multiple cultural layers and reticular social activities. In this respect, the project is clearly multi-disciplinary.

This overwhelming complexity conducted me to develop different strategies in order not to get lost. It means stay focused about my point, be able to plan my work efficiently and – yes! - still have a lot of fun while working.
 First of all, I digitize every bit of archives. Secondly, I use under Zotero a specific status has been given to each document .


« litf » here means the record has been fully read, tagged (TheBrain ) and spit into actions under Filemaker (Fichoz). These codes allow me to plan my work and retrieve every piece of documentatio and the treatment applied to it.
Thirdly, I mindmapped all my ideas and concepts in Thebrain, a terrific tool allowing me to link any ideas with documents ad hoc via a tag system. Therefore, I can access any piece of information needed within a few clicks .
Lastly, I still needed a powerful tool allowing me to thoroughly analyse the relationships and interplay between a large spectrum of social actors.  

Presenting Fichoz

Fichoz was originally developed by a group of French, Spanish and Chilean historians as part of a research project on the political and administrative structures of the Spanish Monarchy (PAPE group). It was later extended to other historical fields as part of the research programs of the LARHRA's Pole Méthode (CNRS / University of Lyon, France) . I’m very glad and lucky to collaborate with its main developer Jean Pierre Dedieu, without whom my project would have been quite different and certainly less ambitious.

Fichoz is a database system for the global storage of social history data. Social must be understood in its broadest meaning: all kind of data referring to or bearing over interactions between persons, between persons and corporations, between corporations, between persons and the artefacts they produce, between persons and their natural surroundings, between artefacts and artefacts. In my case, the relational matrix is simplified for I do not use artefacts in storing data. My main concern is about men and networks, even though the use of cultural objects is quite relevant in my study.

Transforming a source into data, storing and retrieving 

We split records into actions, so that each record should correspond to one action and each field to one descriptive dimension of the action. An action can be described under five dimensions: who (actor), what (predicate), when, where, and significantly with whom.



 1. Name of the first actor in a relationship pair (empty in case of non-relational actions): With whom? Martin Abega in the example whose biography can easily be accessed.
2. Id of the first actor: an actor can be named differently according to different sources.
3. Class of relationship between the first and the second actor. Here “opposition” is a generic relationship. It also can be more specific according to researchers needs.
4 Id of the second actor.
5. Name of the second actor in a relationship pair, or of the unique actor in non-relational actions: Who? Robert Maurage in the example. All kinds of actions, interactions, artefacts related to him can be displayed in a click.
6. Action or relationship: What?
7. Initial date and final date (When?)
8. Place of action (Where?) 9. Source: Every piece of digitized records can be retrieved to get the full information in its context if needed.
10. Remarks and contextual notes

Every piece of the split data must be self-sufficient, and must refer to one easy-to-identify concept. Historical matters demand that the implicit information carried by the fact that various information are mentioned within the same documentary set be preserved, as quite important a clue to reconstruct social reality from partial sources.

In order to be relevant, retrieving is all about flexibility. Because of the uncertainties inherent to any research, a researcher must be able to access the data he is handling from whatever angle he thinks fit, which means that starting from any part of the database, he must be able to reach any information stored in any other part.

Enhancing stored data 

Through permanent coding, the enhancement process is to make explicit an information which in the source remains sometimes implicit, embedded as it is in its context. In this example, all Chefs de canton and groupement can be accessed through the code CCISTA


 On-the-way" coding is quite different. It marks actors, actions, documents or places, that is anyone of the elements which compose the database, after criteria decided upon by the user in function of the demands of the research he is presently carrying on. It makes possible an easy access to complex sets of data, and provides markers to create classes which did not previously exist in the data.  In this example, we have pinned down some of the civil servants in Yaounde the vote of the Loi-cadre Deferre in December 1956. We have labelled the group as “FonctYa




Combining enhanced data and questioning the database         

Running under Filemaker, queries can be on natural language as well as on permanent coding  or “on-the-way coding”

Example of political ambivalence:
 We question political ambiguity amongst Cameroonian chiefs in Nyong and Sanaga. We look after all the chiefs who were close to the nationalist movement at one point but also signed in the BDC, a prebendary administrative political party. We get these names after crossing these three factors in the query : CCIS** as permanent coding, UPC and BDC as on-the-way coding.



A prosopographical and comparative approach can be undertaken at this point to see if there are others common factors. It appears that the three of them were once civil servants in Yaoundé (using On-the way coding “FonctYa<1957” as defined above). However, our hypothesis  these chiefs might belong to the same traditional association (The kolo beti to be named) proved to be invalid. Only Abega was a member.  Moreover, as we may predict, they were all close to the catholic circles of Louis Paul Aujoulat, a central political French figure in Cameroon with many ministerial portfolios in Paris.

 The next step is to trace down the very particular moment they got close to the UPC. At this point, individual trajectories differ. If we look closely at Belinga biography, for instance, it appears that he was a member in 1955 of the nationalist school teacher union just before the riots in May 1955. But he has distanced himself from the nationalist movement as soon as he has got close to the Union Tribale Bantou led by the bulu politician Charles Assalé, a former Upéciste who allied Ahmadou Ahidjo and became his prime minister in 1960.

Unsurprisingly, individual strategies for capital building led these chiefs to conservative political positions.  On the contrary, when it comes to their nationalist drift, environmental factors and structuring events (may 1955) - combined with the structure of personal networks (catholicism opposed to trade unioning) - seem to be prevalent over basic sociology and show cases of political ambivalence.

Processing the database

Processing the resulting data to extract scientific conclusions means rearranging them once more, in a way which cannot be the object of any previous agreement. This impossibility derives from an essential characteristic of research. No researcher knows beforehand which process will be the most efficient at extracting new knowledge from the data. He proceeds through attempts and failures. We conclude a research database must be equipped with all that is necessary to store, retrieve and enhance data. Not properly to process them. It must nevertheless be able to export them easily to any downstream processing package. A huge variety of packages for analyzing data are now at the researcher's disposal, from the most classical datasheets such as Excel® or OpenOffice®, up to more sophisticated tools such as Pajek® for network analysis, Orange canvas® for statistical analysis, Atlas.ti® for marking texts with beacons and for conceptual analysis, Arcgis® or Cartes&Données® for cartography.  Data can be transferred to any of them from the database in question of minutes. The researcher recovers a capacity of really exploring, really investigating the word he is studying without more limits than his own creativity. Computing makes "qualitative" studies possible[1]


In this example, crossing African zone of coffee farming with subversive activities of the Armée de libération nationale Kamerunaise in 1960 strongly suggests the issue of land was a major factor in the launching of the uprising in the Bamileke area years before. In this respect, it can be compared in some way to the Mau Mau movement in Kenya.



[1] A global introduction to Fichoz , Dedieu Jean-Pierre, <http://www.fichoz.org/>