samedi, mai 06, 2006

Modélisation des canaux : débits et latences dans la propagation des flux


Avertissement : ce message « rentre dans le vif du sujet ». Ames sensibles, s’abstenir …

1. Erratum

Je vais aujourd’hui enrichir le modèle de flux d’information dans l’entreprise, en introduisant la notion de latence, ce qui correspond à une correction du message précédent.
Le point de départ qui justifie cette volte-face est le « théorème du modèle SIFOA » : Le modèle décrit un fonctionnement optimal : les bonnes réunions, les bons participants, la bonne priorisation des sujets, etc.
C’est la seule approche convaincante, car pour tenir compte des imperfections de chaque entreprise, il faudrait rentrer dans un niveau de détail épouvantable, et sans la moindre chance de pouvoir instancier le modèle avec des données validées.
La conséquence de ce « théorème » est que seules les contrainte de temps jouent (en terme de débit), comme nous l’avons expliqué précédemment. C’est malheureusement une hypothèse trop stricte, qui ne permet pas de faire apparaître les subtilités de l’utilisation des canaux. Comme la réunion maximise le transfert par mutualisation, la solution « optimale » est d’utiliser ce canal de façon quasi-complète. Ce n’est pas réaliste car l’utilisation d’un calendrier industriel de réunion pour traiter l’ensemble des transferts liés au management est inefficace en terme de flexibilité et de temps de propagation des informations prioritaires.
En conséquence, nous allons proposer, dans ce message, un raffinement de la modélisation des canaux de communication, qui permettra d’introduire la latence.


2. Caractérisation des canaux

Nous caractérisons les quatre canaux de communication avec quatre paramètres, les trois que nous avons déjà présenté et que nous allons reprendre ; plus un quatrième qui représente la fréquence d’accès au canal :

  • Le taux de répétition (R): nombre moyen de fois ou le message a besoin d’être émis pour être efficace. Cette idée élégante est due à Thierry Benoit : plutôt que de représenter une notion de perte d’information, ce qui est complexe, nous utilisons une caractérisation macroscopique qui précise combien de fois il faut répéter le message pour que l’information soit réellement transmise. Dans un premier temps, nous allons ignorer ce paramètre (et travailler dans un monde idéal ou « tout le monde comprends tout du premier coup ») mais, ensuite, nous pourrons étudier la sensibilité du modèle à cette dimension. Aujourd’hui, le « taux de répétition » est une grandeur que certains managers savent caractériser de façon intuitive (en fonction du type de message), mais il serait envisageable de le mesurer (par exemple sur les mails) et d’en faire un indicateur d’efficacité (par exemple, un sujet qui génère des dizaines de cascades de mails aurait-il été mieux traité en direct ?).
  • Mutualisation (M): le nombre de récepteurs moyen d’un message. Cela permet de représenter la mutualisation obtenue en réunion ou avec l’envoi d’un email. Contrairement au paramètre suivant, on parle ici des récepteurs « utiles » qui sont réellement concernés par le transfert d’information.
  • Utilisation (U): le nombre de personnes occupées durant l’échange d’information, y compris les personnes qui ne sont pas concernées de façon utile (participants qui s’ennuient en réunion, destinataires inutiles en cc d’un email, etc.). Ce paramètre est facile à mesurer de façon statistique (nombre de participants moyens dans les réunions planifiées, nombre de destinataires dans les mails.
  • Fréquence (F) : ce dernier paramètre représente la fréquence « de base » de l’accès au canal. Par exemple, une collaborateur a, en moyenne, quatre réunions planifiée par jour, il lit ses messages deux fois par jours (fréquence de 5 heures), etc. Ces valeurs sont très dépendantes de la culture d’entreprise (est-ce qu’on sort d’une réunion pour prendre un coup de fil ?) mais elles sont raisonnablement stables et faciles à estimer.

Nous pouvons en déduire les règles d’ordonnancement de « charge de communication en fonction du canal ». Cela signifie que nous attribuons, en fonction du canal, une durée et un nombre d’agents à une tache de communication définie par une charge théorique (L, en heure), de la façon suivante :

  • [1] si le canal est le canal mail (ASYNC), la durée D vaut L * R / M, tandis que le nombre d’agent vaut *alpha* + *beta* x U. Nous utilisons deux constantes : *alpha* est le rapport de vitesse d’écriture sur celui de l’élocution (combien de temps faut il pour écrire un mail par rapport au temps pour le dire) et *beta* est le rapport de la vitesse de lecture sur celui de l’écoute. Pour faire simple, on écrit (lorsqu’on le fait en continu devant un terminal, lorsqu’on écrit un mail) 5 fois plus lentement qu’on ne parle, mais on lit 10 fois plus vite (resp. 30, 150 et 300 mots à la minute). C’est une simplification, il existe une littérature passionnante et abondante sur le sujet. Pour un résumé et une bibliographie, voir : http://www.keller.com/articles/readingspeed.html
  • [2] si le canal est synchrone, la durée est égale à la charge et nombre de participants est deux.
  • [3] si le canal est le canal de réunion, D = L * R / M et le nombre d’agents est U.
  • [4] si le canal est HF2F (le canal hiérarchique), nous utilisons la profondeur de la hiérarchie (P) comme approximation de la longueur de la chaîne de points « face à face » qui doivent avoir lieu pour transporter l’information d’un point à une autres. C’est d’ailleurs sur cette hypothèse que les partisans des organisations plates s’appuie : une organisation plus plate signifie une redescente/remontée d’information plus rapide. Le nombre d’agents est de P + 1, et la durée de communication est P * L.

Cette caractérisation est suffisante pour traiter, dans notre modèle, les flux de communication comme des tâches à ordonnancer.


3. Modèle pour la latence

Nous arrivons maintenant à la question cruciale de la modélisation de la latence. Commençons par caractériser ce la latence signifie dans notre modèle macroscopique du fonctionnement de l’entreprise. Le déroulement des processus (enchaînement de tâches) produit des transfert de flux d’information (monitoring, feedback, synchronisation, etc.). Comme notre modèle d’ordonnancement traite ces flux en bloc, on ne peut pas utiliser de dépendance entre des blocs. Par exemple, si la coordination d’une activité de 100 homme.jour nécessite 50 heures de réunion, nous allons placer un bloc de 50h. La latence est le temps qu’il faut pour transmettre une information d’une unité au management (ou à une autre unité) au travers de ce canal (réunion). La modélisation par bloc est suffisante pour raisonner sur les quantités totales, mais pas sur la propagation. La réalité de ce qui est représenté dans le modèle par deux blocs consécutifs peut être un entrelacement de réunions. Pour que le modèle d’ordonnancement puisse servir à calculer la latence, il faudrait un niveau de précision beaucoup plus grand, et on retomberait sur un modèle « intractable » (en franglais).


Voici, en conséquence, les modèles que j’ai retenus :

  • [1] si le canal est ASYNC, la latence est 1/F x N. F est la fréquence, N est le nombre de sujets moyen dans l’agenda des agents impliqués. Le principe est de faire le produit de la latence « à vide » (si l’agent est disponible) par un facteur qui indique la probabilité d’être disponible pour le sujet concerné. C’est la que nous pouvons utiliser les informations produites par l’ordonnancement. Puisque les blocs sont triés par priorités, nous pouvons compter le nombre de sujets plus importants et l’utiliser comme facteur multiplicateur (N). De la sorte, si le flux est prioritaire, on supposera que la première « pause email » est la « bonne », tandis que si il est le troisième dans l’ordre d’importance, on supposera qu’il faut attendre trois séances de lecture de mail pour traiter le sujet.
  • [2] si le canal est SYNC, la latence est 1/F x (N1 + N2 – 1). Le doublement de l’effet du taux d’occupation est lié au fait qu’il faut que les deux agents soient disponibles au même moment pour pouvoir communiquer. C’est également une approximation optimiste par rapport à un modèle probabiliste qui ferait un produit de disponibilité.
  • [3] si le canal est MEET, il nous faut estimer deux choses: la latence pour trouver la réunion “adaptée”, soit 1/F * N, et le nombre de reunions à monter pour transmettre l’information d’un point à un autre. Nous avons besoin, pour cela, d’introduire un autre paramètre qui décrit la culture de réunion d’une entreprise, que nous avons appelé « diamètre réunionel » (DR) est qui est le nombre de personnes rencontrée (total) dans les réunions programmée d’une personne. DR est fonction du nombre de réunion, de la taille des réunions et du fait que les réunions ait lieu « toujours avec les mêmes » ou au contraire « couvre une grande partie de l’entreprise ». Le degré de connection (dans le graphe des participation aux réunions) est le nombre de réunions nécessaires pour faire passer l’information est estimé par log(#Agents)/log(DR). Par ailleurs, en première approximation, (DR / U) représente le nombre de réunions différentes d’un agent. Il faut donc attendre (DR / U) réunions en moyenne pour trouver « la bonne » pendant la quelle l’information est passée à une autre personne qui va relayée à la réunion suivante et ainsi de suite … Le nombre de relais est la degré de connexion dont nous venons de parler.
    Ceci nous donne la formule de la latence pour les réunions : 1/F * log(#Agents)/log(DR) * (DR / U)
    Le fait que ce temps est indépendant du taux d’occupation des agents est bien sur une simplification, qui suppose que le principe des réunions programmées avec un ordre du jour et un thème est respecté.
  • [4] enfin, si le canal est H, nous comptons simplement le nombre de points hiérarchiques nécessaires, comme dans la section précédente et obtenons 1/F * P.


La deuxième question sur la modélisation de la latence est son impact sur la performance. Dans le modèle de fonctionnement de l’entreprise que nous avons commencé à décrire, il y a deux aspects qui sont sensibles au temps de propagation :

  1. Nous créons des événements aléatoires de changement de valeur associée à un processus. Ce changement entraîne une ré-évaluation de la priorité, qui modifie l’ordre de traitement. Nous utilisons la latence du canal de management du processus pour représenter le délai de réaction. Plus ce délai est court, plus la réaction de l’entreprise est optimale.
  2. La durée réelle d’exécution des tâches qui composent le processus est, de façon aléatoire, perturbée par rapport au « plan type » que représente le modèle de processus. Ici aussi, cette modification est traitée comme un ajout/retrait de quantité de travail à ordonnancer et nous utilisons la latence du canal de communication pour représenter le délai de réaction.


Cette modélisation est conforme avec le parti-pris de représentation d’un fonctionnement idéal : nous sous-estimons grandement les effets du délai de propagation de l’information, mais au mois ce que nous prenons en compte « fait sens ».

4. Réflexions futures

Il y a de nombreuses pistes à explorer, qui ont trait à la modélisation et la caractérisation des flux d’information, et cela va bien au delà du modèle que je suis en train de construire. Ce qui suit est une liste de sujets en attente, pour provoquer la curiosité du lecteur.

  • La caractérisation des temps de production, de transfert et d’assimilation de l’information permette d’étudier des caractéristiques des réunions optimales. Par exemple, faut-il mieux une réunion à 20 participants dont 10 écoutent, ou deux réunions à 10, dont une est une réunion d’information fondée sur le compte-rendu de la première ?
  • On peut également utiliser les caractérisations lecture/écriture/écoute pour enrichir notre modèle avec des canaux synchrones textuels (instant messaging) et asynchrone vocal (dépose d’un message). La dépose de message vers un ou plusieurs interlocuteurs est une pratique courante et institutionnelle dans certaines entreprises (par exemple, Cisco).
  • La notion de diamètre « réunionel » (paramètre DR) évoque un problème d’optimisation semblable à l’optimisation de la profondeur des hiérarchies. Si DR est grand, chaque individu est très « connecté », mais passe moins de temps avec ses interlocuteurs. Ceci favorise la rapidité de la propagation du signal, mais pas forcément la qualité de transmission. A l’inverse, si DR est petit, cela signifie que les relations avec les interlocuteurs courant sont plus approfondies, mais que la chaîne de propagation peut être longue. Nous avons les bases d’une discipline à développer, celle de la mesure de l’efficacité et de la pertinence du « système réunion » d’une entreprise, ce que nous appelons à Bouygues Telecom «l’agenda industriel ».
  • Enfin, un sujet qui reste encore complètement ouvert, à mon sens, est la rationalisation de l’usage de l’écrit versus celui de l’oral dans l’entreprise. Sans oublier la forme hybride, le Powerpoint ! Bien sûr, on pense aux travaux fondateurs de E. R Tufte (par exemple, « the cognitive style of Powerpoint »), mais le sujet qui m’intéresse le suivant : peut-on déduire des règles d’efficacité de l’emploi de l’écrit à partir des études précédemment citées ? Peut-on ensuite trouver des métriques qui valident ou invalident ces règles ? A titre d’illustration, on peut déduire des chiffres précédents qu’il vaut mieux attendre d’avoir un point programmé pour traiter un sujet non-urgent qui n’intéresse que les deux personnes, plutôt que d’envoyer un mail (du point de vue de l’efficacité temporelle du transfert d’information), puisque (5 + ½) > (1 + 1).

Beaucoup de sujets de réflexion, il est temps d’arrêter :-)