Des Mesures aux ICP : Estimation du SAIDI par nLine

Des Mesures aux ICP : Estimation du SAIDI par nLine

Authors
Mohini Bariya, Molly Hickman, Genevieve Flaspohler
Date
Jan 11, 2023
To read this blog in English, see blog.nline.io/estimating-saidi
Par Mohini Bariya, Chercheuse en Énergie, Molly Hickman, Data Scientist, et Genevieve Flaspohler, Directrice des Données chez nLine
📢
Comment pouvons-nous estimer le SAIDI (Indice de Durée moyenne d'Interruption du Système)—la durée moyenne des coupures de courant subies par les clients—à partir de mesures des capteurs PowerWatch effectuées seulement sur un sous-ensemble de clients ? Cet article décrit l'approche statistique de nLine pour estimer le SAIDI à partir d'un tel ensemble de données. La méthode nLine présente plusieurs propriétés statistiques favorables qui la rendent particulièrement adaptée au calcul du SAIDI dans le monde réel, où les données sont généralement limitées ; au contraire, les calculs traditionnels du SAIDI négligent souvent ce manque de données.

Qu'est-ce que SAIDI ?

Le SAIDI fait partie d'une constellation d'indicateurs clés de performance (ICP) essentiels utilisés par les fournisseurs d'électricité, les régulateurs et les investisseurs pour quantifier la fiabilité de l'infrastructure du réseau électrique. Ces indicateurs permettent de prendre des décisions cruciales sur l'affectation des fonds et des efforts visant à améliorer les performances du réseau. SAIDI est l'abréviation de « System Average Interruption Duration Index » et mesure la durée totale d’interruption de l’alimentation électrique subie par un client moyen sur une période donnée. Pour une période et un total de clients dans une région donnée, le SAIDI est défini comme suit :
est la durée totale de l’interruption du courant subie par le client sur la période . Cette mesure quantifie l'expérience moyenne des clients en ce qui concerne la durée des pannes de réseau. Par exemple, un SAIDI de 5 heures pour janvier 2022 signifie que les clients ont subi en moyenne un total de 5 heures de coupure de courant pendant le mois.
Le SAIDI peut être calculé sur des sous-ensembles de temps (mois, semaines, saisons) et d'espace (une ville entière, un district, une seule ligne de distribution) pour révéler des tendances spatiales et temporelles ainsi que des variations dans la performance du réseau, telles que les impacts météorologiques, les effets de la demande, ou encore les lignes de distribution sous-performantes. SAIDI fournit ainsi des informations sur les pannes ; ces informations permettent aux fournisseurs d'électricité et aux régulateurs d'évaluer les performances globales du réseau, de quantifier l'efficacité des projets de modernisation, et d'identifier les régions où des interventions ciblées sont nécessaires.
Figure 1. La photo représente une rue d'Ablekuma, dans le district de Dansoman à Accra (Ghana). Les estimations SAIDI de nLine pour cette région donnent une idée de la manière dont le réseau dessert cette communauté. Les données de nombreuses communautés similaires peuvent être agrégées pour fournir une image complète de la performance du réseau à l'échelle du système. Ainsi, les valeurs SAIDI de différentes résolutions spatiales et temporelles peuvent donner à un fournisseur d'électricité des informations opérationnelles clés dans le temps et l'espace. À des résolutions élevées - jusqu'au niveau d’une ligne de distribution individuelle - SAIDI peut aider à identifier les lignes de distribution en difficulté sur lesquelles une intervention serait justifiée, ou les lignes de distribution performantes, dont les enseignements peuvent être appliqués ailleurs. À des résolutions plus faibles, SAIDI peut révéler, par exemple, comment les mises à niveau d'infrastructures à grande échelle ou les impacts climatiques généralisés affectent le service du réseau. (Crédit photo : Molly Hickman)
Figure 1. La photo représente une rue d'Ablekuma, dans le district de Dansoman à Accra (Ghana). Les estimations SAIDI de nLine pour cette région donnent une idée de la manière dont le réseau dessert cette communauté. Les données de nombreuses communautés similaires peuvent être agrégées pour fournir une image complète de la performance du réseau à l'échelle du système. Ainsi, les valeurs SAIDI de différentes résolutions spatiales et temporelles peuvent donner à un fournisseur d'électricité des informations opérationnelles clés dans le temps et l'espace. À des résolutions élevées - jusqu'au niveau d’une ligne de distribution individuelle - SAIDI peut aider à identifier les lignes de distribution en difficulté sur lesquelles une intervention serait justifiée, ou les lignes de distribution performantes, dont les enseignements peuvent être appliqués ailleurs. À des résolutions plus faibles, SAIDI peut révéler, par exemple, comment les mises à niveau d'infrastructures à grande échelle ou les impacts climatiques généralisés affectent le service du réseau. (Crédit photo : Molly Hickman)

Comment les fournisseurs d'électricité déterminent-ils le SAIDI?

Pour calculer le SAIDI selon sa définition, pour une région et une période données, un fournisseur d'électricité doit connaître le nombre total de clients dans la région ainsi que la durée totale des pannes subies par chaque client au cours de cette période. Ces données sont généralement fournies par des dispositifs tels que des compteurs communicants ou des commutateurs de réseau, qui identifient les heures de début et de fin de panne pour un seul client ou un petit groupe de clients avec une résolution temporelle élevée. Pour que les données soient suffisantes pour calculer directement le SAIDI, ces dispositifs doivent être omniprésents dans le système. Dans de grandes parties de l'Europe occidentale et de l'Amérique du Nord, les déploiements étendus et coûteux d'équipements tels que les compteurs communicants ont fourni aux services publics les données granulaires et complètes nécessaires pour calculer le SAIDI d’après l'équation (1) [Dunn, 2019].
La situation est très différente dans les pays à revenu faible et intermédiaire (PRFI). Dans la plupart de ces pays, la mesure du réseau, en particulier au niveau de la distribution, est très limitée, voire inexistante. Lorsque les déploiements de capteurs ne sont pas suffisants pour assurer un suivi complet des pannes, le SAIDI ne peut être qu'estimé, jamais calculé avec précision. Les fournisseurs d'électricité des PRFI travaillent avec les données disponibles afin d’estimer le SAIDI. Ces données correspondent souvent à des appels de clients (pour estimer le début d’une panne) et des informations de réparation (pour estimer la fin d’une panne) ; ces données sont à la fois imprécises et biaisées - elles dépendent beaucoup de l'heure à laquelle une panne se produit, de la personne qui prend l'appel au centre de signalement, de l'humeur du client, et de bien plus encore. Étant donné la difficulté d'utilisation de telles données pour calculer le SAIDI, une fraction importante des services publics dans les PRFI ne calcule pas du tout le SAIDI [Banque mondiale, 2020], et ceux qui le font sont susceptibles de produire des estimations approximatives qui diffèrent beaucoup en fonction des perceptions des clients quant à la durée de la panne [Kunaifi, 2017]. Cependant, de nombreux bailleurs de fonds internationaux, tels que Millennium Challenge Cooperation, requièrent des données SAIDI de base pour décider comment investir dans des projets de développement du réseau [MCC, 2021], et le SAIDI est un outil interne très utile pour hiérarchiser la maintenance et les mises à niveau du réseau. Cela place les fournisseurs d'électricité des PRFI dans une position délicate : ils sont soumises à des pressions internes et externes pour fournir le SAIDI, mais manquent souvent de données et de procédures nécessaires pour le fournir avec précision.

SAIDI de nLine

Pour relever ce défi, nous devons aller au-delà de l'équation formelle du SAIDI (1) qui exige des données complètes - couvrant toutes les pannes chez tous les clients - qui font défaut à de nombreux fournisseurs d'électricité. Chez nLine, nous partons du principe que le SAIDI doit être estimé à partir des données et des expériences des clients qui sont disponibles. nLine propose deux innovations clés pour estimer le SAIDI lorsque des données complètes sur le réseau ne sont pas disponibles : (a) des déploiements parcimonieux de capteurs PowerWatch, qui mesurent les pannes aux points de connexion des clients, et (b) une approche d'estimation non biaisée et convergente qui permet d’estimer le SAIDI à partir d’expériences clientes limitées. Cet article présente et décrit notre approche d'estimation (b) ; nos articles précédents et à venir décrivent notre méthodologie de déploiement de capteurs, nos projets dans les pays où nous avons déployé des capteurs, et comment les expériences individuelles des clients sont partitionnées pour fournir des estimations des heures de début ainsi que des durées des pannes (a).
nLine recueille les expériences des clients grâce aux capteurs PowerWatch, qui sont déployés sur le réseau électrique aux points de connexion des clients, comme le montre la figure 2. Les dispositifs PowerWatch enregistrent les expériences individuelles des clients sur le réseau (et grâce à notre algorithme de partitionnement, nous corroborons les informations sur les pannes des capteurs individuels afin de fournir une image plus robuste et plus fiable des pannes du réseau). Pour le reste de cet article, il est important de faire abstraction de la façon dont nLine sait, à partir des capteurs PowerWatch, à quels moments les pannes commencent et se terminent (a) ; nous supposerons simplement que nous avons accès aux expériences de pannes individuelles. Ces expériences de pannes individuelles sont exactement les éléments qui permettent de générer la moyenne dans le SAIDI classique de (1).
Cependant, nLine n'observe que les expériences d'un sous-ensemble de tous les clients du réseau. Même pour les clients équipés d'un capteur PowerWatch, certains instants de leur expérience du réseau peuvent ne pas être observés en raison d'une diminution occasionnelle des rapports des capteurs ou d'une défaillance de ces derniers. Ne disposant pas des données de tous les clients et de tous les instants d'une période, nous ne pouvons pas calculer directement l'équation SAIDI classique à l'aide des données PowerWatch. Plutôt, nLine extrapole le SAIDI à partir d’expériences de clients sous-échantillonnées.
Cela peut paraître abscons, mais ce type d'approche est très répandu, et à la fois familier et naturel pour beaucoup d'entre nous. Nous savons que les données de sondage, les statistiques de santé ou les réponses aux enquêtes que nous voyons dans les journaux n'ont pas pu être obtenues en demandant à chaque personne sur terre ses tendances politiques, son dossier médical ou ses préférences personnelles. Elles ont dû être obtenues auprès d'un sous-ensemble raisonnable de personnes dont nous supposons que les résultats reflètent ceux de l'ensemble de la population - c'est exactement l'extrapolation à partir de données sous-échantillonnées.
Figure 2. Les capteurs PowerWatch sont déployés dans les foyers, les entreprises et les infrastructures sociales au niveau de la prise de courant. À l'heure où nous écrivons ces lignes, 1 258 capteurs ont été déployés à Accra, au Ghana, couvrant 441 des 8 535 transformateurs DSS (basse tension) de la ville.
Figure 2. Les capteurs PowerWatch sont déployés dans les foyers, les entreprises et les infrastructures sociales au niveau de la prise de courant. À l'heure où nous écrivons ces lignes, 1 258 capteurs ont été déployés à Accra, au Ghana, couvrant 441 des 8 535 transformateurs DSS (basse tension) de la ville.
Revenons-en maintenant à notre contexte. Comment devrions-nous estimer une valeur SAIDI à partir de ces données de pannes sous-échantillonnées ?
Une approche simple (que nous n'utilisons pas) consisterait à introduire directement les données dont nous disposons dans l'équation classique (1), en négligeant les clients qui ne sont pas mesurés et les pannes non signalées.
Cette équation utilise le temps de coupure capturé chez les clients (où des capteurs sont installés) pour générer une estimation de SAIDI pour l'ensemble des clients. La durée de coupure signalée par le client au cours de la période est notée et sera inférieure ou égale à la durée de coupure réelle (notée ) subie par le client.
En utilisant directement le temps de panne rapporté plutôt que le temps de panne réel, cet estimateur suppose implicitement que chaque capteur PowerWatch a fonctionné durant toute la période. Nous savons que ce n'est pas toujours le cas. Certains capteurs, pour une raison ou une autre, peuvent avoir été incapables de communiquer leurs données pendant une partie de la période, par exemple parce qu'ils ont perdu la connectivité cellulaire. D'autres peuvent n'avoir été déployés que pendant une partie de la période. Cette réalité compromet sérieusement les résultats de l'estimateur.
Prenons un exemple simple : supposons que nous ayons deux clients à Ablekuma, dont nous utiliserons (de manière ambitieuse) les données pour estimer le SAIDI pour le district. Il y a Agnès, dont l’état du réseau a été suivi, sans faille, par un capteur PowerWatch pendant tout le mois de janvier. Ses données PowerWatch complètes montrent qu'elle a subi un total de heures de coupure au cours du mois. Un autre client, Kofi, n'a reçu un dispositif PowerWatch que durant la seconde moitié du mois. Ses données PowerWatch indiquent un total de heures de panne. En introduisant ces données dans (2), on obtient un SAIDI de :
Ce résultat n'est pas très rassurant. Intuitivement, nous pouvons voir qu'en traitant Kofi (dont PowerWatch n'a mesuré que la moitié du mois) de la même manière qu'Agnès (dont PowerWatch a mesuré tout le mois), nous sous-estimons le numérateur (ou sur-estimons le dénominateur), ce qui conduit à une sous-estimation de SAIDI. Nous savons que Kofi a probablement subi des pannes au cours de la première moitié du mois qui sont absentes de cette équation, mais cet estimateur suppose implicitement que la fourniture d'électricité était parfaite lorsque PowerWatch était absent.
Cet exemple illustre clairement les lacunes de l'approche simple décrite au point (2) pour estimer le SAIDI à partir de données sous-échantillonnées. Heureusement, chez nLine, nous n'estimons pas le SAIDI de cette manière. Nous utilisons un meilleur estimateur qui tient compte du fait que tous les capteurs ne rapportent pas tout le temps des informations, et qui traite chaque heure rapportée de la même manière.

L’Estimateur Proportionnel

Nous présentons maintenant notre héros, l'estimateur proportionnel, ou estimateur-nLine :
est la durée totale des coupures de courant détectées par le PowerWatch pendant la période , et est la durée totale détectée par le PowerWatch pendant la période . Pour chaque capteur, sera inférieur ou égal à — le plus souvent inférieur, pour les raisons mentionnées plus haut (le capteur peut avoir été déployé uniquement sur une partie de la période, ou peut-être n’a-t-il tout simplement pas été en mesure de mesurer l’ensemble de la période). Plus simplement, l'estimateur proportionnel considère le temps total de coupure observé par l'ensemble des capteurs sur la période () en proportion du temps total détecté (), et le multiplie par la durée de la période () pour obtenir le temps moyen de coupures de courant. Le temps de coupure, le temps sous tension, le temps de fonctionnement du capteur, ainsi que la manière dont ces trois valeurs sont utilisées pour estimer le SAIDI de nLine sont illustrés dans la Figure 3, qui fournit une intuition visuelle pour cette approche.
Considérons que les expériences de clients sur une période constituent une aire de taille . Le véritable SAIDI est alors le rapport entre la zone grise (durée totale de coupure) et l'ensemble de la zone jaune + grise (durée totale), multiplié par la durée de la période . L'estimateur proportionnel observe un sous-ensemble de la zone complète en fonction des clients qui ont un capteur, et du moment où celui-ci est actif (indiqués par les cases violettes). Il calcule le même rapport entre le temps de coupure et le temps total, mais cette fois-ci sur la zone observée. Ce ratio est ensuite multiplié par la durée totale de la période pour produire la meilleure hypothèse pour le SAIDI.
Figure 3. Chaque capteur observe plus ou moins de temps chez son client. Le temps observé chez les clients équipés d'appareils PowerWatch est indiqué dans les cases violettes. La ligne supérieure représente une prise où le PowerWatch a capturé la totalité de la période (pas de temps non observé). Les régions jaunes représentent le temps pendant lequel le client/capteur donné recevait du courant depuis la prise ; les régions grises représentent le temps pendant lequel le client/capteur subissait une coupure.
Figure 3. Chaque capteur observe plus ou moins de temps chez son client. Le temps observé chez les clients équipés d'appareils PowerWatch est indiqué dans les cases violettes. La ligne supérieure représente une prise où le PowerWatch a capturé la totalité de la période (pas de temps non observé). Les régions jaunes représentent le temps pendant lequel le client/capteur donné recevait du courant depuis la prise ; les régions grises représentent le temps pendant lequel le client/capteur subissait une coupure.
Utilisons l'estimateur nLine dans le même exemple impliquant Agnès et Kofi à Ablekuma. Le PowerWatch d'Agnès signalant heures de panne et celui de Kofi heures, le temps de panne total enregistré est de heures. Le PowerWatch d'Agnès a détecté le mois entier, tandis que celui de Kofi a détecté la moitié du mois, ce qui nous donne une durée totale détectée de mois. Enfin, la durée totale de la période est de mois. En introduisant ces chiffres dans l'estimateur nLine (3), nous obtenons un SAIDI de :
En effet, l'estimateur nLine extrapole à partir des deux semaines pendant lesquelles nous avons observé l'électricité chez Kofi. Il a été privé d'électricité pendant 2.5 heures au cours des deux semaines observées par PowerWatch. Nous ignorons ce qu’il s'est passé pendant les deux semaines que nous n'avons pas observées - les coupures ont pu augmenter ou au contraire diminuer - mais l'estimateur utilise les informations que nous avons collectées et suppose que la fiabilité de l'alimentation était la même pendant les périodes observées et non observées.
Comme le montre cet exemple, l'estimateur proportionnel donne une valeur SAIDI qui semble intuitivement plus raisonnable que l'estimateur naïf de (2). Cette intuition se reflète dans les propriétés mathématiques de l'estimateur ! Cet estimateur possède deux qualités statistiques très désirables. Dans ce qui suit, lorsque nous parlons de « SAIDI réel », nous entendons la valeur que nous obtiendrions si nous disposions d'une manière ou d'une autre de données sur toutes les coupures subies par les clients afin de calculer directement (1).
  • Non Biaisé [Annexe I]. Si un estimateur est biaisé, il peut avoir tendance à produire des valeurs supérieures ou inférieures à la valeur réelle. L'estimateur proportionnel n’est pas biaisé, ce qui signifie que son estimation du SAIDI a autant de chances d'être un peu plus élevée qu’un peu plus faible que le SAIDI réel : en moyenne, l'estimation générée par l'estimateur proportionnel est égale au SAIDI réel. Cette affirmation est assortie de mises en garde : elle suppose que le déploiement de nos capteurs n'est pas lui-même biaisé, c'est-à-dire que nous ne prélevons pas systématiquement des échantillons dans les seules parties d'Accra où la fiabilité de l'alimentation électrique est anormalement faible (ou exceptionnellement bonne). Cela suppose également que les taux de signalement sont indépendants des taux de panne. Voir la section « Importance de l'échantillonnage » pour plus de détails à ce sujet.
  • Convergent [Annexe II]. Statistiquement, la convergence signifie ce qui suit : si nous considérons l'estimation du SAIDI produite par l'estimateur proportionnel comme une variable aléatoire, sa distribution devient de plus en plus resserrée autour de la vraie valeur à mesure que la quantité de données utilisées dans l'estimateur augmente (au fur et à mesure que nous observons davantage de capteurs sur une plus longue période). Cela signifie que, à mesure que nous utilisons plus de données (plus d'observations de PowerWatch pendant la période) dans chaque estimation, nos estimations de SAIDI deviendront de plus en plus proches les unes des autres.
Le fait que l'estimateur proportionnel soit à la fois convergent et sans biais signifie qu'à mesure que le nombre de données clients utilisées augmente, il devient de moins en moins probable que notre estimation du SAIDI s'éloigne significativement du SAIDI réel. Cette propriété est illustrée dans la Figure 4 : à mesure que les observations s'accumulent, la distribution de l'estimation se resserre de plus en plus autour de la valeur réelle du paramètre.
Figure 4. Pour un estimateur qui est à la fois sans biais et convergent, lorsque le nombre d'observations utilisées augmente, la distribution des estimations résultantes se resserre autour de la valeur réelle, comme on peut le voir ici. C'est le cas de l'estimateur proportionnel (nLine), dont les estimations du SAIDI seront de plus en plus étroitement distribuées autour du SAIDI réel avec un plus grand nombre d'observations de la fiabilité de l'alimentation électrique des clients.
Figure 4. Pour un estimateur qui est à la fois sans biais et convergent, lorsque le nombre d'observations utilisées augmente, la distribution des estimations résultantes se resserre autour de la valeur réelle, comme on peut le voir ici. C'est le cas de l'estimateur proportionnel (nLine), dont les estimations du SAIDI seront de plus en plus étroitement distribuées autour du SAIDI réel avec un plus grand nombre d'observations de la fiabilité de l'alimentation électrique des clients.

Importance de l'échantillonnage

L'estimateur proportionnel extrapole les statistiques d'interruption observées chez les clients à des temps non observés. Nous avons déjà évoqué les propriétés statistiques avantageuses de cet estimateur ; cependant, ces propriétés reposent sur une hypothèse fondamentale qui est nécessaire au succès de toute méthode d'estimation basée sur l'échantillonnage (ce qui inclut la majorité des enquêtes politiques, des études médicales, des évaluations des risques, des méthodes de modélisation, etc.) : les statistiques de notre sous-échantillon doivent refléter les statistiques de l'ensemble de la population.
En pratique, cela signifie que nos déploiements de capteurs doivent couvrir une tranche de clients dont l'expérience collective de la fiabilité du réseau reflète la fiabilité de l'ensemble de la ville d'Accra. Si nous déployons des capteurs uniquement dans un quartier où de récents travaux de maintenance ou de mise à niveau se traduisent par une fiabilité exceptionnellement bonne, notre estimation SAIDI extrapolera cette expérience à l'ensemble de la ville, ce qui donnera une image faussement positive de la fiabilité. De même, si nous ne déployons des capteurs que sur la ligne de distribution dont l'infrastructure est la plus ancienne et la moins performante, l'extrapolation aboutira à un SAIDI peu satisfaisant.
La nécessité d'un échantillon représentatif est valable non seulement pour l'espace sélectionné, mais aussi pour le temps. Si les pannes sont minimes de 1 à 6 heures du matin et que nous ne recueillons des données sur les pannes qu'au cours de cette période, l'extrapolation du SAIDI obtenu à toutes les heures produira un résultat très éloigné du SAIDI réel. Cela signifie que notre affirmation de ne pas être biaisé repose également sur l'hypothèse que les taux d'interruption et de signalement sont indépendants.
Étant donné que nos capteurs collectent des données en permanence et que leur temps de disponibilité est élevé, nous ne craignons pas que notre échantillonnage temporel soit faussé. Pour éviter d'être biaisé en choisissant les clients chez qui nous installons nos capteurs, il est très important de concevoir un déploiement minutieux. Nous avons déployé plus de 1,200 capteurs à Accra, ce qui, selon nous, permet d'appréhender l'ensemble des expériences en matière d'alimentation électrique à Accra. Il y a des dispositifs PowerWatch dans la zone rurale de Mampong et dans la zone métropolitaine d'Accra, dans les quartiers modestes et dans les quartiers plus aisés, dans les ménages et les entreprises. Cependant, nous avons certainement plus de capteurs déployés dans certaines parties de la région du Grand Accra que dans d'autres, et il est possible que nos capteurs ne constituent pas un échantillon parfaitement représentatif ; il est d’ailleurs très certainement imparfait ! Cependant, presque tous les efforts de collecte de données sont affectés par la possibilité d'un échantillonnage biaisé ; c’est quelque chose de très difficile à déterminer, quantifier, et éviter complètement.
Figure 5. Il s'agit de notre déploiement dans la région du Grand Accra, avec un zoom sur la région autour de l'aéroport de Koforidua et de l'Université du Ghana. À l'heure où nous écrivons ces lignes, nous avons installé des capteurs dans 1,258 foyers et entreprises d'Accra, sur 441 sites (c'est-à-dire des transformateurs de distribution).
Figure 5. Il s'agit de notre déploiement dans la région du Grand Accra, avec un zoom sur la région autour de l'aéroport de Koforidua et de l'Université du Ghana. À l'heure où nous écrivons ces lignes, nous avons installé des capteurs dans 1,258 foyers et entreprises d'Accra, sur 441 sites (c'est-à-dire des transformateurs de distribution).

Agrégation dans le temps et l'espace

Pour donner du sens au SAIDI, et pour pouvoir l'utiliser au mieux, les fournisseurs d'électricité aimeraient le découper dans le temps et l'espace de plusieurs manières différentes. Par exemple, pour obtenir une vision globale de la performance du système, un fournisseur pourrait être intéressé par une seule valeur SAIDI couvrant l'ensemble de son réseau sur une année entière ; pour comprendre l'impact des variations météorologiques ou de la demande sur les performances du réseau, un fournisseur pourrait souhaiter disposer d'une valeur SAIDI pour chaque mois de l'année ; et pour savoir où une maintenance ou des mises à niveau urgentes sont nécessaires, un fournisseur pourrait se tourner vers les valeurs SAIDI au niveau d'un district ou d'une ligne de distribution individuelle. On parle alors de groupes temporels et spatiaux distincts de SAIDI.
Figure 6. Nous pouvons explorer les groupements spatiaux pour voir comment le SAIDI varie par district (à gauche : SAIDI par district en 2021), et zoomer sur un district pour voir à quel point le SAIDI varie d'un mois à l'autre (à droite : SAIDI mensuel à Achimota).
Figure 6. Nous pouvons explorer les groupements spatiaux pour voir comment le SAIDI varie par district (à gauche : SAIDI par district en 2021), et zoomer sur un district pour voir à quel point le SAIDI varie d'un mois à l'autre (à droite : SAIDI mensuel à Achimota).
De nombreux groupes de SAIDI temporels et spatiaux se chevauchent de manière conséquente lorsqu’il s’agit de définir les observations des capteurs qui les déterminent. Par exemple, pour un réseau unique en 2021, le SAIDI annuel à l'échelle du système contient le même ensemble d'observations de capteurs que les 12 valeurs mensuelles du SAIDI à l'échelle du système. Toutefois, pour un estimateur de SAIDI arbitraire, il n'est généralement pas possible d'obtenir le SAIDI annuel directement à partir des valeurs mensuelles. Il en résulte une complexité de calcul supplémentaire : pour obtenir le SAIDI pour l'année, nous devons repartir de zéro avec l'ensemble des données des expériences individuelles des capteurs, car nous ne pouvons pas exploiter le SAIDI mensuel précalculé. Si l’on prend en compte le fait que l’on puisse vouloir fournir un grand nombre de groupements temporels et spatiaux différents, cette contrainte de calcul peut devenir importante.
Dans ce contexte, l'estimateur proportionnel présente des propriétés d'agrégation avantageuses. Pour chaque groupe de temps et d'espace, il n'est pas nécessaire de toujours repartir des données complètes au niveau du capteur. Au lieu de cela, nous pouvons construire une estimation SAIDI plus agrégée à partir des valeurs SAIDI précalculées pour des groupes de temps et d'espace plus petits. Pour ce faire, nous aurons besoin d'une donnée supplémentaire en plus des valeurs SAIDI elles-mêmes : le temps de mesure agrégé qui a été pris en compte dans chaque valeur SAIDI.
Disons que nous disposons du SAIDI pour deux périodes de temps qui ne se chevauchent pas, et , et que nous sommes intéressés par le SAIDI pour l'ensemble de la période jointe. Par exemple, pourrait être le SAIDI pour la période de janvier à juin et pourrait être le SAIDI pour la période de juillet à décembre, et nous pourrions vouloir le SAIDI pour l'année entière. Dans ce cas, étant donné les durées totales d’observation pour chaque période, et , nous pouvons obtenir le SAIDI pour à partir du SAIDI dont la résolution est plus limitée comme suit :
correspond à la durée de la période.
Cela nous permet d'agréger facilement le SAIDI, par exemple en passant des valeurs quotidiennes du SAIDI aux valeurs mensuelles du SAIDI, puis aux valeurs annuelles du SAIDI, sans revenir à l'ensemble des données au niveau des capteurs après la première étape. Nous pouvons effectuer une agrégation spatiale de manière très similaire, en passant du SAIDI dont la résolution est un site, au SAIDI d’un district, d’une ville ou d’un pays.
Ces propriétés intéressantes de l'estimateur proportionnel signifient que nous pouvons fournir efficacement le SAIDI pour de nombreux groupes de temps et d'espace, ce qui enrichit considérablement le potentiel de compréhension, d'orientation et de valeur opérationnelle qu'un service public peut obtenir à partir de ces données.

References

  1. Dunn, 2019
  1. World Bank, 2020
  1. Kunaifi, 2017
  1. MCC, 2021

Annexe

Rappelons l'équation de notre estimateur proportionnel :
Nous pouvons remplacer les durées d'interruption observées par une proportion d'interruption observée notée : la fraction de son temps d’observation total pendant laquelle un capteur a subi une interruption. La proportion de pannes est un nombre compris entre et , inclus. Exprimée en termes de proportions de pannes, l'équation de l'estimateur est la suivante :

I. L'estimateur est sans biais.

Le biais de l'estimateur peut être déterminé en trouvant son espérance mathématique. Si l'espérance de l'estimateur est égale à la valeur d'intérêt, l'estimateur est sans biais. L'espérance de l'estimateur dans (5) est calculée comme suit.
où nous utilisons le théorème de l'espérance totale pour passer de (6) à (7).
L'expression finale est en effet la quantité cible : il s'agit de la proportion d'interruption moyenne pour la population multipliée par la durée de la période d'intérêt, ce qui nous donne le temps d'interruption total moyen enregistré au cours de la période. L'estimateur est donc sans biais.

II. L'estimateur est convergent

Pour comprendre la convergence de l'estimateur, nous souhaitons déterminer comment sa variance évolue dans la limite lorsque le nombre d'échantillons augmente (dans ce cas, lorsque le temps passe à ). Si la variance a une limite de , l'estimateur est convergent. Ce qui suit permet de dériver la variance de l'estimateur en (5).
Cette réécriture est rendue possible par le théorème de la variance totale. Simplifions chacun des termes séparément, en commençant par le deuxième terme, plus facile à comprendre.
Passons maintenant à la première expression :
Examinons la limite de chacune de ces expressions lorsque le temps d'observation augmente : .
sera une valeur finie et limitée. De même, sera une valeur finie et limitée.
est le rapport entre le temps de panne et le temps d'enregistrement subi par le capteur au cours de la période . Il s'agit donc d'une moyenne et, à mesure que augmente, la variance de cette quantité diminue si la probabilité de panne sous-jacente est constante. Par conséquent :
Passons maintenant à la covariance :
En introduisant ces résultats dans (20), nous pouvons conclure :
ce qui nous indique que l'estimateur est convergent.