Afin de respecter les conventions signées avec les producteurs de données et, plus généralement, de garantir la protection des données personnelles imposée par les textes de loi (la loi du 26 janvier 2016 de modernisation de notre système de santé, et plus particulièrement le décret n° 2016-1871 du 26 décembre 2016, la loi relative à la protection des données personnelles votée en dernière lecture par l’Assemblée nationale le 14 mai 2018 -en attente de sa publication au Journal officiel- et le règlement européen 2016/679 du 8 avril 2016 dit règlement général sur la protection des données -RGPD- mis en application à compter du 25 mai 2018), certains indicateurs ont dû être floutés. C’est-à-dire que la valeur présentée n’est pas toujours la valeur exacte et peut par conséquent être une valeur approchée. En effet, si la présentation de certains indicateurs respecte les règles du secret statistique, il existe un risque non nul de retrouver des données à caractère personnel de manière indirecte si aucun floutage n’était mis en place. Par exemple, la différence entre les valeurs d’un indicateur calculé sur deux entités géographiques peut correspondre à une commune faiblement peuplée pour laquelle il serait possible de déduire une information sensible.

C’est la raison pour laquelle certains indicateurs disponibles sur cet espace Open Data ont été floutés ; ils concernent la mortalité et les prestations sociales, la partie qui les définit le précisant alors. En effet, sur le site internet, la définition est disponible en survolant l’indicateur -apparition d’une infobulle- ; elle figure également dans les fichiers d’indicateurs téléchargeables.

Afficher les précisions sur la méthode de floutage


La méthode mise en place permet les comparaisons temporelles et territoriales. Ces types de comparaison ne s’effectuent pas à partir des effectifs mais à partir de taux, de part, d’indice… Aussi, la valeur fournie pour ce type d’indicateur correspond, dans la très grande majorité des cas, à la valeur arrondie (le plus souvent à un chiffre après la virgule). Quand la valeur de l’indicateur permet de déduire un nombre de cas concernés trop précis (dans une amplitude inférieure à 5 cas possibles), un floutage est mis en place : soit c’est la valeur réelle qui a été présentée, soit c’est cette valeur arrondie à +/- 0,1 point près (le choix d’affecter ou non une correction a alors été déterminé de manière aléatoire).
Pour perdre la notion d’additivité qui permet par différence de retrouver des données à caractère personnel, tous les effectifs ont été floutés quel que soit le niveau territorial : France, région et niveaux infra-régionaux. Le floutage mis en place sur les effectifs ne change pas pour autant l’ordre de grandeur du phénomène étudié.

Concernant les données de prestations sociales, l’écart pour un territoire donné est au maximum de 5 en valeur absolue.
Pour la mortalité, un écart aléatoire a tout d’abord été appliqué au nombre de décès toutes causes. Puis, pour garder la possibilité de calculer la part des décès par cause et par âge, une proratisation a été appliquée aux effectifs des différentes déclinaisons de la mortalité à partir de l’effectif total flouté. De fait, pour que les effectifs des décès par cause et par âge soient suffisamment floutés pour ne pas retrouver, par différence, des données sensibles, il est nécessaire d’affecter un écart plus important que ce qui a été fait pour les indicateurs de prestations sociales. Aussi, quand le floutage à appliquer au nombre total de décès impliquait une variation trop importante par rapport à la vraie valeur, les causes de décès moins fréquentes n’ont pas été présentées. Ceci permet de flouter le nombre de décès total avec une amplitude de cas plus restreinte pour ne pas avoir une variation trop importante en regard de la valeur initiale. Il est à noter que les cas non présentés reposent de toute façon sur un faible effectif et sont donc par nature instables. Un indicateur composite est disponible pour savoir si la mortalité par cause du territoire en question diffère significativement de celle de la France. La significativité prend en compte la taille des populations, ce qui explique par exemple que certains territoires peuvent avoir un test non significatif par rapport à la France alors que leurs taux sont plus élevés que ceux d’autres territoires qui enregistrent pourtant un test significatif.
En outre, il est à mentionner que comme la notion d’additivité est perdue, il n’est plus possible de sommer les valeurs de deux territoires. Il est donc normal que, pour les indicateurs floutés, la somme des valeurs des unités géographiques composant un territoire soit différente de la valeur de ce territoire.