> ## Documentation Index
> Fetch the complete documentation index at: https://private-7c7dfe99-mintlify-fbfa8bee.mintlify.site/llms.txt
> Use this file to discover all available pages before exploring further.

> Calcule la valeur de `(P(tag = 1) - P(tag = 0))(log(P(tag = 1)) - log(P(tag = 0)))` pour chaque catégorie.

# categoricalInformationValue

<div id="categoricalInformationValue">
  ## categoricalInformationValue
</div>

Introduit dans : v20.1.0

Calcule la valeur d'information (IV) pour des variables explicatives catégorielles par rapport à une variable cible binaire.

Pour chaque catégorie, la fonction calcule : `(P(tag = 1) - P(tag = 0)) × (log(P(tag = 1)) - log(P(tag = 0)))`

où :

* P(tag = 1) est la probabilité que la cible soit égale à 1 pour la catégorie donnée
* P(tag = 0) est la probabilité que la cible soit égale à 0 pour la catégorie donnée

La valeur d'information est une statistique utilisée pour mesurer la force de la relation entre une variable explicative catégorielle et une variable cible binaire dans le cadre de la modélisation prédictive.
Des valeurs absolues plus élevées indiquent un pouvoir prédictif plus important.

Le résultat indique dans quelle mesure chaque variable discrète (catégorielle) `[category1, category2, ...]` contribue à un modèle d'apprentissage qui prédit la valeur de `tag`.

**Syntaxe**

```sql theme={null}
categoricalInformationValue(category1[, category2, ...,]tag)
```

**Arguments**

* `category1, category2, ...` — Une ou plusieurs caractéristiques catégorielles à analyser. Chaque catégorie doit contenir des valeurs discrètes. [`UInt8`](/fr/reference/data-types/int-uint)
* `tag` — Variable cible binaire pour la prédiction. Elle doit contenir les valeurs 0 et 1. [`UInt8`](/fr/reference/data-types/int-uint)

**Valeur renvoyée**

Renvoie un tableau de valeurs Float64 représentant la valeur d'information pour chaque combinaison unique de catégories. Chaque valeur indique le pouvoir prédictif de cette combinaison de catégories pour la variable cible. [`Array(Float64)`](/fr/reference/data-types/array)

**Exemples**

**Utilisation de base : analyse des groupes d'âge par rapport à l'usage mobile**

```sql title=Query theme={null}
-- Using the metrica.hits dataset (available on https://sql.clickhouse.com/) to analyze age-mobile relationship
SELECT categoricalInformationValue(Age < 15, IsMobile)
FROM metrica.hits;
```

```response title=Response theme={null}
[0.0014814694805292418]
```

**Plusieurs variables catégorielles avec des données démographiques utilisateur**

```sql title=Query theme={null}
SELECT categoricalInformationValue(
    Sex,                 -- 0=male, 1=female
    toUInt8(Age < 25),   -- 0=25+, 1=under 25
    toUInt8(IsMobile)    -- 0=desktop, 1=mobile
) AS iv_values
FROM metrica.hits
WHERE Sex IN (0, 1);
```

```response title=Response theme={null}
[0.00018965785460692887,0.004973668839403392]
```
