Régression linéaire généralisée

Diagramme de processus Régression linéaire généralisée


Effectue une régression linéaire généralisée (GLR) en vue de générer des prévisions ou de modéliser une variable dépendante en fonction de sa relation à un ensemble de variables explicatives. Cet outil permet d’adapter des modèles continus (gaussiens), binaires (logistiques) et totaux (Poisson).

Type d'analyse


Spécifie le mode opératoire de l’outil. L’outil peut être exécuté pour entraîner un modèle à la seule fin d’évaluer ses performances ou pour entraîner un modèle et prévoir les entités. Les types de prévision sont les suivantes :

  • Fit a model to assess model performance (Ajuster un modèle pour évaluer les performances du modèle) : un modèle est ajusté et appliqué aux données en entrée. Utilisez cette option pour évaluer l’exactitude de votre modèle avant de générer des prévisions pour un nouveau jeu de données ou comprendre les relations et les indicateurs de la variable prévue. La sortie de cette option prendra la forme d’un service d’entités de vos données ajustées et de diagnostics relatifs au modèle.
  • Fit a model and predict values (Ajuster un modèle et prévoir les valeurs) : les prévisions ou les classifications seront générées pour les entités en entrée et les entités de prévision. Des variables explicatives doivent être fournies pour les entités de prévision et les entités à prévoir. La sortie de cette option prendra la forme d’un service d’entités de votre modèle ajusté à vos données en entrée, d’un service d’entités des valeurs prévues et de diagnostics relatifs au modèle.

Ajuster un modèle pour évaluer les performances du modèle


Utilisez ce mode si vous voulez ajustez un modèle et étudier l’ajustement.

Avec ce choix, le modèle sera entraîné à l’aide d’une couche en entrée. Utilisez cette option pour évaluer l’exactitude de votre modèle avant de générer des prévisions pour un nouveau jeu de données. Cette option génère des diagnostics relatifs au modèle et applique le modèle à vos données d’entraînement.

Ajuster un modèle et prévoir les valeurs


Utilisez ce mode si vous voulez ajustez un modèle et appliquer le modèle au jeu de données pour générer des prévisions.

Les prévisions ou les classifications seront générées pour les entités. La sortie de cette option prendra la forme d’un service d’entités, de diagnostics relatifs au modèle et d’une table facultative de l’importance des variables.

Choisir une couche pour générer un modèle


Couche contenant les entités tabulaires, surfaciques, linéaires ou ponctuelle à décrire, synthétiser ou utiliser à titre d’exemple.

Outre le fait de choisir une couche de votre carte, vous pouvez sélectionner Choose Analysis Layer (Choisir une couche d’analyse) au bas de la liste déroulante pour parcourir votre contenu et rechercher une couche d’entités ou un jeu de données de partage de fichiers Big Data.

Choisir le champ à modéliser


Champ numérique contenant les valeurs observées que vous souhaitez modéliser et type de valeur que vous modélisez. Il est possible de modéliser trois types de valeurs

  • Continu : représente les valeurs continues. Le modèle utilisé est le modèle gaussien ; l’outil procède à une régression des moindres carrés ordinaires.
  • Binaire : représente les valeurs de présence ou d’absence. Il doit s’agir de 1s et 0s. Le modèle utilisé est la régression de type logistique.
  • Total : représente les événements discrets, par exemple le nombre de délits, de maladies et d’accident de la route. Le modèle utilisé est la régression Poisson.

Choisir une couche pour prévoir les valeurs pour


Couche avec des entités représentant les localisations pour lesquelles des estimations doivent être calculées. Chaque entité de ce jeu de données doit contenir des valeurs pour toutes les variables explicatives spécifiées. La variable dépendante pour ces entités sera estimée à l’aide du modèle calibré pour la couche en entrée.

Choisir les champs explicatifs


Un ou plusieurs champs représentant les variables explicatives (champs) qui aident à prévoir la valeur. Seuls les champs numériques sont visibles.

Choisir l’appariement des champs explicatifs


Façon dont les variables correspondantes dans la couche en entrée seront appariées aux variables dans la couche de prévision. Seules les variables utilisées pendant la génération du modèle seront incluses dans la table. Seules les valeurs numériques peuvent être utilisées.

Nom de la couche de résultat


Nom de la couche à créer. Si vous écrivez sur une instance ArcGIS Data Store, les résultats seront enregistrés dans My Content (Mon contenu) et ajoutés à la carte. Si vous écrivez sur un partage de fichiers Big Data, les résultats seront enregistrés dans le partage de fichiers Big Data et ajoutés à son manifeste. Il ne sera pas ajouté à la carte. Le nom par défaut repose sur le nom de l'outil et sur le nom de la couche en entrée. Si la couche existe déjà, l'outil échoue.

Les résultats renvoyés dépendront du type d’analyse. Si vous utilisé l’ajustement pour évaluer l’ajustement du modèle, les résultats contiendront une couche des données en entrée ajustées au modèle et des informations relatives à l’ajustement du modèle. Si vous utilisé l’ajustement et la prévision, les résultats contiendront une couche des données en entrée ajustées au modèle, une couche des résultats prévus et des informations relatives à l’ajustement du modèle.

Lors de l’écriture sur ArcGIS Data Store (répertoire de données relationnelles ou spatio-temporelles) via la zone de liste déroulante Save result in (Enregistrer le résultat dans), vous pouvez spécifier le nom d’un dossier dans My Content (Mon contenu) où le résultat sera enregistré.