Quelques définitions et notions diverses utilisées dans Phénoflore
La phénologie est l'étude de l'apparition d'événements périodiques déterminée par les variations saisonnières du climat.
Introduction.
Phénoflore étudie le calendrier des floraisons en cherchant
des relations d'ordre qui soit non seulement
d'ordre temporel mais encore et surtout d'ordre phénologique.
On peut définir le Calendrier comme une division du temps en unités périodiques fondées sur le déplacement du soleil. L'unité périodique est la semaine ,et on en compte 52 dans un cycle. Chaque cycle débute au 25 décembre, moment où le soleil est au plus bas à l'horizon. On peut donc définir un ordre temporel sur l'axe du temps.
Maintenant, que faut-il comprendre par ordre phénologique ? L’ordre phénologique correspond à deux notions distinctes, la synchronie et la diachronie. Les plantes sont alors ordonnées, en plus d'une date, selon un comportement rapporté à soit une chronique soit à un chronogramme. L'ordre des floraisons ainsi mis en évidence pose la question de savoir quels sont exactement le moment des aléas climatiques ayant déterminé l'expression de la floraison.
Notations logiques et Analyse de la base de données.
Mettre en base de données est une chose, fouiller dans la base en est une autre. L’exploration raisonnée de la base aboutit souvent à l’émergence de notion opératoires synthétisant ainsi plusieurs d’informations élémentaires.
La mise en forme logique des informations est chose utile, si l’on veut raisonner intelligemment sur la base. L’exercice n’est pas immédiat et nécessite souvent de paraphraser plusieurs fois les connaissances jusqu’à se satisfaire d’une représentation.
La représentation objet constitue une alternative au formalisme de représentation logique. La préférence ira vers une représentation finale en termes de prédicats binaires s’exprimant aisément sous la forme fonctionnelle.
Généralement, on débute la représentation par un prédicat m-aire. Ce prédicat m-aire, à m arguments, est transformé en un produit équivalent de prédicats binaires.
Tout prédicat m-aire est en effet constitué du nom de prédicat et de m valeurs des arguments. La notation en termes de prédicats binaires utilise une autre convention pour indiquer les relations fonctionnelles. Chaque fonction devient le nom d’un prédicat binaire dont le premier argument contient le nom du prédicat m-aire et le second argument contient la valeur de l’argument relatif à cette fonction.
Nom_prédicat(valeur_1, …,valeur_m) → ∩j Fonction_j
(nom_prédicat, valeur_j)
Raisonner dans la base.
Raisonner dans une base donne souvent l’impression de réaliser un tri. Si l’on veut dépasse la cardinalité d’une variable, il convient d’établir des règles de raisonnement sur les formules logiques. Pour faire simple, disons qu’on établira une hypothèse que l’on appliquera aux faits en cherchant toutes les correspondances existant avec l’hypothèse.
Définir une opération de correspondance, opération analogue à l’unification utilisée en logique des prédicats, est une nécessité si l’on veut utiliser la représentation objet comme une banque de données. Unifier signifie trouver des substitutions pour les variables qui rendent les formules identiques.
L’opération de correspondance lie une conclusion (but) à des hypothèses (faits). On dira qu’un but correspond à un fait si la formule logique impliquant un but s’unifie avec un fait. Ce dernier étant en général représentant comme une conjonction d’hypothèses et d’axiomes.
On peut utiliser la représentation objet avec des règles d’inférence plus puissantes, règles basées sur le Modus Ponens et l’implication logique et la notion d’héritage.
Par exemple, la question « quel est le diplôme de Jacques ? »
S’écrira en notation logique : Diplôme(Jacques, x)
Pour répondre à cette question nous devrons interroger la base avec la règle :
Élément(x, professeur d’université) →
(Diplôme (x, docteur) ∩ Lieux (x, université))
En unifiant la règle avec le but, le résulta sera : Élément (Jacques, professeur d’université)
On en déduira ensuite que Jacques possède un doctorat.
Comme on le constate, fouiller la base ne se réduit pas à de simples tris, comme par exemple dans l’apprentissage de concepts (de prédicats). Il est en effet impossible de synthétiser un prédicat à partir d’entrées « sorties brutes ».
Pour ne pas entrer dans les détails théoriques de l’apprentissage, disons que décrire consiste en partie à trouver des généralités disjonctives à partir d’une confrontation entre exemples et contre-exemples. Le lecteur intéressé se reportera à la programmation logique inductive. Dans ce domaine d’activités, on cherchera une description qui couvre tous les exemples et aucun contre-exemple.
Relevé.
On appelle relevé la mise en conjonction d’un taxon, d’un événement phénologique de celui-ci : ici, l’épanouissement floral, stade 61 – avec une date définie par l’année en cours et d’un moment particulier dans celle-ci, moment noté par la semaine (unité de temps) en cours, le déroulement des semaines étant compté à partir d’un zéro phénologique situé au 25 décembre correspondant à la position la plus basse du soleil sur l’horizon.
∃r R() ← objet(x0, x1) ∩
objet(x0, x2) ∩ date(x0, x3) ∩ moment(x0, x4) ∩ inst(x0, évenement) ∩ inst(x1, événement) ∩
inst(x2, taxon)
∩ inst(x3, année) ∩
inst(x4, semaine).
Chronique des floraisons.
Après plusieurs années d’observation, les relevés aboutissent à une chronique du type :
Date d’épanouissement du taxon en fonction des années..
Objet(chronique,x0)
← R(semaine) = F(x) ∩ inst(x, année).
Comme toute chronique, on y reconnaitra au besoin une tendance générale, éventuellement une composante cyclique, un résidu de nature erratique.
Soit en logique des prédicats adaptée à l’interrogation d’une base de données :
Objet(x0, x1) ∩ objet(x0, x2) ∩ date(x0, x3) ∩ moment(x0, x1) ∩ inst(x0,
événement) ∩ inst(x1,
épanouissement) ∩ inst(x2, taxon) ∩
inst(x3, année)
∩ inst(x4, semaine)
Cohorte.
Dans un soucis de simplifier la représentation du fleurissement ou dans un but purement paysager, il est possible de rechercher à regrouper en classes dénommées cohortes toutes les plantes dont l’épanouissement s’exprime au même moment S() et ce quelle que soit l’année.
Si, d’un point de vue paysager, on devine l’usage de la cohorte, il est envisageable dans le domaine des allergies de l’utiliser pour limiter l’émission de pollen à certaines saisons en limitant les plantes fleurissant à la même date et présentant des inconvénients pour la santé.
Egalité(x2, x6) ∩ objet(x0, x1) ∩ moment(x0, x2) ∩ date(x0, x3) ∩ objet((x4, x5) ∩ moment(x4, x6) ∩ date(x1, x8) ∩ inst(x0, relevé_1) ∩
inst(x1, taxon_1)
∩ inst(x2, Si) ∩
inst(x3, annéej) ∩ inst(x4,
relevé_2) ∩ inst(x5,
taxon_2) ∩ inst(x6,
Sj ) ∩ inst(x1, annéej).
En plus compact : égalité(x2, x6) ∩ inst(x2, Si)
∩ inst(x6, Sj)
On passe ainsi du niveau singulier de la chronique au niveau particulier de la cohorte. Evidemment, pour devenir une généralité, la cohorte sera vérifiée si possible sur plusieurs sites avec les espèces qui la composent. Ceci présentera un double intérêt. Celui d’abord de définir la valeur sémantique de la cohorte en tranchant soit en faveur d’un ajustement local, soit en faveur d’une structure générale exprimant le fait que les dites plantes s’expriment de la même manière face aux aléas climatiques rencontrés. D’un point de vue phénoménologique, on peut dire que la cohorte constitue un modèle type.
L’égalité,égalité(x2, x6), sera mise en évidence soit de manière stricte, soit en changeant d’opérateur pour la remplacer par la notion de distance euclidienne. Dans ce dernier cas, on pourra attribuer un seuil pour tenir compte des aléas. On supposera donc que l’égalité parfaite n’existe pas et qu’il existe par contre au moins une erreur entachant le vecteur des données observées. Puisqu’il s’agit de confronter deux vecteurs, la notion de corrélation peut être utilisée en fixant un seuil à 0,9 ou 0,8 et cetera pour constituer la cohorte. L’examen dans la base Phénoflore sera effectuée avec la notion de distance et non de corrélation. La notion de distance euclidienne se calcule de la manière suivante : [ (x1-x2)^2 + (y1-y2)^2]^1/2 et cetera.
La notion de cohorte est très utile pour compléter une base de donnée alors comparable à une matrice creuse. Connaissant les floraisons simultanées, il devient possible de compléter les données manquantes. On gagne ainsi de l'information pour l'annalyse multidimensionnelle.
Chronogramme.
La cohorte est liée à sa valuation. De ce fait, elle reste, au niveau du temps, prisonnière d'un moment particulier. Pour atteindre le général, il convient de soumettre la cohorte à une séries d’observations qui s’affranchissent d’un site géographique tout en continuant d’être liée à un moment du calendrier. Une autre manière d’échapper à la singularité du taxon est de s’intéresser non plus à l’aspect contingent de sa chronique mais à la structure qualitative de celle-ci. Nous en arrivons ainsi à la notion de chronogramme. Quitter la cohorte pour atteindre le chronogramme, c'est effectuer un recodage de l'information afin de façonner la chronique autour d'une autre notion, celle d'une structure qualitative, d'une signature du taxon. le recodage consisteà comaper une date de floraison à la moyenne générale. Si la date est supérieure, alors on codera +1 ; si elle est inférieure, on codera -1 ; et si la date est égale à la moyenne, on codera 0. En cas d'absence de valeur, on codera N.
Le chronogramme fonctionne aussi à la manière d’un classifieur utilisé dans les algorithmes génétiques. A chaque itération annuelle, le modèle s’enrichit de trois possibilités {-1, 0, +1}.
{-1, 0, +1}, et cetera.
Ainsi, à chaque itération, la liste des végétaux est répartie selon la typologie des chaînes. Il arrive un moment où les ensembles trouvés deviennent stables et constituent alors un objet phénologique composé de « cohortes ou de suites ».
Analyse par
chronogramme.
Le chronogramme est une chronique recodée de manière à ne retenir que l’expression qualitative d’un évènement phénologique en se libérant ainsi de toute contingence de date.
Dans le contexte présent, la lecture du résultat obéit à la règle suivante :
« Si le taxon A
fleurit de manière hâtive ou tardive par rapport à la moyenne de ses floraisons
alors les taxons de la suite feront de même, et cela quelle que soit l’année ».
Autrement dit, connaître la modalité du premier évènement d’une suite permet d’anticiper, chez les taxa suivant l’expression hâtive ou tardive de l’évènement phénologique considéré. Ce qui pose l’influence exacte des aléas climatiques du cycle en cour sur l’évènement observé. On supposera que si influence climatique il y a, celle-ci n’intervint qu’au cours du cycle précédent. D’où la question de savoir comment des informations climatiques déterminantes et intégrées au cours de l’année précédente commandent en réalité un évènement phénologique s’exprimant après plusieurs mois au cours de l’année suivante ?
Si l’hypothèse du réglage de la date d’expression d’un évènement phénologique est posée, l’existence d’autres explications n’est pas à écarter.
Un simple exemple.
Pour illustrer rapidement l’intérêt du chronogramme, on considérera le cas suivant.
|
Taxa |
Famille |
Moyenne |
écart type |
|
Lonicera
x purpusii Rehd. = Lonicera fragantissima x Lonicera standishii |
Caprifoliaceae. |
1 |
32 |
|
Crepis sancta Bornm. |
Asteraceae. |
25 |
35 |
Le chronogramme est {1, -1, 1, 1}. Il débute en 2004. Les relevés pour chaque taxon correspondent aux données suivantes.
Lonicera : [3, -8 (44), 3, 3] et [4] pour 2008.
Crepis : [26, 17, 26, 31].
Année d’un fleurissement exceptionnel par sa qualité esthétique, l’année 2005 se distingue dans les chroniques par sa floraison hâtive. Le Lonicera fleurit au début de l’hiver avec 11 semaines d’avance, et à la fin du printemps suivant le Crepis exprime sa floraison avec 9 semaines d’avance. Les nombreux exemples de ce type sont révélés à l’aide du chronogramme. Ces correspondances posent une question à la phénologie comme à la chronobiologie.