1. Agrégation externe de mathématiques

1.1 Leçon orale, option informatique

Feedbacks?


2. Algorithme de Cocke-Kasami-Younger

2.0.1 Implémentation d'un développement pour les leçons 906, 907, 910, 923.

L'algorithme de Cocke-Kasami-Younger (CYK) permet de résoudre le problème du mot en temps $\mathcal{O}(|w|^3)$, par programmation dynamique. La grammaire $G$ doit déjà avoir été mise en forme de forme normale de Chomsky, ce qui prend un temps $\mathcal{O}(|G|^2)$ et produit une grammaire équivalente $G'$ de taille $\mathcal{O}(|G|^2)$ en partant de $G$ (qui doit être bien formée).

2.0.2 Références :

2.1 Classes pour répresenter une grammaire

Au lieu de types formels définis en OCaml, on utilise des classes en Python, pour répresenter une grammaire (pas seulement en forme normale de Chomsky mais dans une forme un peu plus générale).

2.1.1 Du typage en Python ?!

Mais comme je veux frimer en utilisant des types formels, on va utiliser des annotations de types en Python. C'est assez nouveau, disponible à partir de Python 3.5. Si vous voulez en savoir plus, une bonne première lecture peut être cette page.

Note : ces annotations de types ne sont PAS nécessaires.


In [1]:
# On a besoin de listes et de tuples
from typing import List, Tuple  # Module disponible en Python version >= 3.5

On définit les types qui nous intéressent :


In [2]:
# Type pour une variable, juste une chaine, e.g. 'X' ou 'S'
Var = str
# Type pour un alphabet
Alphabet = List[Var]
# Type pour une règle : un symbole transformé en une liste de symboles
Regle = Tuple[Var, List[Var]]

Note : ces annotations de types ne sont là que pour illustrer et aider le programmeur, Python reste un langage dynamiquement typé (i.e. on fait ce qu'on veut...).

2.1.2 La classe Grammaire

Une grammaire $G$ est définie par :

  • $\Sigma$ son alphabet de production, qui sont les lettres dans les mots produits à la fin, e.g., $\Sigma = \{ a, b\}$,
  • $V$ son alphabet de travail, qui sont les lettres utilisées dans la génération de mots, mais pas dans les mots à la fin, e.g., $V = \{S, A\}$,
  • $S$ est le symbole de travail initial,
  • $R$ est un ensemble de règles, qui sont de la forme $U \rightarrow x_1 \dots x_n$ pour $U \in V$ une variable de travail (pas de production), et $x_1, \dots, x_n$ sont variables de production ou de travail (dans $\Sigma \cup V$), e.g., $R = \{ S \rightarrow \varepsilon, S \rightarrow A S b, A \rightarrow a, A \rightarrow a a \}$.

Et ainsi on peut definir un classe Grammaire, qui n'est rien d'autre qu'un moyen d'encapsuler ces différentes valeurs $\Sigma$, $V$, $S$, et $R$ (en OCaml, ce serait un type avec des champs d'enregistrement, défini par exemple par type grammar = { sigma : string list; v: string list; s: string; r: (string, strin list) list; };;).

On ajoute aussi une méthode __str__ à cette classe Grammaire pour afficher la grammaire joliment.


In [3]:
class Grammaire(object):
    """ Type pour les grammaires algébriques (en forme de Chomsky). """
    def __init__(self, sigma: Alphabet, v: Alphabet, s: Var, r: List[Regle], nom="G"):
        """ Grammaire en forme de Chomsky :
            - sigma : alphabet de production, type Alphabet,
            - v : alphabet de travail, type Alphabet,
            - s : symbol initial, type Var,
            - r : liste de règles, type List[Regle].
        """
        # On se contente de stocker les champs :
        self.sigma = sigma
        self.v = v
        self.s = s
        self.r = r
        self.nom = nom
        
    def __str__(self) -> str:
        """ Permet d'afficher une grammaire."""
        str_regles = ', '.join(
            "{} -> {}".format(regle[0], ''.join(regle[1]) if regle[1] else 'ε')
            for regle in self.r
        )
        return r"""Grammaire {} :
    - Alphabet Σ = {},
    - Non terminaux V = {},
    - Symbole initial : '{}',
    - Règles : {}.""".format(self.nom, set(self.sigma), set(self.v), self.s, str_regles)

2.1.3 Premier exemple de grammaire (non-Chomsky)

On commence avec un premier exemple basique, la grammaire $G_1$ avec pour seule règle : $S \rightarrow aSb \;|\; \varepsilon$. C'est la grammaire naturelle, bien formée, pour les mots de la forme $a^n b^n$ pour tout $n \geq 0$. Cf. cet exemple sur Wikipedia. Par contre, elle n'est pas en forme normale de Chomsky.


In [4]:
g1 = Grammaire(
    ['a', 'b'],  # Alphabet de production
    ['S'],       # Alphabet de travail
    'S',         # Symbole initial (un seul)
    [            # Règles
        ('S', []),  # S -> ε
        ('S', ['a', 'S', 'b']),  # S -> a S b
    ],
    nom="G1"
)
print(g1)


Grammaire G1 :
    - Alphabet Σ = {'b', 'a'},
    - Non terminaux V = {'S'},
    - Symbole initial : 'S',
    - Règles : S -> ε, S -> aSb.

2.1.4 Second exemple de grammaire (non-Chomsky)

Voici un autre exemple basique, la grammaire $G_2$ qui engendre les expressions arithmétiques en trois variables $x$, $y$ et $z$, correctement parenthésées. Une seule règle de production, ou une union de règle de production, suffit : $$ S \rightarrow x \;|\; y \;|\; z \;|\; S+S \;|\; S-S \;|\; S∗S \;|\; S/S \;|\; (S). $$

Cf. cet autre exemple sur Wikipedia.


In [5]:
g2 = Grammaire(
    ['x', 'y', 'z', '+', '-', '*', '/', '(', ')'],  # Alphabet de production
    ['S'],  # Alphabet de travail
    'S',    # Symbole initial (un seul)
    [       # Règles
        ('S', ['x']),            # S -> x
        ('S', ['y']),            # S -> y
        ('S', ['z']),            # S -> z
        ('S', ['S', '+', 'S']),  # S -> S + S
        ('S', ['S', '-', 'S']),  # S -> S - S
        ('S', ['S', '*', 'S']),  # S -> S * S
        ('S', ['S', '/', 'S']),  # S -> S / S
        ('S', ['(', 'S', ')']),   # S -> (S)
    ],
    nom="G2"
)
print(g2)


Grammaire G2 :
    - Alphabet Σ = {'*', '/', 'z', 'y', '-', 'x', '(', ')', '+'},
    - Non terminaux V = {'S'},
    - Symbole initial : 'S',
    - Règles : S -> x, S -> y, S -> z, S -> S+S, S -> S-S, S -> S*S, S -> S/S, S -> (S).

2.1.5 Dernier exemple de grammaire

Voici un dernier exemple, moins basique, la grammaire $G_3$ qui engendre des phrases "simples" (et très limitées) en anglais. Inspirée de cet exemple sur Wikipedia (en anglais). Cette grammaire $G_3$ est sous forme normale de Chomsky.


In [6]:
g3 = Grammaire(
    # Alphabet de production, des vrais mots anglais (avec une espace pour que la phrase soit lisible
    ['she ', 'eats ', 'with ', 'fish ', 'fork ', 'a ', 'an ', 'ork ', 'sword '],
    # Alphabet de travail, des catégories de mots : V pour verbes, P pour pronom etc.
    ['S', 'NP ', 'VP ', 'PP ', 'V ', 'Det ', 'DetVo ', 'N ', 'NVo ', 'P '],
    # Det = a : déterminant
    # DetVo = an : déterminant avant un nom commençant par une voyelle
    # N = (fish, fork, sword) : un nom
    # NVo = ork : un nom commençant par une voyelle
    # NP = she | a (fish, fork, sword) | an ork : un sujet
    # V = eats : verbe conjugué
    # P = with : conjonction de coordination
    # VP = eats : verbe conjugué suivi d'un objet
    # PP : with NP : complément d'objet direct
    'S',    # Symbole initial (un seul)
    [       # Règles
        # Règles de constuction de phrase
        ( 'S',      ['NP ', 'VP '] ),      # 'S'  -> 'NP' 'VP'
        ( 'VP ',    ['VP ', 'PP '] ),      # 'VP' -> 'VP' 'PP'
        ( 'VP ',    ['V ', 'NP '] ),       # 'VP' -> 'V' 'NP'
        ( 'PP ',    ['P ', 'NP '] ),       # 'PP' -> 'P' 'NP'
        ( 'NP ',    ['Det ', 'N '] ),      # 'NP' -> 'Det' 'N'
        ( 'NP ',    ['DetVo ', 'NVo '] ),  # 'NP' -> 'DetVo' 'NVo'
        # Règles de création de mots
        ( 'VP ',    ['eats '] ),   # 'VP'    -> 'eats '
        ( 'NP ',    ['she '] ),    # 'NP'    -> 'she '
        ( 'V ',     ['eats '] ),   # 'V'     -> 'eats '
        ( 'P ',     ['with '] ),   # 'P'     -> 'with '
        ( 'N ',     ['fish '] ),   # 'N'     -> 'fish '
        ( 'N ',     ['fork '] ),   # 'N'     -> 'fork '
        ( 'N ',     ['sword '] ),  # 'N'     -> 'sword '
        ( 'NVo ',   ['ork '] ),    # 'NVo'   -> 'ork '
        ( 'Det ',   ['a '] ),      # 'Det'   -> 'a '
        ( 'DetVo ', ['an '] ),     # 'DetVo' -> 'an '
    ],
    nom="G3"
)
print(g3)


Grammaire G3 :
    - Alphabet Σ = {'fish ', 'fork ', 'eats ', 'a ', 'she ', 'an ', 'sword ', 'ork ', 'with '},
    - Non terminaux V = {'PP ', 'DetVo ', 'S', 'Det ', 'N ', 'P ', 'V ', 'NVo ', 'NP ', 'VP '},
    - Symbole initial : 'S',
    - Règles : S -> NP VP , VP  -> VP PP , VP  -> V NP , PP  -> P NP , NP  -> Det N , NP  -> DetVo NVo , VP  -> eats , NP  -> she , V  -> eats , P  -> with , N  -> fish , N  -> fork , N  -> sword , NVo  -> ork , Det  -> a , DetVo  -> an .

Nous utiliserons ces exemples de grammaire plus tard, pour vérifier que nos fonctions sont correctement écrites.


2.2 Vérifier qu'une grammaire est bien formée

On veut pouvoir vérifier qu'une grammaire $G$ (i.e., un objet instance de Grammaire) est bien formée (cf. votre cours de langage formel pour une définition propre) :

  • $S$ doit être une variable de travail, i.e., $S \in V$,
  • Les variables de production et les variables de travail doivent être distinctes, i.e., $\Sigma \cap V = \emptyset$,
  • Pour chaque règle, $r = A \rightarrow w$, les membres gauches des règles sont réduits à une seule variable de travail, et les membres droits sont des mots, vides ou constitués de variables de production ou de travail, i.e., $A \in V$, et $w \in (\Sigma \cup V)^{\star}$,

On vérifie ça facilement avec la fonction suivante :


In [7]:
def estBienFormee(self: Grammaire) -> bool:
    """ Vérifie que G est bien formée. """
    sigma, v, s, regles = set(self.sigma), set(self.v), self.s, self.r
    tests = [
        s in v,  # s est bien une variable de travail
        sigma.isdisjoint(v),  # Lettres et variables de travail sont disjointes
        all(
            regle[0] in v  # Les membres gauches de règles sont des variables
            and  # Les membres droits de règles sont des variables ou des lettres
            all(r in sigma | v for r in regle[1])
            for regle in regles
        )
    ]
    return all(tests)

# On ajoute la fonction comme une méthode (au cas où...)
Grammaire.estBienFormee = estBienFormee

In [8]:
for g in [g1, g2, g3]:
    print(g)
    print("La grammaire", g.nom, "est-elle bien formée ?", estBienFormee(g))
    print()


Grammaire G1 :
    - Alphabet Σ = {'b', 'a'},
    - Non terminaux V = {'S'},
    - Symbole initial : 'S',
    - Règles : S -> ε, S -> aSb.
La grammaire G1 est-elle bien formée ? True

Grammaire G2 :
    - Alphabet Σ = {'*', '/', 'z', 'y', '-', 'x', '(', ')', '+'},
    - Non terminaux V = {'S'},
    - Symbole initial : 'S',
    - Règles : S -> x, S -> y, S -> z, S -> S+S, S -> S-S, S -> S*S, S -> S/S, S -> (S).
La grammaire G2 est-elle bien formée ? True

Grammaire G3 :
    - Alphabet Σ = {'fish ', 'fork ', 'eats ', 'a ', 'she ', 'an ', 'sword ', 'ork ', 'with '},
    - Non terminaux V = {'PP ', 'DetVo ', 'S', 'Det ', 'N ', 'P ', 'V ', 'NVo ', 'NP ', 'VP '},
    - Symbole initial : 'S',
    - Règles : S -> NP VP , VP  -> VP PP , VP  -> V NP , PP  -> P NP , NP  -> Det N , NP  -> DetVo NVo , VP  -> eats , NP  -> she , V  -> eats , P  -> with , N  -> fish , N  -> fork , N  -> sword , NVo  -> ork , Det  -> a , DetVo  -> an .
La grammaire G3 est-elle bien formée ? True

On peut définir une autre grammaire qui n'est pas bien formée, pour voir. Cette grammaire $G_4$ engendre les mots de la forme $a^{n+k} b^n$ pour $n,k \in \mathbb{N}$, mais on lui donne une règle de dédoublement des $a$ : $a \rightarrow a a$ (notez que $a$, une variable de production, est à gauche d'une règle).


In [9]:
g4 = Grammaire(
    ['a', 'b'],  # Alphabet de production
    ['S'],       # Alphabet de travail
    'S',         # Symbole initial (un seul)
    [            # Règles
        ('S', []),               # S -> ε
        ('S', ['a', 'S', 'b']),  # S -> a S b
        ('a', ['a', 'a']),       # a -> a a, cette règle n'est pas en forme normale
    ],
    nom="G4"
)
print(g4)
print("La grammaire", g4.nom, "est-elle bien formée ?", estBienFormee(g4))


Grammaire G4 :
    - Alphabet Σ = {'b', 'a'},
    - Non terminaux V = {'S'},
    - Symbole initial : 'S',
    - Règles : S -> ε, S -> aSb, a -> aa.
La grammaire G4 est-elle bien formée ? False

Juste par curiosité, la voici transformée pour devenir bien formée, ici on a juste eu besoin d'ajouter une variable de travail $A$ qui peut donner $a$ ou $A A$ :


In [10]:
g5 = Grammaire(
    ['a', 'b'],  # Alphabet de production
    ['S', 'A'],  # Alphabet de travail
    'S',         # Symbole initial (un seul)
    [            # Règles
        ('S', []),               # S -> ε
        ('S', ['A', 'S', 'b']),  # S -> A S b
        ('A', ['A', 'A']),       # A -> A A, voila comment on gère a -> a a
        ('A', ['a']),            # A -> a
    ],
    nom="G5"
)
print(g5)
print("La grammaire", g5.nom, "est-elle bien formée ?", estBienFormee(g5))


Grammaire G5 :
    - Alphabet Σ = {'b', 'a'},
    - Non terminaux V = {'S', 'A'},
    - Symbole initial : 'S',
    - Règles : S -> ε, S -> ASb, A -> AA, A -> a.
La grammaire G5 est-elle bien formée ? True

2.3 Vérifier qu'une grammaire est en forme normale de Chomsky

On veut maintenant pouvoir vérifier qu'une grammaire $G$ (i.e., un objet instance de Grammaire) est bien en forme normale de Chomsky. En effet, l'algorithme CKY n'a aucune chance de fonctionner si la grammaire n'est pas sous la bonne forme.

Pour que $G$ soit en forme normale de Chomsky :

  • elle doit d'abord être bien formée (cf. ci-dessus),
  • et chaque règle doit être
    • soit de la forme $S \rightarrow \varepsilon$,
    • soit de la forme $A \rightarrow a$ pour $(A, a)$ dans $V \times \Sigma$,
    • soit de la forme $A \rightarrow B C$ pour $(A, B, C)$ dans $V^3$ (certains ouvrages demandent à ce qu'il n'y ait aucune production de $S$ le symbole initial, i.e., $B,C \neq S$, mais ça ne change rien pour l'algorithme qu'on implémente plus bas).

On vérifie ça facilement, point par point, dans la fonction suivante :


In [11]:
def estChomsky(self: Grammaire) -> bool:
    """ Vérifie que G est sous forme normale de Chomksy. """
    sigma, v, s, regles = set(self.sigma), set(self.v), self.s, self.r
    estBienChomsky = all(
        (   # S -> epsilon
            regle[0] == s and not regle[1]
        ) or (  # A -> a
            len(regle[1]) == 1
            and regle[1][0] in sigma  # a in Sigma
        ) or (  # A -> B C
            len(regle[1]) == 2
            and regle[1][0] in v  # B in V, not Sigma
            and regle[1][1] in v  # C in V, not Sigma
        )
        for regle in regles
    )
    return estBienChomsky and estBienFormee(self)

# On ajoute la fonction comme une méthode (au cas où...)
Grammaire.estChomsky = estChomsky

On peut tester avec les cinq grammaires definies plus haut ($G_1$, $G_2$, $G_3$, $G_4$, $G_5$). Seule la grammaire $G_3$ est de Chomsky.


In [12]:
for g in [g1, g2, g3, g4, g5]:
    print(g)
    print("La grammaire", g.nom, "est-elle de bien formée ?", estBienFormee(g))
    print("La grammaire", g.nom, "est-elle de Chomsky ?", estChomsky(g))
    print()


Grammaire G1 :
    - Alphabet Σ = {'b', 'a'},
    - Non terminaux V = {'S'},
    - Symbole initial : 'S',
    - Règles : S -> ε, S -> aSb.
La grammaire G1 est-elle de bien formée ? True
La grammaire G1 est-elle de Chomsky ? False

Grammaire G2 :
    - Alphabet Σ = {'*', '/', 'z', 'y', '-', 'x', '(', ')', '+'},
    - Non terminaux V = {'S'},
    - Symbole initial : 'S',
    - Règles : S -> x, S -> y, S -> z, S -> S+S, S -> S-S, S -> S*S, S -> S/S, S -> (S).
La grammaire G2 est-elle de bien formée ? True
La grammaire G2 est-elle de Chomsky ? False

Grammaire G3 :
    - Alphabet Σ = {'fish ', 'fork ', 'eats ', 'a ', 'she ', 'an ', 'sword ', 'ork ', 'with '},
    - Non terminaux V = {'PP ', 'DetVo ', 'S', 'Det ', 'N ', 'P ', 'V ', 'NVo ', 'NP ', 'VP '},
    - Symbole initial : 'S',
    - Règles : S -> NP VP , VP  -> VP PP , VP  -> V NP , PP  -> P NP , NP  -> Det N , NP  -> DetVo NVo , VP  -> eats , NP  -> she , V  -> eats , P  -> with , N  -> fish , N  -> fork , N  -> sword , NVo  -> ork , Det  -> a , DetVo  -> an .
La grammaire G3 est-elle de bien formée ? True
La grammaire G3 est-elle de Chomsky ? True

Grammaire G4 :
    - Alphabet Σ = {'b', 'a'},
    - Non terminaux V = {'S'},
    - Symbole initial : 'S',
    - Règles : S -> ε, S -> aSb, a -> aa.
La grammaire G4 est-elle de bien formée ? False
La grammaire G4 est-elle de Chomsky ? False

Grammaire G5 :
    - Alphabet Σ = {'b', 'a'},
    - Non terminaux V = {'S', 'A'},
    - Symbole initial : 'S',
    - Règles : S -> ε, S -> ASb, A -> AA, A -> a.
La grammaire G5 est-elle de bien formée ? True
La grammaire G5 est-elle de Chomsky ? False

À la main, on peut transformer $G_5$ pour la mettre en forme de Chomsky (et après, on passe à CYK). Notez que cette transformation est automatique, elle est implémentée dans le cas general (d'une grammaire $G$ bien formée), ci-dessus en partie 5.


In [13]:
g6 = Grammaire(
    ['a', 'b'],            # Alphabet de production
    ['S', 'T', 'A', 'B'],  # Alphabet de travail
    'S',                   # Symbole initial (un seul)
    [                      # Règles
        ('S', []),               # S -> ε, on efface S si on veut produire le mot vide
        # On coupe la règle S -> A S B en deux :
        ('S', ['A', 'T']),       # S -> A T
        ('T', ['S', 'B']),       # T -> S B
        ('A', ['A', 'A']),       # A -> A A, voilà comment on gère a -> a a
        # Production de lettres
        ('A', ['a']),            # A -> a
        ('B', ['b']),            # B -> b
    ],
    nom="G6"
)
print(g6)
print("La grammaire", g6.nom, "est-elle bien formée ?", estBienFormee(g6))
print("La grammaire", g6.nom, "est-elle de Chomsky ?", estChomsky(g6))


Grammaire G6 :
    - Alphabet Σ = {'b', 'a'},
    - Non terminaux V = {'S', 'A', 'T', 'B'},
    - Symbole initial : 'S',
    - Règles : S -> ε, S -> AT, T -> SB, A -> AA, A -> a, B -> b.
La grammaire G6 est-elle bien formée ? True
La grammaire G6 est-elle de Chomsky ? True

2.4 (enfin) L'algorithme de Cocke-Kasami-Younger

On passe enfin à l'algorithme de Cocke-Kasami-Younger.

L'algorithme va prendre une grammaire $G$, bien formée, de taille $|G|$ (definie comme la somme des longueurs de $\Sigma$ et $V$ et la somme des tailles des règles), ainsi qu'un mot $w$ de taille $n = |w|$ (attention, ce n'est pas une str mais une liste de variables List[Var], i.e., une liste de str).

Le but est de vérifier si le mot $w$ peut être engendrée par la grammaire $G$, i.e., de déterminer si $w \in L(G)$. Pour le détail de fonctionnement, cf. le code Python ci dessous, ou la page Wikipedia.

L'algorithme aura :

  • une complexité en mémoire en $\mathcal{O}(|G| + |w|^2)$,
  • une complexité en temps en $\mathcal{O}(|G| \times |w|^3)$, ce qui montrera que le problème du mot pour les grammaires en forme de Chomsky est dans $\mathcal{P}$ (en temps polynomial, c'est déjà cool) et en temps raisonnable (cubique en $n = |w|$, c'est encore mieux !).

On va utiliser une table de hachage E contiendra, à la fin du calcul, les $E_{i, j}$ définis par : $$ E_{i, j} := \{ A \in V : w[i, j] \in L_G(A) \}.$$ Ou l'on a noté $w[i, j] = w_i \dots w_j$ le sous-mot d'indices $i,\dots,j$, et $L_G(A)$ le langage engendré par $G$ en partant du symbole $A$ (et pas du symbole initial $S$).

Note : la table de hachage n'est pas vraiment requise, une liste de liste fonctionnerait aussi mais la notation en serait moins proche de celle utilisée en maths.


In [14]:
def cocke_kasami_younger(self, w):
    """ Vérifie si le mot w est dans L(G). """
    assert estChomsky(self), "Erreur : {} n'est pas en forme de Chomsky, l'algorithme de Cocke-Kasami-Younger ne fonctionnera pas.".format(self.nom)
    sigma, v, s, regles = set(self.sigma), set(self.v), self.s, self.r
    n = len(w)
    E = dict()  # De taille n^2
    # Cas special pour tester si le mot vide est dans L(G)
    if n == 0:
        return (s, []) in regles, E
    # Boucle en O(n^2)
    for i in range(n):
        for j in range(n):
            E[(i, j)] = set()
    # Boucle en O(n x |G|)
    for i in range(n):
        for regle in regles:
            # Si regle est de la forme : A -> a
            if len(regle[1]) == 1:
                A = regle[0]
                a = regle[1][0]
                if w[i] == a:  # Notez que c'est le seul moment ou utilise le mot w !
                    E[(i, i)] = E[(i, i)] | {A}
    # Boucle en O(n^3 x |G|)
    for d in range(1, n):          # Longueur du morceau
        for i in range(n - d):     # Début du morceau
            j = i + d              # Fin du morceau, on regarde w[i]..w[j]
            for k in range(i, j):  # Parcourt du morceau, ..w[k].., sans la fin
                for regle in regles:
                    # Si regle est de la forme A -> B C
                    if len(regle[1]) == 2:
                        A = regle[0]
                        B, C = regle[1]
                        if B in E[(i, k)] and C in E[(k + 1, j)]:
                            E[(i, j)] = E[(i, j)] | {A}
    # On a fini, il suffit maintenant d'utiliser la table créée par programmation dynamique
    return s in E[(0, n - 1)], E

# On ajoute la fonction comme une méthode (au cas où...)
Grammaire.genere = cocke_kasami_younger

2.5 Exemples

On présente ici des exemples d'utilisation de cette fonction cocke_kasami_younger avec les grammaires $G_i$ présentées plus haut et quelques examples de mots $w$.


In [15]:
def testeMot(g, w):
    """ Joli affichage pour un test """
    print("# Test si w in L(G) :")
    print("  Pour", g.nom, "et w =", w)
    estDansLG, E = cocke_kasami_younger(g, w)
    if estDansLG:
        print("  ==> Ce mot est bien engendré par G !")
    else:
        print("  ==> Ce mot n'est pas engendré par G !")
    return estDansLG, E

2.5.1 Avec $G_3$


In [16]:
print(g3)
print(estChomsky(g3))


Grammaire G3 :
    - Alphabet Σ = {'fish ', 'fork ', 'eats ', 'a ', 'she ', 'an ', 'sword ', 'ork ', 'with '},
    - Non terminaux V = {'PP ', 'DetVo ', 'S', 'Det ', 'N ', 'P ', 'V ', 'NVo ', 'NP ', 'VP '},
    - Symbole initial : 'S',
    - Règles : S -> NP VP , VP  -> VP PP , VP  -> V NP , PP  -> P NP , NP  -> Det N , NP  -> DetVo NVo , VP  -> eats , NP  -> she , V  -> eats , P  -> with , N  -> fish , N  -> fork , N  -> sword , NVo  -> ork , Det  -> a , DetVo  -> an .
True

In [17]:
w1 = [ "she ", "eats ", "a ", "fish ", "with ", "a ", "fork " ]  # True
estDansLG1, E1 = testeMot(g3, w1)


# Test si w in L(G) :
  Pour G3 et w = ['she ', 'eats ', 'a ', 'fish ', 'with ', 'a ', 'fork ']
  ==> Ce mot est bien engendré par G !

Pour cet exemple, on peut afficher la table E (en ne montrant que les cases qui ont un $E_{i, j}$ non-vide) :


In [18]:
for k in E1.copy():
    if k in E1 and not E1[k]:  # On retire les clés qui ont un E[(i, j)] vide
        del(E1[k])
print(E1)


{(0, 0): {'NP '}, (0, 1): {'S'}, (0, 3): {'S'}, (0, 6): {'S'}, (1, 1): {'V ', 'VP '}, (1, 3): {'VP '}, (1, 6): {'VP '}, (2, 2): {'Det '}, (2, 3): {'NP '}, (3, 3): {'N '}, (4, 4): {'P '}, (4, 6): {'PP '}, (5, 5): {'Det '}, (5, 6): {'NP '}, (6, 6): {'N '}}


In [19]:
w2 = [ "she ", "attacks ", "a ", "fish ", "with ", "a ", "fork " ]  # False
estDansLG2, E2 = testeMot(g3, w2)


# Test si w in L(G) :
  Pour G3 et w = ['she ', 'attacks ', 'a ', 'fish ', 'with ', 'a ', 'fork ']
  ==> Ce mot n'est pas engendré par G !

In [20]:
w3 = [ "she ", "eats ", "an ", "ork ", "with ", "a ", "sword " ]  # True
estDansLG3, E3 = testeMot(g3, w3)


# Test si w in L(G) :
  Pour G3 et w = ['she ', 'eats ', 'an ', 'ork ', 'with ', 'a ', 'sword ']
  ==> Ce mot est bien engendré par G !

D'autres exemples :


In [21]:
w4 = [ "she ", "eats ", "an ", "fish ", "with ", "a ", "fork " ]  # False
estDansLG4, E4 = testeMot(g3, w4)
w5 = [ "she ", "eat ", "a ", "fish ", "with ", "a ", "fork " ]  # False
estDansLG5, E5 = testeMot(g3, w5)
w6 = [ "she ", "eats ", "a ", "fish ", "with ", "a ", "fish " , "with ", "a ", "fish " , "with ", "a ", "fish " , "with ", "a ", "fish " ]  # True
estDansLG6, E6 = testeMot(g3, w6)


# Test si w in L(G) :
  Pour G3 et w = ['she ', 'eats ', 'an ', 'fish ', 'with ', 'a ', 'fork ']
  ==> Ce mot n'est pas engendré par G !
# Test si w in L(G) :
  Pour G3 et w = ['she ', 'eat ', 'a ', 'fish ', 'with ', 'a ', 'fork ']
  ==> Ce mot n'est pas engendré par G !
# Test si w in L(G) :
  Pour G3 et w = ['she ', 'eats ', 'a ', 'fish ', 'with ', 'a ', 'fish ', 'with ', 'a ', 'fish ', 'with ', 'a ', 'fish ', 'with ', 'a ', 'fish ']
  ==> Ce mot est bien engendré par G !

2.5.2 Avec $G_6$


In [22]:
print(g6)
for w in [ [], ['a', 'b'], ['a', 'a', 'a', 'b', 'b', 'b'],  # True, True, True
          ['a', 'a', 'a', 'a', 'b', 'b', 'b'],  # True
          ['a', 'a', 'a', 'a', 'a', 'a', 'a', 'a', 'a', 'a', 'b', 'b', 'b', 'b', 'b', 'b'],  # True
          ['a', 'b', 'a'], ['a', 'a', 'a', 'b', 'b', 'b', 'b'],  # False, False
          ['c'], ['a', 'a', 'a', 'c'],  # False, False
         ]:
    testeMot(g6, w)


Grammaire G6 :
    - Alphabet Σ = {'b', 'a'},
    - Non terminaux V = {'S', 'A', 'T', 'B'},
    - Symbole initial : 'S',
    - Règles : S -> ε, S -> AT, T -> SB, A -> AA, A -> a, B -> b.
# Test si w in L(G) :
  Pour G6 et w = []
  ==> Ce mot est bien engendré par G !
Out[22]:
(True, {})
# Test si w in L(G) :
  Pour G6 et w = ['a', 'b']
  ==> Ce mot n'est pas engendré par G !
Out[22]:
(False, {(0, 0): {'A'}, (0, 1): set(), (1, 0): set(), (1, 1): {'B'}})
# Test si w in L(G) :
  Pour G6 et w = ['a', 'a', 'a', 'b', 'b', 'b']
  ==> Ce mot n'est pas engendré par G !
Out[22]:
(False,
 {(0, 0): {'A'},
  (0, 1): {'A'},
  (0, 2): {'A'},
  (0, 3): set(),
  (0, 4): set(),
  (0, 5): set(),
  (1, 0): set(),
  (1, 1): {'A'},
  (1, 2): {'A'},
  (1, 3): set(),
  (1, 4): set(),
  (1, 5): set(),
  (2, 0): set(),
  (2, 1): set(),
  (2, 2): {'A'},
  (2, 3): set(),
  (2, 4): set(),
  (2, 5): set(),
  (3, 0): set(),
  (3, 1): set(),
  (3, 2): set(),
  (3, 3): {'B'},
  (3, 4): set(),
  (3, 5): set(),
  (4, 0): set(),
  (4, 1): set(),
  (4, 2): set(),
  (4, 3): set(),
  (4, 4): {'B'},
  (4, 5): set(),
  (5, 0): set(),
  (5, 1): set(),
  (5, 2): set(),
  (5, 3): set(),
  (5, 4): set(),
  (5, 5): {'B'}})
# Test si w in L(G) :
  Pour G6 et w = ['a', 'a', 'a', 'a', 'b', 'b', 'b']
  ==> Ce mot n'est pas engendré par G !
Out[22]:
(False,
 {(0, 0): {'A'},
  (0, 1): {'A'},
  (0, 2): {'A'},
  (0, 3): {'A'},
  (0, 4): set(),
  (0, 5): set(),
  (0, 6): set(),
  (1, 0): set(),
  (1, 1): {'A'},
  (1, 2): {'A'},
  (1, 3): {'A'},
  (1, 4): set(),
  (1, 5): set(),
  (1, 6): set(),
  (2, 0): set(),
  (2, 1): set(),
  (2, 2): {'A'},
  (2, 3): {'A'},
  (2, 4): set(),
  (2, 5): set(),
  (2, 6): set(),
  (3, 0): set(),
  (3, 1): set(),
  (3, 2): set(),
  (3, 3): {'A'},
  (3, 4): set(),
  (3, 5): set(),
  (3, 6): set(),
  (4, 0): set(),
  (4, 1): set(),
  (4, 2): set(),
  (4, 3): set(),
  (4, 4): {'B'},
  (4, 5): set(),
  (4, 6): set(),
  (5, 0): set(),
  (5, 1): set(),
  (5, 2): set(),
  (5, 3): set(),
  (5, 4): set(),
  (5, 5): {'B'},
  (5, 6): set(),
  (6, 0): set(),
  (6, 1): set(),
  (6, 2): set(),
  (6, 3): set(),
  (6, 4): set(),
  (6, 5): set(),
  (6, 6): {'B'}})
# Test si w in L(G) :
  Pour G6 et w = ['a', 'a', 'a', 'a', 'a', 'a', 'a', 'a', 'a', 'a', 'b', 'b', 'b', 'b', 'b', 'b']
  ==> Ce mot n'est pas engendré par G !
Out[22]:
(False,
 {(0, 0): {'A'},
  (0, 1): {'A'},
  (0, 2): {'A'},
  (0, 3): {'A'},
  (0, 4): {'A'},
  (0, 5): {'A'},
  (0, 6): {'A'},
  (0, 7): {'A'},
  (0, 8): {'A'},
  (0, 9): {'A'},
  (0, 10): set(),
  (0, 11): set(),
  (0, 12): set(),
  (0, 13): set(),
  (0, 14): set(),
  (0, 15): set(),
  (1, 0): set(),
  (1, 1): {'A'},
  (1, 2): {'A'},
  (1, 3): {'A'},
  (1, 4): {'A'},
  (1, 5): {'A'},
  (1, 6): {'A'},
  (1, 7): {'A'},
  (1, 8): {'A'},
  (1, 9): {'A'},
  (1, 10): set(),
  (1, 11): set(),
  (1, 12): set(),
  (1, 13): set(),
  (1, 14): set(),
  (1, 15): set(),
  (2, 0): set(),
  (2, 1): set(),
  (2, 2): {'A'},
  (2, 3): {'A'},
  (2, 4): {'A'},
  (2, 5): {'A'},
  (2, 6): {'A'},
  (2, 7): {'A'},
  (2, 8): {'A'},
  (2, 9): {'A'},
  (2, 10): set(),
  (2, 11): set(),
  (2, 12): set(),
  (2, 13): set(),
  (2, 14): set(),
  (2, 15): set(),
  (3, 0): set(),
  (3, 1): set(),
  (3, 2): set(),
  (3, 3): {'A'},
  (3, 4): {'A'},
  (3, 5): {'A'},
  (3, 6): {'A'},
  (3, 7): {'A'},
  (3, 8): {'A'},
  (3, 9): {'A'},
  (3, 10): set(),
  (3, 11): set(),
  (3, 12): set(),
  (3, 13): set(),
  (3, 14): set(),
  (3, 15): set(),
  (4, 0): set(),
  (4, 1): set(),
  (4, 2): set(),
  (4, 3): set(),
  (4, 4): {'A'},
  (4, 5): {'A'},
  (4, 6): {'A'},
  (4, 7): {'A'},
  (4, 8): {'A'},
  (4, 9): {'A'},
  (4, 10): set(),
  (4, 11): set(),
  (4, 12): set(),
  (4, 13): set(),
  (4, 14): set(),
  (4, 15): set(),
  (5, 0): set(),
  (5, 1): set(),
  (5, 2): set(),
  (5, 3): set(),
  (5, 4): set(),
  (5, 5): {'A'},
  (5, 6): {'A'},
  (5, 7): {'A'},
  (5, 8): {'A'},
  (5, 9): {'A'},
  (5, 10): set(),
  (5, 11): set(),
  (5, 12): set(),
  (5, 13): set(),
  (5, 14): set(),
  (5, 15): set(),
  (6, 0): set(),
  (6, 1): set(),
  (6, 2): set(),
  (6, 3): set(),
  (6, 4): set(),
  (6, 5): set(),
  (6, 6): {'A'},
  (6, 7): {'A'},
  (6, 8): {'A'},
  (6, 9): {'A'},
  (6, 10): set(),
  (6, 11): set(),
  (6, 12): set(),
  (6, 13): set(),
  (6, 14): set(),
  (6, 15): set(),
  (7, 0): set(),
  (7, 1): set(),
  (7, 2): set(),
  (7, 3): set(),
  (7, 4): set(),
  (7, 5): set(),
  (7, 6): set(),
  (7, 7): {'A'},
  (7, 8): {'A'},
  (7, 9): {'A'},
  (7, 10): set(),
  (7, 11): set(),
  (7, 12): set(),
  (7, 13): set(),
  (7, 14): set(),
  (7, 15): set(),
  (8, 0): set(),
  (8, 1): set(),
  (8, 2): set(),
  (8, 3): set(),
  (8, 4): set(),
  (8, 5): set(),
  (8, 6): set(),
  (8, 7): set(),
  (8, 8): {'A'},
  (8, 9): {'A'},
  (8, 10): set(),
  (8, 11): set(),
  (8, 12): set(),
  (8, 13): set(),
  (8, 14): set(),
  (8, 15): set(),
  (9, 0): set(),
  (9, 1): set(),
  (9, 2): set(),
  (9, 3): set(),
  (9, 4): set(),
  (9, 5): set(),
  (9, 6): set(),
  (9, 7): set(),
  (9, 8): set(),
  (9, 9): {'A'},
  (9, 10): set(),
  (9, 11): set(),
  (9, 12): set(),
  (9, 13): set(),
  (9, 14): set(),
  (9, 15): set(),
  (10, 0): set(),
  (10, 1): set(),
  (10, 2): set(),
  (10, 3): set(),
  (10, 4): set(),
  (10, 5): set(),
  (10, 6): set(),
  (10, 7): set(),
  (10, 8): set(),
  (10, 9): set(),
  (10, 10): {'B'},
  (10, 11): set(),
  (10, 12): set(),
  (10, 13): set(),
  (10, 14): set(),
  (10, 15): set(),
  (11, 0): set(),
  (11, 1): set(),
  (11, 2): set(),
  (11, 3): set(),
  (11, 4): set(),
  (11, 5): set(),
  (11, 6): set(),
  (11, 7): set(),
  (11, 8): set(),
  (11, 9): set(),
  (11, 10): set(),
  (11, 11): {'B'},
  (11, 12): set(),
  (11, 13): set(),
  (11, 14): set(),
  (11, 15): set(),
  (12, 0): set(),
  (12, 1): set(),
  (12, 2): set(),
  (12, 3): set(),
  (12, 4): set(),
  (12, 5): set(),
  (12, 6): set(),
  (12, 7): set(),
  (12, 8): set(),
  (12, 9): set(),
  (12, 10): set(),
  (12, 11): set(),
  (12, 12): {'B'},
  (12, 13): set(),
  (12, 14): set(),
  (12, 15): set(),
  (13, 0): set(),
  (13, 1): set(),
  (13, 2): set(),
  (13, 3): set(),
  (13, 4): set(),
  (13, 5): set(),
  (13, 6): set(),
  (13, 7): set(),
  (13, 8): set(),
  (13, 9): set(),
  (13, 10): set(),
  (13, 11): set(),
  (13, 12): set(),
  (13, 13): {'B'},
  (13, 14): set(),
  (13, 15): set(),
  (14, 0): set(),
  (14, 1): set(),
  (14, 2): set(),
  (14, 3): set(),
  (14, 4): set(),
  (14, 5): set(),
  (14, 6): set(),
  (14, 7): set(),
  (14, 8): set(),
  (14, 9): set(),
  (14, 10): set(),
  (14, 11): set(),
  (14, 12): set(),
  (14, 13): set(),
  (14, 14): {'B'},
  (14, 15): set(),
  (15, 0): set(),
  (15, 1): set(),
  (15, 2): set(),
  (15, 3): set(),
  (15, 4): set(),
  (15, 5): set(),
  (15, 6): set(),
  (15, 7): set(),
  (15, 8): set(),
  (15, 9): set(),
  (15, 10): set(),
  (15, 11): set(),
  (15, 12): set(),
  (15, 13): set(),
  (15, 14): set(),
  (15, 15): {'B'}})
# Test si w in L(G) :
  Pour G6 et w = ['a', 'b', 'a']
  ==> Ce mot n'est pas engendré par G !
Out[22]:
(False,
 {(0, 0): {'A'},
  (0, 1): set(),
  (0, 2): set(),
  (1, 0): set(),
  (1, 1): {'B'},
  (1, 2): set(),
  (2, 0): set(),
  (2, 1): set(),
  (2, 2): {'A'}})
# Test si w in L(G) :
  Pour G6 et w = ['a', 'a', 'a', 'b', 'b', 'b', 'b']
  ==> Ce mot n'est pas engendré par G !
Out[22]:
(False,
 {(0, 0): {'A'},
  (0, 1): {'A'},
  (0, 2): {'A'},
  (0, 3): set(),
  (0, 4): set(),
  (0, 5): set(),
  (0, 6): set(),
  (1, 0): set(),
  (1, 1): {'A'},
  (1, 2): {'A'},
  (1, 3): set(),
  (1, 4): set(),
  (1, 5): set(),
  (1, 6): set(),
  (2, 0): set(),
  (2, 1): set(),
  (2, 2): {'A'},
  (2, 3): set(),
  (2, 4): set(),
  (2, 5): set(),
  (2, 6): set(),
  (3, 0): set(),
  (3, 1): set(),
  (3, 2): set(),
  (3, 3): {'B'},
  (3, 4): set(),
  (3, 5): set(),
  (3, 6): set(),
  (4, 0): set(),
  (4, 1): set(),
  (4, 2): set(),
  (4, 3): set(),
  (4, 4): {'B'},
  (4, 5): set(),
  (4, 6): set(),
  (5, 0): set(),
  (5, 1): set(),
  (5, 2): set(),
  (5, 3): set(),
  (5, 4): set(),
  (5, 5): {'B'},
  (5, 6): set(),
  (6, 0): set(),
  (6, 1): set(),
  (6, 2): set(),
  (6, 3): set(),
  (6, 4): set(),
  (6, 5): set(),
  (6, 6): {'B'}})
# Test si w in L(G) :
  Pour G6 et w = ['c']
  ==> Ce mot n'est pas engendré par G !
Out[22]:
(False, {(0, 0): set()})
# Test si w in L(G) :
  Pour G6 et w = ['a', 'a', 'a', 'c']
  ==> Ce mot n'est pas engendré par G !
Out[22]:
(False,
 {(0, 0): {'A'},
  (0, 1): {'A'},
  (0, 2): {'A'},
  (0, 3): set(),
  (1, 0): set(),
  (1, 1): {'A'},
  (1, 2): {'A'},
  (1, 3): set(),
  (2, 0): set(),
  (2, 1): set(),
  (2, 2): {'A'},
  (2, 3): set(),
  (3, 0): set(),
  (3, 1): set(),
  (3, 2): set(),
  (3, 3): set()})

2.6 Mise en forme normale de Chomsky (bonus)

On pourrait aussi implémenter la mise en forme normale de Chomsky, comme exposée et prouvée dans le développement.

La preuve faite dans le développement garantit que la fonction ci-dessous transforme une grammaire $G$ en grammaire équivalente $G'$, avec l'éventuelle perte du mot vide $\varepsilon$ : $$ L(G') = L(G) \setminus \{ \varepsilon \}. $$

L'algorithme aura :

  • une complexité en mémoire en $\mathcal{O}(|G|)$,
  • une complexité en temps en $\mathcal{O}(|G| |\Sigma_G|)$.

C'est un algorithme en deux étapes :

  1. D'abord, on transforme $G$ en $G'$ : on ajoute des variables de travail pour chaque lettre de production, $V_a \in V$ pour $a \in \Sigma$, on remplace chaque $a$ dans des membres gauches de règles par la nouvelle $V_a$, et ensuite on ajoute des règles de production de lettre $V_a \rightarrow a$ dans $R$,
  2. Ensuite, $G''$ est obtenue en découpant les règles de $G$ qui sont de tailles $> 2$ : une règle $S \rightarrow S_1 \dots S_n$ devient $n-1$ règles : $S \rightarrow S_1 S_2'$, $S_i' \rightarrow S_i S_{i+1}'$ (pour $i = 2,\dots,n - 2$), et $S_{n-1}' \rightarrow S_{n-1} S_n$. Il faut aussi ajouter toutes ces nouvelles variables $S_i'$ (en s'assurant qu'elles sont uniques, pour chaque règle), on ajoute pour cela le numéro de la règle : $S_i'=$ A'_k pour la k -ième règle et le symbole $S_i=$ A.

In [23]:
def miseChomsky(self):
    """ Met en forme normale de Chomsky la grammaire self, qui doit être bien formée.
    
    - On suppose que l'alphabet Sigma est dans {a,..,z},
    - On suppose que l'alphabet v est dans {A,..,Z}.
    """
    assert estBienFormee(self), "Erreur : {} n'est pas en bien formée, la mise en forme normale de Chomsky ne fonctionnera pas.".format(self.nom)
    sigma, v, s, regles = set(self.sigma), set(self.v), self.s, self.r
    if estChomsky(self):
        print("Info : la grammaire {} est déjà en forme normale de Chomsky, il n'y a rien à faire.".format(self.nom))
        return Grammaire(sigma, v, s, regles)
    assert sigma < set(chr(i) for i in range(ord('a'), ord('z') + 1)), "Erreur : {} n'a pas ses lettres de production Sigma dans 'a'..'z' ...".format(self.nom)
    assert v < set(chr(i) for i in range(ord('A'), ord('Z') + 1)), "Erreur : {} n'a pas ses lettres de travail V dans 'A'..'Z' ...".format(self.nom)

    # Algorithme en deux étapes, G --> G', puis G' --> G''
    
    # 1. G --> G' : On ajoute des variables de travail et on substitue a -> V_a dans les autres règles
    # On pose les attributs de G', qui vont être changés
    sigma2 = list(sigma)
    v2 = set(v)
    s2 = s
    regles2 = []

    V_ = lambda a: 'V_{}'.format(a)
    for a in sigma:
        v2.add(V_(a))
        regles2.append([V_(a), [a]])  # Ajout de la règle V_a -> a (production de la lettre correspondante)
    substitutionLettre = lambda b: V_(b) if (b in sigma) else b
    substitutionMot = lambda lb: [substitutionLettre(b) for b in lb]
    for regle in regles:
        S = regle[0]
        w = regle[1]
        if len(w) >= 2:  # Si ce n'est pas une règle A -> epsilon
            regles2.append([S, substitutionMot(w)])
        else:  # Ici on devrait garder la possibilte de creer le mot vide
            regles2.append([S, w])
    nom2 = self.nom + "'"
    print(Grammaire(list(sigma2), list(v2), s2, regles2, nom=nom2))
    
    # 2. G' --> G'' : On découpe les règles A -> A1..An qui ont n > 2
    # On pose les attributs de G'', qui vont être changés
    sigma3 = list(sigma2)
    v3 = set(v2)
    s3 = s2
    regles3 = []
    
    for k, regle in enumerate(regles2):
        S = regle[0]
        w = regle[1]  # w = S1 .. Sn
        n = len(w)
        if n > 2:
            prime = lambda Si: "%s'_%d" % (Si, k)  # Ajouter le k dans le nom assure que les nouvelles variables de travail sont toutes uniques
            # Premiere règle : S -> S_1 S'_2
            regles3.append([S, [w[0], prime(w[1])]])
            v3.add(prime(w[1]))
            for i in range(1, len(w) - 2):
                # Pour chaque règle intermédiaire : S'_i -> S_i  S'_{i+1}
                regles3.append([prime(w[i]), [w[i], prime(w[i + 1])]])
                v3.add(prime(w[i]))
                v3.add(prime(w[i + 1]))
            # Dernière règle : S'_{n-1} -> S_{n-1} S_n
            regles3.append([prime(w[n - 2]), [w[n - 2], w[n - 1]]])
            v3.add(prime(w[n - 2]))
        else:
            regles3.append([S, w])
    # Terminé
    nom3 = self.nom + "''"
    return Grammaire(list(sigma3), list(v3), s3, regles3, nom=nom3)

# On ajoute la fonction comme une méthode (au cas où...)
Grammaire.miseChomsky = miseChomsky

2.6.1 Exemple pour $G_1$


In [24]:
print(g1)
print("\n(Non) La grammaire", g1.nom, "est-elle de Chomsky ?", estChomsky(g1))
print("\nOn essaie de la mettre sous forme normale de Chomksy...\n")
g1_Chom = miseChomsky(g1)
print(g1_Chom)
print("\n  ==> La grammaire", g1_Chom.nom, "est-elle de Chomsky ?", estChomsky(g1_Chom))


Grammaire G1 :
    - Alphabet Σ = {'b', 'a'},
    - Non terminaux V = {'S'},
    - Symbole initial : 'S',
    - Règles : S -> ε, S -> aSb.

(Non) La grammaire G1 est-elle de Chomsky ? False

On essaie de la mettre sous forme normale de Chomksy...

Grammaire G1' :
    - Alphabet Σ = {'b', 'a'},
    - Non terminaux V = {'S', 'V_a', 'V_b'},
    - Symbole initial : 'S',
    - Règles : V_b -> b, V_a -> a, S -> ε, S -> V_aSV_b.
Grammaire G1'' :
    - Alphabet Σ = {'b', 'a'},
    - Non terminaux V = {'S', 'V_a', "S'_3", 'V_b'},
    - Symbole initial : 'S',
    - Règles : V_b -> b, V_a -> a, S -> ε, S -> V_aS'_3, S'_3 -> SV_b.

  ==> La grammaire G1'' est-elle de Chomsky ? True

2.6.2 Exemple pour $G_6$


In [25]:
print(g5)
print("\n(Non) La grammaire", g5.nom, "est-elle de Chomsky ?", estChomsky(g5))
print("\nOn essaie de la mettre sous forme normale de Chomksy...\n")
g5_Chom = miseChomsky(g5)
print(g5_Chom)
print("\n  ==> La grammaire", g5_Chom.nom, "est-elle de Chomsky ?", estChomsky(g5_Chom))


Grammaire G5 :
    - Alphabet Σ = {'b', 'a'},
    - Non terminaux V = {'S', 'A'},
    - Symbole initial : 'S',
    - Règles : S -> ε, S -> ASb, A -> AA, A -> a.

(Non) La grammaire G5 est-elle de Chomsky ? False

On essaie de la mettre sous forme normale de Chomksy...

Grammaire G5' :
    - Alphabet Σ = {'b', 'a'},
    - Non terminaux V = {'S', 'V_a', 'A', 'V_b'},
    - Symbole initial : 'S',
    - Règles : V_b -> b, V_a -> a, S -> ε, S -> ASV_b, A -> AA, A -> a.
Grammaire G5'' :
    - Alphabet Σ = {'b', 'a'},
    - Non terminaux V = {'V_b', 'S', 'A', 'V_a', "S'_3"},
    - Symbole initial : 'S',
    - Règles : V_b -> b, V_a -> a, S -> ε, S -> AS'_3, S'_3 -> SV_b, A -> AA, A -> a.

  ==> La grammaire G5'' est-elle de Chomsky ? True

C'est tout pour aujourd'hui les amis ! Allez voir d'autres notebooks si vous voulez.