un ensemble X de A+ est un code sur A si pour chaque x1,…,xn, x'1,…,x'm ∈ X, n,m ≥ 1, la condition x1,…,xn = x'1,…,x'm implique que n=m et xi=x'i pour i=1,…,n.
L'ensemble A34 est-il un code?
Oui :
un code trinucléotide X ∈ A34 est comma-free (ou sans ponctuation) si pour chaque y ∈ X et u, v ∈ A*4 tels que uyv = x1,…,xn avec x1,…,xn ∈ X, n ≥ 1, alors u, v ∈ X*.
L'ensemble A34 est-il un code comma-free?
un code trinucléotide ∈ A34 est circulaire si pour chaque x1,…,xn, x'1,…,x'm ∈ X, n,m ≥ 1, p ∈ A*4, s ∈ A+4, les conditions s x2,…,xnp = x'1,…,x'm et x1 = ps impliquent n=m, p=ε, et xi=x'i pour i=1,…,n.
Donner une représentation graphique de cette définition. Tout mot construit avec X et écrit sur “un cercle” a au plus un factorisation avec X.
L'ensemble A34 est-il un code circulaire?
Quelles sont les deux classes de contraintes évidentes que doit vérifier un code trinucléotide pour être circulaire? Nécessaires mais pas suffisantes (d'ailleurs).
un code trinucléotide circulaire X ∈ A34 est maximal si pour chaque x ∈ A34 , X ∪ {x} n'est pas un code trinucléotide circulaire.
Combien de mots (longueur) au maximum peut avoir un code trinucléotide circulaire?
Etant donnée la première contrainte, il reste 64-4 trinucléotides candidats pour les codes circulaires. Mais la deuxième contrainte divise par trois, car on ne pourra pas avoir deux (ou trois) trinucléotides d'une même classe d'équivalence par rotation. Il a y 20 telles classes, 20 est la longueur maximale.
C : A+4 → A+4 est définie par C(A)=T, C(T)=A, C(C)=G, C(G)=C, et par C(uv) = C(v)C(u) pour tout u,v ∈ A+4. Cette application est associée à la propriété double hélice d'ADN qui est complémentaire et antiparallèle (un brin de ADN chimiquement orienté dans la direction 5'-3' et l'autre brin d'ADN dans la direction opposée 3'-5'; Watson & Crick, 1953). Cette application C définie sur les mots est naturellement étendue aux ensembles de mots : un ensemble complémentaire de trinucléotides est obtenu en appliquant l'application complémentaire C à tous ses trinucléotides.
Exemples
P : A+4 → A+4 permute circulairement chaque trinucléotide l1 l2 l3 de la façon suivante
Cette application définie sur les mots est naturellement étendue aux ensembles de mots : un ensemble permuté de trinucléotides est obtenu en appliquant l'application permutée P à tous ses trinucléotides.
Deux trinucléotides u et v sont conjugués s'il existe 2 mots s et t tels que u=st et v =ts. Ainsi, si u et v satisfont Pk(u)=v pour un k donné, alors u et v sont conjugués.