www.all2know.com Google WWW All2know fr
  Accueil Accueil | À propos À propos 
  Navigation
» Accueil
» Page des catégories
» Liste des listes
» Alphabétique indexes
» Biographies
» Une page au hasard
» Éditer Liens externes
Dernière modification: 2007-11-27
  Autres langues 
svLinjering
Catégorie: Génétique biomathématiques Bio-informatique

Alignement de séquences

L'alignement de séquences d'ADN ou d'acides aminés est une opération de base en bio-informatique qui a pour but d'identifier des zones conservées entre séquences. L'alignement sert notamment à :
  • identifier des sites fonctionnels
  • prédire la ou les fonctions d'une protéine
  • prédire la structure secondaire (voire tertiaire) d'une protéine
  • établir une phylogénie
1 Utilisation
2 Exemple
3 Méthodes et algorithmes

Utilisation

Dans la compréhension du fonctionnement de la vie, les protéines jouent un rôle essentiel. On part donc de l'hypothèse que des protéines comportant des séquences similaires risquent fort de posséder des propriétés physico-chimiques identiques. À partir de l'identification de similarités entre la séquence d'une première protéine dont on connaît le mécanisme d'action et celle d'une deuxième protéine dont on ne connaît pas le mécanisme de fonctionnement, on peut inférer des similarités structurelles ou fonctionnelles sur la séquence non connue et proposer de vérifier de manière expérimentale le comportement d'action supposé.

On distingue deux types d'alignements qui diffèrent suivant leur complexité :

  • l'alignement par paires qui consiste à aligner deux séquences peut être réalisé grâce à un algorithme de complexité polynomiale. Il est possible de réaliser un alignement :
    • global, c'est-à-dire entre les deux séquences sur toute leur longueur (FASTA)
    • local, entre une séquence et une partie de l'autre séquence (BLAST)
  • l'alignement multiple, qui est un alignement global, consiste à aligner plus de deux séquences et nécessite un temps de calcul et un espace de stockage exponentiels en fonction de la taille des données.

Un alignement de séquence réalisé par ClustalW entre deux protéines humaines.

Un alignement de séquence réalisé par ClustalW entre deux protéines humaines.

Exemple

Soit les séquences S1 = { ACATT } et S2 = { AAGTT }, un alignement de S1 et S2 est par exemple :
 
            S1 :  A C A - T T 
            S2 :  A - A G T T 
     Consensus :  A . A . T T

Méthodes et algorithmes

Les alignements par paires peuvent être réalisés de manière totalement rationnelle, en utilisant les algorithmes de programmation dynamique. La méthode la plus utilisée est connue comme l'algorithme de Needleman-Wunsch (J Mol Biol. 1970 Mar;48(3):443-5) qui réalise le meilleur alignement global entre deux séquences. Pour obtenir un alignement local optimal, la méthode a été développée par Smith et Waterman (J Mol Evol. 1981;18(1):38-46). Des implémentations de ces algorithmes se retrouvent notamment dans la suite logicielle OpenSource , respectivement sous les noms 'needle' et 'water'.

Un article de Wikipédia, l‘encyclopédie libre. Liens externes. Tous les textes sont disponibles sous les termes de la GNU Free Documentation License Liens externes.