PIB1: Création d’un outil d’alignement multiple basé sur mapping
- Unité d’accueil : IMBE (Institut Méditerranéen de Biodiversité et d'Ecologie)
- Nom de l’encadrant : Emese Meglecz
- Courriel de l’encadrant : Cette adresse email est protégée contre les robots des spammeurs, vous devez activer Javascript pour la voir.
- Bref descriptif :
La plupart des outils d’alignement multiple sont peu efficaces pour les alignements d’un très grand nombre des séquences. De plus si le jeu de données contient quelques séquences mal orientés, divergentes ou non-homologues, les alignements ont tendance à contenir de nombreux gaps.
Le but de ce PIB sera de créer un outil d’alignement multiple qui écarte les séquences distantes et aligne les séquences mal orientées sur la base des positions du mapping des séquences sur des pseudo-références.
L’algorithme est déjà établi et nécessite seulement quelques ajustements. Les scripts en Perl sont disponibles et devraient être traduits/adaptés à Python pour faire un outil facilement utilisable.
- Compétences techniques attendues (langage de programmation, outils imposés, etc.) :
* Python, SnakeMake
