El proyecto internacional COST Grapedia, en el que participa el Instituto de Biología Integrativa de Sistemas (I2SysBio, CSIC-UV), ubicado en el Parc Científic de la Universitat de València (PCUV), consigue completar las versiones 4 y 5 del genoma de referencia de la vid (vitis vinifera) en las que se encuentran una gran cantidad de genes relacionados con la respuesta al estrés por plagas, por la falta de agua o genes determinantes de la capacidad aromática de los frutos. La información obtenida permitirá diseñar el viñedo del futuro más resistente al cambio climático que amenaza gravemente a la industria del vino. Estos trabajos han sido publicados en las revistas Horticulture Research y G3 Genes|Genomes|Genetics.
La iniciativa, coordinada por el investigador del Programa Ramón y Cajal de la Universitat de València y el I2SysBio (CSIC – UV), José Tomás Matus y financiado por la Oficina Europea COST (Cooperation in Science and Technology), desvela una versión completa del genoma de la vid. Si bien la secuenciación de la vid se completó, por primera vez, en 2007, esta primera versión y las que le siguieron estaban incompletas, con muchas regiones aún desconocidas. Muchos de estos fragmentos del genoma, que ahora han sido correctamente ensamblados, corresponden a regiones centroméricas y teloméricas (es decir, del centro y los extremos de los cromosomas), que estaban constituidas de un considerable número de repeticiones que hacía difícil su lectura, motivo por el cual no se tenían en versiones anteriores del genoma.
Contar con la mejor versión de un genoma abre las puertas a conocer el 100% de los genes de una especie. Ahora, y gracias a esta investigación, se podrá estudiar la función de todos ellos y se podrá asociar a caracteres de interés para la industria vitivinícola, mediante la utilización de herramientas de la biología computacional. En este sentido, la mejora genética, mediante métodos tradicionales (breeding), también se verá favorecida.
Si bien la secuenciación de la vid se completó, por primera vez, en 2007, esta primera versión y las que le siguieron estaban incompletas, con muchas regiones aún desconocidas
Versiones 4 y 5 del genoma de la vid
La versión 4 del genoma demostró el pedigrí del cultivo utilizado llamado PN40024. Inicialmente se creía que correspondía a la variedad Pinot Noir, cruzada nueve veces por endogamia, el análisis genómico posterior demostró que era en realidad la variedad Helfnsteiner (un cruce entre Pinot Noir y Schiava Grossa). Esta versión también permitió generar un recurso muy valorado: una anotación de todos los genes del genoma manualmente curada por miembros de la comunidad científica. Con la versión 5 del genoma, podemos decir hoy que tenemos la secuencia completa del genoma de la vid.
La tecnología empleada se basa en la secuenciación de fragmentos largos (long read sequencing). Se trata de una técnica de secuenciación de ADN que permite secuenciar fragmentos de ADN mucho más largos que los métodos tradicionales de secuenciación de lectura corta. Mientras que la versión 4 utiliza la tecnología estándar de PacBio de secuencias largas, la versión 5 utiliza la tecnología HIFi o de alta fidelidad. Las lecturas HiFi se producen utilizando el modo de secuenciación por consenso circular en los sistemas de lectura larga PacBio. Las lecturas de alta fidelidad proporcionan una alta resolución con una precisión de lectura de una sola molécula del 99,9 %.
Proyecto COST Grapedia
Los dos trabajos científicos han sido desarrollados en el marco del proyecto COST Grapedia, una base de datos federativa propuesta como una plataforma de acceso abierto destinada a abordar los desafíos en el acceso y utilización de los datos genéticos, ómicos y de fenotipado relacionados con la vid.
En este sentido, el Jardín Botánico de la Universitat de València ha acogido esta semana, desde el lunes 11 hasta el miércoles 13, la reunión anual de Grapedia, organizada por José Tomás Matus. Investigadores internacionales que han contribuido al proyecto y con valiosa experiencia sobre bases de datos y datos FAIR se han dado cita en un evento que ha tenido acceso libre y se ha podido seguir online.
La tecnología empleada se basa en la secuenciación de fragmentos largos (long read sequencing). Se trata de una técnica de secuenciación de ADN que permite secuenciar fragmentos de ADN mucho más largos que los métodos tradicionales de secuenciación de lectura corta
Los autores de estas dos publicaciones científicas forman parte de un consorcio formado por varios institutos, que incluyen, además de al I2SysBio, el Instituto Nacional para la Investigación Agronómica de Francia (INRAE, por sus siglas en francés), la Academia China de Ciencias Agrícolas, y el Centro de Investigación y Tecnología Agroalimentaria de Aragón, entre otras.
Noticia