Aneta Sawikowska
Se presentan análisis de datos completos para datos lc-ms de alto rendimiento. Se muestran métodos de análisis estadístico e integración para experimentos multifactoriales. Los conjuntos de datos de ejemplo provienen de estudios sobre la respuesta de los cereales a la infección por patógenos y la cebada (Hordeum vulgare) bajo estrés por sequía. Se analizaron metabolitos primarios, metabolitos secundarios y proteínas.
El preprocesamiento, análisis y visualización de los datos se realizó en el sistema R. Los análisis estadísticos se realizaron utilizando procedimientos del paquete Genstat. Se presentan métodos de integración y visualización de datos ómicos mediante redes.
Las redes de correlación y las redes de correlación diferencial se construyeron para comparar las relaciones entre metabolitos y proteínas en diferentes condiciones. Los rasgos se representan mediante nodos, las líneas (bordes) corresponden a las correlaciones entre los pares de rasgos. Se detectan módulos: grupos con rasgos altamente correlacionados. Se indican los centros, que son rasgos con muchas conexiones (correlaciones con otros rasgos).
El análisis de redes de correlación se realizó utilizando el paquete WGCNA en R, la matriz de correlación de Pearson se transformó en una matriz de adyacencia utilizando una función de potencia. Los módulos se detectaron mediante clusterización. Las redes de correlación diferencial se crearon utilizando la prueba basada en la transformación Z de Fisher, con corrección de Bonferroni. La visualización de las redes se realizó en Cytoscape.
Los algoritmos se pueden adaptar a cualquier dato lc-ms de alto rendimiento.