Comparación de medidas de distancias entre individuos usando perfiles RAPD individuales Case Study uri icon

Resumen

  • El objetivo de este trabajo es comparar estadísticamente distintas métricas que pueden ser utilizadas para estimar distancias entre individuos, desde perfiles de marcadores RAPD. Se trabaja con medidas de distancias obtenidas desde la transformación de índices de similitud para datos binarios. A modo de ilustración se compara 8 aislamientos de Fusarium moniliforme afectando cultivos de sorgo y maíz en Argentina, mediante los patrones de bandas producidos por un primer. Se construyen las matrices de distancias para 16 métricas diferentes y se evalúa la congruencia entre las configuraciones producidas por las estructuras de distancias alternativas. La información relevante para establecer distancias entre dos observaciones multivariadas binarias se encuentra en los conteos a, d, y (b+c) asociados respectivamente con los eventos de co-presencia, co-ausencia y polimorfismo de productos de amplificación en cada sitio del genoma que se esta comparando. Se concluye que las medidas de distancia estudiadas deben agruparse de la siguiente forma: Grupo A (asimétrico en a y d): Jaccard, Occhiai, Anderberg, Dice, Braun-Blanquet, Kulczynski, Sokal&Sneath3; Grupo B (simétrico en a y d): Emparejamiento Simple, Hamman, Roger-Tanimoto y Sokal&Sneath1; Grupo C (multiplicativo en a y d): coeficiente Phi y Sokal&Sneath2 y Yulle&Kendall; Grupo D: Emparejamiento Positivo y Excoffier. Las medidas del grupo A son especialmente recomendadas para comparar perfiles RAPD individuales.
  • The objective of this study is to compare statistically different measures that may be used to estimate distance measures among individuals from profiles of RAPD markers. We work with distance measures obtained from the conversion of similarity indices for binary data. For example, eight isolates of Fusarium moniliforme obtained from Argentine sorghum and maize were compared in this work. The matrix of distance was constructed to compare 16 different measures and to evaluate the congruence between configurations obtained from alternative distance structures. The relevant information to establish distance between two binary multivariate observations is found in the a, b and (b+c) counts associated respectively with the events of co-presence, co-absence and polymorphic amplification product in each site in the genome that is compared. We conclude that the measures should be clustered in the following form: Group A (asymmetric in a and d):, Jaccard, Occhiai, Anderberg, Dice, Braun-Blanquet, Kulzcynski and Sokal&Sneath3, Group B (symmetric in a and d) Roger&Tanimoto, Simple Matching, Hamman and Sokal&Sneath1; Group C (multiplicative in a and d): Phi Coefficient, Sokal&Sneath2 and Yule&Kendall; Group D. Positive Matching and Excoffier. The measure of Group A are specially recommended to compare RAPD individuals profiles.

Fecha de publicación

  • 2002