Bioestadística

Doctorado en Cs. Biomédicas, UMRPSFXC.

Santiago Benitez-Vieyra

Bioestadística (práctico).

Diseños metodológicos y su aplicación en el campo.

Bioestadística: Objetivos del curso.

  • Brindar conceptos básicos de predicción y explicación mediante modelos estadísticos.
  • Adquirir destreza en el uso del lenguaje R para su uso en estadística básica y gráficos, así como nociones de programación.
  • Desarrollar una visión global de una amplia clase de modelos estadísticos, incluyendo:
    • Modelos lineales generales.
    • Modelos lineales randomizados.
    • Modelos nulos.
    • Bootstrap.
  • Adquirir herramientas para la representación gráfica de estos modelos.

Introducción al Lenguaje R.

¿Por qué un lenguaje?

f01

f02

Resumen:

  • Hay conceptos confusos en chino
  • Hay chinos que conocen mi apellido
  • Entre latín y chino, latín.

R es un lenguaje para comunicar análisis estadísticos y gráficos y también para programar nuevos métodos.

Lenguaje para construir una rutina de análisis.

library(vegan)
dat <- read.table("/home/santiago/mandevilla.txt", header = TRUE)

## multidimensional scaling
m1 <- metaMDS(dat2, dist = "bray", k = 2)
m1

## figura
plot(m1, "sites", type = "n") 
points(m1$points[,1],
       m1$points[,2],
       pch = c(rep(1, 4), rep(19, 4), rep(19, 3),
               rep(1, 5), rep(19, 4), rep(1, 4)), 
       col = c(rep("blue4", 4), rep("blue4", 4), rep("red4", 3), 
      rep("red4", 5), rep("green4", 4), rep("green4", 4)))

## agregar compuestos
points(m1, "species", pch = 2, cex = 0.7)
## agregar nombres de compuestos
text(m1$species[, 1], m1$species[, 2] - 0.1, colnames(dat2), cex = 0.6)

## anosim
tipo <- as.factor(c(rep("hib", 8), rep("lax", 8), rep("pen", 8)))
a1 <- anosim(dat = dat2, grouping = tipo, distance = "bray", permutations = 9999)
summary(a1)
perm <- permustats(a1)
densityplot(perm)
plot(a1)

Escribir cartas.

Hi!
I’m trying to use the map.overlap function of the R package phytools to compute the fraction of stochastic character mapping that is shared by two trees (I basically want to obtain a quantitative value that tells me if there is correlative evolution between an adaptive strategy and a trait). But the function map.overlap does not accept my two stochastic chatacter mappings.

I did

pollinator.map <- make.simmap(tree, pol, model="ER")
flower.trait.map <- make.simmap(tree, flower, model="ER")
class(flower.trait.map) <- "phylo"
class(pollinator.map) <- "phylo"
overlap.pol.flower <- map.overlap(pollinator.map, flower.trait.map)

But get this error message..

Error in tabulate(phy$edge[, 1]) : 'bin' must be numeric or a factor*

Guardar las instrucciones de un gráfico.

library(hdrcde)
x <- c(rnorm(200,0,1),rnorm(200,4,1))
y <- c(rnorm(200,0,1),rnorm(200,4,1))
par(mfrow=c(1,2))
plot(x,y, pch= "+", cex=.5)
hdr.boxplot.2d(x,y)

Publicar la rutina de análisis.

sup

Publicar un paquete.

sup

Publicar un paquete.

sup

Escribir libros…

sup

Usted puede usar R para que su investigación sea REPRODUCIBLE

  • Métodos cuidadosamente descriptos
  • Datos de libre disponibilidad
  • Análisis estadístico reproducible

creadores de R

Ross Ihaka y Robert Gentleman

R Core Team

Douglas Bates (USA), Roger Bivand (Norway), John Chambers (USA), Peter Dalgaard (Denmark) Dirk Eddelbuettel (USA), John Fox (Canada), Robert Gentleman (USA), Bettina Grün (Austria), Frank Harrell (USA), Kurt Hornik (Austria), Torsten Hothorn (Switzerland), Stefano Iacus (Italy), Ross Ihaka (New Zealand), Michael Lawrence (USA), Friedrich Leisch (Austria), Uwe Ligges (Germany), Thomas Lumley (USA, New Zealand), Martin Mächler (Switzerland), Martin Morgan (USA), Duncan Murdoch (Canada), Paul Murrell (New Zealand), Martyn Plummer (France), Brian Ripley (UK), Deepayan Sarkar (India), Marc Schwartz (USA), Duncan Temple Lang (USA), Luke Tierney (USA), Heather Turner (UK), Simon Urbanek (Germany, USA), Bill Venables (Australia), Hadley Wickham (USA), Achim Zeileis (Austria).

Paquetes

Repos

CRAN

¿Dónde buscar?

¿Por qué usar R?

  • Es el software más abarcativo.
  • Más de 9500 paquetes específicos.
  • Excelentes posibilidades gráficas.
  • Comunidad de usuarios y programadores para consultar
  • Lenguaje abierto.
  • Adquirir habilidades de programación.
  • Es libre y gratuito, pude ser copiado, distribuido y modificado a voluntad.

Interfaces Gráficas de Usuario (GUI).

El lenguaje R y el software donde lo visualizamos son dos cosas diferentes.

Contenidos del curso.

  • Lunes.
    • Funciones básicas de R. Modelos Lineales y diagnóstico gráfico.
    • Predicción: datos de entrenamiento y prueba.
  • Martes.
    • Selección de variables, selección de modelos y regularización.
  • Miércoles.
    • Manejo de gráficos básicos.
    • Introducción a los paquetes lattice y ggplot2.
  • Jueves.
    • Introducción a la programación.
    • Modelos nulos y modelos lineales randomizados.
  • Viernes.
    • Bootstrap.
    • Presentaciones a acrgo de los alumnos.

FIN