R es un lenguaje utilizado para análisis estadísticos, gráficos y programación. Puede ser copiado y distribuido de forma gratuita y permite que los usuarios estudien como funciona, lo modifiquen de acuerdo a sus necesidades y publiquen sus mejoras y extensiones para ser compartidas con otros usuarios.
R es actualmente el software que ofrece mayor número de funciones estadísticas y aplicaciones para la creación de gráficos. Colaboradores producen paquetes destinados a resolver problemas particulares o desarrollan determinadas técnicas estadísticas. Cada usuario puede, además, crear sus propias funciones y rutinas combinando las funciones existentes.
Existe una amplia comunidad de usuarios y por lo tanto, una gran oferta de ayudas para aquellos que se inician en el uso del programa, incluyendo foros de discusión en internet, grupos de usuarios y una profusa bibliografía.
Para quienes trabajamos en ciencias, R es una lingua franca para el intercambio y la difusión de ideas. De la misma manera en que se escribe un artículo para comunicar ideas, pueden escribirse rutinas para comunicar un análisis. Como lenguaje, R asegura la reproduciblidad de los análisis: un registro completo de los procedimientos que se siguieron, permitiendo repetir los análisis después.
Para finalizar, y tal vez lo más importante, el aprendizaje de R tiene un gran componente lúdico, fomenta la capacidad de análisis y la creatividad.
Las rutinas de una investigación científica pueden ser separadas en dos grandes categorías (Mislan et al. 2016).
En este curso las rutinas aparecen incrustadas en la página web y pueden reconocerse por su distinta tipografía y por estar en recuadros. Por comodidad utilizaremos RStudio como interfaz gráfica de usuario (GUI) para ejecutar la rutinas, pero resaltando siempre su naturaleza de lenguaje, independiente del soporte donde es ejecutado. A partir de 2015 todo el material de este curso está disponibles en forma abierta en el repo https://github.com/santiagombv/cursoR y en la página http://santiagombv.github.io/cursoR/.
Este curso está orientado al análisis de datos biológicos,
particularmente en el ámbito de la ecología y evolución. Por lo tanto,
no se dedicará demasiado tiempo a la manipulación y preparación de
datos. El objetivo de este curso es brindar las capacidades para
realizar una rutina de análisis estadístico, aplicando conocimientos de
modelos lineales, manejos de gráficos y programación.
El contenido teórico de este curso comprende introducción al aprendizaje
estadístico supervisado, modelos lineales generales, selección de
modelos y regularización, y métodos de remuestreo (bootstrap y
permutaciones). También aborda la construccíon de gráficos a través de
los paquetes graphics, lattice y, fundamentalmente,
ggplot2 y la construcción de funciones.
Ingresar a http://cran.r-project.org/
En download R for Windows - base, seleccionar la última versión
disponible de R (4.3.0 “Already Tomorrow” al momento de actualizar este
curso). Guardar el archivo R-4.3.0-win.exe en cualquier parte de la
computadora, ejecutarlo y seguir las instrucciones de instalación.
Descargar la última version de RStudio Desktop para el sistema operativo deseado (version gratuita) desde https://posit.co/download/rstudio-desktop/ y seguir las instrucciones de instalación.
Así se ven los paneles principales de RStudio con una rutina ya abierta. Características como el tamaño de fuente y los colores son personalizables.
Los paquetes de R son colecciones de funciones para un fin determinado, asociadas a su ayuda, un manual de referencia y, frecuentemente, a bases de datos y demostraciones de uso (llamadas vignettes).
En R-base seleccionar Paquetes - Instalar Paquetes (la computadora
debe estar conectada a internet). Alternativamente, en R Studio
seleccionar install en la pestaña packages.
Seleccionar el espejo CRAN desde donde se bajará el paquete.
Seleccionar un paquete de la lista desplegable.
En ambos casos, puede hacerse mediante instrucciones en la consola:
install.packages("nombre_del_paquete")
Los paquetes mismos deben actualizarse regularmente, particualrmente junto a los cambios en las versiones de R (recomiendo hacerlo al menos dos veces al año). Para esto, ejecute y posteriormente siga las instrucciones.
update.packages()
Para este curso, se requieren los siguientes paquetes que no son descargados de forma automática con la instalación de R, por lo que deberá instalarlos manualmente: arm, car, devtools, dplyr, glmnet, GGally, ggplot2, lattice, leaps, magrittr, MuMIn, patchwork, rgl, rmarkdown, sciplot, viridis y todas las dependencias necesarias.
La manera más práctica es el paquete installr y ejecutando
install.packages("installr")
library(installr)
updateR() #seguir las instrucciones que aparezcan
Dirigirse a Help - check for updates
.
Se recomienda fuertemente seguir este curso con una versión actualizada de R y RStudio. En caso de tener problemas con la actualización, desinstalar todas las versiones anteriores.
Añadir una fuentes de software desde “Software y actualizaciones” - “Otro Software”. Seleccionar “Añadir”. En la ventana que solicita la línea de APT completa del repositorio colocar:
deb https://cloud.r-project.org/bin/linux/ubuntu jammy-cran40/
En esta línea puede cambiar el espejo CRAN elegido por alguno de los listados en http://cran.r-project.org/ Por ejemplo http://cran.rstudio.com/bin/linux/ubuntu/ corresponde al espejo propio de RStudio. Puede cambiar también la distribución de Ubuntu empleada (jammy, focal, bionic, etc. indicada antes del -cran40).
Agregar una clave de seguridad al sistema (en caso de que esta opción “no funcione”, ver otras posibilidades en http://cran.r-project.org/). En la terminal ingresar:
sudo apt-key adv --keyserver keyserver.ubuntu.com --recv-keys E298A3A825C0D65DFD57CBB651716619E084DAB9
Instalar R desde terminal.
sudo apt-get update
sudo apt-get install r-base
Descargar la última version de RStudio Desktop (version gratuita) desde https://posit.co/download/rstudio-desktop/ y seguir las instrucciones de instalación.
Así se ven los paneles principales de RStudio con una rutina ya abierta. Características como el tamaño de fuente y los colores son personalizables.
Los paquetes de R son colecciones de funciones para un fin determinado, asociadas a su ayuda y, frecuentemente, a bases de datos y demostraciones de uso (vignettes).
La manera más práctica en Ubuntu es desde terminal.
sudo R
install.packages("nombre_del_paquete")
Para este curso, se requieren los siguientes paquetes que no son descargados de forma automática con la instalación de R, por lo que deberá instalarlos manualmente: arm, car, devtools,dplyr, glmnet, GGally, ggplot2, lattice, leaps, magrittr, MuMIn, patchwork, rgl, rmarkdown, sciplot, viridis y todas las dependencias necesarias.
Los paquetes mismos deben actualizarse regularmente, particualrmente junto a los cambios en las versiones de R. Para esto, ejecute y posteriormente siga las instrucciones.
update.packages()
Al agregar una fuente de software a la computadora, R se actualizará junto a todos los otros programas, automáticamente.
Se recomienda fuertemente seguir este curso con una versión actualizada de R y RStudio. En caso de tener problemas con la actualización, desinstalar todas las versiones anteriores.