Se propone un curso introductorio a R, el mismo se apoyará en el GUI RStudio v1.2.1335 y en un conjunto de paquetes tales como dplyr, ggplot2, plotly, rmarkdown, entre otros. Dicho curso será dictado en el mes de agosto en conjunto con el Dpto. de Informática de la Facultad de Ciencias Exactas, Naturales y Agrimensura perteneciente a la Universidad Nacional del Nordeste.
Al finalizar el curso, el participante deberá ser capaz de:
- Usar R en modo interactivo y haberse familiarizado con el uso de Rstudio.
- Conocer y aplicar buenas prácticas en el uso de R.
- Reconocer las estructuras de datos y de control básicas de R y utilizar la más adecuada para cada situación.
- Instalar y utilizar paquetes, además de conocer la organización de paquetes en R.
- Comprender la conveniencia de utilizar scripts y ser capaz de elaborarlos y utilizarlos.
- Manipular de manera básica un conjunto de datos: lectura, limpieza y ordenamiento de datos.
- Elaborar gráficos utilizando el paquete ggplot2 y plotly
- Lic. en Sistemas y estudiante de Maestría en Tecnologías de la Información: Patricia A. Loto
Cada encuentro constará de la exposición de contenidos teóricos y luego se realizarán prácticas para aplicar dichos contenidos. El curso tendrá un mínimo de 6 y un máximo de 15 asistentes, para asegurar que los estudiantes puedan tener suficiente interacción con los instructores y otros estudiantes, y de esta manera facilitar el aprendizaje y el trabajo colaborativo.
Primer encuentro: Instalación de R y RStudio. ¿Qué es R? Principales características del lenguaje. Aplicaciones y casos de uso. Entorno de trabajo de Rstudio. Elementos de la sintaxis de R. Tipos de datos: datos atómicos, vectores, matrices, dataframes, factores y listas. Operadores. Estructuras de control: if, while, repeat. Funciones. Scripts en R y flujo de trabajo. Paquetes: ¿qué es un paquete? Para que sirven y cómo utilizarlos. Importación de datos en R desde diferentes fuentes. Exploración básica de datos. Ejercicios Prácticos.
Segundo encuentro: Manipulación básica de datos con el paquete dplyr. Funciones filter(), select(), arrange(), summarise(), mutate(), rename(), entre otras. El uso del operador pipe (%>%). Introducción a la gramática de gráficos (Grammar of graphics). Importancia de una visualización efectiva. Función qplot y ggplot. Tipos de gráficos. Gráficos estáticos con ggplot2. Gráficos dinámicos con plotly. Ejercicios Prácticos.
A medida que se avance con el contenido teórico se subirá la práctica correspondiente. Para realizar la parte práctica se utilizará el dataset gapminder del paquete datos, el cual consiste en un conjunto de datasets traducidos del libro R para Ciencia de Datos.
Estudiantes y profesionales de Sistemas y todo aquel que tenga interés en utilizar el lenguaje R con el objetivo de visualizar y realizar una exploración básica de datos.
Dos encuentros de 3 horas cada uno.
- Última versión de R: https://cran.r-project.org/bin/windows/base/
- Para descargar Rstudio: https://www.rstudio.com/products/rstudio/download
- Cheatsheets de Rstudio: https://www.rstudio.com/resources/cheatsheets/
- Webinarios de Rstudio: https://resources.rstudio.com/
- Dataset: https://github.com/cienciadedatos/datos
- Para seguir aprendiendo: http://faculty.washington.edu/kenrice/heartgraphs/
- Wickham, H; Grolemund, G. (2017) R for data science. Import, Tidy, Transform, Visualize, and Model Data. O’Reilly. Disponible en español: https://es.r4ds.hadley.nz/. En inglés: https://r4ds.had.co.nz/
- Santana, J S; Farfán, E M.(2014) El arte de programar en R. Un lenguaje para la estadística. UNESCO. Disponible en: https://cran.r-project.org/doc/contrib/Santana_El_arte_de_programar_en_R.pdf
- Grolemund, G. (2014) Hands on Programming with R. Write your own functions and simulations. O’Reilly
- Teutónico, D. (2015) Ggplot2 Essentials. Packt Publishing
- Venables, W N; Smith, D M and the R Core Team. (2018) An introduction to R. Notes on R: A Programming Environment for Data Analysis and Graphics Version 3.5.1 (2018-07-02). Disponible en: https://cran.r-project.org/doc/manuals/R-intro.pdf
- Wickham, H. (2016) ggplot2 Elegant graphics for data analysis. Springer