Sesión N° 4
Análisis de datos estadísticos en R
Profesora Valentina Andrade de la Horra
Ayudantes Dafne Jaime y Nicolás Godoy
Universidad Diego Portales
Importar y exportar datos
Importar y exportar datos
Validación y limpieza datos
Importar y exportar datos
Validación y limpieza datos
Selección de variables
-import
(1) Instalar paquetes (ìnstall.packages()
)
(2) Llamar paquetes (library()
). Veamos su paso a paso
pacman
pacman
es un paquete que literalmente se comió procesos de R base
y las simplificó en funciones únicas y más intuitivas. p_load()
library()
e install.packages()
requiere()
), es decir, ¡no te reinicia R si ya está instalada la librería!pacman::p_load(tidyverse, magrittr, car, sjmisc)
Una vez que hemos decidido qué datos queremos trabajar
Una vez que hemos decidido qué datos queremos trabajar
Un paso evidente es cargar los datos
Una vez que hemos decidido qué datos queremos trabajar
Un paso evidente es cargar los datos
¡Y en R no es la excepción! De hecho, hablamos que R facilita el almacenaje de datos
Para importar los datos en R debemos tener en consideración tres cosas:
Cómo se llaman los datos (en nuestro caso Casen en Pandemia 2020 STATA)
El formato de nuestros datos (en nuestro caso .sav)
El lugar de donde están alojados nuestros datos.
Datos: Encuesta de Caracterización Socioeconómica (CASEN) (2020).
Para ello, deben dirigirse al siguiente enlace y descargar los zip.
pacman
: este facilita y agiliza la lectura de los paquetes a utilizar en R
sjmisc
: explorar datos
tidyverse
: colección de paquetes, del cuál utilizaremos dplyr
y haven
haven
: cargar y exportar bases de datos en formatos .sav y .dta
readxl
y writexl
: para cargar y exportar bases de datos en formato .xlsx y .xls
dplyr
: nos permite seleccionar variables de un set de datos
Para importar los datos en R debemos tener en consideración tres cosas:
1. 2. 3.
Clase | Tipo de variable |
---|---|
numeric |
Cuantitativa |
character |
Categórica |
Logic |
Lógica (TRUE, FALSE, NA) |
factor |
Categórica con niveles y etiquetas |
Clase | Tipo de variable |
---|---|
numeric |
Cuantitativa |
character |
Categórica |
Logic |
Lógica (TRUE, FALSE, NA) |
factor |
Categórica con niveles y etiquetas |
A repasar con dos materiales complementarios: Tipos de variables y Tipos de variables
Importar y exportar datos
Importar y exportar datos
Validación y limpieza datos
Importar y exportar datos
Validación y limpieza datos
Selección de variables
¿Y eso era?
¿Y eso era?
¡Antes! Dos bonus track
¿Cómo hacer mi propio repositorio en GitHub?
¡Vamos a verlo!
funcion(url("ruta_web"))
¿Cómo cargar datos desde una url?
funcion(url("ruta_web"))
Quienes averiguen como cargar datos con url tendrán +0.5 décimas para la tarea N°2.
#tareas
¡Ahora si que si! Nos vemos el próximo lunes en la clase N°4
No olvides hacer el práctico antes
Clase N°3
Análisis de datos estadísticos en R
Profesora Valentina Andrade de la Horra
Ayudantes Dafne Jaime y Nicolás Godoy
Universidad Alberto Hurtado
Keyboard shortcuts
↑, ←, Pg Up, k | Go to previous slide |
↓, →, Pg Dn, Space, j | Go to next slide |
Home | Go to first slide |
End | Go to last slide |
Number + Return | Go to specific slide |
b / m / f | Toggle blackout / mirrored / fullscreen mode |
c | Clone slideshow |
p | Toggle presenter mode |
t | Restart the presentation timer |
?, h | Toggle this help |
o | Tile View: Overview of Slides |
s | Toggle scribble toolbox |
Esc | Back to slideshow |
Sesión N° 4
Análisis de datos estadísticos en R
Profesora Valentina Andrade de la Horra
Ayudantes Dafne Jaime y Nicolás Godoy
Universidad Diego Portales
Importar y exportar datos
Importar y exportar datos
Validación y limpieza datos
Importar y exportar datos
Validación y limpieza datos
Selección de variables
-import
(1) Instalar paquetes (ìnstall.packages()
)
(2) Llamar paquetes (library()
). Veamos su paso a paso
pacman
pacman
es un paquete que literalmente se comió procesos de R base
y las simplificó en funciones únicas y más intuitivas. p_load()
library()
e install.packages()
requiere()
), es decir, ¡no te reinicia R si ya está instalada la librería!pacman::p_load(tidyverse, magrittr, car, sjmisc)
Una vez que hemos decidido qué datos queremos trabajar
Una vez que hemos decidido qué datos queremos trabajar
Un paso evidente es cargar los datos
Una vez que hemos decidido qué datos queremos trabajar
Un paso evidente es cargar los datos
¡Y en R no es la excepción! De hecho, hablamos que R facilita el almacenaje de datos
Para importar los datos en R debemos tener en consideración tres cosas:
Cómo se llaman los datos (en nuestro caso Casen en Pandemia 2020 STATA)
El formato de nuestros datos (en nuestro caso .sav)
El lugar de donde están alojados nuestros datos.
Datos: Encuesta de Caracterización Socioeconómica (CASEN) (2020).
Para ello, deben dirigirse al siguiente enlace y descargar los zip.
pacman
: este facilita y agiliza la lectura de los paquetes a utilizar en R
sjmisc
: explorar datos
tidyverse
: colección de paquetes, del cuál utilizaremos dplyr
y haven
haven
: cargar y exportar bases de datos en formatos .sav y .dta
readxl
y writexl
: para cargar y exportar bases de datos en formato .xlsx y .xls
dplyr
: nos permite seleccionar variables de un set de datos
Para importar los datos en R debemos tener en consideración tres cosas:
1. 2. 3.
Clase | Tipo de variable |
---|---|
numeric |
Cuantitativa |
character |
Categórica |
Logic |
Lógica (TRUE, FALSE, NA) |
factor |
Categórica con niveles y etiquetas |
Clase | Tipo de variable |
---|---|
numeric |
Cuantitativa |
character |
Categórica |
Logic |
Lógica (TRUE, FALSE, NA) |
factor |
Categórica con niveles y etiquetas |
A repasar con dos materiales complementarios: Tipos de variables y Tipos de variables
Importar y exportar datos
Importar y exportar datos
Validación y limpieza datos
Importar y exportar datos
Validación y limpieza datos
Selección de variables
¿Y eso era?
¿Y eso era?
¡Antes! Dos bonus track
¿Cómo hacer mi propio repositorio en GitHub?
¡Vamos a verlo!
funcion(url("ruta_web"))
¿Cómo cargar datos desde una url?
funcion(url("ruta_web"))
Quienes averiguen como cargar datos con url tendrán +0.5 décimas para la tarea N°2.
#tareas
¡Ahora si que si! Nos vemos el próximo lunes en la clase N°4
No olvides hacer el práctico antes
Clase N°3
Análisis de datos estadísticos en R
Profesora Valentina Andrade de la Horra
Ayudantes Dafne Jaime y Nicolás Godoy
Universidad Alberto Hurtado