Professional Documents
Culture Documents
#############################
# Programa para calcular las medidas descriptivas de un conjunto de datos.
# tambin se dibuja el histograma, el diagrama de tallos y hojas y el box-plot.
# Nota: Pra aejecutar una linea parece al comienzo de esta y pulse la tecla F5
# Tambien puede usar Ctrl R (pulse las dos teclas simultneamente)
# Si quiere ejecutar varias lineas, marquelas y despues F5.
###############################################
##############################
##################################
# Estadsticos de resumen
##################################
length(x)
sum(x)
mean(x)
median(x)
# calcula la mediana. El valor de la variable que corresponde al
elemento central de la distribucin.
var(x)
# calcula la varianza.
sd(x)
# clacula la desviacin estndar. Miden la dispersin de los valores
de la variable respecto a la media aritmtica.
quantile(x) # calcula los cuantiles. Dividen la distribucin de frecuencias en
cuatro partes con igual nmero de observaciones.
fivenum(x) # Resumen de 5 nmeros: min., Q1, mediana, Q3 y max.
IQR(x)
summary(x)
# La media recortada al 5%
mean(x,trim=5/100)
# Otros cuantiles.
quantile(x,c(0.1,0.9))
quantile(x,c(0.05,0.95))
quantile(x,c(0.025,0.975))
quantile(x, probs=c(0.25,0.75))
###############################################
###################
# Algunas funciones de uso general.
###############################################
###################
###############################################
##############
# Funciones generadas por el usuario
###############################################
##############
# "function" es la instruccin para crear una funcin. La "x" que le sigue es
# el argumento de la funcin y entre llaves est lo que la funcin hace con el
# argumento.
desvia<-function(x)x-mean(x)
desvia <- function(x) {
x - mean(x)
}
desvia(x)
###############################################
######################
# Un ejemplo pequeo de cmo hacer una funcin en R.
###############################################
######################
desest<-function(x)
{
m=mean(x)
sum<-0
for(i in 1:length(x))
{
sum=sum+(x[i]-m)^2
}
var<-sum/(length(x)-1)
des<-sqrt(var)
cv<-des/m
return(list(media=m, varianza=var, desviacin_estndar=des,
coeficiente_de_variacin=cv))
}
desest(x)
quantile(x)
matrix(x, nc=3)
###############################################
#####################################
# Ahora se importan datos desde un formato .txt. Estos corresponden a
# los datos del ejemplo 1.3 (pg 41 del libro de Navidi). Los datos estn
tambin
# en Excel. De ahi fueron exportados como texto delimitado por tabulaciones
(.txt)
# para ser leidos despues en R.
###############################################
######################################
# Instruccin para
datos
win.graph()
plot(table(datos), type="h", lwd=10, main="datos emision") # Diagrama de
barras para una variable numrica discreta.
#win.graph()
#par(mfrow=c(2, 3))
##################################
# FUNCIONES GRFICAS BSICAS
##################################
stem(Emision)
plot(Emision, col="red")
puntos, lineas, etc.
# Histogramas.
win.graph()
hist(Emision, xlab="Emisin de partculas (g/gal)", ylab="Frecuencia",
main="Histogram de frecuencias absolutas") # Calcula el histograma de
frecuencias
?hist # Para revisar que otras opciones se pueden incluir en el clculo del
histograma
win.graph()
pie(Emision, labels = names(Emision), col= c(2,5,4,3)) # Diagrama de
sectores.
###############################################
######################################
#BOX PLOT: grafico de caja, Ubica los cuartiles y pinta una caja entre el 1 y el 3
#en esta se pude ver la media, la mediana, el rango intercurtil, la forma y se
usa una regla de los 1.5 rangos intecuertilicos.
###############################################
########################################
win.graph()
boxplot(Emision)
# Grafica el Box and Wisker Plot (Diagrama de Caja y
Bigotes). Visualiza la dispersin de una distribucin en base a los 5 valores:
mnimo, Q1, Me, Q3 y valor mximo.
win.graph()
boxplot (Emision, horizontal=TRUE, col="blue") # Box plot horizontal y con
color.
###############################################
#######################################
# INSTALACIN DE PAQUETES
# Si queremos instalar el paquete ISwR, procedemos a ubicarlo con Cran
mirror y luego seleccionamos el pas y la ciudad,
# si hay especificaciones, de donde lo queremos bajar. En este caso usamos la
funcin library(ISwR) para carga el paquete ISwR.
###############################################
######################################
library(ISwR)
?thuesen # Muestra la ayuda donde dice que el data frame thuesen tiene 24
filas y 2 columnas. Contiene la velocidad de la glucosa ventricular y de sangre
glucosa para los pacientes del diabtico del tipo 1.
data(thuesen)
attach(thuesen)
#permite usar las variables de la base de datos. Llama los
datos que estn en la base de datos thuesen.
win.graph()
plot(blood.glucose,short.velocity)
especificaciones.
win.graph()
plot(blood.glucose,short.velocity,main="Grafico de Elias",sub="Clase 21 de
agosto") # A este grfico se le introdujo un nombre y un subttulo.
detach(thuesen)
data(airquality)
?airquality
# La ayuda dice que son medidas diarias de la calidad del aire
en Nueva York, de mayo a septiembre de 1973.
ca=edit(airquality) # Su funcin es editar los datos contenidos en airquality.
Permite editar visualmente el contenido de una data frame.
ca
dd=data.frame(airquality) # Crea una tabla datos.
dd
ca=edit(dd)
usuario.
a=fix(dd)
vaca.
a
data(thuesen)
thue2=subset(thuesen,blood.glucose<7)
thue2
thue3=transform(thuesen,log.gluc=log(blood.glucose)) # crea una nueva
variable a partir de las que estn dentro de thuesen, en este caso trabaja con
el logaritmo de la variable blood.glucose.
thue3
###############################################
###################
#Ahora instalamos el paquete "car"
###############################################
###################
?car
# Este paquete acompaa el J. Fox, An R y S-PLUS compaero para
regresin aplicada, sabio, 2002. El paquete contiene sobre todo las funciones
para la regresin aplicada, los modelos lineares y los modelos lineares
generalizados, con nfasis en diagnsticos de la regresin, particularmente los
win.graph()
hist(m)
#dibuja un histograma, presenta la grfica de la frecuencia de
los datos ordenados en clases.
win.graph()
hist(m,nclass=10) #dibuja un histograma usando aproximadamente 10
barras.
win.graph()
hist(m,nclass=5)
win.graph()
hist(m,nclass=5,freq=F)
curve(dnorm(x),add=T, col="red")
histograma anterior.
win.graph()
hist(m,nclass=5,freq=F,ylim=c(0,0.4)) # modifica el histograma para ajustarlo
a la curva normal. Trabaja con la frecuencia relativa.
curve(dnorm(x),add=T, col="blue")
P=c(1,2,3,5)
y=c(1,1,1,1)
barplot(y, names.arg = P, main = "Diagrama de Barras", col=c(2,3,4,5),xlab=
"Poblacin", ylab="Frecuencias")
y2 = c(1,2,3,2, 3, 3,2,1)
x2 <- c(1,1.5, 2,2.5,3,3.5, 4,5)
win.graph()
barplot(y2, names.arg = x2, main = "Diagrama de Barras", xlab= "Medias",
ylab="Frecuencias")
win.graph()
barplot(y3, names.arg = x3, main = "Diagrama de Barras", xlab= "Medias",
ylab="Frecuencias")
win.graph()
barplot(y4, names.arg = x4, main = "Diagrama de Barras", xlab= "Medias",
ylab="Frecuencias")