You are on page 1of 6

R PROJECT

R es un lenguaje y entorno de programacin, creado en 1993 por Ross Ihaka y


Robert Gentleman del Departamento de Estadstica de la Universidad de
Auckland, cuya caracterstica principal es que forma un entorno de anlisis
estadstico para la manipulacin de datos, su clculo y la creacin de grficos.
CARACTERISTICAS
Lenguaje R Entre otras caractersticas dispone de:
* Almacenamiento y manipulacin de datos.
* Operadores para clculo sobre variables indexadas (Arrays), en particular
matrices.
* Una amplia, coherente e integrada Herramientas para anlisis de datos.
* Posibilidades grficas para anlisis de datos, que funcionan directamente sobre
pantalla o impresora.
* Un lenguaje de programacin bien desarrollado, simple y efectivo, que incluye
condicionales ciclos, funciones recursivas y posibilidad de entradas y salidas.
El trmino entorno lo caracteriza como un sistema completamente diseado y
coherente de anlisis de datos. Como tal es muy dinmico y las diferentes
versiones no siempre son totalmente compatibles con las anteriores. En la
introduccin a R no se hace mencin explcitamente a la palabra estadstica, sin
embargo mayoritariamente se utiliza R como un sistema estadstico, aunque la
descripcin ms precisa sera la de un entorno en el que se han implementado
muchas tcnicas estadsticas. Una diferencia fundamental de la filosofa de R, y
tambin de la de S, con el resto del software estadstico es el uso del objetos
(variables, variables indexadas, cadenas de caracteres, funciones, etc.) como
entidad bsica. Cualquier expresin evaluada por R se realiza en una serie de
pasos, con unos resultados intermedios que se van almacenando en objetos, para
ser observados o analizados posteriormente, de tal manera que se puede hacer
un anlisis sin necesidad de mostrar su resultado inmediatamente produciendo
unas salidas mnimas. Cada objeto pertenece a una clase, de forma que las
funciones pueden tener comportamientos diferentes en funcin de la clase a la
que pertenece su objeto argumento. Por ejemplo no se comporta igual una funcin
cuando su argumento es un vector que cuando es un fichero de datos u otra
funcin. R est disponible en varios formatos: en cdigo fuente est escrito
esencialmente para maquinas Unix y Linux, o como archivos binarios pre
compilados para W indows, Linux (Debian, Mandrake, RedHat, SuSe), M acintosh
y Alpha Unix.
Actualmente se encuentran disponibles 2337 librerias desarrollados en R, que
cubren multitud de campos desde aplicaciones Bayesianas, financieras,
graficacion de mapas, anlisis de datos espaciales, etc. Esto es lo que define R
como un entorno vivo, que se actualiza con frecuencia y que est abierto a la
mejora continua.
Una de las caractersticas ms importantes del lenguaje R es que permite al
usuario combinar en un solo programa diferentes funciones estadsticas para
realizar anlisis ms complejos. Adems los usuarios de R tienen a su
disponibilidad un gran nmero de programas escritos para S y disponibles en la
red la mayora de los cuales pueden ser utilizados directamente con R.
IMPLEMENTACION
En su aspecto R puede considerarse como otra implementacin del lenguaje de
programacin S, con la particularidad de que es un software GNU, General Public
Licenc (conjunto de programas desarrollados por la Free Software Foundation), es
decir, de uso libre.
La pgina principal del proyecto R Project es http: //www.r project.org, en
ella podremos conseguir gratuitamente el programa en su ltima versin, o
cualquiera de las anteriores (para el caso de utilizar paquetes no implementados
para las ltimas versiones), adems de manuales, libreras o package y dems
elementos que forman la gran familia que es R.
Hay que tener en cuenta R es un proyecto vivo y sus capacidades no coinciden
totalmente con las de S. A menudo el lenguaje S es el vnculo escogido por
investigadores que utilizan la metodologa estadstica, y R les proporciona una ruta
de cdigo abierto para la participacin en esa actividad, los usuarios pueden
contribuir al proyecto implementando cualquiera de ellas, creando modificaciones
de datos y funciones. Se dice que ningn otro programa en la actualidad rene las
condiciones de madurez, cantidad de recursos y manejabilidad que posee R,
adems de ser el que en los ltimos aos ha tenido una mayor implantacin en la
comunidad cientfica e ingeniera .
COMO FUNCIONA R PROJECT
R es un lenguaje Orientado a Objetos: bajo este complejo trmino se esconde la
simplicidad y flexibilidad de R. El hecho que R es un lenguaje de programacin
puede desaminar a muchos usuarios que piensan que no tienen alma de
programadores. Esto no es necesariamente cierto por dos razones. Primero R es
un lenguaje interpretado (como Java) y no compilado, lo cual significa que los
comandos escritos en el teclado son ejecutados directamente sin necesidad de
construir ejecutables. Como segunda medida, la sintaxis de R es muy simple e
intuitiva. Por ejemplo, una regresin lineal se puede ejecutar con el comando lm
(y x).
Para que una funcin sea ejecutada en R debe estar siempre acompaada de
parntesis, inclusive en el caso que no haya nada dentro de los mismos (por ej., ls
()).
Si se escribe el nombre de la funcin sin los parntesis, R mostrara el contenido
(cdigo) mismo de la funcin. En este documento, se escribirn los nombres de
las funciones con parntesis para distinguirlas de otros objetos, a menos que se
indique lo contrario en el texto.
Orientado a Objetos significa que las variables, datos, funciones, resultados, etc.,
se guardan en la memoria activa del computador en forma de objetos con un
nombre especfico. El usuario puede modificar o manipular estos objetos con
operadores (aritmticos, lgicos, y comparativos) y funciones (que a su vez son
objetos). Una funcin en R se puede delinear de la siguiente manera:
Argumentos
opciones funcin =resultado
Argumentos por defecto
Los argumentos pueden ser objetos (datos, formulas, expresiones), algunos de
los cuales pueden ser definidos por defecto en la funcin; sin embargo estos
argumentos pueden ser modificados por el usuario con opciones. Una funcin en
R puede carecer totalmente de argumentos, ya sea porque todos estn definidos
por defecto (y sus valores modificados con opciones), o porque la funcin
realmente no tiene argumentos. Por ahora esta corta descripcin es suficiente
para entender el funcionamiento bsico de R.
Todas las acciones en R se realizan con objetos que son guardados en la
memoria activa del ordenador, sin usar archivos temporales.
La lectura y escritura de archivos solo se realiza para la entrada y salida de datos
y resultados (graficas, etc. . . ). El usuario ejecuta las funciones con la ayuda de
comandos definidos. Los resultados se pueden visualizar directamente en la
pantalla, guardar en un objeto o escribir directamente en el disco (particularmente
para grficos). Debido a que los resultados mismos son objetos, pueden ser
considerados como datos y analizados como tal. Archivos que contengan datos
pueden ser ledos directamente desde el disco local o en un servido remoto a
travs de la red.
Las funciones disponibles estn guardadas en una librera localizada en el
directorio R HOME/library (R HOME es el directorio donde R est instalado). Este
directorio contiene paquetes de funciones, las cuales a su vez estn
estructuradas en directorios. El paquete denominado base constituye el ncleo de
R y contiene las funciones bsicas del lenguaje para leer y manipular datos,
algunas funciones grficas y algunas funciones estadsticas (regresin lineal y
anlisis de varianza). Cada paquete contiene un directorio denominado R con un
archivo con el mismo nombre del paquete (por ejemplo, para el paquete base,
existe el archivo R HOME/library/base/R/base).
Este archivo esta en formato ASCII y contiene todas las funciones del paquete. El
comando ms simple es escribir el nombre de un objeto para visualizar su
contenido.
Por ejemplo, si un objeto n contiene el valor 10 > n [1] 10 El digito 1 indica que la
visualizacin del objeto comienza con el primer elemento de n.
Este comando constituye un uso implcito de la funcin print, y el ejemplo anterior
es similar a print(n) (en algunas situaciones la funcin print debe ser usada
explcitamente, como por ejemplo dentro de una funcin). El nombre de un objeto
debe comenzar con una letra (A-Z and a-z) y puede incluir letras, dgitos (0-9), y
puntos (.). R discrimina entre letras maysculas y minsculas para el nombre de
un objeto, de tal manera que x y X se refiere a objetos diferentes (inclusive bajo
Windows).

VENTAJAS Y DESVENTAJAS

R es un software libre:
Cuenta con la licencia GNU GPL el cual consta de 4 libertades
Libertad 0: la libertad de ejecutar el programa como desee y con
cualquier propsito
Libertad 1: libertad de estudiar el funcionamiento del programa y
adaptarlo a sus necesidades.
Libertad 2: La libertad de rescribir copias para ayudar a los dems.
Libertad 3: La libertad de manejar el programa y publicar las mejorar,
de manera que toda comunidad se beneficie.
Muchos de los software comerciales estadsticos cuestan cientos de dlares.
Como SigmPlot cuesta cerca de 900 dlares, Minitab ms de 1500 dlares, MatLab
2150 dlares, entre otros.
Es multiplataforma, R funciona en Mac, Windows, y en nmeros sistemas UNIX.
Esto significa que cualquier persona puede trabajar con tus datos, figuras, anlisis
y ms importante an usar tus instrucciones (tambin conocido como scripts o
cdigo) para generar las figuras y el anlisis. Asi que cualquier persona, y en
cualquier lugar del mundo, con acceso a cualquier SO puede usar R sin ninguna
licencia.

Es de cdigo abierto, existe una gran comunidad de voluntarios trabajando para


mejorarlo, lo cual permite ser moldeado y dirigido a cuestiones especficas. Creando
as programas y paquetes que funcionen en el entorno R. Programas tales como R-
studio, Java GUI for R, R- commander, RKWard, entre otros, y con ms de 6000
paquetes indexado en CRAN, Biocoductor, GitHub y R-Forge.

Actualizacin, Esta comunidad de usuarios hace que se actualice constantemente,


la ltima versin 3.2.2 "Fire Safety", es reciente del 14 de agosto del 2015.

R es una plataforma estadstica, lo cual ofrece todas las tcnicas de anlisis de


datos. Adems de programar nuevos mtodos y rutinas estadsticas de una manera
fcil y robusta.

Los grficos disponibles en R son de gran calidad y de una versatilidad


impresionante.

R remplaza la combinacin de varios programas para el proceso de anlisis de


datos, por ejemplo Excel, Minitab, SAS, SigmaPlot, entre otros. Esto no solo resulta
en el alto costo de las licencias de mltiples programas, si no tambin, en la gran
cantidad de archivos con diferentes formatos que no podran leer otros programas
estadsticos. En cambio con solo utilizar R, puedes realizar todo el anlisis de datos
e inclusive leer archivos de diferentes formatos.

R se est convirtiendo en un estndar en la sociedad cientfica, por hacer figuras


de calidad de publicacin, adems de poder exportarse a diferentes formatos
incluidos PDFs.

Ahora las desventajas

R tiene una vasta documentacin de ayuda, descripcin de paquetes y de


funciones, que es difcil encontrar informacin especfica en un momento dado.

Los mensajes de error que R nos muestra, no es especfica sobre los fallos que
estamos realizando y solo un usuario con cierta experiencia en el uso de R puede
saberlo.

R es un lenguaje de programacin en lnea de comando, lo cual no involucra el


uso de mens como otros programas estadsticos, esto hace que muchas personas
que no estn familiarizadas en la programacin, les resulte muy difcil migrar a R.

ESTADISTICA COMPUTACIONAL EN EL AREA DE LA INGENIERIA.

La estadstica computacional es una disciplina del conocimiento cientfico


tecnolgico, que se ocupa de estudiar el impacto de la computacin en la
metodologa estadstica (Algoritmos, modelacin grfica, mtodos inferenciales
intensivos en clculo recursivo, anlisis exploratorio de datos, evaluacin de
software estadstico, mtodos estadsticos en simulacin, mtodos estadstico en
procesamiento de imgenes y seales etc.) Esta rea aborda todos los aspectos
tericos y prcticos del modelamiento estadstico y al mismo tiempo se ocupa de
todos los cambios y aplicaciones, que la Ciencia de la Computacin est
generando en ella. La estadstica computacional es en verdad una disciplina, que
est en la frontera de dos disciplinas; la Ciencia de la Computacin y la
Estadstica.

La Estadstica computacional busca acumular y optimizar la informacin extrada


de los datos, como recolectar los datos para maximizar la informacin y como
hacer inferencias de los mismos para extender nuestro conocimiento. Por otro
lado, la Ciencia de Computacin, nos dice cmo calcular y procesar de manera
ptima los datos, cmo medir el costo asociado al procesamiento de la
informacin, cmo la informacin y el conocimiento pueden ser tilmente
representados y como comprender los lmites de lo que puede ser calculado etc.

La importancia de la estadstica en la ingeniera, ha sido encaminada por


la participacin de la industria en el aumento de la calidad. Muchas compaas se
han dado cuenta que la baja calidad de un producto, tiene un gran efecto en la
productividad global de la compaa, en el mercado y la posicin competitiva y,
finalmente, en la rentabilidad en la empresa. Mejorar los aspectos de calidad con
lleva al xito de la compaa.
La estadstica computacional es un elemento decisivo en el incremento de la
calidad, ya que las tcnicas estadsticas pueden emplearse para describir y
comprender la variabilidad. Todos los procesos y sistemas de la vida real exhiben
variabilidad. Esta es el resultado de cambios en las condiciones bajo las condiciones
que se hacen las observaciones.
En el contexto de la manufactura, estos cambios pueden ser diferencias en las
propiedades de los materiales utilizados, en la forma en que trabajan los obreros,
en las variables del proceso (tales como la temperatura, la presin o el tiempo de
ocupacin) y en los factores ambientales (como la humedad relativa), entre otros.

You might also like