viernes, 20 de noviembre de 2015

Conclusión


El objetivo de estudio de este trabajo consistió en establecer cuál de los generadores, R, GeoGebra, DevC++ y la Calculadora, siguen una Distribución Uniforme (0,1), es decir, generan números pseudoaleatorios lo más cercano a números aleatorios.
Nuestra hipótesis es que el software R nos arrojará números que se ajustan más a una Distribución Uniforme (0,1), es decir “más aleatorios” que con el resto de los generadores porque es el más específico en el ámbito estadístico.

Luego de distintos análisis, podemos llegar a la conclusión de que los cuatro generadores se ajustan a una Distribución Uniforme (0,1), pero el generador que más se aproxima, es el de la Calculadora, por lo tanto es el de mejor calidad. Si bien pasa ésto, la diferencia con el resto de los software es mínima, en consecuencia, por la rapidez, la eficiencia, la interfaz gráfica y la variedad de herramientas, es conveniente utilizar algunos de los software analizados, estableciendo prioridad por el de R.

domingo, 15 de noviembre de 2015

Desarrollo del Proyecto - Análisis Inferencial

En este análisis ya no tenemos en cuenta solo la muestra, sino que realizamos supuestos para toda la población, es decir, predicciones de cómo se comportarán los generadores en posteriores simulaciones, sirviendonos para tomar decisiones de cuáles serán los mejores.

En un primer momento, para asegurarnos que las medias de las variables son efectivamente próximas a 0.5 para cualquier simulación futura, realizamos un Test de Hipótesis para la media con nivel asintótico, con 99% de coeficiente de confianza. Donde determinamos el test bilateral en el cual la hipótesis nula es μ = 0.5. Como lo hicimos en R, con el paquete Rcommander, y este no cuenta instrucciones para realizar el test para la media con nivel asintótico tuvimos que realizarlo con el siguiente código:
n<-length(conjunto_de_datos$variable) #cantidad de observaciones
mu0<-0.5 #media teorica
s<-sd(conjunto_de_datos$variable) #le asignamos a s el desvío de la muestra
z.test<-(mean(conjunto_de_datos$variable))-mu0)/(s/sqrt(n)) #pivote para el test asintótico
alfa<-0.01 #nivel de significación del 1%
resultado<-c(z.test, pnorm(c(z.test), mean=0, sd=1, lower.tail=TRUE))
IC.media<-c(mean(conjunto_de_datos$variable))-qnorm(1-alfa/2)*s/sqrt(n), mean(conjunto_de_datos$variable))+qnorm(1-alfa/2)*s/sqrt(n))
resultado
IC.media

Obteniendo los  siguientes datos:
Generador
Media muestral
t calculado
valor p
Intervalo de confianza
GeoGebra
0.5008008
0.02990052
0 .51192681
(0.4318185; 0.5697830)
R
0.4730771
0.9031315
0.1832280
(0.3962901; 0.5498641)
Dev C++
0.496885
0.1091265
0.4565511
(0.4233577; 0.5704122)
Calculadora
0.47808
 0.7652732
0.2220544
(0.4042996; 0.5518604)
Figura 1: Test de Hipótesis para la media con nivel asintótico.
 H_0: μ = 0.5 vs. H_a: μ =/ 0.5
Por lo tanto, las cuatro variables tienen su media aproximadamente igual a 0.5.

Como última técnica para definir si las variables siguen Distribución Uniforme Continua (0,1) tal
como propusimos, usamos la Prueba Chi-Cuadrado de Bondad de Ajuste. Consideramos como hipótesis nula justamente que cada una de las variables seguían esa distribución. Con el siguiente código obtuvimos los valores que se muestran en la Figura 2:
tabla1=hist(MuestrasUniformes$obs, breaks="Sturges", plot=F)
datos=tabla1$breaks
n.clas=length(datos)-1
frecobs=tabla1$counts
frecesp=punif(c(datos[2:n.clas],+Inf),0,1)-punif(c(-Inf,datos[2:n.clas]),0,1)
chisq.test(frecobs,p=frecesp)


Generador
Chi-Cuadrado gl:9
calculado
valor p
GeoGebra
8.2
 0.5141
R
 6.4
0.6993
Dev C++
8.6
0.475
Calculadora
5
0.8343
Figura 2: Resultados Bondad de Ajuste por variables para probar si siguen una Distribución Uniforme Continua (0,1)

Con estos resultados llegamos a la conclusión que...



¡¡¡ todas las variables se ajustan a la distribución Uniforme Continua (0,1) !!!