You are on page 1of 175

UNIVERSIDAD DE CHILE

Facultad de Ciencias Fsicas y Matemticas


Departamento de Ingeniera de Minas
Avda. Tupper 2069 - Santiago

4500.00

5.000
4.500
4.000
3.500

Norte

3.000
2.500
2.000
1.500
1.000
.5000
.0
3600.00
5200.00

Este

6000.00

Apuntes de Simulacin Geoestadstica


Profesor Julin Ortiz C.

Ctedra CODELCO de Evaluacin de Yacimientos

El profesor Julin Ortiz C. es Ingeniero Civil de Minas de la Universidad de


Chile (1998) y Ph. D. in Mining Engineering (Geostatistics) de la Universidad de
Alberta (2003). Realiz un post-doctorado en geoestadstica en la University of
Alberta y una visita doctoral a la Universidad de Stanford durante el ao 2003.
Se desempea como acadmico de jornada completa en el Departamento de
Ingeniera de Minas de la Universidad de Chile, en la Ctedra de Evaluacin de
Yacimientos y es adems Profesor Adjunto en la Universidad de Alberta, donde
colabora en investigacin con el Centre for Computational Geostatistics. Es
autor de varias publicaciones en congresos y revistas internacionales
especializadas en geoestadstica. Ha participado en la preparacin y
presentacin de varios cursos y seminarios, dictados tanto en Chile como en
Canad y Sudfrica. Asimismo, ha trabajado como consultor en las reas de
evaluacin geoestadstica de recursos y reconciliacin mina-planta. Sus reas
de especializacin son evaluacin geoestadstica de yacimientos y muestreo.

Comentarios y sugerencias, dirigirlas a:


Julin Ortiz C.
E-mail:
jortiz@ing.uchile.cl
Tel.:
(56 2) 978 4585
E-fax:
(56 2) 672 3504

2006 Depto. de Ingeniera de Minas, Universidad de Chile.

Simulacin Geoestadstica

TABLA DE CONTENIDOS
1. INTRODUCCIN
Alcance
Objetivos
Contenidos del curso
Etapas en la evaluacin de yacimientos
Muestreo y variabilidad del fenmeno
Origen de la variabilidad

2. CONCEPTOS BSICOS Y NOTACIN


Fenmeno regionalizado
Variable regionalizada
Ley de corte o umbral mximo

3. ANLISIS Y REPRESENTACIN DE LOS DATOS


Despliegue de datos
Tablas de frecuencia e histogramas
Funcin de densidad de probabilidad
Funcin de distribucin acumulada
Estadsticas bsicas

11

4. DISTRIBUCIONES DE PROBABILIDAD NORMAL Y LOGNORMAL


Distribucin normal
Clculo de curvas tonelaje-ley para una distribucin normal
Grfico de probabilidad normal
Distribucin lognormal
Clculo de curvas tonelaje-ley para una distribucin
lognormal
Grfico de probabilidad lognormal

22

5. ANLISIS BIVARIABLE
Grfico de dispersin o Scatterplot
Q-q plot
Correlacin
Regresin normal
Regresin lognormal
Paso de la regresin a promedios ponderados

36

6. EVALUACIN GLOBAL
Efecto de soporte

50

7. EL MODELO PROBABILSTICO EN GEOESTADSTICA


Hiptesis de ergodicidad
Hiptesis de estacionaridad
Ley espacial

54

Simulacin Geoestadstica

8. MODELAMIENTO DE LA ESTRUCTURA DE LA VARIABLE


Anlisis espacial
Variogramas cruzados
Modelamiento de variogramas para varias variables

60

9. EVALUACIN LOCAL
Mtodos de estimacin clsicos
Relacin entre la varianza y el tamao del dominio
Varianza-Error de estimacin
Kriging Simple
Kriging Ordinario
Kriging lognormal

80

10. ESTIMACIN Y SIMULACIN


El efecto proporcional
Visualizacin de modelos
Categorizacin de recursos

103

11. ALTERNATIVAS A LA ESTIMACIN CONVENCIONAL


Kriging Multi-Gaussiano
Kriging de Indicadores

111

12. INTRODUCCIN A LA SIMULACIN GEOESTADSTICA


Varianza Del valor estimado
El paradigma de la Simulacin Secuencial Directa

114

13. MTODOS GAUSSIANOS


Introduccin
Transformacin a valores normales
Estimacin de la media y varianza de la distribucin de
incertidumbre local y simulacin
Transformacin de vuelta de los valores simulados
Caso de varias variables

116

14. MTODOS DE INDICADORES


Codificacin de indicadores
Kriging de indicadores
Cokriging de indicadores
El kriging de probabilidades
Informacin secundaria
Correccin de los problemas con las relaciones de orden
Interpolacin y extrapolacin de las funciones de
distribucin acumulativas condicionales
Simulacin de indicadores

120

Simulacin Geoestadstica

15. APLICACIN A LA BASE DE DATOS DE WALKER LAKE


Estadsticas bsicas
Variografa
Kriging simple de indicadores
Kriging ordinario de indicadores
Kriging de indicadores de la mediana
Simulacin de indicadores
Discusin
16. APLICACIN A LA BASE DE DATOS DE PRECIPITACIN EN
NORTEAMRICA
Estadsticas bsicas
Muestreo anidado
Distribucin de referencia
Continuidad espacial
Kriging simple y ordinario
Kriging simple y ordinario de indicadores
Simulacin secuencial Gaussiana
Simulacin secuencial de indicadores
Discusin
Apndice: Estadsticas de las muestras

133

152

Simulacin Geoestadstica

1. INTRODUCCIN
Alcance
El presente apunte forma parte del curso de posttulo dictado por el Departamento
de Ingeniera de Minas de la Universidad de Chile, dentro del programa de
Capacitacin en Innovacin Tecnolgica para la Minera. El curso considera el
desarrollo de un proyecto tridimensional por parte de los alumnos, adems del
repaso de los conceptos tericos, tanto de estadstica clsica como de
geoestadstica, orientado a la evaluacin de recursos minerales.
El proyecto contempla el anlisis exploratorio inicial, a travs del cual se concluye
en una estimacin global de los recursos disponibles, seguido del estudio
geoestadstico (variografa, validaciones y estimacin) para la obtencin final de la
estimacin local. Las ventajas del uso de herramientas de simulacin tanto con el
fin de realizar la estimacin local, como para evaluar incertidumbre y establecer
intervalos de confianza en los resultados, son expuestas como parte del curso.
El presente apunte est orientado principalmente al rea minera, sin embargo, las
tcnicas expuestas son aplicables a otras reas.
Objetivos
El uso de la geoestadstica para estimar leyes o, en general, concentraciones de
elementos, fue establecido hace varias dcadas. Las tcnicas han ido
evolucionando desde mtodos puramente geomtricos hacia mtodos que
consideran la variabilidad en el espacio de la variable de inters. Actualmente,
simulaciones condicionales se utilizan para establecer la incertidumbre en los
resultados. La industria del petrleo y minera han liderado buena parte de las
aplicaciones. El rea medioambiental se ha visto forzada al uso de la
geoestadstica por razones legales, en pases como Estados Unidos o Canad,
donde los litigios medioambientales requieren establecer medidas junto a su
incertidumbre, o nivel de error, en trminos probabilsticos.
En aplicaciones mineras, el muestreo y la evaluacin de yacimientos permiten en
una etapa temprana de un proyecto, tomar la decisin de continuar explorando,
iniciar la explotacin o abandonar el proyecto. Esta decisin puede tomarse
despus de una evaluacin global bastante preliminar, o bien, luego de una
evaluacin local ms detallada.
Una vez que el yacimiento est en explotacin, se utilizan estas herramientas para
construir los planes de produccin de corto, mediano y largo plazo, as como para
determinar nuevas zonas explotables, o para volver a evaluar el proyecto inicial,
con la nueva informacin disponible proveniente de la explotacin.

Simulacin Geoestadstica

A travs de estimaciones, se determinan inicialmente los recursos geolgicos


que el yacimiento posee, es decir, la cantidad y calidad del mineral presente en el
depsito. En segundo trmino, se definen las reservas mineras, que
corresponden al mineral explotable y del cual se obtendr beneficio econmico.
Evaluar la incertidumbre en los recursos y reservas es importante por razones
financieras, adems de ser til a la hora de producir. Las plantas de proceso a
menudo requieren de niveles mnimos o mximos de algn elemento para su
ptimo funcionamiento. La necesidad de crear pilas para mezclar mineral con
diferentes caractersticas, previo al proceso, puede demostrarse con el uso de
simulaciones.
En medio ambiente, una de las caractersticas ms importantes es que las
distribuciones son extremadamente asimtricas. Se encuentran muchos valores
bajos y escasos valores comparativamente muy altos. Estos ltimos son los
valores crticos que resultan importantes al momento de usar herramientas de
estimacin o simulacin. Son precisamente los sectores con estas altas
concentraciones aquellos crticos para el entorno. La evaluacin de estos sitios
debe por lo tanto considerar estas particulares caractersticas de las aplicaciones
medioambientales.
Contenidos del apunte
El presente apunte cubre las siguientes materias:
1. Conceptos bsicos
a. Fenmeno regionalizado
b. Variable aleatoria
c. Funcin aleatoria
d. Ley espacial
e. Decisin de estacionaridad
2. Anlisis exploratorio de datos
a. Estadsticas univariables
b. Estadsticas multivariables
c. Distribucin normal y lognormal
3. Modelamiento espacial
a. Definiciones bsicas
b. Clculo, interpretacin y modelamiento del variograma
c. Caso con varias variables
4. Evaluacin global
a. Mtodos de desagrupamiento
b. Inferencia de la distribucin de la variable de inters
5. Evaluacin local
a. Mtodos geomtricos
b. Regresin normal y lognormal
c. Kriging simple

Simulacin Geoestadstica

d. Kriging ordinario
e. El efecto proporcional
6. Otros mtodos de estimacin local
a. Kriging Multi-Gaussiano
b. Kriging de Indicadores
7. Aspectos generales de simulacin
a. Reproduccin de la covarianza
b. Caso general de simulacin directa
c. El problema de la forma de las distribuciones condicionales
8. Simulacin Gaussiana secuencial
a. Aspectos tericos
b. Aspectos prcticos
9. Simulacin secuencial de indicadores
a. Aspectos tericos
b. Aspectos prcticos
c. Aplicacin a variables categricas
10. Simulacin de varias variables
a. Simulacin Gaussiana con cokriging
b. Simulacin Gaussiana usando variable colocalizada
Etapas en la evaluacin de yacimientos
Las principales etapas en la evaluacin de un yacimiento son:

Estudio geolgico: El estudio preliminar de una zona metalognica favorable,


mediante mapeos geolgicos, geoqumica y geofsica, permitir definir
prospectos. Si en alguno de ellos se encuentra una zona mineralizada, se
efecta un estudio ms detallado utilizando perforaciones, trincheras e incluso
en algunos casos, campaas de sondajes. Se tienen a este nivel, muestras
irregularmente distribuidas, pero usadas para verificar la existencia de la
mineralizacin y dar una descripcin principalmente cualitativa.

Campaa de sondajes sistemtica en una malla de gran tamao: Se


realizan sondajes en una grilla relativamente regular que cubre toda la zona
mineralizada y que debe permitir evaluar los recursos in situ (tonelaje y ley
media). Si se encuentra alguna zona de inters se pueden realizar sondajes de
relleno, o bien se puede extender la campaa de sondajes a zonas
adyacentes, si se ve que la mineralizacin se extiende en dicha direccin. En
esta etapa se realiza una primera estimacin global que utiliza tanto la
informacin cualitativa como la cuantitativa proveniente de los testigos
obtenidos en esta campaa. Sin embargo, resulta muy difcil determinar el error
que esta estimacin tiene. Se puede utilizar una clasificacin como la del
JORC (Joint Ore Reserves Committee), U.S. Bureau of Mines, SAMREC
(South African Mineral Resources Committee): recursos medidos, indicados
e inferidos. Pero los lmites entre cada categora no estn del todo claros. En
general, se sabe que la precisin de la estimacin no slo depender del

Simulacin Geoestadstica

nmero de muestras que se utilice, sino que tambin de la variabilidad in situ


de la ley en el depsito y de la manera en que esta variabilidad sea
muestreada. Ms adelante se explica con ms detalle el origen de la
variabilidad. Asimismo, se sabe que los conceptos de continuidad y zona de
influencia que se usan en la evaluacin de recursos, tambin dependen del
depsito en particular y del tipo de mineral. Por ltimo, tambin se debe tener
en cuenta que la variabilidad en los ensayos de las muestras provenientes de
sondajes, zanjas o canales, ser diferente debido a lo que se denomina efecto
de soporte.

Campaa de sondajes en una malla pequea: Una vez que se ha


determinado que el yacimiento es econmicamente explotable, se deben
definir los parmetros econmicos y tecnolgicos para su explotacin. Los
recursos in situ totales son raramente explotables, ya sea por razones
tecnolgicas (profundidad, accesibilidad) o por razones econmicas (costo de
mina, ley de corte). Para definir las reservas recuperables en un contexto
econmico y tecnolgico dado, y a la inversa, para definir el tipo de minera
que maximizar el beneficio de la explotacin del depsito, es necesario tener
un conocimiento acabado de sus caractersticas. Es necesario conocer la
distribucin de las zonas ricas y pobres del yacimiento, la variabilidad del
espesor de la mineralizacin, as como de su sobrecarga, adems de las
diversas correlaciones existentes entre las leyes (tanto de los elementos de
inters, como de sus impurezas). Para esto, es frecuente muestrear en una
malla ms fina, al menos en el primer sector que entrar en produccin. Esta
informacin se utiliza para realizar una estimacin de bloques en dicha zona.
Se trata entonces de una estimacin local. Se plantean, por tanto, nuevos
problemas: en primer lugar, es necesario determinar el estimador a utilizar y,
en segundo trmino, se debe poder determinar el error con que est
estimando, lo que permitir clasificar esta vez las reservas como probadas y
probables, segn el grado de certeza con que fueron estimadas. Los actuales
cdigos indican que reservas posibles no deben ser reportadas.

Planificacin minera: Una vez realizadas las estimaciones de recursos


geolgicos y reservas recuperables, se debe realizar la planificacin del
proyecto. En esta etapa se utilizar la informacin antes obtenida para poder
prever situaciones debidas a la variabilidad de la ley en el depsito, que, por
ejemplo, harn necesario el uso de acopios o mezclas. En esta etapa, pueden
ser de mucha utilidad herramientas geoestadsticas como las simulaciones,
que permiten visualizar escenarios posibles debidos al desconocimiento de la
variable y a la variabilidad del fenmeno en estudio.

Simulacin Geoestadstica

Muestreo y variabilidad del fenmeno


En la Figura 1, se ejemplifica el grado de conocimiento que se puede llegar a
tener del depsito segn la tasa de muestreo.
En el primer mapa (izquierda arriba), se puede ver que con muestras cada 80
metros, slo se define la zona mineralizada, pero la incertidumbre acerca de su
continuidad, tanto en la zona rica, como en los lmites, es muy alta.
En el segundo mapa (derecha arriba), las muestras cada 40 metros permiten
apreciar que la mineralizacin es bastante continua, sin embargo, en los bordes
del sector de alta ley se puede ver la transicin. Esto sirve para poder definir sus
rasgos estructurales.
Con las muestras cada 40 metros, se puede realizar una estimacin mediante
kriging (mtodo que ser revisado ms adelante), de la ley de bloques de 7 x 7
metros (que corresponde al tamao de la unidad selectiva de explotacin). Se ve
en el tercer mapa (izquierda abajo) que esta estimacin local nos permite predecir
la ubicacin de sectores de inters para iniciar la explotacin.
Finalmente, se presentan en el ltimo mapa (derecha abajo), las muestras
tomadas de los pozos de tronadura (que se asume que tambin se encuentran en
una malla regular de 7 x 7 metros). Con estas muestras se puede ver que, si bien
la estimacin utilizando la informacin proveniente de muestras espaciadas a 40
metros unas de otras, fue bastante acertada en definir los sectores ricos y pobres
del depsito, sta no permite detectar estructuras de corto alcance (precisamente
aquellas que no se manifiestan a una escala como 40 metros, sino que se deben a
variaciones en algunos metros y, en ciertas ocasiones a variaciones
microscpicas).

Simulacin Geoestadstica
6

Figura 1: Muestreo y variabilidad del fenmeno


Arriba izquierda: Muestras en malla de 80 x 80 m.; Arriba derecha: Muestras en malla de 40 x 40 m.;
Abajo izquierda: Kriging de bloques de 7 x 7 m.; Abajo derecha: Muestras en malla de 7 x 7 m.

Simulacin Geoestadstica

Origen de la variabilidad
El principal problema que motiva la toma de muestras y el desarrollo de una
evaluacin de los recursos disponibles, es que la variable que interesa estudiar
tiene un comportamiento difcil de predecir. Resulta lgico pensar que si dicha
variable fuera constante en el depsito, bastara tomar slo una muestra para
conocer su valor en cualquier punto del yacimiento. Sin embargo, en la prctica
esta situacin nunca existe, debido a la presencia de una variabilidad que debe
ser estudiada para poder realizar estimaciones en puntos en los que la variable no
ha sido medida.
Esta variabilidad proviene principalmente de dos fuentes:

En primer lugar est la variabilidad inherente del yacimiento, la que se debe


a los procesos que produjeron la gnesis de esta concentracin anmala que
estudiamos.

Por otro lado, est la variabilidad introducida artificialmente a lo largo del


estudio que se hace del depsito, mediante errores de toma, preparacin y
anlisis de las muestras.

El anlisis de la informacin disponible permite cuantificar la variabilidad artificial y


determinar la calidad de la informacin con que se realizar la estimacin,
mientras que el estudio geoestadstico (variografa) permitir resumir las
caractersticas estructurales del yacimiento.

Simulacin Geoestadstica

2. CONCEPTOS BSICOS Y NOTACIN


Antes de iniciar la revisin de los pasos a seguir para realizar un estudio
geoestadstico, es necesario conocer algunas definiciones importantes (y sus
notaciones) que se utilizarn a lo largo de todo el texto.
Fenmeno regionalizado
En primer lugar, se define un fenmeno regionalizado como aquel que se
desarrolla en el espacio (en general, en el espacio geogrfico). A modo de
ejemplo, se puede mencionar el conjunto de fenmenos fsicos y qumicos que
producen una mineralizacin y el transporte de partculas que generan
depositacin de un contaminante en un sitio.
Variable regionalizada
En este espacio, un fenmeno regionalizado se caracteriza por la distribucin
espacial de una (o varias) variable(s) regionalizada(s), que se nota z(u),
correspondiendo al valor de la variable z en el punto del espacio u. En caso de
tratarse de un punto muestreado, ste se notar u, y en consecuencia, el valor
de la variable regionalizada en dicho punto ser z(u), donde u corresponde
a un punto muestreado con coordenadas (x,y,z).
Ejemplos de variables regionalizadas son la profundidad de un estrato, la potencia
de una veta, la ley de Arsnico en un punto, la densidad de un bloque, la
concentracin de un contaminante sobre un rea, etc.
Es necesario definir de esta variable regionalizada su naturaleza, su soporte y el
campo de extensin en que se desarrolla.

La naturaleza de la variable regionalizada es aquello que se quiere


representar con ella. Es fundamental que la naturaleza quede claramente
definida desde el principio de manera de no confundirla con otras variables en
el desarrollo del estudio. Por ejemplo, la naturaleza de una variable
regionalizada puede ser "potencia de un estrato", o bien, "ley de oro en un
punto". Si se quiere realizar estimacin de bloques (como generalmente ocurre
en el caso minero), la variable debe ser aditiva, es decir que el valor para el
bloque corresponda al promedio de los valores estimados puntualmente al
interior de ste.

El soporte es la superficie o el volumen sobre el cual est definida la variable


regionalizada (dnde se mide). Para comprender este concepto mejor,
podemos considerar por ejemplo la ley de "una muestra de un sondaje de

Simulacin Geoestadstica

diamantina de tamao NQ de 1 metro de longitud". Este soporte es diferente al


de la ley en "un bloque de 5 x 5 x 5 metros", puesto que la distribucin de
ambas variables es diferente.

El campo de extensin D de la variable corresponde al dominio limitado en el


que sta tiene un valor que resulta interesante. Por ejemplo, donde la variable
es no nula o mayor que un cierto umbral, o, en un caso minero, puede quedar
representado por la extensin de la pertenencia de la compaa.

A modo de ejemplo, en el caso de una veta de potencia variable (Figura 2), si se


mide la ley en muestras de toda la potencia de la veta, el promedio de estas leyes
no corresponder a la ley media de toda la unidad, debido a que tiene un ancho
variable. Por esta razn, en casos como este, conviene considerar la
acumulacin, es decir, la ley de la muestra por la potencia de la veta en ese
punto. Esta nueva variable es aditiva, y permitir realizar la estimacin de ella en
cualquier punto de la veta.
De esta manera, si adems de la acumulacin se mide la potencia (que tambin
corresponde a una variable aditiva), se podr determinar en cualquier punto la
acumulacin y potencia de la veta, que entregarn (mediante la divisin de
ambas), la ley media en dicho punto. Esta operacin no lineal (la divisin de dos
variables regionalizadas) puede traer algunos problemas tericos, aunque en la
prctica, se utilizan con frecuencia este tipo de soluciones.
119 cm

81 cm

140 cm

75 cm

215 cm
106 cm

253 cm*gr/ton
199 cm*gr/ton
335 cm*gr/ton
581 cm*gr/ton
212 cm*gr/ton

75 cm

34 cm

91 cm

156 cm*gr/ton
296 cm*gr/ton

352 cm*gr/ton

705 cm*gr/ton

Figura 2: Potencia y acumulacin medidas en muestras tomadas en toda la


potencia de la veta.
Como se mencion, la ley media de cada muestra se obtiene dividiendo la
acumulacin por la potencia de la veta. As, considerando que las muestras estn
bastante bien distribuidas, se puede realizar el siguiente clculo:
1
(335 + 253 + 581 + 199 + 212 + 705 + 296 + 156 + 352 )
gr Au
353.22
9
=
= 3.40
m1 =
1
104
ton
(119 + 81 + 140 + 75 + 106 + 215 + 75 + 34 + 91)
9

Simulacin Geoestadstica

10

Ahora, si se realiza el clculo simple de promediar las leyes medias de cada


punto, se puede ver que segn las diferencias que existen en el largo de las
muestras, el resultado ser totalmente distinto, pues se trabaja con soportes
diferentes para obtener la media:

m2 =

gr Au
1 335 253 581 199 212 705 296 156 352

+
+
+
+
+
+
+
+
= 2.94
9 119
81 140 75 106 215 75
34
91
ton

Como se puede ver, la definicin de la (o las) variable(s) regionalizada(s) que se


quiere estudiar, tiene un impacto importante en el resultado que tendr la
estimacin, por lo que siempre hay que tener presentes nociones como la
sealada en el ejemplo anterior.
Ley de corte o umbral mximo

En minera, buena parte de las decisiones que se toman se refieren a un valor


determinado mediante la aplicacin de parmetros econmicos y operacionales,
denominado ley de corte. Este valor corresponde a un lmite que separa diferentes
calidades de material. Por ejemplo, se puede diferenciar entre el mineral y el lastre
(este es el ejemplo ms sencillo), sin embargo, tambin se aplican para diferenciar
diferentes acopios de mineral de baja o alta ley, por ejemplo, que pueden
posteriormente utilizarse para realizar mezclas o para suplir falencias en la
alimentacin a planta. Se notar la ley de corte por zC.
Una definicin similar se aplica cuando se trata de estimar la concentracin de un
contaminante sobre una determinada rea. Por ejemplo, la decisin de limpiar
dicha rea se basar en un umbral mximo aceptable zC (que puede ser dictado
por una ley o reglamento).

Simulacin Geoestadstica

11

3. ANLISIS Y REPRESENTACIN DE LOS DATOS


Despliegue de datos
Antes de comenzar a realizar cualquier anlisis cuantitativo, es necesario conocer
la informacin disponible. En el caso de depsitos minerales, frecuentemente, el
gelogo realiza la interpretacin de la informacin proveniente de las primeras
etapas de la exploracin. Esta interpretacin, basada en el entendimiento de la
gnesis de la mineralizacin, permitir definir algunos lmites, que en ciertos casos
sern lmites duros (es decir, que separan dos poblaciones independientes, por lo
que no se pueden estimar valores en una zona utilizando informacin de la otra) y
en otros, lmites blandos (que dan cierta flexibilidad en el uso de la informacin
disponible). Adems, se proponen en esta etapa las unidades geolgicas
(diferenciadas por litologa, enriquecimiento, alteracin, tipo de mineralizacin,
etc.) que se debern analizar durante el estudio exploratorio para definir cuales de
ellas son estadsticamente diferentes.
El conocimiento del depsito pasa por su visualizacin, que puede realizarse a
travs del sistema clsico de revisar plantas y secciones, o bien, se puede llevar a
cabo utilizando programas computacionales que facilitan la visin en tres
dimensiones del modelo y permiten en consecuencia, modelar las diferentes
unidades con una visin un poco ms global.
A modo de ejemplo, se entregan dos secciones donde la litologa se presenta
codificada con colores para facilitar la interpretacin geolgica y el modelamiento
de los cuerpos mineralizados (Figura 3), adems de un modelo tridimensional que
permite entender de mejor manera la forma, posicin y continuidad de estas
unidades (Figura 4).

Figura 3: Modelamiento geolgico: secciones.

Simulacin Geoestadstica

12

Figura 4: Modelamiento geolgico: modelo tridimensional.


Debe, sin embargo, tenerse en cuenta que la interpretacin geolgica es
susceptible de cambios, si la nueva informacin que se recoge resulta
contradictoria con el modelo inicial. Por esta razn, es importante revisar
constantemente el modelo de manera de irlo corrigiendo a medida que se tiene un
mayor conocimiento de las caractersticas del depsito.
Como se mencionaba, la visualizacin de la informacin puede realizarse de
diversas formas, segn el fin que se persiga. En ciertos casos puede ser til
presentar las muestras codificadas por color, y en otros puede interesar ver los
sectores con ley mayor a un determinado umbral, para lo que resultara ms til
utilizar un mapa de indicador, donde se distingan solamente con dos colores las
zonas bajo el umbral y las que estn sobre l. En otros casos, puede interesar
visualizar los valores.
Un mapa como el que se presenta en la Figura 5, permite determinar la posicin
de zonas ricas y zonas pobres, pues adems de explicitar los valores, codifica las
muestras con colores. De esta manera es ms fcil visualizar los sectores de
inters.

Figura 5: Despliegue de datos en planta codificados por color.

Simulacin Geoestadstica

13

A travs de las diversas formas de desplegar los datos se llega a conocer de


mejor manera la distribucin de las leyes y se puede tener una primera idea de la
continuidad que posee el depsito.
Para realizar un anlisis preliminar de los datos debe recurrirse a las herramientas
que la estadstica clsica ofrece.
Tablas de frecuencia e histogramas
Una de las formas ms comunes y tiles para presentar datos es la tabla de
frecuencia y su grfico correspondiente, el histograma. La tabla de frecuencia
registra cun seguido los datos caen en determinados intervalos o clases.
Comnmente se utiliza un ancho de clase constante de manera que la altura de
cada barra del histograma sea proporcional al nmero de valores en la clase. El
histograma corresponde a una forma de representar la distribucin experimental
de los datos. Es decir, da una idea de la distribucin real de la poblacin.
A modo de ejemplo se presentan la siguiente tabla de frecuencias (Tabla 1) y su
histograma correspondiente (Figura 6):
Clase
0,0
0,1
0,2
0,3
0,4
0,5
0,6
0,7
0,8
0,9
1,0
1,1
1,2
1,3
1,4
1,5
1,6
1,7
1,8
1,9
2,0
2,1
2,2
2,3
2,4
2,5

0,1
0,2
0,3
0,4
0,5
0,6
0,7
0,8
0,9
1,0
1,1
1,2
1,3
1,4
1,5
1,6
1,7
1,8
1,9
2,0
2,1
2,2
2,3
2,4
2,5
2,6

Frecuencia
0
9
48
108
146
149
155
162
181
158
177
165
128
119
119
88
81
66
47
40
39
48
33
13
20
11

%
0,00
0,38
2,02
4,55
6,14
6,27
6,52
6,82
7,62
6,65
7,45
6,94
5,39
5,01
5,01
3,70
3,41
2,78
1,98
1,68
1,64
2,02
1,39
0,55
0,84
0,46

Clase
2,6
2,7
2,8
2,9
3,0
3,1
3,2
3,3
3,4
3,5
3,6
3,7
3,8
3,9
4,0
4,1
4,2
4,3
4,4
4,5
4,6
4,7
4,8
4,9
5,0
5,1

2,7
2,8
2,9
3,0
3,1
3,2
3,3
3,4
3,5
3,6
3,7
3,8
3,9
4,0
4,1
4,2
4,3
4,4
4,5
4,6
4,7
4,8
4,9
5,0
5,1
y mayor

Tabla 1: Tabla de frecuencia.

Frecuencia
8
9
9
6
4
1
4
0
3
0
1
1
1
0
3
2
2
1
0
0
1
0
0
1
0
9

%
0,34
0,38
0,38
0,25
0,17
0,04
0,17
0,00
0,13
0,00
0,04
0,04
0,04
0,00
0,13
0,08
0,08
0,04
0,00
0,00
0,04
0,00
0,00
0,04
0,00
0,38

Simulacin Geoestadstica

14
Histograma

200
180
160

Frecuencia

140
120
100
80
60
40
20
0
0

0,2 0,4 0,6 0,8

1,2 1,4 1,6 1,8

2,2 2,4 2,6 2,8

3,2 3,4 3,6 3,8

4,2 4,4 4,6 4,8

Clase

Figura 6: Histograma.
Mediante la visualizacin del histograma, se puede definir la existencia de valores
errticos altos. Se considerar un valor errtico alto aquel que se destaque en su
vecindad por ser extremadamente alto en relacin con los dems y que ocurra con
poca frecuencia. Como se ve es una definicin un tanto ambigua que requiere del
discernimiento de quin est analizando los datos.
En el caso de evaluaciones de reservas interesan las frecuencias acumuladas
sobre lmites inferiores (por ejemplo, leyes de corte). Para esto, la preparacin de
tablas de frecuencia acumulada y sus correspondientes histogramas
acumulados se hace despus de ordenar los datos en orden decreciente.
En el clculo se considera el nmero total de valores sobre una cierta ley de
corte. El histograma acumulado es una funcin no decreciente entre 0 y 100%.
Ambas formas, porcentaje de frecuencia y porcentaje de frecuencia acumulada se
utilizan indistintamente pues uno se obtiene del otro.
Enseguida se presentan para los mismos datos anteriores, la tabla de frecuencia
acumulada (Tabla 2) y el histograma acumulado (Figura 7).

Simulacin Geoestadstica

Ley de
Corte ZC
0,0
0,1
0,2
0,3
0,4
0,5
0,6
0,7
0,8
0,9
1,0
1,1
1,2
1,3
1,4
1,5
1,6
1,7

Frecuencia
Acumulada
2376
2376
2367
2319
2211
2065
1916
1761
1599
1418
1260
1083
918
790
671
552
464
383

15

%
Z(u) > ZC
0,00
0,38
2,40
6,94
13,09
19,36
25,88
32,70
40,32
46,97
54,42
61,36
66,75
71,76
76,77
80,47
83,88
86,66

Ley de
Corte ZC
1,8
1,9
2,0
2,1
2,2
2,3
2,4
2,5
2,6
2,7
2,8
2,9
3,0
3,1
3,2
3,3
3,3
3,4

Frecuencia
Acumulada
317
270
230
191
143
110
97
77
66
58
49
40
34
30
29
25
25
25

%
Z(u) > ZC
88,64
90,32
91,96
93,98
95,37
95,92
96,76
97,22
97,56
97,94
98,32
98,57
98,74
98,78
98,95
98,95
98,95
99,07

Ley de
Corte ZC
3,5
3,6
3,7
3,8
3,9
4,0
4,1
4,2
4,3
4,4
4,5
4,6
4,7
4,8
4,9
5,0
y mayor

Frecuencia
Acumulada
22
22
21
20
19
19
16
14
12
11
11
11
10
10
10
9
9

%
Z(u) > ZC
99,07
99,12
99,16
99,20
99,20
99,33
99,41
99,49
99,54
99,54
99,54
99,58
99,58
99,58
99,62
99,62
100,00

Tabla 2: Tabla de frecuencia acumulada.

Histograma acumulado

Frecuencia acumulada

100%

80%

60%

40%

20%

0%
0

0,2 0,4 0,6 0,8

1,2 1,4 1,6 1,8

2,2 2,4 2,6 2,8

3,2 3,4 3,6 3,8

4,2 4,4 4,6 4,8

Clase

Figura 7: Histograma acumulado.


Funcin de densidad de probabilidad
Las muestras con las que se construye el histograma provienen de una poblacin
subyacente cuyo conocimiento completo est, en general, fuera de nuestro
alcance. Sin embargo el conjunto de muestras nos permite estimar parmetros de
dicha poblacin. Es as como en general estaremos hablando de estadsticas de la
muestra (en el sentido estadstico de la palabra, es decir, hablamos del conjunto

Simulacin Geoestadstica

16

de datos extrados de la poblacin subyacente), en lugar de estar hablando de la


poblacin. Por esta razn introducimos la nocin de funcin de densidad de
probabilidad.
En simples palabras, esta funcin es a la poblacin lo que el histograma es a la
muestra o conjunto de datos. La funcin de densidad de probabilidad indica
precisamente la densidad de probabilidad para un valor dado de la variable. El
caso es anlogo al histograma, que entrega la frecuencia de que el valor est en
una determinada clase. La funcin de densidad de probabilidad corresponde al
lmite si se conociera de manera exhaustiva la poblacin del histograma con un
infinito nmero de clases.
Funcin de distribucin acumulada
Al igual que en el caso del histograma, se puede construir una funcin de
distribucin acumulada a partir de la funcin de densidad de probabilidad. La
funcin acumulada ser simplemente la integral de menos infinito al valor de
inters de la funcin de densidad de probabilidad. Esta funcin entrega la
probabilidad de un punto de tener un valor menor al valor de inters antes
mencionado.
En ecuaciones:
f ( x)

funcin de densidad de probabilidad


x

F(x) = f ( y )dy

funcin de distribucin acumulada

Estadsticas bsicas
Los datos experimentales slo permiten construir el histograma, mediante el cual,
se pueden estimar algunos parmetros de la distribucin de la poblacin real. El
histograma puede ser descrito por unos pocos estadsticos los que se dividen en
medidas de posicin, de dispersin y de forma.
Medidas de posicin:
Media m: corresponde al estimador de la media de la poblacin (parmetro de
la distribucin), y se calcula como el promedio aritmtico de los valores
experimentales z(u):

m=

1 n
z (u )
n =1

1
z (u )du
D D

Simulacin Geoestadstica

17

Mediana M: es el punto medio de los valores observados si se ordenan en forma


creciente. La mitad de los valores estn sobre la mediana y la otra mitad, bajo ella.
Si se ordenan los datos tal que z (u1 ) z (u 2 ) ... z (u n ) , la mediana de la
distribucin se estima:
z (u( n+1) / 2 )

M = ( z (u n / 2 ) + z (u( n / 2)+1 ))

si n es par
si n es impar

La mediana puede obtenerse fcilmente de un grfico de probabilidad. Si el eje


Y registra la frecuencia acumulada y el eje X la ley, la mediana es el valor en el eje
X correspondiente al 50 % en el eje Y.
La media y la mediana son medidas de la ubicacin del centro de la distribucin,
sin embargo, la media es sensible a los valores errticos altos y la mediana no lo
es.
Moda: La moda es el valor que ocurre ms frecuentemente. La clase cuya barra
es la ms alta en el histograma da una idea de dnde est la moda. Una
desventaja de la moda es que cambia con la precisin de los valores. Por esta
razn no se usa cuando se trabaja con muchos dgitos significativos.
Mnimo: Corresponde al menor valor entre los datos experimentales. En algunos
casos este valor es slo el lmite de deteccin, lo que puede acarrear problemas
en algunos mtodos de estimacin.
Mximo: Es simplemente el valor ms alto entre los datos y da una idea del rango
en que se mueven los valores de la distribucin.
Rango: Corresponde al intervalo dentro del cual se presentan los valores
experimentales. Est definido, por lo tanto, por la diferencia entre el mximo y el
mnimo.
Cuartil inferior y superior: De la misma forma en que la mediana corta los datos
en dos mitades, los cuartiles cortan los datos en cuartos. Si los datos se ordenan
en forma creciente, entonces un cuarto de los datos caer bajo el cuartil inferior o
primer cuartil Q1 o Q.25 y un cuarto caer sobre el tercer cuartil o cuartil superior Q3
o Q.75.
Deciles, percentiles y cuantiles: La idea de dividir la distribucin en mitades con
la mediana o en cuartos con los cuartiles, puede extenderse a cualquier otra
fraccin. Los deciles dividen los datos en dcimos. Una dcima parte de los datos
cae bajo el primer decil, dos dcimas partes lo hacen bajo el segundo y as
sucesivamente. El quinto decil corresponde a la mediana. De la misma manera,
los percentiles dividen los datos en centsimos. El vigsimo quinto percentil es el
mismo que el primer cuartil, el quincuagsimo percentil corresponde a la mediana

Simulacin Geoestadstica

18

y el septuagsimo quinto, al tercer cuartil. Los cuantiles son una generalizacin de


esta idea.
La forma de notar los cuantiles es una letra q con el tanto por uno en el subndice.
Por ejemplo: q.05 para el percentil 5
q.25 para el primer cuartil
q.5 para la mediana
Medidas de dispersin:
Varianza s2: corresponde al estimador de la varianza de la poblacin 2 y est
dada por el promedio de las diferencias al cuadrado de los valores y la media de
los datos.
s2 =

1 n
( z (u ) m) 2

n =1

2 =

1
( z (u ) ) 2 du

DD

Dado que son diferencias al cuadrado, la varianza es muy sensible a valores


errticos muy altos. Una desventaja de este parmetro es que sus unidades son
las de la variable al cuadrado.
Desviacin estndar s: corresponde simplemente a la raz cuadrada de la
varianza. Se usa frecuentemente en lugar de la varianza puesto que tiene las
mismas unidades que la variable que describe.
s = s2

= 2

Rango intercuartil (IQR): Otra medida til para describir la dispersin de los
valores observados es el rango intercuartil. Es la diferencia entre los cuartiles
superior e inferior y est dado por:
IQR = Q 3 Q 1
Al contrario que la varianza y la desviacin estndar, el rango intercuartil no utiliza
la media como centro de la distribucin y por esta razn se la prefiere cuando
algunos valores errticos influencian fuertemente la media.
Coeficiente de variacin (CV): Este estadstico se utiliza para comparar la
dispersin de la distribucin relativa a la media (se asume aqu que se estudian
variables positivas), dividiendo el valor de la desviacin estndar por la media:

CVexp . =

s
m

CVpobl. =

Simulacin Geoestadstica

19

Si la estimacin es el objetivo del estudio, el coeficiente de variacin puede indicar


algunas precauciones que tomar para evitar posteriores problemas. Un coeficiente
de variacin mayor que uno indica la presencia de algunas muestras errticas
altas que pueden tener un importante impacto en las estimaciones finales.
A modo de ejemplo, se pueden sealar los siguientes coeficientes de variacin
para ciertos tipos de depsitos:
Yacimiento tipo prfido cuprfero
Yacimiento de cobre de mediana variabilidad
Yacimiento de oro de alta variabilidad

CV = 0.7
CV = 1.5
CV = 4.5

Para ilustrar estos casos, se presentan plantas de estos tres yacimientos con
diferentes grados de continuidad (Figura 8). A la izquierda, se muestra el
yacimiento tipo prfido cuprfero, cuya mineralizacin es bastante continua. A la
derecha arriba, el yacimiento de cobre de mediana variabilidad, donde se aprecia
que la mineralizacin es un poco ms discontinua. Y finalmente, debajo del
anterior se presenta el yacimiento de oro de alta variabilidad, donde se aprecia
una mineralizacin muy discontinua, con bolsones de alta ley extendidos
preferentemente en la direccin N 50E aproximadamente. Esta tendencia de la
variable a ser ms continua en una direccin que en otra, se denomina
anisotropa, y ser estudiada ms adelante.
Medidas de forma
Coeficiente de asimetra (skewness): Una caracterstica del histograma que los
estadsticos anteriores no capturan es su simetra. El estadstico ms utilizado
para referirse a la forma de una distribucin es la cantidad llamada coeficiente de
asimetra. En realidad, el trmino skewness se traduce como sesgo, y se entiende
como el hecho de que la media y la mediana no son iguales, por lo que el
histograma es asimtrico (lo que se presta a confusin pues el trmino sesgo se
utiliza principalmente para describir la diferencia entre la estimacin y la realidad).
Este coeficiente se define como:
1 n
( z (u ) m) 3

n
Coeficiente de asimetra = =1
s3

El numerador es el promedio de las diferencias al cubo entre los valores y su


media, y el denominador es la desviacin estndar al cubo.
El coeficiente de asimetra es ms sensible a los valores errticos altos que la
media o la varianza. Un solo valor alto puede influenciar de manera importante

Simulacin Geoestadstica

20

este coeficiente dado que las diferencias entre los datos y la media estn elevadas
al cubo.
A menudo no se utiliza la magnitud de este coeficiente, sino que slo su signo
para describir la simetra (Figura 9). Un histograma positivamente sesgado tiene
una larga cola de valores altos hacia la derecha, haciendo que la mediana sea
menor que la media. En datos geoqumicos, asimetras positivas son tpicas
cuando la variable descrita es la concentracin de un elemento menor. Si se tiene
una larga cola de valores bajos hacia la izquierda y la mediana es mayor que la
media, lo que es tpico en el caso de concentraciones de elementos mayores, el
histograma ser negativamente asimtrico. Si el coeficiente es cercano a cero, el
histograma es aproximadamente simtrico y la mediana se parece a la media
(este es el caso de las distribuciones Gaussianas, por ejemplo).

Figura 8: Plantas de yacimientos con diferentes grados de continuidad.


Izquierda: Yac. de cobre (m = 0,969%; = 0,680%; CV = 0,702);
Derecha arriba: Yac. de cobre (m = 0,355%; = 0,535%; CV = 1,508);
Derecha abajo: Yac. de oro (m = 0,534 g/t; = 2,408 g/t; CV = 4,513).

Simulacin Geoestadstica

21

Frec.

Frec.

Mm

z(x)

Frec.

M
m

z(x)

mM

z(x)

Figura 9: Coeficiente de asimetra (skewness)


Izquierda: distribucin positivamente sesgada; Centro: distr. simtrica
(coeficiente cercano a 0); Derecha: distribucin negativamente sesgada.
Coeficiente de aplanamiento (Kurtosis): Si se tiene un histograma simtrico,
este coeficiente da una idea del aplanamiento de la distribucin, es decir, de la
relacin entre la altura y el ancho de la campana. Sirve para comprobar si una
distribucin simtrica es Gaussiana, caso en el cual este coeficiente es 3. Se
calcula como el promedio de las diferencias entre los valores experimentales y la
media, elevadas a la cuarta potencia dividido por la varianza al cuadrado:
1 n
( z (u ) m) 4
n =1
Coeficiente de aplanamiento =
s4

Simulacin Geoestadstica

22

4. DISTRIBUCIONES DE PROBABILIDAD NORMAL Y LOGNORMAL


Distribucin Normal
Algunas herramientas de estimacin funcionan mejor si la distribucin de los datos
se parece a una Gaussiana. La distribucin Gaussiana, tambin llamada normal,
es una de las distribuciones para las cuales existe una descripcin matemtica
concisa. Luego, tiene propiedades que favorecen su uso para enfoques tericos
de estimacin. Es interesante, por lo tanto, saber qu tan cercana es la
distribucin de los datos a una Gaussiana.
En primer lugar, se debe recordar que la funcin de densidad de probabilidad
de una distribucin normal es:
g( z ) =

1
2

1 z

donde:
z es el valor observado
2 es la varianza de la poblacin
es la media de la poblacin
Y si se hace:

y=

se tiene la funcin de densidad de probabilidad de una normal de media 0 y


varianza 1, llamada distribucin normal estndar y que se designa N(0,1):
g( y ) =

1
2

y
2

Las caractersticas de esta distribucin estn tabuladas. El rea bajo la curva de


densidad de probabilidad, corresponde a la frecuencia acumulada, es decir, si se
nota G(y) a la frecuencia acumulada, se tendr:
y

G( y ) =

g( y) dy

A continuacin se presenta, a modo de ejemplo, el grfico de densidad de


probabilidad y de densidad acumulada para una distribucin normal de media 8 y
varianza 2 (Figura 10).

Simulacin Geoestadstica

23

g(z)

G(z)1.0

0.40

0.9

0.35

0.8

0.30

0.7

0.25

0.6

0.20

0.5
0.4

0.15

0.3

0.10

0.2

0.05

0.1

0.00

0.0
0

10

12

14

16

10

12

14

16

Figura 10: Distribucin normal.


Izquierda: densidad de probabilidad; Derecha: densidad acumulada.

Repasando los principales estadsticos para esta distribucin, se puede ver que si
se tienen n muestras, la media se estima simplemente con el promedio de los
datos:

Media de las muestras = m =

1 n
z (u )
n =1

Sin embargo para estimar la varianza en el caso en que las muestras no estn
1
1
por
. Esto, para tener
correlacionadas, es necesario reemplazar el factor
n
n 1
un estimador insesgado de la varianza de la poblacin. De esta manera, la
varianza se estima a travs de la siguiente frmula:
2

1 n 2
Varianza de las muestras = s =
z (u ) z (u ) / n

n 1 =1
=1

Los lmites de confianza se pueden obtener de la tabla de frecuencia acumulada


de la distribucin normal estandarizada, en el caso en que se tiene ms de 25
datos experimentales. A partir de esta tabla, se puede decir que el intervalo central
de confianza a un 68% de probabilidad est dado por (Figura 11):

[m s ; m + s]
Y el intervalo central de confianza a un 95% de probabilidad:

[m 1.96 s ; m + 1.96 s]

Simulacin Geoestadstica

24

g(z)

g(z)

0.40

0.40

0.35

0.35

0.30

0.30

0.25

0.25

0.20

0.20

68%

0.15

0.15

0.10

0.10

0.05
0.00
0

95 %

16%
2

10

12

14

16

0.00
0

2.5%

2.5%

0.05

16%

10

12

14

16

Figura 11: Distribucin normal.


Intervalos de confianza central a 68% (izquierda) y 95% (derecha) de
probabilidad.

Para determinar los lmites de confianza para cualquier probabilidad, se debe


utilizar la Tabla 3 que entrega la probabilidad acumulada bajo y para una
distribucin normal estndar (media 0 y varianza 1). A modo de ejemplo, se
presenta destacado el valor de la probabilidad acumulada para un intervalo de
confianza central de 80%. Es necesario tener en cuenta que este intervalo es
central, por lo que en la tabla de ms abajo es necesario encontrar el valor que
acumula el 90% de la distribucin. Este valor corresponde aproximadamente a
1,28 (Figura 12).
g(y)
0.40
0.35
0.30
0.25
0.20

90 %

0.15
0.10
0.05
0

-4

-3

-2

-1

Figura 12: Distribucin normal: probabilidad acumulada bajo y =1,28.

Simulacin Geoestadstica

y
0
0,1
0,2
0,3
0,4
0,5
0,6
0,7
0,8
0,9
1
1,1
1,2
1,3
1,4
1,5
1,6
1,7
1,8
1,9
2
2,1
2,2
2,3
2,4
2,5
2,6
2,7
2,8
2,9
3

0,00
0,50000
0,53983
0,57926
0,61791
0,65542
0,69146
0,72575
0,75804
0,78814
0,81594
0,84134
0,86433
0,88493
0,90320
0,91924
0,93319
0,94520
0,95543
0,96407
0,97128
0,97725
0,98214
0,98610
0,98928
0,99180
0,99379
0,99534
0,99653
0,99744
0,99813
0,99865

0,01
0,50399
0,54380
0,58317
0,62172
0,65910
0,69497
0,72907
0,76115
0,79103
0,81859
0,84375
0,86650
0,88686
0,90490
0,92073
0,93448
0,94630
0,95637
0,96485
0,97193
0,97778
0,98257
0,98645
0,98956
0,99202
0,99396
0,99547
0,99664
0,99752
0,99819
0,99869

0,02
0,50798
0,54776
0,58706
0,62552
0,66276
0,69847
0,73237
0,76424
0,79389
0,82121
0,84614
0,86864
0,88877
0,90658
0,92220
0,93574
0,94738
0,95728
0,96562
0,97257
0,97831
0,98300
0,98679
0,98983
0,99224
0,99413
0,99560
0,99674
0,99760
0,99825
0,99874

25

0,03
0,51197
0,55172
0,59095
0,62930
0,66640
0,70194
0,73565
0,76730
0,79673
0,82381
0,84849
0,87076
0,89065
0,90824
0,92364
0,93699
0,94845
0,95818
0,96638
0,97320
0,97882
0,98341
0,98713
0,99010
0,99245
0,99430
0,99573
0,99683
0,99767
0,99831
0,99878

0,04
0,51595
0,55567
0,59483
0,63307
0,67003
0,70540
0,73891
0,77035
0,79955
0,82639
0,85083
0,87286
0,89251
0,90988
0,92507
0,93822
0,94950
0,95907
0,96712
0,97381
0,97932
0,98382
0,98745
0,99036
0,99266
0,99446
0,99585
0,99693
0,99774
0,99836
0,99882

0,05
0,51994
0,55962
0,59871
0,63683
0,67364
0,70884
0,74215
0,77337
0,80234
0,82894
0,85314
0,87493
0,89435
0,91149
0,92647
0,93943
0,95053
0,95994
0,96784
0,97441
0,97982
0,98422
0,98778
0,99061
0,99286
0,99461
0,99598
0,99702
0,99781
0,99841
0,99886

0,06
0,52392
0,56356
0,60257
0,64058
0,67724
0,71226
0,74537
0,77637
0,80511
0,83147
0,85543
0,87698
0,89617
0,91308
0,92785
0,94062
0,95154
0,96080
0,96856
0,97500
0,98030
0,98461
0,98809
0,99086
0,99305
0,99477
0,99609
0,99711
0,99788
0,99846
0,99889

0,07
0,52790
0,56749
0,60642
0,64431
0,68082
0,71566
0,74857
0,77935
0,80785
0,83398
0,85769
0,87900
0,89796
0,91466
0,92922
0,94179
0,95254
0,96164
0,96926
0,97558
0,98077
0,98500
0,98840
0,99111
0,99324
0,99492
0,99621
0,99720
0,99795
0,99851
0,99893

0,08
0,53188
0,57142
0,61026
0,64803
0,68439
0,71904
0,75175
0,78230
0,81057
0,83646
0,85993
0,88100
0,89973
0,91621
0,93056
0,94295
0,95352
0,96246
0,96995
0,97615
0,98124
0,98537
0,98870
0,99134
0,99343
0,99506
0,99632
0,99728
0,99801
0,99856
0,99896

0,09
0,53586
0,57535
0,61409
0,65173
0,68793
0,72240
0,75490
0,78524
0,81327
0,83891
0,86214
0,88298
0,90147
0,91774
0,93189
0,94408
0,95449
0,96327
0,97062
0,97670
0,98169
0,98574
0,98899
0,99158
0,99361
0,99520
0,99643
0,99736
0,99807
0,99861
0,99900

Tabla 3: Distribucin normal: probabilidad acumulada bajo y.

Es importante tambin conocer la distribucin de la media, puesto que es uno de


los estimadores ms utilizados en minera.
Para esto, se debe recordar el Teorema Central del Lmite:
Si x 1, x 2 ,..., x n son variables aleatorias independientes de esperanza y varianza
n

, entonces la variable aleatoria media m =


2

normal de media y varianza

x
=1

tiende a una distribucin

2
.
n

As, la distribucin de la media se presenta mucho ms estrecha que la


distribucin de los datos en un histograma dada la reduccin de la varianza.
Ntese que las variables aleatorias x 1, x 2 ,..., x n no tienen que ser necesariamente
Gaussianas.

Simulacin Geoestadstica

26

Adems, los lmites de confianza para la media, calculados con los datos
experimentales, pasan a ser los siguientes en el caso del 68% de probabilidad
central:

s
s
;m +
m

n
n

Y para el 95% de probabilidad, el intervalo de confianza central es:

s
s
; m + 1.96
m 1.96

n
n

Ahora bien, si se tiene menos de 25 muestras, es necesario recurrir a la


distribucin t de student. Los lmites de confianza centrales para una probabilidad
de (100 2 p ) sern:

s
s
;m + t P
m t P

n
n

Para este clculo es necesario utilizar la Tabla 4, que entrega el valor de tP para
distintos grados de libertad, que corresponden a n-1, siendo n el nmero de datos.
Ejemplo:
Se tiene un conjunto de 20 datos con media 2 y varianza 4, y se quiere determinar
el intervalo de confianza central para la media a 90 % de probabilidad. Utilizando
la tabla anterior, se determina que para un 90 % de probabilidad central, se debe
buscar el valor de tP que acumule el 95 % de probabilidad, con 19 grados de
libertad (n-1). Con esto, se obtiene tP = 1,7291. Luego, el intervalo de confianza
central para la media ser:

s
s
2
2
;m + t P
; 2 + 1,7291
= [1,226 ; 2,773]
m t P
= 2 1,7291
n
n
20
20

Simulacin Geoestadstica

Grados de
libertad
n-1
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
30
40
50
100
1000000

27

1-p
80 %

90 %

95 %

97,5 %

1,3764
1,0607
0,9785
0,9410
0,9195
0,9057
0,8960
0,8889
0,8834
0,8791
0,8755
0,8726
0,8702
0,8681
0,8662
0,8647
0,8633
0,8620
0,8610
0,8600
0,8591
0,8583
0,8575
0,8569
0,8562
0,8538
0,8507
0,8489
0,8452
0,8416

3,0777
1,8856
1,6377
1,5332
1,4759
1,4398
1,4149
1,3968
1,3830
1,3722
1,3634
1,3562
1,3502
1,3450
1,3406
1,3368
1,3334
1,3304
1,3277
1,3253
1,3232
1,3212
1,3195
1,3178
1,3163
1,3104
1,3031
1,2987
1,2901
1,2816

6,3137
2,9200
2,3534
2,1318
2,0150
1,9432
1,8946
1,8595
1,8331
1,8125
1,7959
1,7823
1,7709
1,7613
1,7531
1,7459
1,7396
1,7341
1,7291
1,7247
1,7207
1,7171
1,7139
1,7109
1,7081
1,6973
1,6839
1,6759
1,6602
1,6449

12,7062
4,3027
3,1824
2,7765
2,5706
2,4469
2,3646
2,3060
2,2622
2,2281
2,2010
2,1788
2,1604
2,1448
2,1315
2,1199
2,1098
2,1009
2,0930
2,0860
2,0796
2,0739
2,0687
2,0639
2,0595
2,0423
2,0211
2,0086
1,9840
1,9600

Tabla 4: Distribucin t de student.

Clculo de curvas tonelaje-ley para una distribucin normal

Si se tiene una distribucin normal de media y varianza 2 se puede calcular la


ley media y el porcentaje de la distribucin, sobre una determinada ley de corte zC.
Para esto, se utiliza la tabla de distribucin normal que se entreg antes, por lo
que se requiere llevar la distribucin N(,2) a una normal estndar N(0,1).
Al conocer el valor de la ley de corte zC, se puede determinar la probabilidad
acumulada de la distribucin sobre este valor, lo que representa tambin la
proporcin del tonelaje total que est sobre esta misma ley. Luego:
%( z > z C ) = G( y C )

Simulacin Geoestadstica

donde y C =

28

xC

Ahora, la ley media sobre dicha ley de corte, est dada por:

( z > z C ) = +

2
yC

e 2
2 G( y C )

Ejemplo:
Se tiene un yacimiento donde la ley sigue una distribucin normal de media = 5 y
desviacin estndar = 2. Se quiere determinar el tonelaje y la ley media sobre
una ley de corte zC = 3.
Primero, se pasa la ley de corte a una normal (0,1), restando la media y dividiendo
por la desviacin estndar:
yC =

zC 3 5
=
= 1

g(z)

g(z)

0.40

0.40

0.35

0.35

0.30

0.30

0.25

0.25

0.20

0.20

84.13%

0.15
0.10

0.10

0.05

0.05

-4

-3

-2

-1

84.13%

0.15

-4

-3

-2

-1

Figura 13: Ejemplo de clculo de tonelaje para distribucin normal:


Izquierda: Porcentaje acumulado bajo yC = 1 (obtenido de la tabla);
Derecha: Porcentaje acumulado sobre yC = -1 (equivalente a zC = 3).

La Tabla 3 entrega la probabilidad acumulada bajo el valor con que se ingresa


(Figura 13, izquierda). Sin embargo, se requiere encontrar la probabilidad

Simulacin Geoestadstica

29

acumulada sobre el valor ingresado en la tabla (Figura 13, derecha). En este


caso, se ingresa con 1 a la tabla antes mencionada, lo que nos entrega la
probabilidad acumulada de que la ley est entre - y 1, lo que equivale a la
probabilidad acumulada de que est entre -1 e (pues la distribucin normal es
simtrica), tal como se ve en las figuras anteriores.
Luego, buscando en la tabla la probabilidad acumulada bajo 1, obtenemos
0.84134, es decir, el 84.134% de la distribucin est bajo 1 y, por consiguiente,
sobre -1.
%( z > z C ) = G( 1) = 1 G(1)
Con esto, se obtiene el tonelaje. Ahora se debe determinar la ley media de este
tonelaje.

( z > z C ) = +

( z > 3) = 5 +

( z > 3) = 5 +

2
yC

e 2
2 G( y C )

( 1) 2

e 2
2 G( 1)

2
0.6065

2.5066 0.84134

( z > 3) = 5.5752
En resumen, para el yacimiento cuya distribucin de leyes es normal de media 5 y
desviacin estndar 2, el tonelaje sobre una ley de corte de 3 corresponde al
84,13 %, con una ley media de 5,5752.
Grfico de probabilidad normal

El grfico de probabilidad normal es un tipo de grfico de frecuencias acumuladas


que permite determinar si la distribucin es normal o no lo es.
En este grfico, el eje Y presenta una escala de probabilidad de 0 a 1,
representando la frecuencia acumulada de una Gaussiana, y el eje X corresponde
a una escala aritmtica que representa la ley de corte, de manera que las
frecuencias acumuladas se dibujan como una lnea recta si la distribucin es
normal.

Simulacin Geoestadstica

30

Figura 14: Grfico de probabilidad normal.

En el caso de la Figura 14, la distribucin es claramente diferente a una normal


(dado que los cuantiles no trazan una lnea recta).
Distribucin lognormal

Muchas variables en ciencias de la Tierra tienen distribuciones que no se acercan


a una Gaussiana. Es comn tener muchos valores muy bajos y pocos muy altos.
Como la distribucin normal es a menudo inapropiada como modelo para este tipo
de distribucin asimtrica, una distribucin relacionada, la lognormal, puede a
veces ser una buena alternativa.
Una poblacin tendr distribucin de probabilidad lognormal si los logaritmos de
los datos tienen un comportamiento normal. En el caso de leyes de elementos
de bajas concentraciones, estas distribuciones presentan una larga cola hacia los
valores altos, lo que puede permitir encontrar un valor extremadamente alto en un
pequeo conjunto de datos (muestras). En este caso, la media aritmtica es muy
poco confiable y podra ser bueno utilizar una media basada en la media
geomtrica, esto es, la raz ensima del producto de los n datos, que es ms
estable.
La funcin de densidad de probabilidad de una lognormal es:

g( z) =

1
2 ln( z + )

1
e
z+

1 ln( z + )

2 ln( z + )

Simulacin Geoestadstica

31

donde:
z es el valor observado
es la media de los ln(z+)
ln(z+) es la desviacin estndar de los ln(z+)
es la constante aditiva de la distribucin lognormal
La Figura 15 muestra la densidad de probabilidad y densidad acumulada de una
distribucin lognormal.
g(z)

G(z)

0.35

1.0

0.9

0.30

0.8

0.25

0.7
0.6

0.20

0.5

0.15

0.4
0.3

0.10

0.2

0.05
0.00

0.1

0.0

10

10

Figura 15: Distribucin lognormal


Izquierda: densidad de probabilidad; Derecha: densidad acumulada.

Si se hace x = ln(z+), se obtiene una distribucin normal para x, por lo que todos
los clculos vistos para este tipo de distribucin vuelven a ser vlidos para esta
nueva variable.

g( x ) =

1
2 ln( z + )

1 x

2 ln( z + )

A partir de esto, se pueden obtener algunas relaciones:

Media aritmtica:
Media geomtrica:

2
ln(
z + )

2
=e

M.G. = e

Lo que implica que la media aritmtica corresponde tambin a:


2
ln(
z +)

= (M.G. + ) e

Simulacin Geoestadstica

32

Adems:

Varianza de los valores z:


(M.G. + )
Moda =

2
e ln( z + )

2z = ( + ) 2 (e

2
ln(
z +)

1)

Clculo de curvas tonelaje-ley para una distribucin lognormal

Nuevamente, si se tiene una distribucin lognormal, se utiliza la tabla de la normal


de media 0 y varianza 1 para poder determinar el tonelaje y la ley media sobre una
ley de corte zC. Las frmulas sern las siguientes:
1
z + ln( z + )
+
%( z > z C ) = G
ln C

2
+
ln( z + )
1
z + ln( z + )

ln C
G

ln(
z
)

( z > z C ) =
1
z + ln( z + )
+
G
ln C

ln(
z
)

( + )

Ejemplo:
Se tiene un depsito aurfero de potencia variable, cuya acumulacin sigue una
distribucin de probabilidades lognormal de media 1015 cm*g/t y la desviacin
estndar de los ln(z+) es 1,3. La constante aditiva de la distribucin es = 60
cm*g/t. Se quiere determinar el tonelaje (en porcentaje) y la acumulacin media
sobre una ley de corte zC = 500 cm*g/t.
Utilizando primero la frmula para el tonelaje, se tiene:
1
z + ln( z + )
+
%( z > z C ) = G
ln C

2
+
ln( z + )

= G 1 ln 500 + 60 + 1,3 = G(0,15)


1,3

1015 + 60 2

Y de la tabla de la distribucin normal, se obtiene el valor de G:


G(0,15)= 0.55962
Sin embargo, este porcentaje corresponde a la probabilidad acumulada bajo la
acumulacin de corte deseada, por lo tanto, es necesario hacer 1 G(0,15), lo que
resulta 0,44038, es decir, el tonelaje sobre la acumulacin de corte es 44,038 %.

Simulacin Geoestadstica

33

Para la acumulacin media, se tiene:


1
z + ln( z + )

G
ln C

2
+
ln( z + )
( z > z C ) =
1
z + ln( z + )
+
G
ln C

2
+
ln( z + )

( + )

1
500 + 60 1,3

G
ln

G( 1,15)
1,3 1015 + 60 2
(1015 + 60) 60 =
1075 60
( z > 500) =
G(0,15)
1
500 + 60 1,3

G
ln
+
1,3 1015 + 60 2
g(z)

g(z)

0.40

0.40

0.35

0.35

0.30

0.30

0.25

0.25

0.20

0.20

87.49%

0.15
0.10

0.10

0.05

0.05

-4

-3

-2

-1

87.49%

0.15

-4

-3

-2

-1

Figura 16: Ejemplo de clculo de acumulacin media para distr. lognormal:


Izquierda: Porcentaje acumulado bajo yC = 1,15 (obtenido de la tabla);
Derecha: Porcentaje acumulado sobre yC = -1,15.

De la tabla, se obtiene (Figura 16) que G(1,15) = 0,87493, que representa el rea
bajo el valor 1,15 (figura de la izquierda), y se quiere obtener el rea sobre G(1,15) (figura de la derecha), por lo tanto el valor recin obtenido es equivalente al
buscado, y finalmente:
( z > 500) =

0,87493
1075 60 = 2077
0,44038

Es decir, para un depsito cuya distribucin de acumulaciones sigue una


lognormal de media 1015 cm*g/t y constante aditiva = 60 cm*g/t, y en que la
desviacin estndar de los ln(z+) es 1,3, para una acumulacin de corte de 500
cm*g/t se tiene un tonelaje equivalente al 44,038 % del depsito con una
acumulacin media de 2077 cm*g/t.

Simulacin Geoestadstica

34

Se debe mencionar a modo de precaucin que la simple transformacin


logartmica de los valores y su posterior transformacin de vuelta a travs del la
funcin exponencial suele introducir un sesgo en las estimaciones.
Grfico de probabilidad lognormal

Al igual que el grfico de probabilidad normal, este grfico permite detectar si una
distribucin es lognormal o no.
Usando ahora escala logartmica en el eje X, correspondiente a la ley de corte, y
conservando la escala probabilstica en el eje Y, asociado a la frecuencia
acumulada, se puede verificar la lognormalidad si se obtiene una recta (Figura
17).

Figura 17: Grfico de probabilidad lognormal.

Es importante sealar que todo aquello que se asuma acerca de la distribucin de


los datos tendr posteriormente sus mayores impactos cuando se est estimando
valores extremos. Considerar linealidad en los extremos resulta muy comn y fcil
de hacer cuando el resto de la distribucin es una lnea recta, sin embargo, este
modelo bien ajustado puede ser muy diferente de la realidad.
Los grficos de probabilidad son tiles para chequear la presencia de mltiples
poblaciones. En todo caso, quiebres en el grfico no implican necesariamente
mltiples poblaciones, pueden slo representar cambios en las caractersticas de
las frecuencias acumuladas entre diferentes intervalos y las razones deben ser
exploradas.

Simulacin Geoestadstica

35

Se presenta a continuacin un ejemplo donde el cambio de pendiente es notorio y


se debe, en este caso, a la mezcla de dos poblaciones (Figura 18).

Figura 18: Grfico de probabilidad lognormal para dos poblaciones.

Para comprobar si esta inflexin en el grfico se debe a la presencia de ms de


una poblacin, se construye el histograma, el cual se presenta en la Figura 19.

Figura 19: Histograma de dos poblaciones.

Tal como poda suponerse, el histograma presenta dos modas (una muy cercana
a 0 y la otra alrededor de 0,8), lo que confirma que el quiebre en la curva del
grfico de probabilidad se deba a la presencia de ms de una poblacin. Como se
puede suponer, el estudio de esta clase de hechos debe hacerse cuidadosamente
en cada caso de manera de poder determinar el origen de estas variaciones en las
curvas de probabilidad.

Simulacin Geoestadstica

36

5. ANLISIS BIVARIABLE
Las herramientas anteriores permiten tener un conocimiento bastante acabado de
una poblacin de datos (variable regionalizada). Sin embargo, en un mismo
dominio puede existir ms de una poblacin de inters. Puede ocurrir que se
tengan datos de la misma variable medidos de diferentes maneras (a travs de
dos campaas de sondajes diferentes) o en distintos soportes, o bien, que exista
ms de una variable regionalizada de inters (por ejemplo, puede interesar la
acumulacin y la potencia, o la ley de oro y de plata en una veta, etc.). Por esta
razn, puede ser interesante verificar si las distribuciones son independientes, si
estn correlacionadas, o si son iguales, en el caso en que se estudia la misma
variable medida de distintas formas.
El primer anlisis que debe hacerse es la comparacin entre las estadsticas
bsicas (media, varianza, cuartiles,...) de las variables en estudio (para simplificar
hablaremos slo de dos variables, pero todos los anlisis son extensivos a
cualquier nmero de variables).
Dos histogramas parecidos indican que las distribuciones se parecen, pero no
indica que exista alguna relacin espacial entre ellas.
Grfico de dispersin o Scatterplot
El grfico de dispersin corresponde al tpico despliegue de los pares ordenados,
considerando una distribucin en cada eje del grfico. Es la forma ms sencilla de
comparar dos distribuciones, pues adems de dar una buena idea del
comportamiento de ambas variables, nos permite determinar si existe alguna
correlacin entre ellas, junto con ser una herramienta muy til para detectar
valores aberrantes.
A continuacin se presenta un tpico grfico de dispersin (Figura 20), donde se
puede ver que las dos variables presentadas estn fuertemente correlacionadas,
lo que puede cuantificarse utilizando las herramientas que se entregan ms
adelante.

Simulacin Geoestadstica

37
Grfico de Dispersin

2,5

Variable 2

1,5

0,5

0
0

0,5

1,5

2,5

Variable 1

Figura 20: Grfico de dispersin o scatterplot.


Q-q plot
Este mismo anlisis resulta ms interesante construyendo un q-q plot, que permite
un anlisis visual ms completo para comparar dos distribuciones (se trata en este
caso de comparar cuantil a cuantil). No se utiliza para verificar la relacin par a par
que hay entre ellas, sino que slo permite saber si las dos distribuciones se
parecen.
Se construye dividiendo las distribuciones en cuantiles y graficando el valor de un
mismo cuantil de una distribucin versus el de la otra. Un cuantil, tal como se
explic antes, es el valor de la distribucin acumulada bajo el cual se encuentra el
tanto % de la distribucin.
Ejemplo :
Se tienen dos sondajes con los valores presentados en la Tabla 5 (no importa el
orden que stos tengan en el sondaje, por lo que se entregan ordenados de
menor a mayor):
Para construir el q-q plot es necesario determinar el valor que alcanzan las
distribuciones en determinados cuantiles. En este caso, consideramos los deciles
(cada 10% de la distribucin). El grfico obtenido es el q-q plot de la Figura 21.

Simulacin Geoestadstica

38

Sondaje N1
N
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15

Ley
0.02
0.03
0.05
0.07
0.07
0.10
0.12
0.15
0.20
0.20
0.22
0.28
0.29
0.35
0.36

Sondaje N2
% Acum.
3.33
6.67
10.00
13.33
16.67
20.00
23.33
26.67
30.00
33.33
36.67
40.00
43.33
46.67
50.00

N
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30

Ley
0.40
0.50
0.52
0.61
0.66
0.85
1.03
1.10
1.20
1.32
1.40
1.42
1.50
1.53
1.55

% Acum.
53.33
56.67
60.00
63.33
66.67
70.00
73.33
76.67
80.00
83.33
86.67
90.00
93.33
96.67
100.00

N
1
2
3
4
5
6
7
8
9
10

Ley
0.01
0.02
0.04
0.08
0.12
0.15
0.35
0.52
0.78
0.96

% Acum.
5.00
10.00
15.00
20.00
25.00
30.00
35.00
40.00
45.00
50.00

N
11
12
13
14
15
16
17
18
19
20

Ley
1.02
1.02
1.10
1.15
1.20
1.22
1.24
1.25
1.27
1.29

% Acum.
55.00
60.00
65.00
70.00
75.00
80.00
85.00
90.00
95.00
100.00

Tabla 5: Datos para el clculo de un q-q plot.

QQ-Plot Sondaje 1 vs. Sondaje 2


1,6

1,4

Sondaje 2 (%Cu)

1,2

0,8

0,6

0,4

0,2

0
0

0,2

0,4

0,6

0,8

1,2

1,4

1,6

Sondaje 1 (%Cu)

Figura 21: Ejemplo de Q-q plot.


Si dos poblaciones son iguales, el q-q plot muestra los puntos en la recta de
identidad (x = y), puesto que los cuantiles seran iguales. Si el q-q plot da una
recta diferente a la identidad, se debe a que las distribuciones tienen la misma
forma, pero estn localizadas en una posicin distinta y con una dispersin
diferente.
Las curvas de probabilidad normal y lognormal antes presentadas, corresponden a
la misma idea del q-q plot, es decir, se comparan los cuantiles de una distribucin

Simulacin Geoestadstica

39

cualquiera con los de una normal o los de una lognormal, para verificar si son
iguales.
La similitud entre una poblacin y un modelo terico de distribucin normal o
lognormal se mide por la rectitud de los puntos en el grfico de probabilidad
respectivo.
Correlacin
Aunque el grfico de dispersin permite detectar la relacin que existe entre dos
variables, es necesario poder cuantificar qu tan buena es la correlacin. En
general, se pueden presentar tres casos que relacionen las dos variables:
correlacin positiva, correlacin negativa e inexistencia de correlacin.
Se considera una correlacin positiva si los valores altos de una variable estn
asociados a los valores altos de la otra, y los bajos de la primera lo estn tambin
con los bajos de la segunda. En un grfico de dispersin, esta situacin se detecta
como una nube de puntos elptica, cuyo radio mayor tiene pendiente positiva. Un
caso comn podra ser la comparacin entre la concentracin de dos elementos
presentes en una misma mineralizacin.
La correlacin negativa corresponde al caso donde valores altos de una variable
estn relacionados con valores bajos de la otra y viceversa. En este caso, la nube
de puntos tiene su eje mayor con pendiente negativa. Esto puede ocurrir en el
caso en que un elemento reemplaza a otro en una mineralizacin.
Finalmente, el caso en que no existe correlacin corresponde a aquel en que las
variables no estn relacionadas de ninguna manera. En el grfico de dispersin,
los pares ordenados generan una nube de puntos circular, sin un eje mayor
pronunciado.
Para cuantificar la relacin que existe entre dos variables se utiliza el coeficiente
de correlacin , el cual se calcula de la siguiente forma:
1 n
( z 1 m Z1 )( z 2 m Z 2 )
n =1
=
Z1 Z 2
donde
n es el nmero de datos.
los z 1 corresponden a los valores medidos para la primera variable.

los z 2 corresponden a los valores medidos para la segunda variable.


m Z1 y m Z 2 son las medias de la primera y segunda variable respectivamente.

Z1 y Z 2 son las desviaciones estndar tambin para ambas variables.

Simulacin Geoestadstica

40

Este valor expresa qu tan parecido a una recta es el conjunto de pares


ordenados presentados en el grfico de dispersin. Una alternativa al coeficiente
de correlacin es utilizar la covarianza entre las dos variables, que corresponde al
numerador de la frmula del coeficiente de correlacin. Sin embargo, la ventaja de
este ltimo es que resulta comparable pues siempre el valor est entre -1 y 1.
Tanto el coeficiente de correlacin como la covarianza son muy sensibles a
valores aberrantes, por lo que siempre es importante ver el grfico para poder
detectar situaciones de este tipo.
Para ejemplificar el efecto de un valor aberrante en el coeficiente de correlacin,
se presenta el siguiente caso (Figura 22), donde se muestra el valor de este
coeficiente al incluir y eliminar un valor aberrante (este efecto se conoce tambin
como efecto lollipop).
Correlacin con valor aberrante

Correlacin sin valor aberrante


Y

= 0,73
= -0,68
X

Figura 22: Efecto de un valor aberrante en el coeficiente de correlacin.

Como se ve, el coeficiente de correlacin cambia incluso de signo (aunque


obviamente esto depende de la posicin del valor aberrante respecto al resto de
los puntos).
Se presentan a continuacin otros ejemplos (Figura 23), donde se puede apreciar
el efecto que tiene sobre el valor de la posicin de los datos. Se muestran casos
con correlacin positiva, negativa y sin correlacin.

Simulacin Geoestadstica

41

Caso 1

Caso 2

Y
=1

= 0,68

Caso 3

Caso 4
Y

=0

=0

Caso 6

Caso 5
Y

Y
= -0,87
= -1

Figura 23: Ejemplos de correlacin.

A continuacin, se presenta la tabla de significacin del coeficiente de


correlacin (Tabla 6). Con ella se puede determinar si el coeficiente de
correlacin es significativo o no lo es. Para ello, se debe entrar con los grados de
libertad (que corresponden al nmero de muestras menos 1) y con la probabilidad
a la que se quiere ver la significacin. Si el coeficiente de correlacin obtenido a
partir de los datos es mayor que el que se obtiene de esta tabla con los
parmetros de entrada antes mencionados, entonces, se puede considerar que es

Simulacin Geoestadstica

42

significativo, es decir, que existe correlacin entre los conjuntos de datos en


estudio.
Grados de
libertad
n-1
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
25
30
35
40
45
50
60
70
80
90
100

Probabilidad
0,1
0,988
0,900
0,805
0,729
0,669
0,621
0,582
0,549
0,521
0,497
0,476
0,457
0,441
0,426
0,412
0,400
0,398
0,378
0,369
0,360
0,323
0,296
0,275
0,257
0,243
0,231
0,211
0,195
0,183
0,173
0,164

0,05
0,997
0,950
0,878
0,811
0,754
0,707
0,666
0,632
0,602
0,576
0,553
0,532
0,514
0,497
0,482
0,468
0,456
0,444
0,433
0,423
0,381
0,349
0,325
0,304
0,287
0,273
0,250
0,232
0,217
0,205
0,195

0,02
0,999
0,980
0,934
0,882
0,833
0,789
0,750
0,716
0,685
0,658
0,634
0,612
0,592
0,574
0,558
0,543
0,528
0,516
0,503
0,492
0,445
0,409
0,381
0,358
0,338
0,322
0,295
0,274
0,256
0,242
0,230

0,01
1,000
0,990
0,959
0,917
0,874
0,834
0,798
0,765
0,735
0,708
0,684
0,661
0,641
0,623
0,606
0,590
0,575
0,561
0,549
0,537
0,487
0,449
0,418
0,393
0,372
0,354
0,325
0,302
0,283
0,267
0,254

0,001
1,000
0,999
0,992
0,974
0,951
0,925
0,898
0,872
0,847
0,823
0,801
0,780
0,760
0,742
0,725
0,708
0,693
0,679
0,665
0,652
0,597
0,554
0,519
0,490
0,465
0,443
0,408
0,380
0,357
0,337
0,321

Tabla 6: Tabla de significacin para el coeficiente de correlacin.


Regresin normal

Resulta interesante poder estimar una variable utilizando otra, cuando ambas
estn relacionadas, es decir, cuando tienen un coeficiente de correlacin
significativo. Para esto, se utiliza la regresin lineal, que permite estimar una
variable con otra conocida, mediante la lnea de regresin que minimiza la suma
de los errores al cuadrado.
Sean Z1 y Z2 dos variables con distribucin normal:
Z 1 ~ N( Z1 , 2Z1 )
Z 2 ~ N( Z 2 , 2Z 2 )

Simulacin Geoestadstica

Se puede calcular: Z1Z 2 =

43

Z1Z 2
Z1 Z 2

. Los parmetros para calcular este valor se

presentan en la Tabla 7.

Descripcin

Parmetro de la
Poblacin

Media de Z1

Z1

m Z1 =

Media de Z2

Z2

m Z2

Varianza de Z1

2Z1

Varianza de Z2

2Z 2

Covarianza de Z1 y Z2

Z1Z 2

Coeficiente de
Correlacin

Z1Z 2

Estimador utilizando muestras

1 n
z1
n =1
1 n
= z2
n =1

1 n
( z 1 m Z1 ) 2

n 1 =1
1 n
s 2Z 2 =
(z 2 m Z2 ) 2

n 1 =1
1 n
=
(z 1 m Z1 )(z 2 m Z2 )
n 1 =1
s Z1Z 2
rZ1Z 2 =
s Z1 s Z 2
s 2Z1 =

s Z1Z 2

Tabla 7: Parmetros de la poblacin y sus estimadores, utilizados para el


clculo del coeficiente de correlacin.

La lnea de regresin ser:


z 2 = a z 1 + b

donde la pendiente a y la constante b, estn dadas por:


a = rZ1Z 2

s Z2
s Z1

b = m Z 2 rZ1Z 2

s Z2
s Z1

m Z1

Para poder comprender de mejor manera estos conceptos, se presenta a


continuacin un ejemplo, donde se seala la cantidad de pares ordenados en cada
celda, as como las lneas de regresin de y en x, y de x en y, junto a algunas
distribuciones marginales (globales) y condicionales para determinados valores
(Figura 24).
Las varianzas condicionales que se obtienen son vlidas condicionadas a
cualquier valor, es decir:

Simulacin Geoestadstica

44

2Z 2 / Z1 = 2Z 2 (1 r 2 )

z 1

2Z1 / Z 2 = 2Z1 (1 r 2 )

z 2

La regresin de z2 en z1 pasa por las medias de las columnas, mientras que la


regresin de z1 en z2, lo hace por las medias de las filas. Esto es lo que se llama
generalmente, medias condicionales.
5a. Fila

Ejemplo de distribuciones en filas horizontales


La media corresponde a la de la lnea MN de regresin
Z1/Z22 = Z12(1-r2) = 2,835

7
4

Variable z1

Variable z 2

K1

1
1

7
6

Lnea de
regresin
5
de z 2 en z 1
4
3

Lnea de regresin
de z 1 en z 2

M
0

1
7

10

Variable z1

4
9

9
15

11

12 0

15
20 20

Distribucin Marginal (Global) de z1


Media = 6
Z12 = 3,78
Z1 = 1,945

Coeficiente de
Correlacin
r = 0,5

Figura 24: Ejemplo de regresin, distribuciones marginales y condicionales.

15

12

15

31 31
Distribucin Marginal (Global) de
z2
Media = 5
2
Z2 = 1,334
Z2 = 1,155

11

10

4a. Columna

8a. Columna

Ejemplos de distribuciones
en columnas verticales
La media corresponde a la
de la lnea KL de regresin
2
2
2
Z2/Z1 = Z2 (1-r ) = 1,00

Variable z 2

1
9

Simulacin Geoestadstica

45

Regresin lognormal

En el caso en que ambas variables son lognormales:


2
ln( Z 1 + Z1 ) ~ N( Z1 , ln(
z1 + Z ) )
1

ln( Z 2 + Z 2 ) ~ N( Z 2 ,

2
ln( z 2 + Z 2 )

donde:
Z1 es la media de los ln( z1 + Z1 )

Z 2 es la media de los ln( z2 + Z 2 )

2
ln(
z 1 + Z1 ) es la varianza de los ln( z1 + Z 1 )

2
ln(
z 2 + Z2 ) es la varianza de los ln( z 2 + Z 2 )

se tiene que las ecuaciones para la regresin normal siguen siendo vlidas, pero
la recta de regresin es:

ln( z2 + Z 2 ) = Z 2 + r

sZ 2
sZ 1

ln( z1 + Z1 ) Z1 +

1 2
Z2 1 r 2
2

o bien,

sZ
1
ln( z2 + Z 2 ) = ln(mz2 + Z ) + r sZ 2 ( sZ1 r sZ 2 ) + r 2 ln( z1 + Z1 ) ln(mz1 + Z )
1
2
2
sZ1

Ejemplo:
Se presenta el caso del horizonte basal de la mina Harmony del Orange Free
State en Sudfrica, donde se dispona de la tabla de correlacin presentada en la
Figura 25 para bloques explotados que previamente haban sido estimados (se
considera que ambas distribuciones son lognormales con constante aditiva =
20). Las leyes estimadas de bloques se determinaron utilizando muestras
obtenidas en chimeneas en la periferia de los bloques, mientras que las leyes
reales se obtuvieron de muestras tomadas al interior de los bloques durante su
explotacin. Al interior de cada celda se presenta la frecuencia, es decir, el
nmero de bloques en cada intervalo.

Simulacin Geoestadstica

46

1102

36

68

14

52 120

60

23

85

35

12

6,33

5,87

5,41

4,95

Variable z 2: Ley real de bloques (cm*g/t)

Valor medio de ln(z2+ ) de la categora

6,79
688

427

262

158

92

4,49
51

92

158

262

427

688

1102

1758

Variable z1: Ley estimada de bloques (cm*g/t)


4,49

4,95

5,41

5,87

6,33

6,79

7,25

Valor medio de ln(z1+ ) de la categora

Figura 25: Tabla de correlacin para la mina Harmony.

En la figura anterior, se presenta el valor medio de cada categora para poder


realizar la regresin y el clculo del coeficiente de correlacin.
Las frecuencias para cada par ordenado se presentan en la Tabla 8.
Valor medio de ln(z1+b)
de la categora
4,49
4,49
4,95
4,95
4,95
5,41
5,41
5,41
5,41
5,87
5,87

Valor medio de ln(z2+b)


de la categora
4,95
5,41
4,95
5,41
5,87
4,95
5,41
5,87
6,33
4,95
5,41

Frec.
4
1
5
23
3
12
85
52
4
1
35

Valor medio de ln(z1+b)


de la categora
5,87
5,87
5,87
6,33
6,33
6,33
6,33
6,79
6,79
6,79
7,25

Valor medio de ln(z2+b)


de la categora
5,87
6,33
6,79
5,41
5,87
6,33
6,79
5,87
6,33
6,79
6,33

Frec.
120
36
1
8
60
68
7
5
14
4
2

Tabla 8: Frecuencias para los valores medios de cada categora.

Se deben calcular las varianzas de cada poblacin, covarianza y el coeficiente de


correlacin, de manera de poder obtener la recta de regresin lognormal. Se
trabajar sobre las siguientes variables (para utilizar las frmulas de regresin
normal):

1 = ln( z 1 + )
2 = ln( z 2 + )
Con esto, se tiene:
m 1 = 5,84

Simulacin Geoestadstica

47

m 2 = 5,83
s

2
1

1 n
1 n
n

2
2
= 0,221
(
m
)
f
f
/
n
=

1
1
1
1

n 1 =1
n 1 =1
=1

2
2

1 n
1 n
n

2
2
( 2 m 2 ) =
f 2 f 2 / n = 0,157
=

n 1 =1
n 1 =1
=1

s 1 2 =
=

r1 2 =

1 n
( 1 m 1 )( 2 m 2 )
n 1 =1
n
1 n
n

f 1 2 f 1 f 2 / n = 0,123
n 1 =1
=1
=1

s 1 2
s 1 s 2

= 0,660

donde los f representan la frecuencia en la categora.


De esta forma, se obtiene la recta de regresin lognormal:
ln(z 2 + Z 2 ) = Z 2 + r

ln( z 2 + 20) = 5,83 + 0,660

sZ2
s Z1

ln(z 1 + Z 1 ) Z1 +

1
2Z2 1 r 2
2

0,396
1
(ln( z 1 + 20 ) 5,84 ) + 0,157 1 0,660 2
0,470
2

ln( z 2 + 20) = 0,556 ln( z 1 + 20) + 2,626

As, para bloques que se haban estimado con una ley de 100 cm*g/t, se obtuvo
en realidad una media de:
ln( z 2 + 20) = 0,556 ln(100 + 20) + 2,626 z 2 = 178 cm * g / t

(Subestimacin)

Por otro lado, para bloques estimados como de alta ley, por ejemplo, 800 cm*g/t,
se obtuvo:
ln( z 2 + 20) = 0,556 ln(800 + 20) + 2,626 z 2 = 556 cm * g / t

Este fenmeno es el que se conoce como sesgo condicional.

(Sobrestimacin)

Simulacin Geoestadstica

48

El sesgo condicional causa los siguientes problemas:


Sube la ley de corte, es decir, si se utiliza la ley de corte para los valores
estimados, en realidad, se estar imponiendo una ley de corte ms alta (en los
valores reales), pues al existir sesgo condicional, se subestiman las bajas leyes
(donde generalmente est la ley de corte) y se sobreestiman las altas.
Sobreevala la ley media sobre la ley de corte y por lo tanto sobreestima el
valor del proyecto.
Hace disminuir el tamao del rajo final en el diseo.
Paso de la regresin a promedios ponderados

Si se revisa la ecuacin de la recta de regresin, en el caso en que las medias de


ambas variables son iguales (como es el caso cuando se tiene que una variable es
el estimador de la otra), se ve que el valor obtenido de la regresin puede
corresponder a un promedio ponderado de los valores de muestras de la periferia
de los bloques y de la ley media del sector de inters en la mina (Figura 26).

sZ
z 2 = z 1 r 2
sZ
1

s
+ m 1 r Z 2

s Z1

Valores
perifricos

Otros valores
en el sector

Figura 26: Posicin de muestras perifricas y alejadas del bloque a estimar.

Este corresponde a un primer acercamiento al mtodo de estimacin llamado


kriging, que ser revisado ms adelante. A esta ponderacin de los datos
perifricos y de la media, pueden agregarse datos ms cercanos al bloque, pero
no perifricos, a los que se les puede dar un peso superior al de la media e inferior
al de los datos perifricos, pues estos estn ms cerca del bloque, por lo que la
correlacin con la ley del bloque debera ser mayor (por lo tanto son ms
confiables). Luego, este sera un segundo paso para llegar finalmente a tener que
los valores externos al bloque tienen pesos decrecientes segn su distancia al
centro del bloque a estimar (Figura 27).

Simulacin Geoestadstica
Peso

49
Peso

Peso
Periferia

Periferia

Periferia
Media de todos
los valores
externos

Media de valores
cercanos a la
periferia

Valores externos
con pesos
decrecientes

Media del sector

Distancia al centro del bloque

Distancia al centro del bloque

Distancia al centro del bloque

Figura 27: Paso de la regresin a promedios ponderados (kriging).

Simulacin Geoestadstica

50

6. EVALUACIN GLOBAL
Con las herramientas de anlisis exploratorio vistas hasta ahora, se puede obtener
el conocimiento bsico de la variable de inters. Ahora, para iniciar el estudio de
recursos disponibles, se debe comenzar con una estimacin global de la variable
regionalizada. Esto se puede realizar, por ejemplo, determinando la media. Las
muestras existentes permitirn estimar la distribucin real de la variable en el
yacimiento, sin embargo, en muchos casos, el muestreo es preferencial en
aquellas zonas que resultan ms interesantes, es decir, se tiene una mayor
densidad de muestras, lo que distorsiona el histograma global.
Por esta razn, se utilizan mtodos de declusterizacin (del ingls, cluster, que
significa grupo) que permiten obtener una distribucin representativa del
yacimiento.
Para desagrupar existen tres metodologas:

Mtodo del volumen de influencia: consiste en ponderar el valor de cada


muestra por el volumen de influencia Vi, dividido por el volumen total V, es
decir, se trata de un volumen normalizado (Figura 28).

Figura 28: Mtodo del volumen de influencia.


Vi
, donde Vi representa su volumen de
V
influencia y V representa el volumen del campo, corrigindose el histograma y
hacindolo ms representativo de la distribucin real de las leyes en dicho
volumen.

Se pondera cada muestra por

Uno de los problemas de este mtodo est en la definicin de los bordes del
campo (que generalmente no es muy clara), producindose una diferencia
importante en la estimacin global, segn los bordes que se hayan definido de
la mineralizacin.

Simulacin Geoestadstica

51

Mtodo de las celdas: Este mtodo de declusterizacin consiste en generar


una malla tridimensional en que cada celda (o bloque) tiene el mismo tamao.
Dentro de cada una de estas celdas, habr una cantidad de muestras variable,
segn la posicin y tamao de la red. Se calcula la media de los datos
desagrupados promediando las leyes de las muestras que estn en una misma
celda y luego promediando, sin ponderar, las leyes de todas las celdas. Con
esto, segn el tamao de las celdas variar la media desagrupada, como se
puede ver en la Figura 29.

Figura 29: Mtodo de declusterizacin por celdas.


Influencia del tamao de celda sobre la media.
Adems de esto, la media desagrupada depende de la posicin de la malla,
por lo que al variar su origen tambin variar la media. Esta situacin se
aprecia en la Figura 30, donde el nmero de datos en cada celda vara, por
haber modificado el origen de la malla de celdas respecto a las muestras.

Figura 30: Mtodo de declusterizacin por celdas.


Influencia del origen de las celdas sobre la media.

Simulacin Geoestadstica

52

Finalmente, analizando las variaciones de la media para diversos tamaos de


celda y orgenes, se construye un grfico (Figura 31), a partir del cual se
escoge el tamao apropiado para realizar la declusterizacin de los datos,
obtenindose los ponderadores, para construir el histograma representativo de
las leyes en el dominio.

Figura 31: Mtodo de declusterizacin por celdas.


Eleccin del tamao de celda que minimiza la media.

Mtodo utilizando los pesos de kriging ordinario: una de las tcnicas de


estimacin local que se ver ms adelante es el kriging ordinario. La idea
es estimar el valor de la variable de inters en un punto cuando no se
conoce la media. El estimador utiliza en su lugar, la media local de los datos
en una vecindad al punto a ser estimado. Basado en la distancia del punto
de inters a las muestras a su alrededor, as como a la correlacin espacial
existente entre ellas, pesos son asignados a cada muestra para as estimar
la variable en el punto de inters como un promedio ponderado de las
muestras circundantes. Estos pesos, consideran adems la redundancia de
las muestras, es decir, tal como se ver luego, si varias muestras estn
distribuidas a un lado del punto de inters y slo una est al lado opuesto,
sta ltima tendr un peso cercano al 50% del total, mientras que las otras
muestras se repartirn el peso restante. El dominio de inters puede
discretizarse en una serie de puntos, cada uno de ellos estimarse usando
kriging ordinario. La suma sobre todos los puntos estimados de los pesos
asignados a una muestra en particular representa la cantidad de
informacin contenida en la muestra, es decir, una muestra aislada en el
dominio estar informando acerca de un volumen mayor que una muestra
rodeada por otras. Pesos de desagrupamiento pueden entonces obtenerse
como la proporcin del total que representa la suma de los pesos para una
muestra en particular.

Simulacin Geoestadstica

53

Utilizando cualquiera de estos mtodos de declusterizacin, se puede reproducir la


distribucin representativa del dominio en estudio y determinar su ley media.
Efecto de soporte
Mediante los mtodos antes expuestos, se puede obtener la distribucin de leyes
desagrupadas de compsitos, sin embargo, en la prctica, lo que interesa es la
distribucin al tamao que se utilizar en la explotacin (en general, bloques de
tamao considerable respecto al soporte de las muestras), de manera de
determinar su curva tonelaje-ley.
Tal como se haba mencionado antes, esta diferencia entre la distribucin de las
muestras, la de los compsitos y la de los bloques es lo que se denomina efecto
de soporte y se debe principalmente a que cuando un soporte es ms grande, la
dispersin en los datos es menor.
Para comprender esto, debemos entender que una muestra con un soporte mayor
es un promedio de varias muestras con un soporte ms pequeo. Por ejemplo, la
ley de un bloque de 10 x 10 x 10 metros equivale a un promedio de las leyes de
1000 bloques de 1 x 1 x 1 metro, por lo que si en la distribucin de bloques de 1 x
1 x 1 m hay pocos valores muy altos, stos se promediarn con el resto al cambiar
de soporte, por lo que la distribucin de la ley en los bloques de 10 x 10 x 10 m
tendr un valor mximo menor y un valor mnimo mayor, y en consecuencia, ser
menos dispersa.
Luego de estudiar la variografa revisaremos la correccin afn y correccin
lognormal indirecta, que corresponden a formas de determinar, a partir de la
distribucin desagrupada de compsitos, la distribucin aproximada de bloques
para minera selectiva (UMS).

Simulacin Geoestadstica

54

7. EL MODELO PROBABILSTICO EN GEOESTADSTICA


La geoestadstica requiere formalizar algunas nociones que, aunque tienen poca
relevancia desde el punto de vista prctico, hacen que esta ciencia aplicada tenga
una fundacin slida sobre la cual los modelos pueden construirse. Se mencion
antes que es necesario asignar a la variable regionalizada en estudio una variable
aleatoria. Esto quiere decir que se asume que existe una distribucin de
probabilidad asociada a esta variable aleatoria. En trminos prcticos, esto es
equivalente a asumir que la variable puede tomar ciertos valores con
probabilidades dadas por su funcin de densidad de probabilidad. En puntos
donde tenemos una muestra, el valor no tiene ninguna incertidumbre, por lo que la
funcin de distribucin de probabilidad acumulada es una funcin escaln, es
decir, la variable tiene una probabilidad igual a 1 de corresponder al valor de la
muestra. Si, por el contrario, el punto no ha sido muestreado, existir
incertidumbre en el valor de la variable en ese punto. La incertidumbre ser mayor
cuanto menos informado est el punto, esto es, cuanto menos datos haya en la
vecindad. Mientras ms cerca estn los datos, menor ser la incertidumbre, lo que
se manifestar como una reduccin en la varianza de la distribucin condicional.
El uso del formalismo de las probabilidades nos permite, por un lado entender e
interpretar el problema como uno donde la incertidumbre se manifiesta a travs de
una distribucin en cada punto, y por otro lado, es la nica forma en la que
podemos llevar a cabo inferencia estadstica.
La geoestadstica interpreta el valor de una variable en cada punto, como la
realizacin de una variable aleatoria. Por realizacin entendemos el resultado de
un experimento aleatorio. Por ejemplo, el experimento tirar un dado tiene seis
posibles resultados. Una realizacin de este experimento ser el resultado 2.
Sabemos que la probabilidad de obtener esta realizacin es 1/6. Lo mismo sucede
en el caso de la concentracin de un elemento. La diferencia es que no
conocemos la distribucin de probabilidad, es decir, no sabemos cul es la
probabilidad de que el valor est por ejemplo entre 1 y 2. Por lo tanto, debemos
inferir dicha probabilidad. Ahora bien, en el caso de un dado, podemos repetir el
experimento y notar que cuanto mayor es el nmero de repeticiones, ms
cercanas sern las frecuencias relativas a las probabilidades que conocemos del
modelo. Es decir, tras un largo nmero de repeticiones cada realizacin posible
del experimento habr ocurrido aproximadamente 1/6 de las veces.
Cuando hablamos de una variable medida en el espacio, no tenemos la posibilidad
de repetir el experimento puesto que slo hay un valor en cada posicin.
Entonces, no podemos inferir la distribucin de probabilidad en cada punto puesto
que no podemos repetir nuestro experimento. Esta afirmacin es estrictamente
correcta, a menos que uno asuma que todos los puntos se comportan igual, es
decir, que las repeticiones ocurren en diferentes puntos. Dos hiptesis deben
asumirse para poder realizar inferencia.

Simulacin Geoestadstica

55

Hiptesis de ergodicidad
Se debe asumir la hiptesis de ergodicidad para hacer la inferencia estadstica,
que en trminos simples considera que no es necesario tener muchas
realizaciones de la funcin, sino que se pueden considerar los numerosos valores
obtenidos de una sola realizacin para caracterizarla. Para esto, se requiere un
dominio D de tamao suficientemente grande, de manera que la media espacial
de la realizacin converja a la esperanza estacionaria de la funcin aleatoria.

Hiptesis de estacionaridad
Adems de la hiptesis de ergodicidad, es necesario definir el comportamiento de
los dos primeros momentos que se requiere estimar, lo que podra considerarse
como una caracterizacin de la homogeneidad espacial de la variable:
Hiptesis de estacionaridad estricta: Se dice que una funcin aleatoria es
estacionaria en un sentido estricto, cuando su ley espacial es invariante por
traslacin. Es decir, cuando todos los sectores del campo tienen las mismas
caractersticas estadsticas, o sea, sus momentos, si existen, son todos iguales.
Sin embargo, esta hiptesis es muy fuerte y en geoestadstica, se puede restringir
a los dos primeros momentos (que son aquellos que podemos inferir).
Hiptesis de estacionaridad de segundo orden: Una funcin aleatoria Z(x) es
estacionaria de segundo orden cuando su esperanza matemtica existe y no
depende del punto x, y cuando para cualquier par de valores {Z(x),Z(x+h)} la
covarianza existe y slo depende del vector h:
E [Z (u )] = m

covarianza (Z(u ), Z(u + h) ) = C (h)

independiente de u
slo depende de h

La existencia de la covarianza implica que la relacin siguiente se cumple:

(h) = C(0) C(h)


Esto significa que el variograma para el vector h equivale a la varianza a priori (o
covarianza en el origen) menos la covarianza para el mismo vector h. Esta
relacin es importante, pues permite trabajar indistintamente con uno u otro
momento de segundo orden.
Una manera grfica de entender la estacionaridad de segundo orden es que la
funcin vare constantemente en torno a la misma media y que las fluctuaciones
sean relativamente constantes, es decir, que no se vean zonas con grandes
variaciones en torno a la media y otras con fluctuaciones menores.

Simulacin Geoestadstica

56

Hiptesis de casi-estacionaridad: La funcin aleatoria Z(u) puede no ser


estacionaria de orden dos si se la mira a una escala muy grande. Como se ve en
la figura siguiente, la funcin, que a escala global tiene una media que vara
notoriamente, puede parecer estacionaria si se observa su variacin a una escala
local. Ahora bien, es importante definir a qu escala interesa que la funcin
aleatoria sea estacionaria: para efectos prcticos (en general, si se quiere realizar
una estimacin con los datos) basta que la funcin sea estacionaria dentro de la
vecindad de estimacin, que corresponde al rea dentro de la cual se buscar la
informacin para realizar la estimacin (Figura 32).
30
25

14
zona
pobre

12

20

10

z(x)

z(x)
15

10

5
0

zona rica
0

200

global

400

4
2

20

40

local

Figura 32: Ejemplo de una variable casi estacionaria.


Hiptesis intrnseca: Una funcin aleatoria Z(u) se dice intrnseca cuando sus
crecimientos son estacionarios de orden dos, es decir:

1) E [ Z (u + h) Z (u ) ] = 0
2) var ianza { Z (u + h) Z (u ) } = 2 (h) no depende ms que de h
Hiptesis casi-intrnseca: Al igual que en el caso casi-estacionario, esta
definicin pasa por la escala de trabajo adoptada. Se dir que una funcin
aleatoria es casi-intrnseca si el variograma (u,u+h) slo depende de h cuando
este valor es menor a un radio local, es decir, cuando es localmente estacionario.
En el siguiente ejemplo (Figura 33) se muestra una variable cuyos datos brutos no
son estacionarios, ni intrnsecos. Al calcular los crecimientos de los datos, es
decir, las diferencias entre un valor y el anterior, se aprecia que la media de los
crecimientos es constante, sin embargo, su dispersin en torno a sta es irregular.
Si se considera el logaritmo de los datos brutos, se aprecia a simple vista que si
bien la media no permanece constante, la variabilidad en torno a las medias

Simulacin Geoestadstica

57

locales parecen constantes, lo que se confirma al tomar los crecimientos de estos


logaritmos.
As, se aprecia que los logaritmos de la variable son intrnsecos, puesto que sus
crecimientos son estacionarios de orden dos.
4.5

1.5

3.5
0.5

2.5
2

-0.5

1.5
-1

-1.5

0.5
0

100

200

300

400

500

-2
0

datos brutos

0.4

0.6

0.3

0.4

0.2

0.2

0.1

-0.2

-0.1

-0.4

-0.2

-0.6

-0.3
100

200

300

200

300

400

500

logaritmo de los datos brutos

0.8

-0.8
0

100

400

crecimientos de los datos brutos

500

-0.4
0

100

200

300

400

500

crecimientos del logaritmo


de los datos brutos

Figura 33: Ejemplo de hiptesis de estacionaridad de una variable.


Arriba izq.: datos brutos (ni estacionarios, ni intrnsecos);
Arriba der.: logaritmo de los datos brutos (intrnsecos);
Abajo izq.: crec. de los datos brutos (ni estacionarios, ni intrnsecos);
Abajo der.: crec. del log. de los datos brutos (estacionarios de orden dos)
Para poder aplicar mtodos geoestadsticos, se requiere en primer trmino,
caracterizar la variabilidad del yacimiento. Para esto, se realiza el estudio
variogrfico que, como veremos, utiliza los momentos de segundo orden recin
revisados, para representar esta estructura de la variable.

Simulacin Geoestadstica

58

Ley Espacial
Recordando que se considera la variable regionalizada z(u) como una realizacin
particular de una funcin aleatoria Z(u), entonces, cmo inferir la ley espacial de
esta funcin aleatoria, si slo se dispone de una realizacin nica?
La ley espacial corresponde al conjunto de funciones de distribucin de cualquier
vector de variables aleatorias, dada una funcin aleatoria. Sin embargo, no es
necesario conocer todos los parmetros de la ley espacial, puesto que los
momentos de orden superior a dos tienen una utilidad cuestionable (resultan
difciles de estimar y son cada vez menos importantes).
Los dos primeros momentos que sern de utilidad para caracterizar la funcin que
representa el fenmeno regionalizado en estudio, son los siguientes:
Esperanza matemtica o momento de primer orden: Sea Z(u0) una variable
aleatoria definida en el punto u0. Si la funcin de distribucin de Z(u0) tiene una
esperanza, esta esperanza es una funcin de u0 y se escribe:

E (Z (u0 ) ) = m(u0 ) .
La esperanza de la variable aleatoria Z(u0) en un punto u0 dado es un valor
numrico que representa la media alrededor de la cual los valores de Z(u0) se
distribuyen segn la ley de probabilidad P de Z(u0).
Momentos de segundo orden: se utilizan principalmente los siguientes:

varianza 2(u), o varianza a priori de Z(u): cuando existe, est definida como el
momento de segundo orden de la variable aleatoria Z(u) de esperanza m(u):

2 (u ) = var ianza(Z (u ) ) = E [Z (u ) m(u )] 2 , depende de u.

Es fcil deducir que: 2 (u ) = var ianza (Z (u ) ) = E Z (u ) 2 m(u ) 2 .


La varianza es una cantidad siempre positiva, por ser definida como la
esperanza de un cuadrado. Su raz cuadrada es llamada desviacin
estndar. Como se explicara antes, la varianza corresponde a una medida de
la mayor o menor dispersin de Z(u) en torno de su valor medio m(u) y
cuantifica, de esta forma, su carcter ms o menos aleatorio.

covarianza (centrada) C(u1,u2): si las dos variables aleatorias Z(u1) y Z(u2)


tienen varianzas en los puntos u1 y u2, tienen tambin una covarianza que es
una funcin de las posiciones u1 y u2, y que se escribe:

Simulacin Geoestadstica

59

cov arianza (Z (u1 ), Z (u 2 ) ) = C (u1 , u 2 ) = E{ [Z (u1 ) m(u1 )][Z (u2 ) m(u 2 )] }


= E {Z (u1 ) Z (u2 )} m(u1 ) m(u 2 )

La covarianza permite tener una visin elemental de la relacin que existe entre
Z(u1) y Z(u2). En particular, si se relaciona una variable consigo misma, se tendr:
C (u1 , u1 ) = 2 (u1 ) , varianza a priori de Z(u1).
La desigualdad de Cauchy-Schwarz permite relacionar la covarianza entre Z(u1) y
Z(u2) con las varianzas de Z(u1) y Z(u2):
C (u1 , u 2 ) 2 (u1 ) 2 (u 2 ) .

variograma o semivariograma: se define como la mitad de la varianza, cuando


existe, de los crecimientos Z(u1) - Z(u2) y se escribe:

(u1 , u2 ) =

1
var ianza (Z (u1 ) Z (u 2 ) ) .
2

correlograma: corresponde al coeficiente de correlacin entre Z(u1) y Z(u2):

coef . correlacin (Z (u1 ), Z (u 2 ) ) = (u1 , u 2 ) =

C (u1 , u 2 )

(u1 ) 2 (u 2 )
2

Al contrario de la covarianza o del variograma, el correlograma es


adimensional. La desigualdad de Cauchy-Schwarz implica que toma sus
valores en el intervalo [1,1]. Un coeficiente nulo indica que las variables
Z(u1) y Z(u2) no estn correlacionadas (condicin necesaria para que sean
independientes), un coeficiente igual a 1 o 1 indica que estn ligadas
linealmente:
Z(u1) = Z(u2) + constante, con = 1.
Para caracterizar la ley espacial de una funcin aleatoria, se deben inferir los dos
primeros momentos (esperanza y covarianza, por ejemplo), puesto que la
posibilidad de inferir los momentos de orden superior es cuestionable.
Sin embargo, para realizar esta inferencia estadstica, existen algunas hiptesis
que se deben aclarar desde un principio.

Simulacin Geoestadstica

60

8. MODELAMIENTO DE LA ESTRUCTURA DE LA VARIABLE


Para efectos de la explotacin y planificacin de un yacimiento minero, es
necesario estimar la variable de inters de manera ms exhaustiva, de modo tal
de poder delimitar las zonas ricas y pobres a una escala definida por la
selectividad del mtodo. La estimacin que se realizar ahora, est definida en un
soporte mucho menor que en las etapas preliminares de la exploracin. Se
requiere un modelo de bloques que indique localmente el valor de la variable y el
error que presenta esta estimacin.
Anlisis espacial
Para encontrar la relacin espacial existente entre los datos se utiliza el
variograma o la covarianza.
Variograma
El variograma es la herramienta por excelencia de la geoestadstica y, al igual que
la covarianza, permite medir la variabilidad del fenmeno regionalizado.
Se deben considerar dos valores numricos Z (u ) y Z (u + h) , en dos puntos u y
u + h separados por el vector h . La variabilidad entre estas dos cantidades est
caracterizada por la funcin variograma (u + h) , que est definida como la mitad
de la varianza de la variable aleatoria [Z (u ) Z (u + h)] , sin embargo, bajo la
hiptesis de estacionaridad de segundo orden (o casi-estacionaridad), se cumple
que:
(E ( Z (u ) Z (u + h) )2 = 0
y por lo tanto, la expresin del variograma se reduce a:

(u, h) =

1
2
E [Z (u ) Z (u + h)]
2

Considerando el caso general, el variograma (u, h ) es una funcin tanto del punto
u , como del vector h . Luego, la estimacin de este variograma requiere de varias
realizaciones, [z k (u ), z k (u + h )], [z k ' (u ), z k ' (u + h )],..., [z k '' (u ), z k '' (u + h )] , del par de
variables aleatorias [Z (u ), Z (u + h )] . Ahora, en la prctica, al menos en aplicaciones
mineras, slo una de tales realizaciones [z (u ), z (u + h)] est disponible y
corresponde al par de valores medidos en los puntos u y u + h . Como se
explicara antes, para solucionar este problema, se introduce la hiptesis
intrnseca. Esta hiptesis es que la funcin variograma (u , h ) depende slo del
vector de separacin h (mdulo y direccin) y no de la posicin u . Es posible

Simulacin Geoestadstica

61

entonces estimar el variograma (h) con los datos disponibles: un estimador


* (h) es el promedio aritmtico de las diferencias al cuadrado entre dos medidas
experimentales [z (u ), z (u + h)] en todos los pares de puntos separados por el
vector h , es decir :

* (h) =

1 N (h )
[z (u ) z (u + h)]2 ,

2 N (h) =1

donde N(h) es el nmero de pares experimentales


separados por el vector h .

[z (u ), z (u + h)]

de datos

Ntese que la hiptesis intrnseca es simplemente la hiptesis de estacionaridad


de segundo orden de las diferencias [Z (u ) Z (u + h)] . En trminos fsicos, esto
significa que, dentro de un dominio D, la estructura de la variabilidad entre dos
leyes z (u ) y z (u + h) es constante y, luego, independiente de u . Esto sera cierto,
si la mineralizacin dentro de D fuera homognea o que, al menos, su
comportamiento se pudiera considerar localmente homogneo (esto es lo que se
asume en la mayora de los casos para aplicar estos mtodos y poder obtener
estimaciones locales).
Propiedades del variograma
Las principales propiedades del variograma son:

El variograma es simtrico:
(h) = ( h)
Se anula en el origen:
(0 ) = 0
Es positivo o nulo:
(h) 0
En el infinito, el variograma crece menos rpido que una parbola.
Toda suma de variogramas es un variograma
El producto de variogramas no es necesariamente un variograma

Clculo de variogramas experimentales


Para calcular un variograma, no se puede esperar que los datos estn separados
exactamente por el vector h . Esto puede ocurrir solamente si se tienen datos en
una malla regular. Por esta razn, en el clculo de un variograma experimental, se
utiliza una aproximacin. Se consideran los siguientes parmetros para el clculo
experimental, incluyendo aquellos que permiten aproximar la bsqueda
(tolerancias):

Paso p: es la distancia a la que se calcularn los puntos del variograma


experimental.

Simulacin Geoestadstica

62

Nmero de pasos np: corresponde al nmero de pasos a calcular (segn el


tamao del dominio).
Tolerancia del paso p: corresponde a la tolerancia en la separacin, de
manera que los puntos puedan encontrarse a una distancia mayor o menor al
paso.
Azimut : es la direccin en la que se calcula el variograma medida en un plano
horizontal respecto al norte, en el sentido de los punteros del reloj.
Tolerancia angular en el azimut : es el parmetro a travs del cual se
aproxima el clculo del variograma experimental, y corresponde al ngulo
dentro del que se considera vlido un punto, para el clculo de la diferencia.
Ancho de banda en el azimut hH: corresponde a una banda dentro de la
cual se consideran vlidos los datos para el clculo del variograma, y se mide
perpendicular a la direccin del azimut.
Inclinacin : es la direccin, medida en el plano vertical del azimut, en la que
se calcula el variograma. Una inclinacin de 0 corresponde a la direccin
horizontal, considerndose positiva la direccin hacia arriba y negativa la
direccin hacia abajo.
Tolerancia angular en la inclinacin : este parmetro corresponde al
ngulo dentro del cual se considera vlido un punto, para el clculo de la
diferencia, en el mismo plano vertical en que se defini la inclinacin.
Ancho de banda en la inclinacin hV: al igual que el ancho de banda en el
azimut, corresponde a la dimensin vertical de la banda dentro de la cual se
consideran los datos vlidos para calcular el variograma.
Nmero de pares mnimo: se puede considerar que un punto del variograma
es vlido si su clculo se hizo con un nmero de pares superior a este
parmetro.
Desplazamiento inicial: es la distancia inicial que se considera desde el punto
para iniciar la bsqueda de los dems datos.
En la Figura 34 se presenta una descripcin en dos dimensiones de algunos de
los parmetros antes descritos. Se presentan los parmetros siguientes:
Azimut Este ( = 90)
Tolerancia angular en el azimut de =22.5
Paso p
Tolerancia del paso p=p/2
Ancho de banda en el azimut hH
Desplazamiento inicial igual a cero.

Simulacin Geoestadstica

63

Paso 0

hH

Paso 1

Paso 2

Paso 3

Paso 4

Figura 34: Parmetros para el clculo de un variograma experimental.


Para ejemplificar la influencia que estos parmetros tienen en el resultado final, se
presentan, para los mismos datos, los variogramas experimentales calculados con
dos pasos diferentes. Como puede verse en la Figura 35, al aumentar el paso, el
variograma queda ms regular, pero se pierde algo de informacin cerca del
origen, lo que dificultar su posterior modelamiento.

Figura 35: Efecto de la variacin del paso en el clculo


de un variograma experimental.
Todos los parmetros mencionados tienen algn efecto sobre el resultado final y,
en consecuencia, sobre el modelo que ser utilizado para la estimacin, por lo que
esta etapa es trascendental en una evaluacin de recursos, pues entrega un dato
de gran importancia para las etapas posteriores del estudio.
Ejemplo de clculo:
Considere los datos presentados en la Figura 36 correspondientes a ley de zinc
(en %) obtenidos de muestras tomadas cada un metro a lo largo de una galera de
exploracin.

Simulacin Geoestadstica

64

12

11

Figura 36: Ejemplo de datos para el clculo del variograma,


covarianza y correlograma.
X indica que la muestra se perdi.
Las siguientes ecuaciones pueden ser utilizadas en la estimacin de la covarianza,
correlograma y variograma.
Sea:
n(h) el nmero de pares de muestras disponibles separadas a una distancia h.
z(u) y z(u+h) los valores (en %Zn) de las muestras tomadas en los puntos u
y u+h respectivamente.
Se tiene:

1 n( h)
mcola =
z (u )
n(h) =1
1 n(h)
mcabeza =
z (u + h)
n(h) =1
n( h)
1
2
2
scola =
( z (u ) mcola )
n(h) 1 =1
n( h)
1
2
( z (u + h) mcabeza )
n(h) 1 =1

2
scabeza
=

C ( h) =

r(h) =

C(h)
s cabeza s cola

( h) =

n(h)
1
2
(z (u ) z (u + h) )
2 n(h) =1

n( h)
1
( z (u ) mcola ) ( z (u + h) mcabeza )
n(h) 1 =1

Media de los primeros


valores en los pares.
Media de los segundos
valores en los pares.
Varianza de los primeros
valores en los pares.
Varianza de los
segundos valores en los
pares.
Covarianza entre los
primeros y segundos
valores separados a una
distancia h.
Covarianza
Coeficiente de
correlacin entre los
primeros y segundos
valores.
Correlograma
Variograma
de muestras separadas
a una distancia h.

Simulacin Geoestadstica

65

Utilizando las ecuaciones anteriores, se obtiene:


h
0
1
2
3

n(h)
10
7
6
6

mcabeza
6,300
7,286
7,500
7,333

s2cabeza
11,344
10,950
13,900
13,867

mcola
6,300
6,143
6,500
6,333

s2cola
11,344
9,476
13,100
19,067

C(h)
11,344
7,619
4,300
-1,733

r(h)
1,00
0,75
0,32
-0,11

(h)
0,000
2,859
8,167
15,667

Tabla 9: Resultados del clculo de la variograma, covarianza y correlograma.

En la Figura 37 se presenta el variograma, covarianza y correlograma. En el


grfico del variograma, se agreg la varianza de la poblacin (equivalente a la
covarianza para h = 0).
Covarianza de muestras de zinc

Variograma de muestras de zinc


18,00

11,344

10,000

12,00
10,00
8,00
6,00

8,000

Varianza
=11,344

8,17

0,000
-2,000 0

0,00

0,00
0

4,300

4,000
2,000

2,86

4,00
2,00

7,619

6,000
C(h)

(h)

12,000

15,67

16,00
14,00

3 -1,733

-4,000

Distancia h (m)

Distancia h (m)

Correlograma de muestras de zinc


1,20
1,00

1,00

r(h)

0,80

0,75

0,60
0,40

0,32

0,20
0,00
-0,20

3 -0,11

Distancia h (m)

Figura 37: Variograma, covarianza y correlograma para los datos de zinc.


Modelos de variogramas

El comportamiento del variograma (y, en consecuencia, de la covarianza) depende


del tipo de variable que se est analizando.
Comportamiento en el infinito

Puede ser, por ejemplo, que se estudie una variable estacionaria, caso en el
cual, el variograma tender a estabilizarse para una determinada distancia,
llamada alcance, en un valor que debera corresponder a su varianza a priori (la

Simulacin Geoestadstica

66

meseta). As, en los casos ms "fciles" de estudiar, el variograma tendr la forma


que se muestra en la Figura 38.
meseta ()

C(0)=2
C(h)

(h)

alcance a

Figura 38: Forma tpica del variograma y la covarianza (fen. estacionario).

Puede suceder que se trate de un fenmeno cclico (estacionario, pero con un


perodo). En este caso (Figura 39), el variograma presentar un efecto hoyo, que
da una idea de la intensidad del perodo y del tamao del (seudo) perodo.
(h)

Figura 39: Forma de un variograma con efecto hoyo.

Finalmente, existe la posibilidad de que el fenmeno presente tendencia (es decir,


que en alguna direccin la variable aumente indefinidamente, no pudiendo
asumirse hiptesis de estacionaridad alguna). En estos casos el variograma no
tiene meseta (la covarianza no existe) y se dice que el fenmeno tiene deriva
(Figura 40).

Simulacin Geoestadstica

67

(h)

Figura 40: Forma de un variograma con deriva.


Comportamiento en el origen

Adems del comportamiento en el infinito recin analizado, una de las


caractersticas ms importantes del variograma es su comportamiento en el
origen. Esta condicin da una muy clara idea de la continuidad de la variable en el
dominio D. Se tienen bsicamente cuatro comportamientos posibles (Figura 41):

Parablico: caracteriza una variabilidad espacial muy regular.

Lineal: en este caso, la variable tiene un comportamiento regular, pero menos


suave que en el caso anterior. Visualmente se puede entender como ms
rugosa que cuando el comportamiento es parablico en el entorno del origen.

Efecto pepita (discontinuo): en este caso se tiene que cuando |h| tiende a 0,
(h) no tiende a 0, es decir, dos puntos muy cercanos presentan una
correlacin baja, lo que se puede deber a la existencia de mineralizacin
discontinua (en pepitas por ejemplo, como es el caso del oro, de donde este
comportamiento obtuvo su nombre), o bien, debido a que la escala de trabajo
impide ver la presencia de una estructura (variograma) de muy corto alcance.
Adems errores de muestreo, de preparacin de muestras, de anlisis qumico,
etc. tambin se reflejan en este valor.

Efecto pepita puro (discontinuo): es el caso lmite del anterior y corresponde a


la inexistencia de correlacin de las muestras para toda distancia.

Simulacin Geoestadstica

68

(h)

parablico

(h)

lineal

(h)

(h)
C0

efecto pepita puro

efecto pepita

C0

Figura 41: Comportamiento en el origen del variograma.

Se presentan a continuacin los principales modelos autorizados de variogramas.

Modelos con meseta o modelos de transicin: a estos variogramas les


corresponden modelos de covarianza, dados por la relacin:

(h) = C(0) C(h)

Efecto pepita de meseta C:

0
(h) =
C

para h = 0
para h > 0

(h)

Figura 42: Modelo de efecto pepita puro.

Simulacin Geoestadstica

69

Esfrico de alcance a y meseta C:

3 h 1 h3

C
(h) = 2 a 2 a 3

para 0 h a

(h)

para h a

2a/3

Figura 43: Modelo esfrico.

Exponencial de parmetro a (alcance 3a) y meseta C:


C
0.95 C

h
(h) = C 1 exp
a

(h)

3a

Figura 44: Modelo exponencial.

Cbico de alcance a y meseta C:

h 2 35 h 3 7 h 5 3 h 7

C 7
(h) = a 2
4 a3 2 a5 4 a7

para 0 h a
para h a

Simulacin Geoestadstica

70

(h)

Figura 45: Modelo cbico.

Gaussiano de parmetro a (alcance a 3 ) y meseta C:

C
0.95 C

h2

(r ) = C 1 exp 2
a

(h)

a 3

Figura 46: Modelo Gaussiano.

Modelos de efecto hoyo: Este efecto se manifiesta como una o varias


oscilaciones del variograma. En general, la explicacin es fsica y es necesario
tratar de encontrarla, para poder tenerla en consideracin en la etapa de
estimacin. Se debe en general a que el fenmeno es peridico, por ejemplo,
la mineralizacin puede presentarse en estratos de continuidad diferente, por lo
que en la direccin perpendicular a los planos de estratificacin, posiblemente
se apreciar en el variograma este efecto.

Simulacin Geoestadstica

71

Seno cardinal de parmetro a y meseta C:


(r)

1.212 C

sin ( h a )

(h) = C 1
h
a

4,493 a

20,371 a

Figura 47: Modelo seno cardinal.

Modelos sin meseta: Estos modelos salen del marco estacionario de segundo
orden. Corresponden a funciones aleatorias intrnsecas estrictas.

Potencia de parmetros y :
= 1,5

=1

(h) = h

con 0 < < 2.

= 0,5

(h)

Figura 48: Modelo potencia.

Lineal de parmetro : corresponde a un modelo potencia de parmetro


=1.

(h) = h

Mapa variogrfico

Una interesante manera de comenzar a analizar el comportamiento espacial de la


variable es construyendo un mapa variogrfico, que es un despliegue del valor

Simulacin Geoestadstica

72

del variograma experimental medido para un determinado paso en todas las


direcciones de un plano (eventualmente, se puede trabajar en tres dimensiones,
sin embargo, la visualizacin y determinacin de las direcciones de mayor
continuidad no es tan sencilla como en el caso de dos dimensiones). Mediante
esta herramienta, se puede visualizar el comportamiento de la variable en distintas
direcciones. Ms adelante se ve un ejemplo, donde se podr entender de mejor
manera su utilidad.
Anisotropas

Cuando una variable tiene el mismo comportamiento espacial en todas las


direcciones, se dice que es istropa. Esto puede verse en un mapa variogrfico
como curvas de isovalor circulares, es decir, sin ninguna direccin en que el
alcance sea mayor. Cuando se trazan variogramas direccionales de una variable
istropa, stos se parecen mucho en distintas direcciones, y se ven entrelazados
entre s, debido a lo errtico del clculo del variograma experimental.
El caso contrario implica que el fenmeno tiene direcciones preferenciales. El tipo
ms sencillo de anisotropa es la anisotropa geomtrica, que se soluciona con
una transformacin geomtrica de las coordenadas. Esto quiere decir que al
multiplicar por un factor la coordenada en una direccin, se vuelve al caso
istropo.
Grficamente, esta anisotropa se detecta ya sea a travs de la construccin de un
mapa variogrfico (Figura 49), donde se aprecia una elipse, de la cual se pueden
deducir el ngulo de anisotropa y la razn entre los alcances en las direcciones
principales para considerar en la transformacin (los ejes mayor y menor de la
elipse mencionada), o bien al graficar el variograma de la variable en dos
direcciones diferentes (perpendiculares), donde se aprecia una diferencia en los
alcances, pero no en las mesetas de las curvas.
Un tipo de anisotropa ms compleja es la anisotropa zonal, que corresponde al
caso en que la varianza de la variable es diferente en distintas direcciones
(generalmente, la diferencia est en la direccin vertical, respecto al plano
horizontal). Grficamente, esta anisotropa se detecta a travs de un mapa
variogrfico como una banda en una direccin (una elipse con el radio mayor
infinito), es decir, que en ciertas direcciones no se alcanza la misma meseta que
en otras, o en los variogramas se manifiesta como una diferencia en las mesetas
segn las diferentes direcciones.
Finalmente, es importante mencionar que, en ciertas ocasiones, la anisotropa no
se puede modelar, casos en los cuales se debe dividir el campo de trabajo en
zonas menores donde puedan modelarse estas anisotropas, o bien se recurre a
tcnicas mucho ms complejas.

Simulacin Geoestadstica

73

Se presenta a continuacin un ejemplo, donde se muestran cuatro mapas


variogrficos: el primero corresponde al caso en que la variable es istropa, el
segundo muestra una clara anisotropa geomtrica en direccin N 40W
aproximadamente, el tercero presenta anisotropa zonal donde la direccin de
menor varianza es N 45E aproximadamente, y el ltimo corresponde simplemente
a un caso en que no es fcil visualizar si existen direcciones preferenciales (en la
mayora de los casos prcticos, los mapas variogrficos son difciles de
interpretar).

Figura 49: Mapas variogrficos para cuatro casos.


Arriba izquierda: isotropa; Arriba derecha: anisotropa geomtrica;
Abajo izquierda: anisotropa zonal; Abajo derecha: caso real.
Las anisotropas tambin pueden detectarse mediante la construccin de
variogramas direccionales, de forma de ver las diferencias en las distintas

Simulacin Geoestadstica

74

direcciones. Para saber cmo se ven las anisotropas en los variogramas, se


presenta la Figura 50.
(h)

(h)
d1

d2

ad1

ad2

Figura 50: Variogramas direccionales para variables anistropas.


Izquierda: anisotropa zonal; Derecha: anisotropa geomtrica.
Consideraciones prcticas

Para el clculo de variogramas se hacen las siguientes recomendaciones:


El variograma es vlido hasta la mitad del dominio (en cada direccin).
Es necesario tener al menos 50 pares de puntos para el clculo de cada paso,
de manera que la estimacin de (h) sea confiable.
Cambio de soporte

En la evaluacin global, se seal que la curva tonelaje-ley construida a partir de


las muestras (o de los compsitos) desagrupadas no representa la distribucin de
unidades selectivas mnimas de explotacin (bloques del tamao que se define
segn el mtodo de explotacin). Por esta razn, para obtener el histograma (y, en
consecuencia, la curva tonelaje-ley) de los bloques, se debe corregir la distribucin
de muestras. La correccin depende del cambio de soporte y afecta a la varianza
de la distribucin (pues un cambio de soporte no afecta a la media).
Se puede demostrar que el cambio de varianza debido a un cambio de soporte
(desde un soporte puntual a un bloque) equivale al variograma medio entre todos
los posibles pares de puntos dentro del volumen V, esto se denota ( v, v ) (Figura
51).
En caso de cambiar de un soporte no puntual a otro, se debe realizar la resta entre
los variogramas medios de ambos soportes. Por ejemplo, para pasar de un
soporte V1 a otro soporte V2 (ninguno de los dos es puntual), se debe calcular la
diferencia siguiente:
( V1, V2 ) = ( V2 , V2 ) ( V1, V1 )

Simulacin Geoestadstica

75

Donde los variogramas medios corresponden al efecto del cambio de soporte


desde puntos al volumen correspondiente.
(h)
()
(v,v)

v()

Figura 51: Disminucin en la varianza debida al cambio de soporte.

De esta manera, se puede modificar un histograma de manera de corregir su


varianza y poder obtener la curva tonelaje-ley aproximada para el soporte que
interesa.
Correccin afn

La correccin afn consiste en reducir la varianza de la distribucin de compsitos


desagrupados, manteniendo su media y forma. Se realiza como una simple
correccin en los cuantiles de la distribucin, de forma que la distribucin que se
obtiene posee la misma media que la original, pero su varianza es corregida por
un factor de reduccin f:
q ' = 1 f ( q m) + m

donde q' es el valor del cuantil corregido, q es el valor del cuantil en la


distribucin original (con soporte puntual), m es la media de ambas distribuciones
y f es el factor de reduccin de varianza.
En la prctica, la correccin afn da buenos resultados para factores de reduccin
menores a 0.3 y cuando la ley de corte es cercana a la media de la distribucin.
Uno de los problemas de esta correccin es que el mnimo y mximo cambian de
manera frecuentemente poco realista. Los valores cercanos a la media son los
menos afectados por la correccin, mientras que aquellos en las colas de la
distribucin son los que reciben el mayor cambio.

Simulacin Geoestadstica

76

Correccin indirecta lognormal

Esta correccin tambin es una transformacin de los cuantiles de la distribucin,


al igual que la correccin afn. Se asume en este caso que la distribucin cambia
de la misma forma que una distribucin lognormal cambiara al cambiar el soporte
de la variable. La distribucin puntual que se quiere corregir no tiene
necesariamente que ser lognormal, sin embargo, se recomienda que sea
positivamente sesgada, es decir, que posea una larga cola de valores altos hacia
la derecha. Es importante mencionar que esta correccin es diferente que una
correccin lognormal directa, donde la distribucin original es modelada con una
lognormal y luego se cambia analticamente la varianza a esta ltima. En el caso
indirecto, no se ajusta una distribucin lognormal a la distribucin puntual que se
quiere corregir. Esto provoca en general una leve variacin en la media. Esta
situacin no es conveniente ya que la media en general se sabe con cierto grado
de confianza. La media obtenida debe por lo tanto reescalarse a su valor original.
Mientras ms diferente la distribucin puntual a una lognormal, mayor ser el
cambio en la media al hacer la correccin. El mtodo requiere los siguientes
pasos:
Transformacin de los cuantiles:

q' = a q b
donde

a=

CV 2 + 1

m
f CV 2 + 1

b=

ln( f CV 2 + 1)
ln(CV 2 + 1)

Correccin de la media

m
q'
m'
donde q' ' es el cuantil corregido final y m' la media obtenida despus del paso
anterior.
q' ' =

La correccin lognormal indirecta funciona, en general, mejor que la correccin


afn. Genera mnimos y mximos ms realistas y puede aplicarse con factores de
reduccin mayores.

Simulacin Geoestadstica

Figura 52: Correccin afn.

77

Simulacin Geoestadstica

78

Variogramas cruzados
Cuando se tiene ms de una variable, la informacin contenida en las mediciones
de una variable puede ayudar a estimar o simular otras variables, siempre que
stas estn correlacionadas. Para medir la relacin entre dos variables, se puede
construir un variograma cruzado. Este se define como el producto de las
diferencias entre los valores obtenidos para la primera y segunda variables en dos
puntos separados por una distancia dada:

XY (h) =

1
E{( X (u ) X (u + h))(Y (u ) Y (u + h))}
2

Como puede verse, para calcular el variograma cruzado se requiere tener ambas
variables medidas en los mismos puntos. Esto puede ser una limitacin para su
inferencia, sin embargo, algunas formas de superar este problema han sido
propuestas.
El variograma cruzado lucir como el variograma directo, sin embargo, el primero
puede ser negativo si la correlacin entre ambas variables lo es. La meseta en el
caso del variograma directo corresponde a la varianza de la poblacin. En el caso
de los variogramas cruzados, sta corresponde al coeficiente de correlacin lineal
existente entre las dos variables.
Tambin resulta interesante notar que el variograma cruzado a una distancia cero
es, al igual que el variograma, nulo, dado que depende de una diferencia de la
misma variable medida en dos puntos. Si el punto es el mismo, la diferencia es
cero, haciendo que por definicin el valor del variograma directo y cruzado a una
distancia h=0, sea cero.

Modelamiento de variogramas para varias variables


Hemos visto que modelar un variograma es, en general, una tarea un tanto
complicada. La dificultad aumenta al considerar el modelamiento conjunto de la
estructura espacial para ms de una variable. El problema radica en que hay
ciertas restricciones fsicas que deben reflejarse en el modelo matemtico
utilizado. Consideremos por ejemplo una variable primaria extremadamente
discontinua y una variable secundaria muy continua. Intuitivamente podemos decir
que ambas no estarn altamente correlacionadas. Al contrario, en el caso de dos
variables cuyo variograma cruzado presenta una meseta muy alta, esto significa
que el coeficiente de correlacin es alto entre las dos variables. Por tanto, al
modelar los variogramas directos, stos no deberan ser muy diferentes, puesto
que la correlacin entre las variables es alta. El modelo lineal de
corregionalizacin permite realizar el modelamiento conjunto de varias variables
como combinaciones lineales de las mismas estructuras de base. Aplicando
ciertas restricciones a las contribuciones de cada una de las estructuras que
componen el modelo, se asegura que el resultado final sea consistente.

Simulacin Geoestadstica

79

El modelo lineal de corregionalizacin puede expresarse como:

XX (h) = b

0
XX

NST

i
+ b XX
i (h)
i =1

NST

0
i
XY (h) = b XY
+ b XY
i (h)
i =1

NST

0
i
YY (h) = bYY
+ bYY
i (h)
i =1

En palabras, cada variograma se modela como la suma de un efecto pepita y


varias estructuras iguales con contribuciones diferentes. Cada estructura
considerada debe tener el mismo alcance para todos los variogramas que estn
siendo modelados. Las contribuciones deben satisfacer las siguientes relaciones:
i

>0
b XX

i
bYY > 0
i
i
i
i
2
b XX bYY (b XY )
Como puede verse, las restricciones implican que las contribuciones deben ser
todas positivas (puesto que se trata de varianzas), y que la contribucin de una
estructura al variograma cruzado debe ser menor que la raz cuadrada del
producto de las contribuciones de la misma estructura a los dos variogramas
directos.
Como se ver ms adelante, tambin existe el modelo de Markov de
corregionalizacin, que asume que la muestra secundaria ubicada exactamente en
el punto a estimar apantalla todas las otras muestras secundarias, por lo que slo
se requiere el use de esta muestra secundaria colocada.

Simulacin Geoestadstica

80

9. EVALUACIN LOCAL
Mtodos de estimacin clsicos
Polgonos: El mtodo de los polgonos de influencia consiste simplemente en
ponderar el valor de la variable en cada
D
punto por el rea o volumen de
influencia. En tres dimensiones, el
z(u)
procedimiento de clculo consiste en
S
crear una malla fina de nodos y asignar
a cada uno, el valor de la muestra ms
cercana. De esta manera, se pueden
realizar estimaciones tanto globales,
como locales. Para realizar con este
mtodo una estimacin global se
requiere tener bien delimitado el campo
de estudio.
Figura 53: Estimacin por polgonos.
Estimacin local:

z(u) = z(u)

donde
u es el punto ms cercano a u
z(u) es el valor de la variable en el punto muestreado u
Estimacin global:

m=

1
V

V z (u )

=1

donde
V = | D| corresponde al volumen total del dominio
V es el volumen de influencia de la muestra ubicada en el punto u
z(u) es el valor de la variable en el punto muestreado u
Inverso de la distancia: este mtodo sirve para realizar estimaciones locales y
consiste en ponderar las muestras cercanas al punto a estimar por el inverso de la
distancia elevado a alguna potencia (en general, entre 1 y 2). La suma de todas
las muestras ponderadas, dividida por la suma de los ponderadores entrega el
valor estimado en el punto que se quera estimar.

Simulacin Geoestadstica

81
D
z(u)
d

Figura 54: Estimacin por inverso de la distancia.


n (u )

Estimacin local:

z (u )
dp
z (u ) = =n1( u )
1

p
=1 d

donde:
n(u) corresponde al nmero de muestras utilizadas para estimar el punto u,
que puede estar definido por un radio de bsqueda, por ejemplo.
p es la potencia a la que se eleva el inverso de la distancia y que en general
est entre 1 y 2.
z(u) es el valor de la variable en el punto muestreado u
Relacin entre la varianza y el tamao del dominio
Se puede determinar la relacin existente entre la varianza y el tamao del
dominio, de manera de comprobar por ejemplo, si se llega a una varianza
constante a partir de un determinado volumen. Tambin se puede calcular la
varianza de un tamao dado de bloques dentro del dominio, utilizando esta
relacin. Esta varianza se conoce como varianza de dispersin.
Para ilustrar estos conceptos, se considerar el siguiente ejemplo bidimensional:
En un rea de 2000 x 500 metros, se dispone de 21 muestras de una variable
regionalizada, tal como se muestra en la figura 55.

Simulacin Geoestadstica

82

2000
A1

B1

C1

10

D1

E1
8

6
9

B2
11

10

C2

12

A3

D2

E2

H1

I1

14

12

F2

10

15

G1

13

A2

F1

20

15
13

G2

19

H2

I2
19

17

12

B3

C3

D3

E3

F3

G3

H3

I3

Figura 55: Relacin entre la varianza y el tamao del dominio.


Disposicin de los datos.
Se calcula por lo tanto la varianza en funcin del rea utilizando la siguiente
frmula:
s

o2/ B =

(n
i =1

1) i2

(n
i =1

1)

donde:
o2/ B corresponde a la varianza de las muestras (puntuales) en un rea
correspondiente a un bloque B.
ni corresponde al nmero de datos encontrados en el i-simo bloque.
i2 es la varianza experimental encontrada entre las muestras del i-simo
bloque.
Con esto, se puede construir la siguiente tabla y graficar la varianza de los datos
en funcin del rea.

500

Simulacin Geoestadstica

rea
W1 (500 x 2000)
W2 (500 X 1000)
W4 (500 X 500)

W8 (250 X 500)

W8 (500 X 250)

W16 (250 X 250)

Sub
rea
1
1
2
1
2
3
4
1
2
3
4
5
6
7
8
1
2
3
4
5
6
7
8
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16

Lmites
A1I1A3I3
A1E1A3E3
E1I1E3I3
A1C1A3C3
C1E1C3E3
E1G1E3G3
G1I1G3I3
A1C1A2C2
C1E1C2E2
E1G1E2G2
G1I1G2I2
A2C2A3C3
C2E2C3E3
E2G2E3G3
G2I2G3I3
A1B1A3B3
B1C1B3C3
C1D1C3D3
D1E1D3E3
E1F1E3F3
F1G1F3G3
G1H1G3H3
H1I1H3I3
A1B1A2B2
B1C1B2C2
C1D1C2D2
D1E1D2E2
E1F1E2F2
F1G1F2G2
G1H1G2H2
H1I1H2I2
A2B2A3B3
B2C2B3C3
C2D2C3D3
D2E2D3E3
E2F2E3F3
F2G2F3G3
G2H2G3H3
H2I2H3I3

83

Nmero de
muestras
21
12
9
7
5
6
3
3
3
5
1
4
2
1
2
5
2
3
2
0
6
1
2
2
1
1
2
0
5
0
1
3
1
2
0
0
1
1
1

Varianza
15,76
5,90
9,19
7,62
3,70
6,27
2,33
4,33
1,00
1,30
--4,67
2,00
--2,00
1,30
40,50
6,33
0,50
--6,27
--0,50
0,50
----0,50
--1,30
----1,00
--2,00
-----------

Grados de
libertad
20
11
8
6
4
5
2
2
2
4
0
3
1
0
1
4
1
2
1
--5
0
1
1
0
0
1
--4
--0
2
0
1
----0
0
0

Varianza
promedio
15,76
7,29

5,68

4,61

1,13

Tabla 10: Varianza de las muestras al interior del bloque en funcin del rea.

Simulacin Geoestadstica

84

Relacin entre la varianza y el rea

Varianza de las muestras


dentro delos bloques

20
16

15,76
2

12
8
4,61

5,68

7,29

B/D

o/B=

BB

1,13

0
0

0,2

0,4

0,6

0,8

1,2

Area (en millones de m2)

Figura 56: Grfico de la varianza en funcin del rea.


En la figura anterior, la varianza de muestras dentro del dominio equivale a 15,76.
Se cumple la ecuacin de Krige, que relaciona para un tamao de bloque B, la
varianza de las muestras en el bloque, la varianza de las muestras en todo el
dominio y la varianza de dispersin de los bloques en el dominio:
o2/ D = o2/ B + B2 / D
donde adems
o2/ D = D / D = Varianza a priori de la poblacin
o2/ B = B / B
Con esta relacin se puede determinar la varianza de dispersin de los bloques en
el dominio y, por lo tanto, el factor de correccin de varianza para ser utilizado en
la correccin afn.
Varianza-Error de estimacin (Varianza de estimacin)
La principal desventaja de los mtodos clsicos de estimacin es que no
consideran la estructura de la variable (continuidad, anisotropa, etc.), estn
simplemente condicionados por la geometra. Adems, no consideran el clculo de
la varianza de estimacin. A continuacin se presentan las ecuaciones que
permiten obtener esta varianza.

Simulacin Geoestadstica

85

Varianza de estimacin:
Si a partir de un conjunto de muestras V={v1, v2, , vn} (que pueden considerarse
puntuales), se quiere estimar la media de un bloque V, mediante el promedio
aritmtico del conjunto de muestras (sin ponderar), y notando E2 ( V, V ' ) , la
varianza de la diferencia Z(V) - Z(V'), se puede hacer la siguiente deduccin:
E2 ( V, V ' ) = Var (Z( V ) Z( V ' ))
Es decir, se interpreta la diferencia Z(V) - Z(V') como el error de estimacin, el cual
si se considera una variable estacionaria (de orden dos), tiene esperanza nula y
varianza igual a la varianza de estimacin recin expuesta. En caso de estimar la
ley de un bloque mediante una muestra central, por ejemplo, la varianza de
estimacin se denomina varianza de extensin.
Ahora bien. esta varianza puede desarrollarse como sigue:

Var (Z( V ) Z( V ' )) = Cov (Z( V ) Z( V ' ), Z( V ) Z( V ' ))


= Cov (Z( V ), Z( V )) + Cov (Z( V ' ), Z( V ' )) 2 Cov (Z( V ), Z( V ' ))
Pero Cov (Z( V ), Z( V )) = 2Z( V ) y Cov (Z( V ' ), Z( V ' )) = 2Z( V ' )
es decir, cada una de las covarianzas anteriores representan la varianza de los
bloques de tamao V (o V') en el dominio D.
Luego, la varianza de estimacin queda:
E2 (V, V ') = 2Z( V ) + 2Z( V ' ) 2 Cov (Z( V ), Z( V ' ))

donde

2Z( V ) = (2V / D ) = (2o / D ) ( o / V ) = (2o / D ) (V, V )


2Z( V ' ) = (2V ' / D ) = (2o / D ) ( o / V ' ) = (2o / D ) (V ' , V ')

Cov (Z( V ), Z( V ' )) = (2o / D ) (V, V ')

Por lo que la igualdad anterior queda:


E2 (V, V ') = 2 (V, V ') (V, V ) (V ' , V ')

es decir, la varianza del error de estimar V con V' es dos veces el variograma
medio entre todos los pares de puntos en los que un punto pertenece a V y el otro

Simulacin Geoestadstica

86

a V', menos el variograma medio de los pares de puntos en V y menos el


variograma medio de los pares en V'.
Si las muestras que constituyen el dominio V' son pequeas relativas al dominio a
estimar V y al dominio total D, stas pueden considerarse para efectos prcticos
como muestras puntuales.
A continuacin se presentan tres clculos de varianzas de estimacin.
Ejemplo 1:
Al estimar la ley del bloque V de la figura, dada la muestra v1, se pide calcular la
varianza de estimacin. El modelo variogrfico de esta variable es el siguiente:

(h) = Expa=2 / 3 (h)


es decir, se trata de un modelo exponencial sin efecto pepita, con meseta igual a 1
y alcance prctico 2 (parmetro 2/3).
V

v1
3

Figura 57: Posicin de la muestra respecto al bloque a estimar.

La varianza de estimacin est dada por:


E2 (v 1, V ) = 2 (v 1, V ) (v 1, v 1 ) (V, V )

Con esto, para calcular ( v 1, V ) , se subdivide el bloque en 9 puntos (de manera de


discretizar el clculo del variograma medio) y se tiene:

Simulacin Geoestadstica
( v 1 , V ) =

87

1
(0,5 2 ) + (1,5 2 ) + (2,5 2 ) + 2 ( 0,5 2 + 1,5 2 )
9

+ 2 ( 0,5 2 + 2,5 2 ) + 2 ( 1,5 2 + 2,5 2 )


= 0,928

Este valor ser ms parecido al verdadero ( v 1, V ) , mientras mayor sea la


cantidad de puntos en que se discretiza el bloque. Los siguientes son los mnimos
recomendados para aplicaciones prcticas:

Una dimensin:
Dos dimensiones:
Tres dimensiones:

10
6 x 6 = 36
4 x 4 x 4 = 64

El valor de ( v 1, v 1 ) es cero, puesto que es una muestra puntual y el variograma


en el origen es nulo.
Ahora se debe calcular el ( V, V ) que corresponde al variograma medio entre
todos los pares de puntos de la discretizacin del bloque. As:

1
9 (0) + 24 (1) + 16 ( 2 ) + 12 (2) + 4 (2 2 ) + 16 ( 5 )
81
= 0,784

( V, V ) =

Finalmente, se puede calcular la varianza de estimacin:


E2 (v 1, V ) = 2 (v 1, V ) (v 1, v 1 ) (V, V )
= 2 0,928 0 0,784
= 1,072
Ejemplo 2:
Ahora se estimar la ley del bloque V de la figura, dada la muestra v2 ubicada en
el centro. Se desea calcular la varianza de estimacin. El modelo variogrfico de
esta variable es el mismo:

(h) = Expa=2 / 3 (h)

Simulacin Geoestadstica

88

v2

Figura 58: Posicin de la muestra respecto al bloque a estimar.

La varianza de estimacin est dada por:


E2 (v 2 , V ) = 2 (v 2 , V ) (v 2 , v 2 ) (V, V )
Procediendo igual que antes, se obtienen los siguientes variogramas medios:
( v 2 , V ) = 0,691
( v 2 , v 2 ) = 0
( V, V ) = 0,784

La varianza de estimacin resulta:


E2 (v 2 , V ) = 0,598
Ejemplo 3:
Ahora se estimar la ley del bloque V de la figura utilizando las dos muestras. Se
desea calcular la varianza de estimacin. El modelo variogrfico de esta variable
sigue siendo:

(h) = Expa=2 / 3 (h)

Simulacin Geoestadstica

89

v2

v1
3

Figura 59: Posicin de las muestras respecto al bloque a estimar.

La varianza de estimacin est dada por:


E2 (V ' , V ) = 2 (V ' , V ) (V ' , V ') (V, V )
donde V={v1, v2}.
Procediendo igual que antes, se obtienen los siguientes variogramas medios:
1
(( v 1, V ) + ( v 2 , V )) = 0,810
2
1
( V ' , V ' ) = (( v 1, v 1 ) + ( v 1, v 2 ) + ( v 2 , v 1 ) + ( v 2 , v 2 )) = 0,479
4
( V, V ) = 0,784
( V ' , V ) =

La varianza de estimacin resulta:


E2 (V ' , V ) = 0,357
Como se ve, la varianza de estimacin depende de las geometras tanto del
dominio a estimar como del conjunto de muestras, adems de la estructura de la
variable (que se manifiesta a travs de su variograma o covarianza). Es importante
notar que la varianza no depende del valor de las muestras.
Como era de esperar, la varianza de estimacin mayor corresponde a la
configuracin con una muestra en la esquina del bloque. La configuracin con la
muestra en el centro tiene una varianza de estimacin de aproximadamente la

Simulacin Geoestadstica

90

mitad del primer caso. Finalmente, dando iguales ponderadores a las dos
muestras, se obtiene una varianza an menor.
Se puede concluir que no tiene sentido dar igual peso a dos muestras que
conducen a errores tan diferentes. Intuitivamente, la muestra central debiera tener
un ponderador de aproximadamente dos tercios y la muestra de la esquina, de
slo un tercio.
Ahora bien, se desea que el error de estimacin sea lo ms pequeo posible, es
decir, que la varianza de estimacin sea mnima. Este es el origen del kriging.
Para lograr este objetivo debe desarrollarse una expresin para la varianza de
estimacin en que los ponderadores sean las incgnitas a determinar.
Kriging Simple

Se considera, para el kriging simple, que la media m del dominio (o al menos la


media en una vecindad que se llamar vecindad de kriging) es conocida.
Adems, se conoce el valor de la variable que se quiere estimar en n puntos de
medicin: z(u), = 1,...,n.
Se asume inicialmente, que la media es nula.
Bajo estas condiciones, el valor estimado ser una combinacin lineal ponderada
de los valores conocidos:
n

Z * (u0 ) = Z (u )
=1

Se tiene entonces que la varianza de estimacin es la varianza de la diferencia


entre el valor estimado (combinacin lineal de los puntos medidos) menos el valor
real desconocido del punto a estimar. Esta varianza se puede descomponer en la
doble suma ponderada de las covarianzas de las distancias entre las muestras
ms la covarianza a priori del modelo variogrfico utilizado, menos dos veces la
suma ponderada de las covarianzas entre el punto a estimar y los puntos medidos:
n

Var [Z * (u0 ) Z (u0 )] = Var Z (u ) Z (u0 )

=1

= C (u u ) + C (0) 2 C (u u )
=1 =1

=1

Simulacin Geoestadstica

91

Para obtener los ponderadores que minimizan esta varianza, se debe derivar e
igualar a cero la expresin anterior, obtenindose el sistema de kriging simple:
n

C (u u ) = C (u u )

= 1,,n.

=1

Este sistema es un sistema lineal que tiene igual nmero de ecuaciones y de


incgnitas, y que corresponden al nmero de datos disponibles n. Este sistema se
presenta tambin en escritura matricial:
[ ] = [C (u u0 )]

[C (u u )]

C (u1 u1 ) L C (u1 u n )

M
M

C (u u ) L C (u u )
n
1
n
n

1 C (u1 u0 )

M
M =

C (u u )
n
0
n

Con esto, los ponderadores ptimos sern:


[ ] = [C (u u )]1 [C (u u0 )] .

Reemplazando estos valores en la expresin de la varianza de estimacin, que


ahora se llamar varianza de kriging, se obtiene que sta vale:
n

2
KS
(u0 ) = C (0) C (u u0 )

=1

El haber asumido la media nula es una decisin que no parece muy prctica en el
caso minero, en que las variables regionalizadas son en su mayora mayores que
cero. Sin embargo, lo que se hace es trabajar con la variable Zm que tiene media
nula, resolver el sistema como se muestra en los prrafos anteriores, y luego
volver a Z una vez que se tengan los ponderadores ptimos y se haya resuelto el
sistema, de la siguiente forma:
n

Z * (u0 ) m = [ Z (u ) m] ,
=1

o bien
n

=1

=1

Z * (u0 ) = Z (u ) + ( 1 ) m .

Simulacin Geoestadstica

92

Ejemplo:
Dada la siguiente configuracin, calcular el estimador de kriging simple y su
varianza para estimar el punto u0.
15 m.
u0

u2

15 m.

u1

Figura 60: Configuracin de muestras para estimar u0.

El modelo variogrfico a utilizar es: (h) = 0,3 + 1,75 Expa=30 (h)


Se sabe que u1 = 0.50 g/t, u2 = 16.00 g/t y la media del sector (vecindad) es m =
1.40 g/t.
Las ecuaciones asociadas son las siguientes:
u0 = 0,50 1 + 16,00 2 + 1,40 (1 1 2 )

2
KS

= C (u0 u0 ) 1 C (u0 u1 ) 2 C (u0 u 2 )

y para el clculo de los ponderadores ptimos, el sistema de ecuaciones es:

C (u1 u1 ) 1 + C (u1 u 2 ) 2 = C (u0 u1 )


C (u 2 u1 ) 1 + C (u 2 u 2 ) 2 = C (u0 u2 )
Del modelo variogrfico se tiene que:

C (u1 u1 ) = C (u 2 u 2 ) = C (u0 u0 ) = 2 = 2,05 (varianza de la poblacin)


C (u1 u 2 ) = C (u 2 u1 ) = 2,05 0,99 = 1,06
C (u0 u1 ) = 2,05 1,19 = 0,86
C (u0 u 2 ) = 2,05 0,99 = 1,06

Luego, el sistema de ecuaciones queda:

Simulacin Geoestadstica

93

2,05 1 + 1,06 2 = 0,86


1,06 1 + 2,05 2 = 1,06
Y las soluciones son:

1 = 0,208
2 = 0,410
(1 1 2 ) = 0,382

Por lo tanto, el estimador de kriging simple es:

u0 = (0,208 0,50) + (0,410 16,00) + (0,382 1,40) = 7,22 g/t


Y su varianza asociada:
2
KS
= 2,05 (0,208 0,86) (0,410 1,06) = 1,437 (g/t) 2

Kriging ordinario

En la mayora de los casos la media no es conocida, por lo que el kriging simple


no se puede aplicar. Es necesario entonces, replantear el sistema de kriging
recin revisado, de manera de obtener los ponderadores sin considerar la
media.
Nuevamente, el estimador que se utiliza es una combinacin lineal de los valores
medidos de la variable en una vecindad:
n

Z * (u0 ) = Z (u )
=1

Sin embargo, en este caso debe imponerse la condicin de insesgo, es decir, se


debe imponer que la esperanza del error de estimacin sea nula:
n

E [ Z * (u0 ) Z (u0 )] = E [ Z (u )] E [ Z (u0 )]


1424
3 1424
3
=1
m

=m

( 1 )
=1

Esto lleva a la siguiente restriccin (llamada tambin condicin de universalidad):


n

=1

= 1.

Simulacin Geoestadstica

94

Ahora, nuevamente se debe minimizar la varianza de estimacin, pero sujeta a la


restriccin recin presentada:
n

min Var [Z * (u0 ) Z (u0 )] = C (u u ) + C (0) 2 C (u u )


=1 =1

s.a.

=1

= 1

=1

Este problema se resuelve utilizando la tcnica de los multiplicadores de


Lagrange. Para esto, se minimiza la siguiente funcin:
n

E2 2 1
=1

igualando a cero sus derivadas parciales respecto a los ponderadores y al


multiplicador de Lagrange, se obtiene el sistema de kriging ordinario:
n

=
0
:
C (u u ) = C (u u0 )


=1

n
= 0 : =1


=1

= 1...n

o matricialmente,
C (u u ) 1

1
0


C (u u0 )
=

C (u1 u1 ) L C (u1 u n ) 1 1 C (u1 u0 )

M
M
M M
M

C (u u ) L C (u u ) 1 = C (u u )
n
1
n
n
n
0

L
1
1
0
1

Y la varianza de kriging vale:


n

2
KO
(u0 ) = 2 C (u u0 ) +

=1

Se puede utilizar equivalentemente el variograma en lugar de la covarianza,


obtenindose el sistema siguiente:

Simulacin Geoestadstica

95

n
(u u ) + = (u u0 )
=1
n
=1

=1

= 1... n

o matricialmente,
(u u ) 1

1
0


(u u0 )
=

(u1 u1 ) L (u1 un ) 1 1 (u1 u0 )

M
M
M M
M

(u u ) L (u u ) 1 = (u u )
n
1
n
n
n
0

L
1
1
0
1

Y la varianza de kriging vale:


n

2
KO
(u0 ) = (u u0 ) + .

=1

Simulacin Geoestadstica

96

Ejemplo:
Dada la misma configuracin anterior, calcular el estimador de kriging ordinario y
su varianza para estimar el punto u0.
15 m.
u0

u2

15 m.

u1

Figura 61: Configuracin de muestras para estimar u0.

El modelo variogrfico a utilizar es: (h) = 0,3 + 1,75 Expa=30 (h)


Se sabe que u1 = 0.50 g/t y u2 = 16.00 g/t.
Las ecuaciones en este caso son:
u0 = 0,50 1 + 16,00 2 con 1 + 2 = 1
2
KO
= C (u0 u0 ) 1 C (u0 u1 ) 2 C (u0 u 2 ) +

y para el clculo de los ponderadores ptimos, el sistema de ecuaciones es:


C (u1 u1 ) 1 + C (u1 u 2 ) 2 = C (u0 u1 )
C (u2 u1 ) 1 + C (u2 u 2 ) 2 = C (u0 u 2 )

1 + 2 = 1
Del modelo variogrfico se tiene que:

C (u1 u1 ) = C (u 2 u 2 ) = C (u0 u0 ) = 2 = 2,05 (varianza de la poblacin)


C (u1 u 2 ) = C (u 2 u1 ) = 2,05 0,99 = 1,06
C (u0 u1 ) = 2,05 1,19 = 0,86

Simulacin Geoestadstica

97

C (u0 u 2 ) = 2,05 0,99 = 1,06

Luego, el sistema de ecuaciones queda:


2,05 1 + 1,06 2 = 0,86
1,06 1 + 2,05 2 = 1,06
1 + 2 = 1

Y las soluciones son:

1 = 0,399
2 = 0,601
= 0,595

Por lo tanto, el estimador de kriging ordinario es:


u0 = (0,399 0,50) + (0,601 16,00) = 9,82 g/t

Y su varianza asociada:
2
KO
= 2,05 (0,399 0,86) (0,601 1,06) + 0,595 = 1,66 (g/t) 2

Se puede observar que el kriging simple es ms robusto que el kriging ordinario,


debido al efecto suavizante de la media.
Kriging lognormal simple

En caso de tener una distribucin de datos lognormal, se puede realizar la


transformacin siguiente y calcular el variograma (logartmico):

(u ) = ln (Z (u ) + )
En este caso, el estimador es:

ln Z * (u0 ) + = ln (Z (u ) + ) + ( 1 ) ln (m + )
+

=1

=1

1
(C (u u ) C (u0 u ) )
2 =1

o equivalentemente,
n

=1

=1

1
2

* (u0 ) = (u ) + ( 1 ) (m) + (C (u u ) C (u0 u ) )


=1

Simulacin Geoestadstica

98

El sistema de kriging y la varianza de estimacin son idnticos al del kriging


simple.
Kriging lognormal ordinario

Al igual que antes, si la distribucin es lognormal y se hace la transformacin


(u ) = ln (Z (u ) + ) , se calcula el variograma logartmico y luego se utiliza el
estimador siguiente:

ln Z * (u0 ) + = ln (Z (u ) + ) +
=1

1 n
1
(C (u u ) C (u0 u ) ) +
2 =1
2

o bien,
n

1
2

1
2

* (u0 ) = (u ) + (C (u u ) C (u0 u ) ) +
=1

=1

Al igual que en el caso del kriging lognormal simple, el sistema de ecuaciones y la


varianza son las mismas que en el caso normal.
Ejemplos de kriging ordinario

A continuacin se presentan ocho casos de kriging, donde se observa sobre los


ponderadores el efecto de la distancia, de la anisotropa, el efecto pantalla, el
efecto de declusterizacin y el resultados de tener un efecto pepita mayor en el
modelo variogrfico.
Se considera en primer lugar el caso base siguiente y el efecto de aumentar la
distancia de una de las muestras, con el variograma:

(h) = 0,2 + 0,8 Spha=100 (h)


En la figura siguiente se presenta la posicin de las muestras respecto al bloque,
con el valor del ponderador calculado mediante kriging ordinario. Adems, se
muestra el valor de la varianza de estimacin.

Simulacin Geoestadstica

99

Caso base
2

Efecto de distancia
2

= 0,1888
0,25

50

0,25

= 0,2162
0,265

50

0,25

0,303

0,25

0,303

0,129

50

50

Figura 62: Caso base y efecto del aumento de la distancia sobre los
ponderadores.

Como es lgico, al alejar una muestra, los pesos de las muestras ms cercanas al
bloque a estimar aumentan y el de la que se alej, disminuye. La varianza de
estimacin aumenta (pues la informacin es de peor calidad al estar ms lejos).
Adems se produce un resultado interesante: las muestras ms cercanas a la
muestra que se alej toman un peso mayor que la ms lejana (en este caso la de
ms arriba). Esto se debe a que el peso que pierde la muestra al alejarse se
traspasa principalmente a las muestras que se encuentran ms cercanas a ella.
Ahora considerando respecto al caso base, la presencia adicional de dos muestras
que estn ocultas respecto al bloque a estimar, se tendr el efecto pantalla.
Efecto pantalla
2

= 0,1668
0,247

50

0,233

0,233
0,174
0,080
0,033
50

Figura 63: Efecto pantalla sobre los ponderadores de kriging.

Como se puede ver, los ponderadores de las muestras afectadas por este efecto
pantalla son muy bajos. Las tres muestras que forman este grupo suman un peso
de 0,287 (muy distinto al 0,5 que se podra suponer por tratarse de tres muestras
de seis). La varianza de estimacin disminuye, pues se cuenta con una mayor
cantidad de informacin (adems sta es de calidad superior al caso base, pues

Simulacin Geoestadstica

100

adems de las cuatro muestras ubicadas en las mismas posiciones, se dispone de


dos muestras adicionales).
Se presenta ahora el efecto de declusterizacin del kriging sobre los pesos. Este
efecto se pudo apreciar en el caso anterior y se manifiesta como una disminucin
de los ponderadores cuando las muestras estn muy cerca unas de otras
(formando grupos o clusters).
Efecto de declusterizacin
2

Efecto de decl. + distancia


2

= 0,1668

0,111
0,106
0,111

0,242

= 0,2107

0,3437

0,215

50

50

0,016
0,013
0,016

0,2674

0,215

0,3437

50

50

100

150

Figura 64: Efecto de declusterizacin y efecto de


declusterizacin + distancia.

Al igual que antes, la varianza de estimacin depende de la cantidad de


informacin disponible.
Se supone ahora que el variograma no es istropo. Se considera una anisotropa
geomtrica de razn 4 a 1 en la direccin X (es decir, el alcance del modelo en
esta direccin es cuatro veces mayor que en la direccin Y). Considerando la
misma disposicin de las muestras que en el caso base, se tiene lo siguiente:
Efecto de la anisotropa
2

= 0,2248
0,074

50

0,426

0,426

0,074

50

Figura 65: Efecto de la anisotropa geomtrica sobre los


ponderadores de kriging.

Simulacin Geoestadstica

101

Finalmente, se presenta una configuracin para un modelo con un efecto pepita de


20% y se compara, para la misma disposicin de las muestras, con un modelo que
tiene un efecto pepita de 70%.
Caso base
2

Cambio en el efecto pepita


2

= 0,0827

= 0,1206

0,208

0,1044

50

50
0,042

50
(h) = 0,2 + 0,8 Sph(100)

0,1456

50
(h) = 0,7 + 0,3 Sph(100)

Figura 66: Efecto sobre los ponderadores de un cambio en


el efecto pepita del modelo variogrfico.

Como puede verse, los ponderadores tienden a parecerse cuando el efecto pepita
es ms alto, llegando al extremo de ser todos iguales si se tiene efecto pepita
puro, sin importar la posicin de las muestras respecto al bloque a estimar.
Eleccin del mejor plan de kriging
Validaciones cruzadas

En el plan de kriging, existe una serie de parmetros que hacen que el resultado
de la estimacin sea mejor o peor. Para decidir si un determinado plan es mejor
que otro, se deben realizar validaciones cruzadas para comparar varios planes,
viendo el efecto que tienen sobre los resultados la modificacin de los siguientes
parmetros:

Radio de bsqueda
Mnimo nmero de compsitos a utilizar
Mximo nmero de compsitos a utilizar
Mnimo nmero de octantes con informacin
Mximo nmero de compsitos por octantes
Mximo nmero de compsitos por sondaje

La validacin cruzada es una tcnica que permite evaluar la calidad de un plan de


estimacin. Consiste en estimar las muestras (puntuales) en lugar de los bloques,
con los parmetros de bsqueda del plan en cuestin. Para ello, se descarta la

Simulacin Geoestadstica

102

muestra a estimar, y se evala su valor con los otros datos y los parmetros de
bsqueda y el variograma. De esta forma, se podr comparar el valor estimado
con el valor real (el de la muestra), y determinar qu plan de estimacin es mejor.
Una vez calculadas las validaciones cruzadas, se deben aplicar los siguientes
criterios para decidir cual es mejor plan:

La media de los compsitos debe parecerse (idealmente, debe ser igual) a la


media de los puntos estimados en la validacin cruzada (sesgo global)
Es preferible el plan que genere la menor varianza, lo que puede verse en el
grfico de dispersin.
En un grfico de medias condicionales puede verse el sesgo condicional
generado por un plan de kriging. Este sesgo debe evitarse.
Se favorece tambin el plan que genere una varianza baja de las diferencias
entre el valor estimado y el valor real.
Debe considerarse la distribucin de los errores estandarizados (valor
estimado menos valor real, dividido por la desviacin estndar de estimacin).
Esta distribucin debe tener media cercana a cero y los errores cuyo mdulo
sea superior a 2,5 deben ser estudiados.

Utilizando estos criterios para comparar los planes de kriging diseados, variando
los parmetros antes mencionados, se elige el plan de kriging con el que se
realizar la estimacin definitiva del yacimiento.

Simulacin Geoestadstica

103

10. ESTIMACIN Y SIMULACIN


El efecto proporcional
En la prctica, a menudo se encuentra que la variabilidad de la variable de inters
cambia dependiendo de si se est en una zona de valores altos o bajos. Esto se
conoce como heteroscedasticidad o efecto proporcional de la variable, es decir, la
varianza local no es constante en todo el dominio. En minera se encuentra que
las leyes suelen ser ms variables en cuanto ms alta es la media local. De hecho,
la relacin es, en general, cuadrtica: si se grafica en un depsito la media local,
es decir la media de todas la muestras en una vecindad, versus la varianza de las
mismas muestras, la varianza aumenta ms rpido que la media.
Se puede mostrar analticamente que una distribucin espacial lognormal genera
un efecto proporcional donde el cuadrado de la media local es exactamente
proporcional a la varianza local, tal como se ilustra en la Figura 67.

Figura 67: Efecto proporcional en el caso de una distribucin lognormal. La


media local es proporcional a la varianza local.
Si, en cambio, graficamos la media local versus la desviacin estndar local, es
decir, la raz cuadrada de la varianza local, la relacin ser lineal.
El hecho de que la variable no tenga una varianza constante en las zonas de
valores altos y bajos se refleja en que el variograma, cuya meseta corresponde a
la varianza de la poblacin no es el mismo en todo el dominio, sino que debe
escalarse de manera de considerar solo la varianza local.

Simulacin Geoestadstica

104

Previamente, se mencion que una decisin de estacionaridad se requiere para


utilizar herramientas geoestadsticas. En realidad, basta con que la variable sea
localmente estacionaria, o cuasi-estacionaria, esto es, que su media, localmente
sea relativamente constante y que su funcin estructural, variograma, covarianza o
correlograma, slo dependa del vector de separacin entre dos puntos y no de sus
valores. La heteroscedasticidad aparece como una violacin a la hiptesis de
estacionaridad de segundo orden, donde la media y la varianza se asumen
constantes en todo el dominio. Sin embargo, esta hiptesis puede relajarse a un
nivel local, donde es efectivamente satisfecha.
El hecho de tener efecto proporcional, no impide aplicar las herramientas de
estimacin discutidas anteriormente, sin embargo, es conveniente ajustar el
variograma o covarianza para considerar este efecto. La varianza local debe ser
igual a la meseta del variograma. En general, los variogramas de las zonas altas y
bajas del depsito, pueden hacerse idnticos simplemente dividindolos por un
valor que es funcin de la media local, es decir:

(h; u1 )
f (m(u1 ))

(h; u 2 )
f (m(u 2 ))

Esto asume que existe un modelo estacionario de variograma 0 (h) que es


independiente de la posicin del punto que se est estimando:

(h; u ) = f (m(u )) 0 (h)


Se debe mencionar que el hecho de escalar el variograma no produce ningn
cambio en el valor estimado, ya que los pesos de kriging no cambian. Sin
embargo, la varianza de kriging ser ahora una funcin no slo de la configuracin
espacial de las muestras, sino que adems de su valor medio en dicha vecindad.
La ventaja de considerar este efecto es que ahora la varianza de estimacin es un
mejor indicador de la incertidumbre en la estimacin. Si el efecto proporcional no
es considerado, la varianza de kriging slo representa un ordenamiento de las
diferentes configuraciones de los datos, sin un significado real como medida de
incertidumbre, por lo que en este caso, no debe ser utilizada para decidir dnde
ubicar sondajes adicionales o para clasificar los recursos o reservas.
Desde el punto de vista prctico, la implementacin de kriging considerando el
efecto proporcional se hace infiriendo el variograma global y escalndolo al valor
de la meseta local, esto es, la varianza local. Esto se hace a travs del modelo
que se ajusta a la media local versus la varianza local. As la varianza de kriging
considerar la mayor o menor incertidumbre dada la media local.
La funcin que relaciona la media y la varianza debe ajustarse. Como se
mencion, en general la relacin es cuadrtica, por lo que la varianza debe
multiplicarse simplemente por la media al cuadrado para obtener la varianza

Simulacin Geoestadstica

105

escalada. Este valor es una buena forma de cuantificar la incertidumbre en la


estimacin:
2
KC
(u ) = f (m * (u )) K2 (u )

La varianza de kriging por s sola no es una buena medida para clasificar reservas,
dado que slo corresponde a una medida de la configuracin espacial de las
muestras utilizadas para estimar el valor del punto o bloque de inters. Sin
embargo, al incorporar el efecto proporcional, se est adems considerando la
influencia de las leyes de las muestras utilizadas en la estimacin, a travs de la
utilizacin de la media local para escalar el variograma y, consecuentemente, la
varianza de estimacin.
A pesar de que la incorporacin del efecto proporcional soluciona en parte el
problema de la evaluacin de la incertidumbre en torno a la prediccin realizada a
travs de kriging, varios problemas adicionales hacen que el uso de simulaciones
resulte en estimaciones e intervalos de confianza ms realistas y que han
demostrado en la prctica una mejor reconciliacin con los resultados obtenidos
en la fase de produccin.
Algunos de estos problemas son la inferencia del variograma, la cual resulta ms
fcil y confiable al transformar los datos a valores normales o a indicadores. Estas
transformaciones eliminan la existencia de valores errticos altos o outliers. La
inferencia y modelamiento del variograma resulta ms fcil y confiable.
Un segundo punto es que los mtodos de simulacin consideran de manera
implcita el efecto proporcional. Una propiedad de la transformacin a valores
normales es que en el espacio normal, la variable es homoscedastica, es decir, no
tiene efecto proporcional (Figura 68). Al transformar de vuelta a la variable
original, se inyecta de vuelta el carcter heteroscedstico de la variable original.
Kriging es simplemente una regresin lineal a partir de las muestras. El valor
estimado por kriging resulta idntico a la esperanza condicional obtenida en el
caso multi-Gaussiano, es decir, implcitamente se asume que la varianza es
constante. Por lo tanto, en el espacio normal, la hiptesis de varianza constante
respecto a la variable se cumple. El efecto proporcional puede verse como un
efecto de la distinta pendiente de la distribucin acumulada de la variable original.
Mientras ms cercana a cero la pendiente, mayor ser la varianza local.

Simulacin Geoestadstica

106

Figura 68: Relacin entre la media y la varianza despus de transformar los


datos a valores normales.
Visualizacin de modelos
Al observar un modelo construido mediante el uso de alguna de las herramientas
de estimacin presentadas, uno nota que el mapa aparece muy suave. Esto se
debe a que la mayor parte de los mtodos de estimacin calculan el valor
estimado como un promedio ponderado de las muestras en el dominio, o en una
vecindad alrededor del punto a ser estimado. As, al presentar los valores
estimados en un mapa, la variable aparece ms continua de lo que en realidad es.
El uso de los valores estimados para predecir, por ejemplo, el comportamiento de
las leyes al alimentar la planta de tratamiento, no es recomendable, dado que los
valores estimados tienen una varianza menor que los valores reales.
La Figura 69 muestra cuatro mapas. El primero ha sido construido mediante
kriging ordinario, mientras que los otros tres corresponden a realizaciones
construidas con el algoritmo de simulacin Gaussiana secuencial.
El mapa obtenido por kriging no tiene valores extremadamente altos, dado que los
puntos estimados corresponden a promedios ponderados de las muestras. Por el
contrario, los mapas obtenidos mediante simulacin reproducen el histograma
original de las muestras y su variograma. Se puede demostrar que la varianza
faltante en el mapa de kriging corresponde a la varianza de estimacin. El
algoritmo de simulacin se basa en agregar esta varianza faltante, como un
componente independiente aleatorio al valor simulado, generndose un mapa que
reproduce el variograma.

Simulacin Geoestadstica

107

Figura 69: Mapas obtenidos por kriging (arriba izquierda) y por simulacin
Gaussiana secuencial (tres mapas restantes). Se puede apreciar el efecto de
suavizamiento del mtodo de estimacin, en contraste a la mejor
reproduccin de la variabilidad real del fenmeno en los mapas simulados.
Categorizacin de recursos
Una vez que se ha comprobado que la estimacin se realiz de manera correcta
(mediante una comprobacin estadstica y grfica), se deben determinar los
recursos del yacimiento en estudio. Sin embargo, no todos estos recursos tienen
el mismo grado de confiabilidad, dado que hay bloques que fueron estimados con
muchas muestras, incluso, con muestras al interior de ellos, y otros que fueron
estimados con pocas muestras muy distantes del bloque (en la periferia, por
ejemplo). Por esta razn, se definen categoras de recursos:

Recursos medidos: son aquellos bloques que han sido estimados con un
mayor grado de seguridad, dado que haba muestras muy cercanas y en
suficiente cantidad para realizar dicha estimacin.

Simulacin Geoestadstica

108

Recursos indicados: son los que se estimaron con un grado de confiabilidad


menor pero que tienen suficientes muestras a distancia prudente, como para
tener cierto grado de confianza de los valores estimados.
Recursos inferidos: corresponden a las estimaciones de peor calidad, en el
sentido de que fueron hechas con pocas muestras o bien con muestras muy
distantes, por lo que la correlacin existente entre el bloque y las muestras
utilizadas para su estimacin es muy baja, generando una estimacin con muy
alta varianza.

De todas estos recursos, para efectos financieros o comerciales, los nicos vlidos
son los demostrados (es decir, medidos ms indicados), por lo que interesa tener
la curva tonelaje-ley de ellos.
Para efectos prcticos, las descripciones dadas recin de cada tipo de recurso son
muy vagas, por lo que se debe definir algn procedimiento prctico que permita
distinguir lo "confiable", de lo "menos confiable" y de lo "poco confiable".
Debemos mencionar que el uso de la varianza de kriging sin un exhaustivo
anlisis del efecto proporcional y correspondiente modelamiento del variograma
considerando el escalamiento antes indicado, no es recomendado, a pesar de que
ha sido utilizado extensivamente en aos anteriores. Esta prctica ha sido
constantemente criticada y la tendencia actual es a evitarla. La incertidumbre en la
estimacin puede obtenerse mediante el uso de la varianza de kriging escalada
para considerar el efecto proporcional, o bien mediante el uso de simulaciones que
permiten obtener la varianza condicional a travs de la generacin de mltiples
realizaciones.
Varios factores influyen en la calidad de la estimacin. En primer lugar, est la
cantidad de informacin disponible para estimar un bloque dado. Si el bloque se
encuentra muy lejos de las muestras la calidad de la estimacin ser baja. Un
segundo factor a considerar es el efecto proporcional. Si el bloque es de baja ley,
lo ms probable es que la incertidumbre que se tiene en su ley no sea demansiado
alta. Si, por el contrario, el bloque se encuentra en una zona de alta ley, su ley es
mucho ms incierta. Es por esta razn que puede darse el caso de un bloque de
baja ley que se ha estimado con relativamente pocas muestras (o con muestras
distantes) que es tan confiable como un bloque de alta ley que ha sido estimado
con abundantes muestras (e incluso con muestras cercanas). Este hecho es
problemtico a la hora de definir los recursos. Por ejemplo, puede ocurrir que la
mayor parte de los recursos medidos sea de baja ley y que muchos de los bloques
de alta ley, precisamente aquellos que son de inters, queden clasificados como
recursos indicados o inferidos.
Una prctica habitual es utilizar tambin el espaciamiento de sondajes como una
referencia para la varianza mxima que se quiere obtener en una categora.
Nuevamente, esta varianza depender de si se est en una zona de alta o baja
ley. Por esta razn, hablamos de una varianza condicional.

Simulacin Geoestadstica

109

Por ejemplo, se puede definir que los bloques estimados dentro de una malla de
70 x 70 metros (por ejemplo, para un prfido cuprfero) sern considerados
recursos medidos (Figura 70). Con esto se determina la mayor varianza de un
bloque que se encuentre dentro de una malla de este tamao, la que se
considerar como varianza de corte para este tipo de categora. En la figura
siguiente se muestra la varianza de estimacin de los bloques, adems de los
cuatro sondajes con que fueron estimados (los que se encuentran
aproximadamente en una malla de 70 x 70 m.). En este caso, se podra escoger
como varianza de corte 0,4. Esta decisin se toma considerando varios casos y
escogiendo un nmero que aparezca como razonable para todos ellos.
De esta misma manera, se pueden definir como recursos indicados aquellos que
se encuentren entre sondajes espaciados 120 metros. Con esto se definir una
nueva varianza de corte (por ejemplo, 0,7). Luego, sern recursos indicados todos
aquellos cuya varianza de estimacin est entre 0,4 y 0,7.
Finalmente, la categora de recursos inferidos corresponder a aquellos bloques
cuya varianza de estimacin sea superior al ltimo valor considerado, es decir,
superiores a 0,7, y que hayan sido razonablemente estimados.

Figura 70: Eleccin de la varianza de corte para categorizar recursos.


Tanto las distancias entre sondajes, como las varianzas de corte consideradas
varan caso a caso. Perfectamente el criterio podra basarse en espaciamientos
entre sondajes de 25 y 50 metros (para un yacimiento aurfero), para determinar
estas varianzas de corte. Es en este punto donde el criterio del especialista
cumple el papel ms importante.
Finalmente, cabe mencionar que se pueden clasificar los recursos en base a la
mxima incertidumbre que se quiere tener en los recursos para un perodo dado
de produccin. Por ejemplo, se puede definir:

Simulacin Geoestadstica

110

Recursos medidos: aquellos cuya ley est en el intervalo definido por +/15% del valor estimado, 80% del tiempo, para una produccin mensual.
Recursos indicados: aquellos cuya ley est en el intervalo definido por +/15% del valor estimado, 80% del tiempo, para una produccin trimestral.
Recursos inferidos: todos los otros bloques razonablemente estimados.

Simulacin Geoestadstica

111

11. ALTERNATIVAS A LA ESTIMACIN CONVENCIONAL


Kriging Multi-Gaussiano
Una alternativa a escalar el variograma para considerar el efecto proporcional es
utilizar una transformacin de los datos a valores normales estndares. Como se
muestra en la Figura 71, a cada valor de la distribucin original (variable z) se le
asigna un nico valor transformado (variable y). La transformacin se realiza de
manera grfica con gran simplicidad.

Figura 71: Transformacin de los datos originales a valores normales. La


distribucin de la izquierda corresponde a la distribucin acumulativa de los
datos originales. A la derecha se muestra la distribucin acumulativa de una
variable normal estndar, es decir, con media 0 y varianza 1.
El kriging multi-Gaussiano no es ms que el kriging convencional (simple u
ordinario) pero considerando los valores transformados como muestras. El
algoritmo procede como sigue:

Transformar los datos a valores normales


Para cada punto a estimar, definir una vecindad y hacer una bsqueda de
muestras (valores normales) para estimar.
Calcular el valor estimado por kriging. Este valor estimado est en unidades
transformadas.
Transformar de vuelta el valor estimado a las unidades reales de la variable
por integracin numrica. La varianza tambin puede obtenerse de esta
forma (Figura 72).

En la Figura 72 se muestra que se transforman de vuelta los 9 deciles de la


distribucin local obtenida por kriging de los valores normales (abajo derecha). La
media de esta distribucin corresponde al valor estimado por kriging de los valores
normales, y la varianza es la varianza de kriging. La distribucin es normal bajo la
hiptesis multi-Gaussiana. Cada decil es transformado de vuelta considerando la
relacin entre la distribucin global y la distribucin normal estndar con que se

Simulacin Geoestadstica

112

transformaron las muestras (arriba). Finalmente, se obtiene la distribucin de


incertidumbre local del punto que se est estimando en las unidades de la variable
original (abajo izquierda).

Figura 72: Integracin numrica para obtener el valor estimado en las


unidades reales de la variable de inters.
Algunas consideraciones que deben tenerse en cuenta al implementar este
algoritmo son:
El variograma utilizado para realizar el kriging, es aquel calculado y
modelado utilizando los valores normales, es decir, despus de transformar
los datos.
Kriging de bloques no debera hacerse en el espacio normal, dado que
implica asumir que los valores normales se promedian linealmente en estas
unidades transformadas. El modo correcto es hacer el kriging de puntos en
una malla densa y luego promediar los valores una vez que se han
transformado de vuelta a las unidades de la variable de inters.
El kriging multi-Gaussiano implcitamente corrige el efecto proporcional ya que la
transformacin de vuelta de la distribucin local generar diferentes resultados
dependiendo de si se est en los valores altos o bajos.

Simulacin Geoestadstica

113

Kriging de Indicadores
Una segunda alternativa al kriging convencional es el kriging de indicadores. ste
ser discutido ms adelante.

Simulacin Geoestadstica

114

12. INTRODUCCIN A LA SIMULACIN GEOESTADSTICA


Varianza del valor estimado
Consideremos el caso del estimador de kriging simple:

y recordemos el sistema de kriging:

Los valores estimados por kriging tienen las siguientes propiedades:

La covarianza entre el valor estimado y los datos es correcta.


La covarianza entre los datos es correcta (obvio, dado que de aqu
inferimos el variograma)
La covarianza entre los valores estimados no es correcta.

El problema de reproduccin de la covarianza entre los valores estimados se


soluciona considerando un valor simulado a partir de la distribucin de
incertidumbre como un dato adicional al estimar la distribucin de incertidumbre
del valor siguiente. Esta es la base de las simulaciones secuenciales. El orden en
que se realiza la estimacin es aleatorio para evitar artefactos producidos por el
efecto de pantalla de kriging al tener datos en una configuracin demasiado
ordenada.
La varianza de los valores estimados es menor que la de la distribucin de
referencia, lo que se conoce como efecto de suavizamiento de kriging. La varianza
faltante es precisamente la varianza de kriging en cada punto estimado.

La base de la simulacin Gaussiana es incorporar esta varianza faltante al calcular


la incertidumbre local.
El paradigma de la Simulacin Secuencial Directa
La idea bsica de las simulaciones consiste en calcular en cada nodo la
distribucin de la incertidumbre local a partir de los datos y de los nodos
previamente simulados, y generar un valor a partir de dicha distribucin a travs
de simulacin de Monte-Carlo, es decir, generar un nmero aleatorio uniforme
entre 0 y 1, el cual representa la probabilidad acumulada del valor simulado.
Esto se muestra en la Figura 73, donde un valor aleatorio u uniforme entre 0 y 1
es generado. El valor simulado zs se lee a partir de la distribucin acumulativa de
incertidumbre local.

Simulacin Geoestadstica

115

Figura 73: Simulacin de Monte-Carlo para generar un valor simulado a partir


de una distribucin de incertidumbre.
Si la distribucin de incertidumbre local tiene una media correspondiente al valor
estimado mediante kriging simple y una varianza correspondiente a la varianza de
kriging simple, la reproduccin de la covarianza est garantizada. Ahora bien, el
nico problema es saber qu forma tienen las distribuciones de incertidumbre
local. El hecho de asumir una forma, por ejemplo que todas son uniformes,
afectar la reproduccin del histograma de referencia que es una estadstica
considerada fundamental a reproducir.
Esta limitacin hace que la implementacin de una simulacin secuencial directa,
es decir, que no requiera de transformacin alguna de los datos, resulte muy
difcil. Se desconoce la combinacin de formas de las distribuciones condicionales
que generar al final de la simulacin, el histograma de referencia deseado. La
hiptesis multi-Gaussiana se presenta como una salida a este problema. En este
caso, todas las distribuciones locales son asumidas Gaussianas o normales. Bajo
esta hiptesis, todas las distribuciones condicionales y marginales son
Gaussianas, por lo que estn completamente definidas slo por su media y
funcin de covarianza (o variograma). As, se asegura que el histograma final ser
reproducido despus de transformar de vuelta los valores simulados en este
espacio normal. Si se asume otra forma de las distribuciones condicionales, el
histograma final (que puede verse como un compsito de todos estas
distribuciones locales) no ser necesariamente reproducido.

Simulacin Geoestadstica

116

13. MTODOS GAUSSIANOS


Introduccin
Uno de los mtodos ms populares para simular una funcin aleatoria es el
mtodo secuencial Gaussiano. La hiptesis multi-Gaussiana permite solucionar el
problema de la forma de las distribuciones condicionales. El algoritmo requiere
transformar los datos originales a una distribucin normal estndar y trabaja en el
espacio normal. Al concluir la generacin de mltiples realizaciones, stas se
transforman de vuelta a las unidades de la variable original. La reproduccin del
histograma est garantizada debido a que la distribucin normal estndar se utiliza
como distribucin de referencia. Se obtiene una distribucin normal (debido a la
hiptesis multi-Gaussiana) cuya media flucta alrededor de cero y cuya varianza
es aproximadamente uno. Estas fluctuaciones se denominan fluctuaciones
ergdicas y se deben esencialmente a que el dominio simulado es finito. Si se
considera un dominio mayor, las fluctuaciones tienden a disminuir. De hecho,
tamao del dominio
.
estas fluctuaciones son mayores cuanto mayor es la tasa
alcance del variograma
A continuacin revisaremos los aspectos ms importantes de la simulacin
Gaussiana secuencial. Posteriormente veremos cmo implementar la
cosimulacin utilizando un sistema de cokriging completo entre dos variables, o
bien, utilizando solamente la muestra colocalizada bajo la hiptesis de Markov.
Transformacin a valores normales
Tal como se mostrara para el caso del kriging multi-Gaussiano, para llevar a cabo
una simulacin Gaussiana secuencial es necesario transformar los datos a una
distribucin normal estndar (ver Figura 71).
Se debe considerar que la distribucin representativa de la variable de inters
debe ser utilizada como objetivo en la simulacin, es decir, no se quiere reproducir
la distribucin de los datos, sino que su distribucin desagrupada. En otros cases,
se puede considerar una distribucin de referencia diferente, por ejemplo, de un
banco distinto de la mina. Los datos se transforman de la misma manera, pero
utilizando la distribucin acumulativa de referencia para calcular sus
correspondientes valores normales.
Un segundo aspecto a considerar es que el clculo del variograma se realiza sin
considerar los pesos de desagrupamiento, puesto que se requiere que su meseta
sea uno, es decir, la varianza total. En rigor, esto no debiera hacerse as, sin
embargo, no se ha encontrado una forma de conciliar la inferencia del variograma

Simulacin Geoestadstica

117

de los valores normales con el sesgo que puedan tener los datos respecto a la
distribucin original.
Estimacin de la media y varianza de la distribucin de incertidumbre local y
simulacin
Como se mencionara antes, la distribucin local de incertidumbre ser Gaussiana
en forma, dada la hiptesis multi-Gaussiana. La media y varianza estn dadas por
el kriging simple de los valores normales dentro de una vecindad del punto a ser
estimado. Con este procedimiento se obtiene una distribucin local a partir de la
cual se genera un valor simulado por simulacin de Monte-Carlo (ver Figura 73).
La simulacin se realiza secuencialmente, es decir, se visitan los nodos que se
quieren simular y se va generando un valor simulado en cada uno, el que es
utilizado como dato para la estimacin de la media y varianza de kriging simple en
los prximos nodos.
El uso de un camino aleatorio para visitar los nodos a simular se debe a la
necesidad de evitar los artefactos que se producen debido al efecto de pantalla de
kriging. Cuando los datos se apantallan es comn encontrar pesos inusualmente
altos o bajos. Esto genera algunos problemas en el resultado final. Por ello, se
prefiere visitar cada nodo sin un orden preferencial. En cada punto se hace una
bsqueda de muestras y nodos previamente simulados que se utilizarn para
resolver el sistema de kriging simple. Una vez obtenidos el valor estimado y
varianza de kriging, se genera un valor simulado.
Transformacin de vuelta de los valores simulados
Se debe recordar que todos los valores simulados estn en el espacio normal,
pues son valores simulados a partir de la distribucin de incertidumbre del valor
normal en el punto de inters. As, la realizacin debe transformarse de vuelta a
las unidades originales, utilizando el proceso inverso al mostrado en la Figura 71.
Caso de varias variables
Cuando se tiene ms de una variable, suele ser conveniente considerar la
cosimulacin de las variables. La idea es utilizar la informacin contenida en una
variable para estimar la otra en un punto que no ha sido muestreado. El uso de
una o ms variables que llamaremos secundarias es recomendado slo si la
correlacin entre ambas variables es significativa. Dado que los mtodos
presentados a continuacin estn tambin basados en la hiptesis multiGaussiana, consideraremos que ambas variables han sido transformadas a
valores normales. Esta transformacin se hace por separado para cada variable.

Simulacin Geoestadstica

118

Cosimulacin considerando cokriging de ambas variables


Como se mencionara antes, el mtodo de simulacin Gaussiana funciona en
cuatro pasos bsicos:

Transformar los datos a valores normales


Visitando los nodos de manera aleatoria, realizar bsqueda de muestras y
nodos previamente simulados dentro de una vecindad
Calcular el estimador de kriging y su varianza
Bajo la hiptesis multi-Gaussiana asumir que la forma de la distribucin
condicional es Gaussiana (o normal) y generar un valor a partir de sta

El utilizar una (o ms) variable(s) secundaria(s) implica reemplazar la inferencia de


la distribucin condicional por un sistema de cokriging. Se requiere por lo tanto
transformar cada variable a una normal estndar y modelar los variogramas
directos y cruzados utilizando el modelo lineal de corregionalizacin.
El sistema de cokriging se presenta a continuacin:

[C11 (u1 u 1 )] [C12 (u1 u 2 )] [ 1 (u )]T [C11 (u1 u )]T


[C 21 (u u )] [C 22 (u u )] [ (u )]T = [C (u u )]T

2
1
2
2

2
21 1

Cada submatriz representa las covarianzas entre las muestras primarias, entre
primarias y secundarias y entre secundarias. El sistema es virtualmente el mismo
de un kriging simple, pero considera las covarianzas cruzadas y las de la variable
secundaria. Se asignan pesos de cokriging tanto a los datos provenientes de la
variable primaria, a travs del vector [ 1 (u )] , como a los datos secundarios, por
medio del vector [ 2 (u )] .
El estimador de cokriging es:

[ y1 (u )]*CKS =

n1

n2

(u ) y1 (u ) + (u) y 2 (u )

1 =1

2 =1

y la varianza:
n1

n2

2
CKS
= C11 (0) (u ) C11 (u u ) (u ) C21 (u u )

1 =1

2 =1

Bajo la hiptesis multi-Gaussiana, la distribucin condicional es normal por lo que


est completamente definida por estos dos valores (que correspondern a su
media y varianza). El valor simulado para la variable primaria se obtiene por
simulacin de Monte-Carlo, al igual que en el caso de la simulacin univariable.

Simulacin Geoestadstica

119

La necesidad de modelar los variogramas directos y cruzados de las variables


involucradas hace que este mtodo no sea muy atractivo en la prctica. A
continuacin veremos una simplificacin de la cosimulacin usando el sistema de
cokriging completo.
Cosimulacin con dato colocalizado bajo la hiptesis de Markov
La idea es considerar que se tiene un dato secundario colocalizado, es decir, que
est exactamente en el punto que se quiere simular. Para que esto sea posible, es
necesario simular la variable secundaria en todos aquellos puntos donde se quiere
simular la variable primaria. La hiptesis de Markov dice que el dato secundario
apantalla todos los otros datos secundarios, por lo que basta con slo utilizar ste.
Se puede mostrar que bajo esta hiptesis, el variograma cruzado es proporcional
al variograma primario. La constante de proporcionalidad es el coeficiente de
correlacin lineal de las dos variables (en rigor, de sus valores normales).
El sistema de cokriging se simplifica notablemente bajo esta hiptesis, dado que
hay ahora slo un dato secundario y el clculo y modelamiento del variograma
directo de la variable secundaria no es necesario, as como tampoco lo es, el del
variograma cruzado.
El sistema de cokriging con dato secundario colocado corresponde a:
[C11 (u1 u 1 )] [ C11 (u1 u )]

[ C11 (u u )]

C22 (0)
1

[1 (u )]T [C11 (u1 u )]T

(u ) = C (0)
11
2

El estimador y su varianza corresponden a:


*
CKS

[ y1 (u )]

n1

= 1 (u ) y1 (u 1 ) + 2 (u ) y2 (u )
1 =1

n1

2
CKS
= C11 (0) (u ) C11 (u u ) 2 (u ) C11 (0)

1 =1

Simulacin Geoestadstica

120

14. MTODOS DE INDICADORES


El enfoque no paramtrico de los indicadores fue introducido en 1983 por A. G.
Journel y ha sido discutido en detalle en varios libros de Geoestadstica. Este
mtodo no requiere asumir que la distribucin bivariable es Gaussiana y por lo
tanto, el problema de mxima entropa de los mtodos Gaussianos puede
evitarse. La variable regionalizada se caracteriza de manera diferente para
valores altos y bajos, contrariamente a la caracterstica simetra respecto a la
mediana implcita en los mtodos Gaussianos.
Este formalismo requiere que los datos estn codificados directamente como
probabilidades. Una funcin de distribucin acumulativa condicional se obtiene
en cada punto que se desea estimar. Para asegurar la reproduccin de la
covarianza al simular, los puntos anteriormente simulados deben incluirse como
datos al estimar las nuevas distribuciones condicionales. Luego, se obtiene un
valor a partir de esta distribucin condicional generando un nmero aleatorio
entre 0 y 1, el cual corresponde a la frecuencia acumulada del valor simulado.
Dada la frecuencia acumulada, el valor simulado se lee del grfico de la
distribucin condicional. Esta idea bsica de estimar directamente las
probabilidades tiene varias ventajas:

Se utiliza la correlacin (variograma) a diferentes valores de corte.


La informacin secundaria puede codificarse de la misma manera, lo que
le da gran flexibilidad a estas tcnicas.
Se puede realizar cambio de soporte, modificando la distribucin
condicional.
Las reservas recuperables de los bloques pueden ser calculadas.

Aunque en general es muy flexible, la implementacin de algunos de estos


puntos puede ser bastante difcil.

Codificar informacin secundaria como si fueran datos primarios es til,


pero la informacin no puede usarse como si fuera primaria, a pesar de
que estn codificadas de la misma manera. Para esto, se requiere un
modelo lineal de corregionalizacin o un modelo de MarkovBayes.
El uso de datos con soportes diferentes tambin es complicado, dado que
la correlacin cambia con el soporte.

Como siempre en geoestadstica, el formalismo de las funciones aleatorias se


requiere para poder llevar a cabo inferencia estadstica. Los valores observados
de una variable y el conjunto de valores exhaustivos subyacentes se interpretan
como una realizacin de una funcin aleatoria que representa el fenmeno
estudiado. Se debe recordar que las funciones aleatorias se denotan con letras

Simulacin Geoestadstica

121

maysculas, por ejemplo Z(u), y sus realizaciones se denotan en minsculas,


z(u).
Codificacin de indicadores
La idea bsica es codificar los datos como probabilidades. Esto considera el
orden de los valores. Diferentes tipos de dato pueden codificarse de la misma
manera, lo que permite integrar datos de diferentes orgenes, con soportes y
precisin distintos.
Una vez seleccionados los valores de corte zk, k=1,...,K, los datos se codifican
como:
i (u ; z k ) = Pr ob{z (u ) z k }
Cada una de estas nuevas variables se interpreta a su vez como una variable
aleatoria.
En cada posicin donde hay un dato, se tiene ahora un vector de K indicadores,
en lugar de un solo valor. Con n datos, se generan nK indicadores. La eleccin
del nmero de valores de corte a utilizar es crtica para obtener buenos
resultados: si se eligen muy pocos valores de corte la discretizacin de las
distribuciones condicionales ser insuficiente, mientras que la seleccin de un
nmero muy grande de umbrales generar mala inferencia de los variogramas
de indicadores y largos tiempos de computacin de los resultados. Adems los
problemas de relaciones de orden entre los indicadores estimados tambin se
vern significativamente incrementados, problema que se discutir
posteriormente. En general, entre 7 y 12 indicadores pueden recomendarse. Una
buena idea es hacer coincidir alguno de los valores de corte con valores crticos,
la ley de corte de la mina o un umbral crtico para un contaminante, y distribuirlos
uniformemente en la distribucin, ubicndolos en cuantiles regulares.
Datos primarios o duros:
Datos con error de muestreo despreciable son llamados datos duros. La
codificacin de stos es la ms intuitiva de todas. Se define un indicador en el
punto u como:
1, si z (u ) z k
i (u ; z k ) =
0, en otro caso

k = 1,..., K

donde z (u ) es el valor de la muestra en ese punto. Esta codificacin puede


interpretarse como una probabilidad:

i (u ; z ) = Pr ob{z (u ) z k } = Fu ( z k )

Simulacin Geoestadstica

122

Esto significa que se asigna un valor de 1 para un umbral dado zk en el punto u,


si el valor de la muestra es menor o igual que el umbral, y se asigna 0 en el caso
contrario. Esto corresponde a la probabilidad de que el valor de la muestra sea
menor o igual que zk.
Datos blandos o inciertos:
Los datos pueden presentar errores significativos, sin embargo, sabemos que el
valor de z est acotado por un mximo y mnimo, b y a (por razones fsicas,
por ejemplo). Podemos entonces codificar los datos como sigue:
si z (u ) > b
1,

i (u ; z k ) = indefinido, si a < z (u ) b

si z (u ) a
0,

k = 1,..., K

donde z(u) es el valor en el punto u, a es el valor mnimo conocido que la


variable puede tomar, y b es el lmite superior de la variable.
Datos Categricos Blandos:
Una variable categrica se puede utilizar a veces para condicionar la funcin de
distribucin acumulativa de la variable primaria. Por ejemplo, si medimos el
valor z de la variable y de la variable categrica s (por ejemplo, el tipo de roca)
en n puntos u, entonces, se puede calcular la distribucin acumulativa
condicional de z dada la variable categrica secundaria s como:

donde i(u;sl) es la funcin del indicador de la variable secundaria s (igual a 1 si


la categora en la localizacin u es sl y 0 de otra manera).
Usando la informacin secundaria, una distribucin condicional diferente de la
variable primaria ser utilizada al estimar diversos puntos, puesto que la variable
de condicionamiento categrica depende de la localizacin.
Datos Continuos Blandos:
Ampliando la idea presentada para los datos categricos, podemos utilizar una
variable secundaria continua v para condicionar la variable primaria z. La
variable secundaria es categorizada en L clases y entonces utilizada como

Simulacin Geoestadstica

123

variable categrica para condicionar la distribucin condicional de la variable


primaria. El procedimiento es el siguiente:

Discretizar la variable secundaria en L clases (vl 1 , vl ] .


Codificar la variable secundaria como:

1, si v(u ) (vl 1 , vl ]
i (u ; vl ) =
en otro caso
0,

l = 1,..., L

Calcular la distribucin acumulativa condicional de z dada la variable


continua secundaria v:

donde i(u;vl) es la funcin indicador de la variable continua secundaria v


segn lo presentado antes.
Kriging de Indicadores
La distribucin de la incertidumbre de la variable regionalizada puede ser inferida
estimando por kriging la funcin del indicador en cada umbral. El kriging de
indicadores no es nada ms que kriging simple u ordinario. La nica diferencia
es que una transformacin de la variable original es necesaria. Usando la
codificacin presentada antes, los n datos originales se convierten en K
conjuntos de n indicadores. Cada uno de estos sistemas se utiliza para estimar
el valor del indicador en puntos no muestreados, es decir la probabilidad de
tener z (u ) z k . Los indicadores en umbrales diferentes del cual se est
estimando podran tambin utilizarse como variables secundarias para realizar
cokriging. Una vez ms no hay diferencia entre cokriging de indicadores y el
cokriging estndar, a excepcin de la transformacin de la variable. Una breve
revisin de diversas tcnicas aplicadas a los indicadores se presenta a
continuacin.
Kriging Simple de Indicadores
Para realizar kriging simple de indicadores, la media estacionaria de la funcin
aleatoria debe ser conocida. La media de un indicador est dada directamente
por la distribucin acumulativa de la funcin aleatoria:

Simulacin Geoestadstica

124

El estimador por kriging simple (estacionario) del indicador en ese umbral es:

donde los pesos SK (u; z ) son la solucin nica del sistema de kriging simple:

Una funcin de covarianza del indicador C I (u u ; z ) o, asumiendo


estacionaridad, C I (h; z ) tiene que ser deducida para cada umbral en la ecuacin
anterior.
Kriging Ordinario de Indicadores
El kriging ordinario se diferencia de kriging simple en que no se requiere conocer
la media y por lo tanto, se debe agregar la condicin de insesgo de la suma de
los pesos iguales a uno.
El estimador por kriging ordinario del indicador se escribe:

donde los pesos OK (u; z ) son la solucin nica del sistema de kriging ordinario:

Una vez ms, las covarianzas de los indicadores tienen que ser deducidas para
cada umbral.
Kriging del indicador de la mediana
En el kriging de indicadores simple y ordinario, es necesario modelar K
variogramas o covarianzas. La inferencia de los variograms en umbrales
extremadamente bajos o altos es, en general, difcil, dado que los ceros y unos
no se encuentran en la misma proporcion, generando un variograma
experimental ms errtico. Para umbrales cercanos a la mediana donde el
nmero de ceros y unos es aproximadamente el mismo, la inferencia del
variograma es ms fcil. El kriging del indicador de la mediana se puede aplicar

Simulacin Geoestadstica

125

si las K funciones aleatorias estn en correlacin intrnseca, es decir, todos los


variogramas del indicador y los variogramas cruzados son proporcionales a un
modelo comn, o equivalentemente, todos los correlogramas son iguales. Este
modelo de funcin aleatoria se conoce como el modelo mosaico:

El correlograma requerido puede estimarse usando el correlograma


experimental de los indicadores para el valor de corte zk=M (correspondiente a la
mediana), donde F(M)=0.5. La ventaja de usar el correlograma experimental del
indicador es que no hay valores errticos o outliers, debido a la transformacin y
por lo tanto, la inferencia de la funcin del variograma (correlograma) es ms
fcil.
Si todos los indicadores estn definidos en todos los puntos muestreados, es
decir, si no hay datos inciertos que estn definidos slo fuera de un intervalo,
entonces en cada punto se deber resolver slo un sistema de kriging con cuyos
pesos se podr estimar el indicador para todos los valores de corte. Los pesos
no cambiarn puesto que la configuracin y el variograma de los datos se
mantendrn constantes.
Cokriging de Indicadores
Los indicadores en diversos umbrales pueden tambin utilizarse para ayudar a
estimar la probabilidad acumulativa en un umbral particular. El indicador i (u; z k ) ,
equivalente a la probabilidad de tener z (u ) z k , se puede estimar usando los
valores del indicador en los puntos muestreados para el mismo umbral y para los
otros umbrales, es decir, se debe resolver un sistema de cokriging con los
indicadores en todos los valores de corte, para estimar el indicador a un umbral
dado.
Este mtodo requiere la inferencia de K ( K + 1) / 2 variogramas directos y
cruzados de indicadores, lo que lo hace muy exigente en trminos de inferencia;
sin embargo, la ventaja es que utiliza toda la informacin dada por la codificacin
del indicador, mejorando (tericamente) el resultado: debiera obtenerse una
varianza de kriging ms baja que la que se obtiene simplemente con kriging.
El estimador de cokriging del indicador se escribe:

Simulacin Geoestadstica

126

El sistema de cokriging ordinario del indicador corresponde al sistema estndar,


pero utilizando covarianzas de indicadores:

donde C I (h; z k , z k ' ) es la covarianza cruzada entre las dos variables aleatorias

I (u; z k ) e I (u + h; z k ' ) , y k k0 es 1 si k = k 0 y 0 en los otros casos.


La prctica ha demostrado que el cokriging de indicadores requiere
considerablemente ms esfuerzo en la inferencia y no mejora notablemente el
resultado.
El kriging de probabilidad
En lugar de usar todos los indicadores para todos los umbrales, podramos
utilizar los datos originales o su orden estandarizado como variable secundaria.
Esto requiere menos esfuerzo para inferir los variogramas; el nmero se reduce
de K ( K + 1) / 2 a 2 K + 1 .
El orden estandardizado corresponde a la posicin de los datos cuando se
ordenan en orden ascendiente, dividida por el nmero total de datos:

p (u ) = r (u ) / n
donde r (u ) es la posicin del dato z (u ) .
El estimador de kriging de probabilidad se escribe:

donde p(u ) corresponde al orden estandarizado de los datos, cuyo valor


esperado es 0,5. Los ponderadores y se obtienen al resolver el sistema
de cokriging simple.

Simulacin Geoestadstica

127

Informacin Secundaria
Kriging simple de indicadores con media local
En kriging simple, la decisin del estacionaridad implica que la media de la
funcin aleatoria del indicador es independiente de la posicin u a estimar. En
algunos casos, se puede tener una variable secundaria que nos da informacin
a priori sobre la probabilidad de tener Z (u ) z . Se define dicha probabilidad
como:
y (u; z k ) = Pr ob{Z (u ) z k | informacion secundaria en u}
entonces, podemos reescribir el estimador de kriging simple usando estas
medias locales, como sigue:

donde los pesos SK (u; z ) son los mismos que en caso estacionario del kriging
simple de indicadores, es decir, el caso en que la media es constante.
Cokriging Blando
Las probabilidades usadas como medias locales a priori en el caso anterior
pueden usarse como variable secundaria (variable blanda). Se interpretan como
una realizacin de una variable aleatoria Y(u,zk), correlacionada espacialmente
con Z(u,zk). Se puede calcular el estimador de cokriging considerando solamente
la variable primaria y secundaria al valor de corte de inters:

donde OCK (u; z k ) y OCK


(u; z k ) son los pesos de cokriging ordinario, n1 y n2 son

el nmero de puntos con datos primarios y secundarios respectivamente.


Este mtodo requiere la inferencia del variograma del indicador de los datos
primarios, de los secundarios y del variograma de indicador cruzado entre las
dos variables.

Simulacin Geoestadstica

128

Cokriging de indicadores con dato colocalizado


En la prctica, se intenta evitar la necesidad de modelar muchas covarianzas y
covarianzas cruzadas simultneamente a travs del modelo lineal de
corregionalizacin. Por lo dems, cuando los datos secundarios son abundantes,
el sistema de cokriging puede sufrir de inestabilidad numrica al momento de ser
resuelto. Una solucin a este problema es utilizar solamente los datos
secundarios colocalizados, es decir, aquellos que se encuentran exactamente en
la misma ubicacin que el punto donde la variable primaria se est estimando.
Sin embargo, an se requiere calcular y modelar el variograma directo y cruzado
entre la variable primaria y secundaria para cada valor de corte. Sin embargo, el
variograma cruzado se necesita slo para una distancia h=0 dado que el dato
secundario est colocalizado. Esta covarianza se calcula como:

donde mY ( z k ) = E{Y (u; z k )}


As, el cokriging de indicador con dato colocalizado resuelve el problema de
inestabilidad del sistema, sin realmente simplificar el modelamiento de los
variogramas. La aproximacin de Markov-Bayes puede usarse para aliviar la
inferencia de los variogramas cruzados, tal como se presenta a continuacin.
Algoritmo de Markov-Bayes
Si se asume que la variable secundaria colocalizada tendr el mayor impacto al
estimar la variable primaria en la misma posicin, entonces el variograma
cruzado no se requiere. La covarianza de la variable secundaria y la covarianza
cruzada puede deducirse a partir de la funcin de covarianza de la variable
primaria. Se requiere solamente un parmetro de calibracin para escalar esta
covarianza.
Las relaciones siguientes se pueden probar bajo esta hiptesis:

donde se definen los coeficientes B(zk) en [-1,1] como:

con

Simulacin Geoestadstica

129

Estos coeficientes se pueden estimar de la siguiente forma:

donde nIY es el nmero de puntos donde ambos datos, primarios y secundarios,


estn disponibles.
Correccin de los problemas con las relaciones de la orden
Las probabilidades estimadas a travs del kriging de indicadores deben
satisfacer las condiciones de una distribucin acumulativa: tienen que ser no
decrecientes entre 0 y 1. Sin embargo, el valor estimado del indicador puede
caer fuera del intervalo [0,1], puesto que la estimacin por kriging es una
combinacin linear no convexa de los datos condicionantes y, por lo tanto, los
pesos pueden ser negativos. La carencia de datos en algunas clases y
diferencias en los modelos del variograma desde un umbral al siguiente son
factores importantes para tener una funcin no-creciente.
La correccin a posteriori hacia delante y hacia atrs de las distribuciones
acumulativas condicionales genera resultados satisfactorios, en general.
Aunque ms difcil de implementar, restringir el sistema de kriging, de modo que
satisfaga las relaciones de orden por construccin, es tambin una solucin.

Figura 74: Correccin de problemas de relacin de orden.

Simulacin Geoestadstica

Interpolacin y extrapolacin
acumulativas condicionales

130

de

las

funciones

de

distribucin

Dado que el nmero de datos es limitado, la distribucin de la incertidumbre


local se discretiza usando solamente algunos pocos valores de corte. La
distribucin acumulativa condicional continua en cada punto u se representa
entonces a travs de un conjunto de puntos [i (u; z k )]* con k=1,...,K, que estn
dentro del intervalo [0,1].
Es por lo tanto necesario interpolar los valores entre las probabilidades
estimadas para cada umbral, y ms importante, extrapolarlos ms all de los
valores mnimo y mximo disponibles. Esta decisin tiene un gran impacto en las
estadsticas finales del modelo estimado o simulado, por lo que debe ser
analizada cuidadosamente. La interpolacin entre los umbrales es a menudo la
menos importante. Normalmente, es suficiente interpolar linealmente entre los
valores del indicador en los umbrales z k 1 y z k . Al extrapolar las colas, se deben
considerar cuales son los valores mnimo y mximo concebibles para la variable.
La extrapolacin no debe hacerse lineal, dado que esto implicara una
distribucin uniforme entre el valor mnimo y z1 , y entre z K y el valor mximo, lo
cual a menudo no es realista. Los modelos potencia e hiperblicos se utilizan
para extrapolar las distribuciones condicionales ms all de los valores mnimo y
mximo de los umbrales. Otra posibilidad es considerar la distribucin
acumulativa global y escalarla para extrapolar las colas de las distribuciones
condicionales.
Los diversos mtodos a interpolar y a extrapolar se detallan a continuacin:

Modelo lineal: Si se asume una distribucin uniforme entre dos umbrales,


entre un valor mnimo y el primer umbral o entre el umbral ms alto y un
valor mximo, el valor de la distribucin acumulativa se calcula:

Modelo potencia: Dependiendo del valor del parmetro w, el modelo


potencia puede tomar una amplia gama de formas (ver figura). La
distribucin acumulativa se calcula como:

Simulacin Geoestadstica

131

Puede utilizarse para extrapolar las colas inferior y superior de la


distribucin. Esto se lleva a cabo sustituyendo z k 1 y z k por z min y z1 , y
usando una potencia w > 1 para la cola inferior, o substituyendo z k 1 y z k
por z K y z max usando una potencia w < 1 para la cola superior.

Figura 75: El modelo potencia de interpolacin y extrapolacin.

Modelo hiperblico: Este modelo es til para extrapolar la cola superior.


Como con el modelo potencia, el parmetro w permite controlar la forma
de la funcin (ver figura). La distribucin acumulativa se calcula como:

Figura 76: El modelo hiperblico de extrapolacin.

Simulacin Geoestadstica

132

Re-escalando la distribucin acumulativa global: Este mtodo se puede


utilizar para extrapolar ambas colas de la distribucin. Las colas
resultantes tendrn la misma forma que aquellas de la distribucin global.
Sin embargo, se requiere una distribucin global confiable para utilizar
este mtodo.

Simulacin de indicadores
La simulacin de indicadores utiliza la distribucin obtenida a travs del kriging
de los indicadores para generar un valor simulado utilizando la simulacin de
Monte-Carlo. Es importante acentuar que los datos condicionantes usados para
obtener la distribucin condicional, corresponden a las muestras y a valores
previamente simulados dentro de la vecindad de bsqueda utilizada en la
estimacin. De esta manera, se asegura la reproduccin de las covarianzas de
indicadores.
El mtodo secuencial de simulacin procede como sigue:

Paso 1: Escoger al azar un nodo no informado.


Paso 2: Buscar muestras y nodos previamente simulados dentro de una
vecindad.
Paso 3: Realizar la estimacin del valor de la probabilidad para cada
umbral, a travs de kriging. De esta forma se construye la distribucin
condicional discretizada.
Paso 4: Generar a travs de la simulacin de Monte-Carlo, un valor de la
distribucin condicional. Los mtodos de interpolacin y extrapolacin
antes descritos se utilizan en este punto para tener el valor de la
distribucin en puntos distintos que los umbrales.
Paso 5: Volver al paso 1.

El nmero de datos condicionantes crece de n a n+N-1, en la medida que la


simulacin progresa. Cuanto ms grande es el nmero de datos condicionantes,
mayor es el sistema de kriging que debe resolverse. Este problema se supera
usando una vecindad de bsqueda y un nmero mximo de datos dentro de
dicho radio.
La reproduccin del variograma depende de diversos factores tales como el
tamao de la vecindad de la bsqueda y de la importancia de la correlacin de
alto-orden comparada con estadsticos de dos-puntos, tales como la covarianza.

Simulacin Geoestadstica

133

15. APLICACIN A LA BASE DE DATOS DE WALKER LAKE


Estadsticas Bsicas
La base de datos de Walker Lake fue utilizada para evaluar algunas de las
tcnicas de indicadores para datos continuos descritas anteriormente. La
variable U de la base de datos fue utilizada como variable primaria. Esta variable
se relaciona con la elevacin.
Mapas e histogramas del conjunto de datos exhaustivo y de muestras tomadas
al azar son presentados en la Figura 77. Los datos exhaustivos comprenden
260 por 300 celdas con una distribucin altamente asimtrica. Los valores
exhaustivos tienen un rango entre 0 y 9500. De este conjunto de datos
exhaustivo, 494 muestras fueron tomadas aleatoriamente. El rango muestreado
va de 0 a 2500, es decir, valores significativamente altos no fueron muestreados.
En el conjunto exhaustivo, 6% de los valores son ceros, mientras que en las
muestras, hay aproximadamente 7% de ceros. La distribucin de las muestras
se asemeja a la distribucin de los datos exhaustivos. Problemas con valores
muy altos pueden anticiparse, dado que la distribucin de muestras no incluye
ningn valor mayor que 2500. Sin embargo, esos valores representan menos del
1% de la distribucin exhaustiva. La Figura 78 presenta un q-q plot de la
distribucin exhaustiva versus las muestras, que indica que la forma de ambas
distribuciones es similar puesto que los puntos forman una lnea recta. La
varianza de ambas distribuciones es claramente diferente, dado que la
pendiente de la recta es diferente de 45. Esto se debe a la larga cola de la
distribucin exhaustiva. Puesto que los valores extremos altos no fueron
muestreados, la varianza se vi afectada presentando un valor menor para el
caso de las muestras. Sin embargo, esto puede considerarse como un
problema inevitable de distribuciones altamente asimtrica, donde la
probabilidad de muestrear valores extremos altos es muy baja. La distribucin de
las muestras se considera por tanto aceptable como representacin de la
distribucin subyacente. No hay necesidad de desagrupar las muestras puesto
que el muestreo no privilegi zonas de altos o bajos valores.
El mapa exhaustivo demuestra que la hiptesis de estacionaridad puede no ser
adecuada para representar el fenmeno. Diversas zonas pueden reconocerse:
Una zona curvilnea de valores bajos (cercanos o iguales a cero) cruza el
dominio desde el noroeste al este. ste es probablemente el lago Walker.
Una zona de valores altos va de norte a sur, al oeste del lago.
Una zona ms estacionaria (que tambin parece ser ms variable) de
valores altos y bajos se encuentra al sureste.
Debido a la ausencia de informacin secundaria para describir y entender mejor
la variable, no se pueden distinguir diferentes poblaciones a priori. El uso de

Simulacin Geoestadstica

134

indicadores es por lo tanto apropiado para caracterizar la variabilidad espacial de


la variable U considerada.

Figura 77: Anlisis exploratorio de datos: mapa e histograma de la base de


datos de Walker Lake (izquierda); mapa e histograma de las muestras
tomadas (derecha).

Variografa
Para aplicar las tcnicas de indicadores, los valores de corte a utilizar deben
seleccionarse. De acuerdo a la distribucin de las muestras, 10 umbrales fueron
elegidos para tener una buena discretizacin de las funciones de distribucin
acumulativas condicionales en cada sitio estimado. Se espera tener problemas
de relaciones de orden, los cuales sern analizados para entender las razones
de su ocurrencia. Los umbrales fueron elegidos para considerar valores crticos
y se intent distribuirlos uniformemente (en probabilidad). El primer umbral fue
elegido apenas sobre cero. Los 8 umbrales siguientes corresponden a los
deciles, comenzando en 20 y hasta 90. El ltimo umbral fue fijado en el cuantil
95 de la distribucin. Los cuantiles y los umbrales que corresponden a los
valores de U de la distribucin de muestras se presentan en la Tabla 11. Los

Simulacin Geoestadstica

135

valores obtenidos de la distribucin exhaustiva para las mismas probabilidades


tambin se presentan para considerar la diferencia debido al uso de la
distribucin de muestras.

Figura 78: Q-q plot mostrando que la distribucin de los datos exhaustivos
y de las muestras tienen aproximadamente la misma forma, pero diferentes
varianzas.
Los variogramas deben calcularse para cada umbral. Para encontrar las
anisotropas se construyeron mapas variogrficos. La Figura 79 muestra los
mapas variogrficos para cada umbral. En la mayora de los casos, la direccin
de la continuidad mxima tiene un azimut de 20. Para el segundo y tercer
umbral, la direccin principal parece estar a 45. El mapa variogrfico para el
primer umbral presenta ms variabilidad y no demuestra claramente ninguna
caracterstica.

Umbral

Cuantil

1
2
3
4
5
6
7
8
9
10

0.08
0.20
0.30
0.40
0.50
0.60
0.70
0.80
0.90
0.95

Valor
distribucin
muestras
0.010
2.011
8.272
21.726
46.070
91.140
164.690
315.847
572.619
965.674

Valor
distribucin
exhaustiva
0.020
3.100
11.800
26.940
56.970
115.151
228.600
427.875
786.383
1236.893

Tabla 11: Cuantiles y valores correspondientes en la distribucin de


muestras y exhaustiva.

Simulacin Geoestadstica

136

Figura 79: Mapas variogrficos para los 10 valores de corte.


Los variogramas de indicadores estandardizados fueron calculados en cuatro
direcciones: 70, 160, 45 y 135 para encontrar la anisotropa en cada umbral.

Simulacin Geoestadstica

137

Los parmetros utilizados para el clculo de los variogramas experimentales se


presentan en la Tabla 12. Tal como se ilustra en la Figura 80, en todos los
casos, las direcciones principales de anisotropa son 160 y 70, diferentes de
las sugeridas por los mapas variogrficos para el segundo y tercer umbrales.
Tambin se aprecia la mayor continuidad de valores altos.
Nmero de pasos
Distancia del paso
Tolerancia en el paso
Nmero de direcciones
Azimut
Tolerancia angular en el azimut
Ancho de banda horizontal

7
15.0 unidades
7.5 unidades
4
70, 160, 45 y 135
22.5
25.0 unidades

Tabla 12: Parmetros para el clculo de variogramas experimentales.


Modelos fueron ajustados a los variogramas de indicadores experimentales para
las direcciones principales de anisotropa (160 y 70). Un solo modelo
exponencial es necesario para obtener buen ajuste en todos los umbrales. Esto
permite tambin reducir los problemas de relaciones de orden. Puesto que por
definicin, los indicadores estn correlacionados, repetidos y abruptos cambios
en los modelos de un umbral al siguiente no son deseables. El efecto pepita y
alcances deben cambiar de manera consistente: pueden tener cambios
repentinos, pero no deberan oscilar todo el tiempo.

Umbral
1
2
3
4
5
6
7
8
9
10

Efecto
Pepita
Relativo
0.10
0.30
0.30
0.50
0.40
0.40
0.30
0.30
0.30
0.20

Meseta
Relativa
0.90
0.70
0.70
0.50
0.60
0.60
0.70
0.70
0.70
0.80

Exponencial
Alcance
Alcance a
a 160
70
25
15
40
15
50
15
45
25
45
25
45
20
45
30
40
40
45
30
40
30

Tabla 13: Parmetros de los modelos de los variogramas de indicadores.


Los modelos junto con los variogramas experimentales en las direcciones
principales de anisotropa se presentan en la Figura 81. La Tabla 13 presenta
los parmetros de los modelos ajustados a los variogramas experimentales. Tal
como se muestra en la Figura 82, los cambios en los parmetros de los modelos
del variograma de un umbral al siguiente son bastante suaves. Esto debera
traer como consecuencia pocos problemas con las relaciones de orden.

Simulacin Geoestadstica

138

Figura 80: Variogramas de indicadores experimentales en cuatro


direcciones para los 10 valores de corte (70 Negro, 160 verde, 45 rojo y
135 azul).

Simulacin Geoestadstica

139

Figura 81: Modelos y variogramas experimentales de indicadores en las


direcciones principales de anisotropa para los 10 valores de corte (70
negro y 160 verde).

Simulacin Geoestadstica

140

Figura 82: Cambio en los parmetros de los modelos de los variogramas


para los distintos umbrales.

Kriging simple de indicadores


Sabiendo que la variable no es estacionaria en todo el dominio, es
recomendable evitar utilizar kriging simple de indicadores como una tcnica de
estimacin. Sin embargo, con propsitos ilustrativos, se implement kriging
simple de indicadores y se calcul el estimador E-type, que corresponde al valor
medio de la distribucin condicional calculado por integracin numrica. Se
utiliz un mnimo de 4 muestras y un mximo (ptimo) de 16, dentro de un radio
de la bsqueda de 60 unidades.
Para calcular la media de la distribucin condicional, sta debe ser continua. Sin
embargo, slo se dispone de diez valores, los valores estimados para cada valor
de corte. Por esta razn, es necesario integrar numricamente la distribucin,
requirindose interpolar entre los puntos y extrapolar en las colas. La
interpolacin y extrapolacin es particularmente crtica. El efecto del mtodo de
la extrapolacin fue estudiado. Tres opciones de extrapolacin al valor mximo
(igual a 2500) fueron utilizadas:
Extrapolacin lineal
Extrapolacin usando un modelo potencia con parmetro w=0,5
Extrapolacin usando un modelo potencia con parmetro w=2,0
La segunda opcin parece ser la ms conservadora, ya que las otras dan una
importancia poco realista a las muestras extremadamente altas.

Simulacin Geoestadstica

141

Un acercamiento ms acertado a este problema podra ser re-escalar la forma


de la distribucin global de las muestras, ms all del umbral ms alto para
extrapolar las distribuciones condicionales al valor mximo.
El mapa de las estimaciones E-type que usan la segunda opcin de la
extrapolacin junto con su histograma se presenta en la Figura 83, arriba. Tal
como se esperaba, el mapa es suave (y por cierto, ms suave que el mapa
exhaustivo, ver la Figura 77). Las estadsticas bsicas para cada caso se
presentan en la Tabla 14.
Lineal
Nmero de datos
Media
Desviacin Estndar
Coeficiente de variacin
Mximo
Cuartil superior
Mediana
Cuartil Inferior
Mnimo

78000
230,126
220,973
0,960
1565,339
280,320
158,584
88,891
6,445

Potencia
w=0,5
78000
216,582
195,742
0,904
1336,107
270,934
154,367
86,736
6,445

Potencia
w=2,0
78000
243,718
246,855
1,013
1794,669
288,507
162,726
91,363
6,445

Tabla 14: Estadsticas bsicas para el estimador de E-type con diferentes


opciones de extrapolacin de las distribuciones condicionales.
La desviacin estndar es en todos los casos ms baja que aquella calculada a
partir de las muestras: 355,565. Esto se debe a que el estimador de kriging es
un promedio ponderado.
Las desviaciones de las relaciones de la orden se encuentran y corrigen
automticamente, a travs del mtodo presentado previamente. En el 14,42% de
los nodos, se presentaron problemas en este aspecto. La desviacin promedio
es 0,0152 y la mxima es 0,1623. Debe recordarse que estos valores son
desviaciones en las probabilidades. Los errores ms grandes fueron generados
en los umbrales bajos. Este problema ser estudiado ms adelante (cuando se
realice la simulacin de indicadores).
La probabilidad de estar sobre un umbral se puede calcular fcilmente a partir de
la distribucin acumulativa condicional obtenida a travs de kriging en cada sitio.
La media sobre dicho umbral se puede calcular por integracin numrica. En
este caso, la probabilidad y la media sobre la mediana y el cuantil 95 fueron
calculadas (Figura 84 y Figura 85).

Simulacin Geoestadstica

142

Figura 83: Mapas e histogramas de los estimadores de E-type calculados


usando las distribuciones condicionales obtenidas usando kriging simple
de indicadores (arriba), kriging ordinario de indicadores (centro) y kriging
de indicador de la mediana (abajo) Opcin de extrapolacin: modelo
potencia con w=0,5.

Simulacin Geoestadstica

143

Kriging ordinario de indicadores


El kriging ordinario no requiere tan fuertemente de la hiptesis de
estacionaridad. De hecho, slo la estacionaridad local es necesaria para estimar.
Esto se debe al uso de una media local, en lugar de la media global que utiliza
kriging simple. Se ha visto que, si la variable es casi-estacionaria y hay
suficientes datos condicionantes, el kriging ordinario es una tcnica robusta de
estimacin.
Usando los mismos parmetros de bsqueda que en el caso del kriging simple
de indicadores y considerando el modelo potencia con parmetro w=2 para
extrapolar ms all del umbral ms alto, se utiliz el kriging ordinario de
indicadores para estimar las distribuciones condicionales. Los resultados se
presentan en la Figura 83, centro.
Los problemas con relaciones de orden fueron en este caso mayores. 26,28%
de las estimaciones hechas presentaron desviaciones. En este caso, la
desviacin promedio correspondi a 0,0113 y la desviacin mxima encontrada
fue de 0,1844. Cabe destacar que el promedio es ms bajo que para el caso de
kriging simple de indicadores, sin embargo el valor mximo es ms alto.
Kriging de indicador de la mediana
El kriging de indicador de la mediana asume que todos los variogramas y
variogramas cruzados estn en correlacin intrnseca, es decir son
proporcionales los unos a los otros. La inferencia de variograma se hace
entonces utilizando los datos o los valores del indicador en la mediana. El uso
del variograma de indicador de la mediana parece ser ms conveniente que el
variograma de datos puesto que, por definicin, no hay valores extremos en los
indicadores, generando variogramas menos errticos.
El modelo de variograma que se utilizar es:

El kriging de indicador de la mediana fue realizado utilizando los mismos


parmetros que para SIK y OIK, y el estimador E-type fue calculado (Figura 83,
abajo). Este mtodo no genera problemas de relaciones de orden, pues es
consistente por definicin.

Simulacin Geoestadstica

144

Figura 84: Mapas e histogramas de la probabilidad y valor medio sobre la


mediana calculados usando las distribuciones condicionales obtenidas
usando kriging simple de indicadores (arriba), kriging ordinario de
indicadores (centro) y kriging de indicador de la mediana (abajo) Opcin
de extrapolacin: modelo potencia con w=0,5.

Simulacin Geoestadstica

145

Figura 85: Mapas e histogramas de la probabilidad y valor medio sobre el


cuantil 95 calculado usando las distribuciones condicionales obtenidas
usando kriging simple de indicadores (arriba), kriging ordinario de
indicadores (centro) y kriging de indicador de la mediana (abajo) Opcin
de extrapolacin: modelo potencia con w=0,5.

Simulacin Geoestadstica

146

Simulacin de indicadores
La simulacin secuencial de indicadores fue implementada usando los
parmetros enumerados en la Tabla 15.
Nmero mximo de muestras para cada kriging
Nmero mximo de nodos previamente simulados para cada kriging
Mximo nmero de octantes
Radio mximo de bsqueda
Parmetro de extrapolacin modelo potencia

16
16
4
60
0.5

Tabla 15: Parmetros para simulacin secuancial de indicadores.


Un resumen de los problemas de relaciones de orden se presenta en la Tabla
16. Dos tercios de los nodos estimados presentaron desviaciones. La desviacin
promedio fue de 0,0075, que es ms que aceptable. La desviacin mxima fue
de menos de 20 %, lo cual tambin es aceptable. La configuracin de los cuatro
nodos que generaron las mayores desviaciones se presenta en la Figura 86. En
el centro de cada mapa, el punto que se quiere simular se presenta como un
punto negro. El valor de las muestras o nodos previamente simulados se codifica
usando una escala gris que va desde -100 (blanco) a 1000 (negro). En todos los
casos el punto a estimar est al centro de una pequea zona con valores bajos.
Las distribuciones condicionales estimadas se presentan en la Figura 87. En
esos casos, est clara la importancia de hacer la correccin. En general, las
desviaciones son del orden de 0,01.

Umbral
1
2
3
4
5
6
7
8
9
10

Nmero de
desviaciones de las
relaciones de orden
64423
52745
49072
46447
51455
44249
53277
49729
48997
67989

Promedio de
desviaciones

Desviacin
mxima

0.0054
0.0076
0.0123
0.0158
0.0090
0.0105
0.0062
0.0069
0.0031
0.0021

0.1958
0.1435
0.1715
0.1958
0.1761
0.1752
0.1517
0.1582
0.1083
0.1446

Tabla 16: Resumen de problemas con las relaciones de orden para una
realizacin.
Cuatro realizaciones de la variable regionalizada simulada se presentan en la
Figura 88.

Simulacin Geoestadstica

147

Reproduccin del histograma y variogramas


Veinte realizaciones fueron generadas usando el algoritmo sisim. Para chequear
los modelos, la reproduccin del histograma y de los variogramas de indicadores
fueron evaluadas. Las Figura 89 y Figura 90 presentan estos resultados.
Se debe recordar la media y varianza de la distribucin de las muestras:

El promedio de las medias de las realizaciones simuladas es levemente ms alto


que la media de las muestras, mientras que el promedio de las varianzas de las
realizaciones es ms baja que aquella de la distribucin de muestras. Un mayor
nmero de realizaciones producira estadsticas ms cercanas. Las desviaciones
presentadas aqu se deben probablemente a fluctuaciones ergdicas.
La reproduccin del variograma es, en general, buena, aunque para algunos
valores de corte, los variogramas calculados a partir de las realizaciones
aparecen levemente desplazados con respecto a los modelos impuestos. El
nmero de muestras y de nodos previamente simulados utilizados para construir
las distribuciones condicionales es crtico para el buen funcionamiento del
mtodo. Sin embargo, cuanto ms alto es el nmero de muestras y de nodos
previamente simulados que se utilizan para estimar cada nodo, mayor es
tambin el tiempo requerido para generar cada realizacin. Ambas tareas deben
por tanto balancearse para generar resultados confiables en un tiempo
razonable.
Discusin
Esta aplicacin muestra cmo las tcnicas de indicadores pueden ayudar
cuando se manejan datos que provienen de distintas poblaciones, pero stas no
estn disponibles para diferenciarlas de antemano.
La base de datos utilizada en este estudio es bastante compleja. Presenta un
comportamiento no estacionario, con una distribucin altamente asimtrica. Un
aspecto interesante que est fuera del alcance de este proyecto es estudiar el
funcionamiento de las realizaciones generadas por esta tcnica de la simulacin
despus de que se haya aplicado una funcin de la transferencia (por ejemplo,
un plan minero). El verdadero objetivo de los mtodos de simulacin estocstica
es predecir la incertidumbre de una respuesta que procesa las realizaciones de
manera altamente compleja. Con esto se puede ayudar en la toma de
decisiones. Este objetivo es muy difcil de alcanzar, lo que hace la investigacin

Simulacin Geoestadstica

148

acerca de mtodos que reproduzcan la respuesta despus de complejos


procesos, una de las reas ms fascinantes en geoestadstica.

Figura 86: Configuracin de los puntos condicionantes de los cuatro


nodos con mayors desviaciones de las relaciones de orden.

Simulacin Geoestadstica

149

Figura 87: Distribuciones condicionales acumulativas para los cuatro


casos con mayors desviaciones de las relaciones de orden.

Simulacin Geoestadstica

150

Figura 88: Cuatro realizaciones obtenidas a travs de simulacion


secuencial de indicadores.

Figura 89: Reproduccin del histograma para 20 realizaciones usando


sisim: medias (izquierda); varianzas (derecha).

Simulacin Geoestadstica

151

Figura 90: Reproduccin de variogramas de indicadores para 20


realizaciones usando sisim.

Simulacin Geoestadstica

152

16. APLICACIN A LA BASE DE DATOS DE PRECIPITACIN EN


NORTEAMRICA
Estadsticas Bsicas
Introduccin
Los valores dentro de una seccin de un mapa a color correspondiente a datos
de precipitacin en Norteamrica fueron transformados a valores entre 0 y 1. Un
valor entre 0 y 1 se calcul a partir de los tres espectros: azul, verde y rojo. Se
utiliz la frmula siguiente:

Cada uno de los tres espectros puede tomar valores entre 0 y 255, por lo que el
nmero total de combinaciones posibles es 2563. Esta transformacin genera un
valor nico para cada combinacin de los tres colores. El mapa de la nueva
variable se presenta en la Figura 91. Observe que los valores de esta nueva
variable no tienen un significado fsico, por lo que se utilizarn como una variable
artificial.
Transformacin a valores normales
La distribucin exhaustiva original fue transformada a una distribucin
Gaussiana. Una comparacin de la distribucin original y aquella de los datos
transformados se presenta en la Figura 92. Los datos transformados sern
utilizados a partir de este punto.

Figura 91: Mapa exhaustivo de la variable artificial.

Simulacin Geoestadstica

153

Figura 92: Histograma de la base de datos exhasutiva y de los valores


transformados.

Muestreo anidado
Un esquema de muestreo anidado se podra aplicar en la prctica para asegurar
que un nmero suficiente de pares est disponible para calcular el variograma a
diferentes pasos. Cien muestras fueron tomadas en una malla rectangular (el
espaciamiento es 59 unidades en la direccin Este-Oeste por 31 unidades en la
direccin Norte-Sur). Luego, en dos sectores diferentes se tomaron 36 muestras
en una malla ms densa (el espaciamiento fue de 12 unidades en la direccin
Norte-Sur y 7 unidades en la direccin Este-Oeste). Finalmente, se identificaron
dos nuevos sectores para tomar muestras con un espaciamiento aun ms
denso. Treinta y seis muestras adicionales espaciadas a 2 unidades en el EsteOeste y slo 1 unidad en la direccin Norte-Sur completan las muestras para
esta aplicacin. Este muestreo se presenta en la Figura 93. Dada la disposicin
de las muestras, se han creado grupos que sesgarn las estadsticas. El tamao
de celda ideal para aplicar desagrupamiento por el mtodo de las celdas est
dado por el tamao de estos grupos. Utilizando un tamao de celda rectangular
de 59 por 31 unidades se resolver el sesgo generado por estos grupos.
Estas muestras se utilizan como datos condicionantes en la simulacin. Sin
embargo, puesto que el objetivo de esta aplicacin es demostrar el uso de las
tcnicas de simulacin Gaussiana y de indicadores, y no ocuparse de problemas
de inferencia de estadsticas representativas, se utilizarn las estadsticas
extradas dela distribucin exhaustiva. Las estadsticas de las muestras se
presentan en el Apndice como referencia.

Simulacin Geoestadstica

154

Figura 93: Muestreo anidado e histograma de las muestras

Distribucin de referencia
Para simular es necesario tener una distribucin de referencia que servir para
la transformacin, en el caso Gaussiano, o para utilizar la forma de las colas al
extrapolar y extraer los umbrales de inters, en el caso de la simulacin de
indicadores. En este estudio, se utiliza la distribucin exhaustiva transformada a
valores normales estndares.
Continuidad espacial
El estudio de la continuidad de la variable fue realizado utilizando la base de
datos exhaustiva y las 228 muestras anidadas. Para cada caso, los variogramas
conituo y de indicadores fueron calculados. Los variograms obtenidos a partir de
los datos exhaustivos se presentan aqu, mientras que aquellosobtenidos a partir
de las muestras se entregan en el Apndice.
Variograma continuo de los datos exhaustivos
Los variogramas experimentales obtenidos a partir de la base de datos
exhaustiva tienen un muy buen comportamiento. Para encontrar posibles
direcciones de anisotropa, un mapa variogrfico fue construido a una resolucin
de 10 m para 21 pasos (Figura 94).
Segn lo demostrado en la Figura 94, la continuidad es istropa y el alcance
aproximado es 200 unidades. Una inspeccin ms detallada revela
caractersticas de ''diente de sierra que irradian del centro. Estas caractersticas
son un artefacto del espaciamiento regular de los datos y del procesamiento
original con que se obtuvo la imagen.

Simulacin Geoestadstica

155

Figura 94: Mapa variogrfico de los datos exhaustivos. La variable es


istropa.
Variogramas fueron calculados en las direcciones norte-sur y este-oeste. Tal
como se esperaba, los variogramas exhaustivos son muy suaves, sin un
comportamiento errtico, como ocurre con variogramas experimentales cuando
las muestras son escasas. Confirman el comportamiento istropo e indican muy
claramente el efecto pepita de los datos y su alcance (Figura 95). El variogram
fue modelado con efecto pepita y dos estructuras exponenciales:

Los variograms direccionales y el mapa variogrfico son tiles para identificar


deriva en los datos, y confirmar nuestra decisin del estacionaridad, que es la
decisin a trabajar con todos los datos como si pertenecieran a la misma
poblacin estadstica. La Figura 95 demuestra que para la direccin Norte-Sur,
el variograma alcanza la meseta sin superarla. El variograma Este-Oeste supera
levemente la meseta, lo que implicara un cierto carcter no estacionario. Sin
embargo, el mapa variogrfico y los variogramas direccionales demuestran un
comportamiento istropo que confirmara que el fenmeno es estacionario.
Variogramas de indicadores de los datos exhaustivos
Los variogramas de indicadores fueron calculados a partir de los datos
exhaustivos (Figura 97). Presentan un comportamiento no simtrico respecto de
la mediana, lo que sugerira que los mtodos Gaussianos son probablemente
inadecuados, puesto que la hiptesis multi-Gaussiana no se cumplira. Esto
puede comprobarse deduciendo los variograms de indicadores del modelo
continuo presentado en la seccin anterior.

Simulacin Geoestadstica

156

Figura 95: Variogramas direccionales calculados a partir de los datos


exhaustivos
Puesto que algunos de los variogramas de indicadores experimentales
sobrepasan la meseta en algunos casos, la estacionaridad de la variable puede
chequearse una vez ms construyendo mapas de indicadores (Figura 96). stos
demuestran cierta deriva, que se refleja en los variogramas de indicadores y que
fuera predicha al obtener el variograma continuo. En vista de la gran cantidad de
datos condicionantes y de su distribucin relativamente en el dominio (a pesar
de los grupos de muestra generados), la deriva no ser modelada y se trabajar
asumiendo estacionaridad.
Modelos fueron ajustados para cada valor de corte. Los parmetros de dichos
modelos cambian suavemente de un umbral al siguiente. Se entregan en la
Tabla 17.
Cuantil

Umbral

10
20
30
40
50
60
70
80
90

-1.282
-0.842
-0.524
-0.253
0.000
0.253
0.524
0.842
1.282

Efecto
Pepita
0.25
0.25
0.25
0.25
0.25
0.25
0.30
0.30
0.40

Exponencial
Meseta
Alcance
0.50
5
0.45
5
0.45
5
0.45
5
0.45
5
0.45
5
0.50
5
0.55
5
0.55
5

Exponencial
Meseta
Alcance
0.25
60
0.30
80
0.30
140
0.30
140
0.30
160
0.30
160
0.20
180
0.15
200
0.05
240

Tabla 17: Parmetros de modelos de variogramas de indicadores.


Estos variogramas experimentales de indicadores junto con sus modelos se
pueden comparar con los variograms tericos calculados asumiendo que los
datos poseen una distribucin Gaussiana bivariable. Est claro a partir de la
Figura 95, que la continuidad no sigue la forma que tendra una variable bi-

Simulacin Geoestadstica

157

Gaussiana y que la correlacin no es multi-Gaussiana. El modelo Gaussiano es


un modelo de mxima entropa, es decir, la distribucin de los extremos tiene
menos estructura que los valores ms cercanos a la mediana. Los variogramas
de indicadores no demuestran este patrn. Siempre queda la duda de cunta
diferencia es aceptable para aplicar un mtodo Gaussiano.

Figura 96: Mapas de indicadores.

Simulacin Geoestadstica

158

Figura 97: Variogramas de indicadores experimentales junto con sus


modelos (lnea verde continua), comparados con los variogramas de
indicadores esperados para un caso bi-Gaussiano (lnea azul continua).

Simulacin Geoestadstica

159

Kriging simple y ordinario


Las muestras anidadas se utilizaron para estimar por kriging simple y ordinario
(Figura 98, primera y segunda fila). Los mapas muestran claramente que la
variable no es estacionaria. Estas derivas podran causar algunos problemas al
efectuar las simulaciones, sin embargo, si la estacionaridad es satisfecha a una
escala local, stos no debieran ser significativos.
Kriging simple y ordinario de indicadores
Las muestras anidadas se utilizaron para estimar por kriging simple y ordinario
de indicadores (Figura 98, primera y segunda fila). La interpolacin entre los
umbrales y las extrapolaciones ms all del umbral ms bajo y ms alto son muy
importantes. Pequeos cambios en estas opciones generan diferencias
significativas en los resultados. Estadsticas bsicas tales como la media y la
varianza se ven fuertemente afectadas por estos parmetros de la distribucin
(en especial, por el mtodo de extrapolacin utilizado para la cola superior). En
esta aplicacin, se utiliz la distribucin global para inferir la forma de las
distribuciones condicionales construidas por el kriging de indicadores.
Las relaciones de orden son un problema en kriging y simulacin de indicadores.
Son aceptables si su magnitud es baja, lo que se consigue comnmente a travs
de un buen modelo de variograma, donde los parmetros son consistentes de un
umbral al siguiente.
Un resumen de los problemas de relaciones de orden para el kriging simple y
ordinario de indicadores se presenta en la Tabla 18. Se muestra que las
desviaciones son de poca importancia y se presentan en un nmero
relativamente bajo de nodos.
El resultado de aplicar kriging de indicadores puede compararse con la
distribucin exhaustiva de la variable (Figura 98, tercera fila).

Simulacin Geoestadstica

160

Figura 98: Mapas e histogramas para kriging simple y ordinario de


indicadores y para los datos exhaustivos.

Simulacin Geoestadstica

Kriging simple de indicadores


Umbral
Nmero Promedio Mximo
1
1073
0.0020
0.0313
2
17960
0.0069
0.0283
3
17958
0.0069
0.0283
4
1515
0.0024
0.0200
5
100
0.0048
0.0255
6
14717
0.0055
0.0437
7
14745
0.0055
0.0415
8
1295
0.0014
0.0210
9
1216
0.0015
0.0194
Total
3.51%
Promedio
0.0059

161

Kriging ordinario de indicadores


Umbral
Nmero Promedio Mximo
1
41384
0.0085
0.0291
2
44632
0.0083
0.0320
3
5732
0.0056
0.0320
4
29567
0.0039
0.0320
5
27396
0.0037
0.0321
6
22823
0.0099
0.0433
7
24169
0.0098
0.0379
8
30688
0.0033
0.0247
9
36429
0.0025
0.0170
Total
13.05%
Promedio
0.0062

Tabla 18: Resumen de problemas de relaciones de orden para kriging


simple y ordinario de indicadores.

Simulacin secuencial Gaussiana


Los parmetros de bsqueda utilizados en kriging simple, fueron modificados
para llevar a cabo la simulacin Gaussiana, dado que generaban problemas
para reproducir el variograma. Los nuevos parmetros se presentan a
continuacin:

Mnimo nmero de muestras: 12


Mximo nmero de muestras: 24
Mximo nmero de nodos previamente simulados: 48
Radio de bsqueda: 200

Se generaron 101 realizaciones. La distribucin de sus medias y varianzas se


presenta en la Figura 99. Se cheque la reproduccin del variograma con
resultados satisfactorios (Figura 100). Las realizaciones fueron ordenadas
basado en sus medias. La Figura 101 muestra las realizaciones
correspondientes a los percentiles 5, 25, 50, 75 y 95.
Simulacin secuencial de indicadores
101 realizaciones fueron generadas a travs de simulacin secuencial de
indicadores. Las realizaciones fueron ordenadas de acuerdo a la media
obtenida. Los parmetros usados en la simulacin se presentan en la Tabla 19.
La distribucin de las medias y varianzas de las realizaciones se muestra en la
Figura 99. La reproduccin de los variogramas de indicadores es bastante
buena (Figura 100). Note el alto nmero muestras y nodos previamente
simulados utilizados para calcular las distribuciones condicionales en cada nodo
que es simulado.

Simulacin Geoestadstica

162

Nmero mximo de muestras


Nmero mximo de nodos previamente simulados
Radio de bsqueda

Tabla 19: Parmetros


indicadores.

utilizados

en

la

24
48
300

simulacin

secuencial

de

Cinco realizaciones que corresponden a los percentiles 5, 25, 50, 75 y 95 se


ilustran en la Figura 101.

Figura 99: La distribucin de medias y varianzas de las realizaciones


obtenidas por sisim.

Simulacin Geoestadstica

163

Figura 100: Reproduccin de variogramas de las realizaciones obtenidas a


travs de simulacin Gaussiana secuencial.

Figura 101: Realizaciones obtenidas a travs de simulacin Gaussiana


secuencial.

Simulacin Geoestadstica

164

Discusin
Los resultados presentados en este estudio sugieren lo siguiente:
Modelar la continuidad de manera diferente para los valores altos y bajos
es una ventaja de los mtodos de indicadores, por sobre los mtodos
Gaussianos.
En este caso, mostramos que la variable no era multi-Gaussiana. De
haberlo sido, los mtodos de indicadores habran caracterizado de
manera ms pobre a la variable, sin embargo, fueron capaces de capturar
mejor su variabilidad.
A pesar de que los problemas de relaciones de orden en los mtodos de
indicadores son una desventaja, en general no impiden una buena
reproduccin de los variogramas para cada umbral.
Los mtodos del indicador son convenientes para muchos usos donde los
mtodos Gaussianos resultan inapropiados, puesto que los primeros no
imparten entropa mxima en los extremos. Sin embrago, requieren ms
esfuerzo en trminos de inferencia.

Simulacin Geoestadstica

Figura 102: Reproduccin de los variogramas de indicadore por sisim.

165

Simulacin Geoestadstica

166

Figura 103: Realizaciones correspondientes a los percentiles 5, 25, 50, 75 y


95, utilizando sisim.

Apndice: Estadsticas de las muestras


Este apndice contiene todas las estadsticas experimentales calculadas usando
las muestras tomadas en una grilla anidada (Figura 93). Debe recordarse que
las estadsticas de la base de datos exhaustiva se utiliz en el estudio para
evitar efectos indeseables debido a problemas de la inferencia.

Simulacin Geoestadstica

167

Desagrupamiento del histograma de las muestras


El histograma presentado en la Figura 93 tiene grupos de datos, por lo que se
requiere obtener estadsticas representativas. El mtodo de desagrupamiento de
celdas se utiliza para calcular los pesos de desagrupamiento que se asignarn a
las frecuencias. La Figura 104 presenta el grfico del tamao de celda versus la
media desagrupada, junto con el histograma desagrupado utilizando los pesos
obtenidos con un tamao de celda de 120 unidades.
El comportamiento de los puntos en el grfico indica que el sesgo en el
muestreo fue introducido en zonas de bajos valores, por lo que la media
desagrupada tiene un valor ms alto que la media sin desagrupar. El
valormximo que la media desagrupada toma es 0,0, que corresponde a la
media del conjunto exhaustivo. Esto indica que la media desagrupada mxima
es apropiada en esta aplicacin.
Segn lo presentado en la Figura 104, el desagrupamiento hace que la
distribucin se acerque a una normal, corrigiendo la media de -0,182 a -0,048.
Sin embargo la varianza disminuy desde 0,982 a 0,863. Este cambio se puede
considerar pequeo, aunque es una desventaja.

Figura 104: Grfico de tamao de celda versus media desagrupadae


histograma desagrupado de las muestras.

Simulacin Geoestadstica

168

Figura 105: Q-q plot de las muestras originales versus las muestras
desagrupadas y grfico de probabilidad normal de la distribucin
desagrupada.

Variograma de las muestras


Se calcul el variograma experimental y variogramas de indicadores utilizando
todas las muestras. En ambos casos se encontr que la estructura anidada del
muestro gener nuevos desafos a la inferencia del variograma. La aplicacin de
un solo espaciamiento para los pasos de clculo, como se emplea comnmente,
conduce a estructuras cclicas en los variogramas experimentales, debido a la
fluctuacin en el nmero de datos usados para calcular cada paso. Para superar
esto, diversas distancias para el paso de clculo del variograma fueron
aplicadas. Estas distancias corresponden al espaciamiento de las tres grillas
anidadas y los rangos de aplicacin de cada una corresponden al tamao de los
subconjuntos.
Anlisis variogrfico continuo de las muestras
El nmero de muestras no es suficiente para producir un mapa variogrfico til,
por lo que los variogramas direccionales se calcularon sin el conocimiento de las
direcciones de anisotropa (Figura 107).
Se determin que no hay bastantes datos para conseguir variograms
direccionales confiables y se calcul, por tanto, un variograma omnidireccional
(Figura 107). Este variogram es ms claro que aquellos direccionales.

Simulacin Geoestadstica

169

Figura 106: Los variogramas direccionales calculados para las muestras


anidadas.

Figura 107: El variograma omni-direccional de las muestras anidadas.

Anlisis variogrfico de indicadores de las muestras


Nuevamente, el clculo de variogramas direccionales no genera resultados
confiables, por lo que se calcularon variogramas omni-direccionales. Los
variogramas de indicadores se presentan junto con sus modelos y el variograma
previsto de indicadores para el caso bi-Gaussiano (Figura 108).

Simulacin Geoestadstica

170

Figura 108: Los variogramas de indicadores omni-direccionales, sus


modelos (lnea negra continua) y los variogramas de indicadores previstos
para el caso bi-Gaussiano (lnea roja continua).

You might also like