Autor: Dr. Joan Nunes. Universitat Autònoma de Barcelona
Promotor: Institut Cartogrà fic de Catalunya, 2013
Â
Els fenòmens que varien de forma contÃnua en l'espai, com per exemple pluviositat, temperatura, granularitat o pH dels sòls, i els que varien de forma discreta però cobreixen l'espai de forma contÃnua, com és ara els tipus de vegetació o els usos del sòl, són fenòmens que poden prendre valor en qualsevol posició de l'espai. Les dades corresponents als fenòmens que presenten continuïtat en l'espai s'han de mesurar necessà riament mitjançant un nombre finit d'observacions inferior al total d'observacions possibles, que constitueix la població d'on s'extreuen les observacions realitzades. El conjunt d'observacions realitzades constitueix per tant una mostra.
El mostreig espacial, és un tipus de mostreig estadÃstic, que té per finalitat seleccionar un subconjunt de casos del conjunt d'una població, però que en lloc de seleccionar individus selecciona posicions, amb la finalitat de caracteritzar el conjunt de la població, que en el cas d'una mostra de posicions és el conjunt de posicions d'una determinada à rea d'estudi d'un fenomen que presenta continuïtat espacial. Hi ha diversos mètodes de mostreig espacial, entre els quals el mostreig espacial aleatori, el mostreig espacial sistemà tic, el mostreig espacial sistemà tic aleatori, el mostreig espacial estratificat i el mostreig espacial al llarg de transsectes o d'isolÃnies, entre els més importants. En qualsevol cas, les regles perquè un mostreig espacial sigui estadÃsticament và lid són les mateixes que per a qualsevol mostreig estadÃstic.
Sumari:
- Origen
- Definició
2.1Â Mostreig probabilÃstic
2.2Â Mida de la mostra
2.3 Marc de mostreig - Mètodes de mostreig espacial de punts
3.1Â Mostreig espacial aleatori
3.2 Mostreig espacial sistemà tic
3.3 Mostreig espacial sistemà tic aleatori
3.4 Mostreig espacial estratificat sistemà tic no alineat
3.5 Mostreig espacial estratificat sistemà tic aleatori - Mètodes de mostreig espacial per a lÃnies i à rees
4.1Â Transsectes
4.2Â IsolÃnies
4.3 Parcel·les experimentals - Factors condicionants
- Temes relacionats
- Referències
- Lectures recomanadesÂ
Â
Origen
No hi ha un origen definit per al mostreig estadÃstic, ja que la idea sembla ser força antiga. En tot cas, la formalització dels mètodes de mostreig és paral·lela a la formalització de l'estadÃstica moderna a finals del segle XVIII, per part de Gauss, Laplace i d'altres. En aquest sentit un dels precedents documentats de mostreig estadÃstic és un assaig realitzat el 1786 per Laplace per a estimar la població de França.
El desenvolupament dels mètodes de mostreig espacial és paral·lel al de l'anà lisi espacial i al de l'estadÃstica espacial (Yates, 1960; Stuart, 1962; Cochran, 1963) a partir de la dècada de 1950 i de 1960, en disciplines com la geologia, la biogeografia, l'econometria o la geografia.
Definició
Un mostreig estadÃsticament và lid ha de complir la definició de mostreig probabilÃstic, segons la qual cada cas seleccionat té una probabilitat coneguda de ser escollit. Un mostreig aleatori és un mostreig probabilÃstic en què tots els casos tenen igual probabilitat de ser escollits. No tots els mostreigs de probabilitat són necessà riament aleatoris en el sentit que tots els casos tenen la mateixa probabilitat, basta que sigui coneguda i que, si es tracta d'un mostreig ponderat es pugui multiplicar cada cas pel seu pes per obtenir estimacions no esbiaixades dels estadÃstics corresponents al conjunt de la població. Per exemple, en un mostreig estratificat, la mida de les subpoblacions de cada estrat és diferent i proporciona un pes diferent a cada cas segons l'estrat a què pertanyi, però la probabilitat d'elecció de cada cas és coneguda. Grà cies a conèixer sempre la probabilitat d'elecció de cada cas, en un mostreig probabilÃstic és possible sempre calcular l'error de mostreig, que permet per a un determinat interval de confiança establir els lÃmits entre els quals es mou el valor d'un estadÃstic corresponent al conjunt de la població, com és ara la mitjana o un percentatge.
Un mostreig no probabilÃstic és qualsevol mostreig en què alguns casos no tenen cap probabilitat de ser escollits o la probabilitat d'alguns dels casos escollits no pot ser coneguda, com a conseqüència del mètode de selecció utilitzat. Un exemple, tÃpic de mostreig no probabilÃstic és la selecció d'un cert nombre de casos considerats representatius a criteri de l'investigador. En un mostreig no probabilÃstic no és possible calcular l'error de mostreig.
L'aleatorietat, no obstant, és important per assegurar la independència entre els casos i, d'altra banda, assegura directament l'obtenció d'un mostreig probabilÃstic. Són tipus de mostreig probabilÃstic el mostreig aleatori simple, el mostreig sistemà tic i el mostreig estratificat, entre els més bà sics. Són tipus de mostreig no probabilÃstic el mostreig intencionat (amb un propòsit definit) o el mostreig per quotes.
El mostreig espacial, per tal de ser và lid ha de complir la definició de mostreig probabilÃstic. De fet, els diferents mètodes de mostreig espacial són homòlegs dels mètodes bà sics de mostreig probabilÃstic no espacial.
La mida d'una mostra espacial ha de complir, com tota mostra, amb el criteri de permetre obtenir un determinat error mostral per a un determinat interval de confiança. En el cas d'una variable quantitativa de raó, el lÃmit de l'interval de confiança es calcula segons l'expressió:
Â
on
c  és el lÃmit de l'interval de confiança desitjat
z  és la mesura d'unitat d'error està ndard per a l'interval de confiança desitjat (1,96 per al 95%, 2,58 per al 99%, d'acord amb els valors d'una distribució normal reduïda)
SE és l'error està ndard de la mitjana
Coneixent que l'error mostral de la mitjana és:
on Â
s  és la desviació està ndard de la població
n  és el nombre de casos, la mida, de la mostra
S'obté la mida de la mostra:
Â
En el cas d'estimar un percentatge, freqüència relativa d'una variable categòrica, l'expressió anterior esdevé:
on    p  és el percentatge de la categoria
En el cas d'estimar percentatges, el valor de p es pren igual al 50%, que és el cas de mà xima variabilitat o indeterminació. En el cas d'estimar la mitjana d'una variable quantitativa, com que sovint es difÃcil conèixer per endavant la desviació està ndard de la variable per al conjunt de la població, se sol utilitzar la fórmula emprada en el cas d'estimar percentatges, considerant p la proporció de desviació està ndard respecte de la mitjana i c el lÃmit de l'interval de confiança en percentatge respecte de la mitjana, la qual cosa dóna una certa subestimació de la mida de la mostra ja que no és infreqüent que la desviació està ndard sigui més gran que el 50% de la mitjana. Per a determinar la mida de la mostra amb la finalitat d'obtenir un determinat interval de confiança en tests de significació es fan servir altres mètodes que utilitzen taules precalculades.
El marc de mostreig és la col·lecció organitzada dels casos d'una població, de manera que facilita la disponibilitat de tots els casos de la població i la selecció de casos, per procediments aleatoris o d'altre tipus. Una llista (o, més habitualment, una base de dades) de tots els casos ordenats i numerats és un exemple d'un bon marc de mostreig.
Les caracterÃstiques desitjables d'un marc de mostreig correcte són:
- tots els casos tenen un identificador numèric
- tots els casos es poden trobar
- el marc ha de tenir una organització lògica sistemà tica
- la informació dels casos en el marc contempla informació addicional per poder aplicar criteris avançats de mostreig
- el marc conté tots els casos de la població estudiada
- cada element de la població només és present en el marc una sola vegada
- el marc no conté elements no pertanyents a la població estudiada
La disponibilitat o no d'un marc de mostreig apropiat és un factor crÃtic a l'hora de produir una mostra correcta. Si el marc de mostreig conté algun biaix o no conté tots els casos de la població a mostrejar, la mostra no serà và lida en el sentit de mostra probabilÃstica. El principal problema sol ser sovint que no es disposa de marc de mostreig i cal generar-lo prèviament a la tasca de mostreig en si. El cost de generar un marc de mostreig pot ser considerable, però l'efecte sobre la mostra és decisiu. Dit simplement, abans de realitzar un mostreig és necessita tenir l'inventari complet de casos de la població a mostrejar.
Per a realitzar mostreigs espacials se solen utilitzar quadrÃcules com a marc de mostreig, aprofitant generalment les quadrÃcules dels sistemes de coordenades planes emprats en la cartografia, com per exemple la quadrÃcula UTM o similars. En cas que l'à rea tingui forma irregular, la quadrÃcula ha de cobrir tota l'à rea d'estudi. Les coordenades de columna i fila de la quadrÃcula compleixen la mateixa funció que els identificadors numèrics en una llista.
Mètodes de mostreig espacial de punts
Deixant a part casos especials de mostreig espacial per a lÃnies i à rees, el mostreig espacial tÃpic és una selecció de punts o posicions en l'espai. Els diferents mètodes de mostreig espacial de punts (Hagget, 1965; Berry and Baker 1968) són, en general, homòlegs dels mètodes bà sics de mostreig probabilÃstic no espacial.
El mostreig espacial aleatori és l'equivalent del mostreig aleatori simple de dades no espacials. Consisteix en una selecció aleatòria de punts en lloc d'individus. Sovint es realitza utilitzant una quadrÃcula com a marc de mostreig i generant números aleatoris per a obtenir les coordenades de columna i de fila de la cel·la de la quadrÃcula en la qual es selecciona el punt, tÃpicament en el centre de la cel·la. Els punts seleccionats que cauen fora de l'à rea d'estudi es descarten.
És un tipus de mostreig adequat per a variables quantitatives contÃnues en l'espai, com és ara precipitacions, temperatura o caracterÃstiques dels sòls. No és gaire adequat per a fenòmens com la vegetació o els usos del sòl (en general, per a variables categòriques), ja que si les diferents categories es distribueixen en proporcions diferents per l'à rea d'estudi, les que ocupen menys extensió resultaran subrepresentades. En aquest darrer cas pot ser més adequat un mostreig espacial sistemà tic o, com a mÃnim, una mida de mostra expressament gran per tal d'augmentar les possibilitats d'obtenir punts de mostreig en les categories menys presents a l'à rea d'estudi.
Gran part dels estudis amb informació distribuïda espacialment requereixen un recobriment complet de l'à rea d'estudi, la qual cosa s'aconsegueix mitjançant el mostreig espacial sistemà tic, que consisteix en un conjunt de punts distribuïts regularment a intervals de distà ncia fixos en les dues direccions. El mostreig espacial sistemà tic tÃpicament pren la forma d'una malla de punts que són els centres de la corresponent quadrÃcula, com en el cas de les dades de tipus rà ster, quan els valors són referits als centres de cel·la.
El mostreig espacial sistemà tic té l'inconvenient o el risc, com el mostreig sistemà tic a partir de llistes, que la distà ncia o interval de mostreig entre punts coincideixi amb alguna periodicitat present a les dades, com poden ser certes formes geomorfològiques en la topografia del terreny en el cas de mostrejar elevacions (Zarkovich, 1966).
En general, l'interval de mostreig condiciona decisivament la capacitat de reconèixer objectes o les variacions de la variable objecte de mostreig, tant en el cas del mostreig espacial sistemà tic, per efecte de la periodicitat, com en el cas del mostreig espacial aleatori, perquè la distà ncia mÃnima entre punts és indicativa de la major o menor densitat de punts de mostreig, que pot ser insuficient per a reconèixer variacions significatives.
El mostreig espacial sistemà tic també té l'inconvenient de poca aleatorietat i de recollir un nombre excessiu de punts en zones d'escassa variabilitat.
Mostreig espacial sistemà tic aleatori
El mostreig espacial sistemà tic aleatori combina, com en el cas no espacial, mètodes aleatoris i sistemà tics. La forma més senzilla de realitzar un mostreig espacial sistemà tic aleatori és escollir aleatòriament el punt dins de cada cel·la de la quadrÃcula usada com a marc de mostreig, la qual cosa dóna lloc al mètode de mostreig anomenat mostreig espacial sistemà tic amb aleatorietat local. Un altre tipus de mostreig espacial sistemà tic aleatori és el mostreig espacial sistemà tic a intervals aleatoris, que consisteix a definir aleatòriament l'interval de distà ncia entre punts de mostreig en cada una de les dues dimensions. Ambdós mètodes donen resultats semblants, si bé el mètode de mostreig espacial sistemà tic a intervals aleatoris produeix una distribució més irregular dels punts i menys alineada.
El mostreig espacial sistemà tic aleatori té la caracterÃstica fonamental del mostreig espacial sistemà tic de proporcionar un recobriment complet de l'à rea d'estudi i, a més, dos avantatges addicionals. D'una banda evita l'alineació i distribució regular dels punts que podria coincidir amb alguna periodicitat present a les dades; i d'altra banda, igual que el mètode no espacial corresponent, introdueix un major grau d'aleatorietat en la selecció dels casos, que sempre és beneficiós per a la representativitat e la mostra.
Mostreig espacial estratificat sistemà tic no alineat
El mètode de mostreig espacial estratificat sistemà tic no alineat Berry and Baker (1968) utilitza les cel·les de la quadrÃcula com a estrats i defineix un sistema de coordenades dins de cada cel·la de la quadrÃcula, que utilitza per a definir aleatòriament la posició del punt a seleccionar dins de la cel·la. La novetat del mètode és el fet de mantenir la coordenada x per a seleccionar els punts de totes les cel·les d'una mateixa fila i la coordenada y per a seleccionar els punts de totes les cel·les d'una mateixa columna, mentre que la coordenada que falta en cada cas es genera aleatòriament. El resultat no és gaire diferent que el del mostreig espacial sistemà tic amb aleatorietat local, si bé el manteniment d'una coordenada al llarg de cada fila o columna proporciona una certa estratificació espacial.
Mostreig espacial estratificat sistemà tic aleatori
El mètode de mostreig espacial estratificat sistemà tic aleatori consisteix a dividir l'à rea d'estudi en diferents zones, que actuen com a estrats, i realitzar un mostreig espacial sistemà tic amb aleatorietat local de diferent densitat de punts dins de cada zona. És un mètode apropiat per a cobrir completament una à rea i al mateix temps adaptar-se a la diferent variabilitat de la variable estudiada en diferents zones de l'à rea d'estudi o quan es tracta de comparar zones que tenen significació per si mateixa i són molt desiguals en superfÃcie, de manera que un mostreig regular no proporcionaria suficients punts per a les zones més petites.
Mètodes de mostreig espacial per a lÃnies i à rees
Un transsecte és una lÃnia recta sobre el terreny o sobre un mapa al llarg de la qual es realitzen observacions. L'ús de transsectes és molt habitual en geologia, biologia o ecologia.
Els transsectes es poden utilitzar simplement per a mesurar la longitud de caracterÃstiques sobre el terreny o el mapa al llarg del trassecte a mesura que aquest creua les à rees de les diferents caracterÃstiques. De forma més acurada es poden utilitzar també per a ubicar punts de mostreig aleatòriament sobre el transsecte en els quals realitzar les observacions.
Els transsectes es poden definir aleatòriament mitjançant parells de coordenades aleatòries que defineixin l'inici o final del transsecte o sistemà ticament mitjançant lÃnies paral·leles a un cert interval de distà ncia que cobreixin completament l'à rea d'estudi. Un cas especial de transsecte són els transsectes intencionats, escollits en funció de caracterÃstiques particulars del terreny. En aquest cas, malgrat que el transsecte no constitueix un mostreig probabilÃstic, el mostreig de punts, de forma aleatòria o sistemà tica al llarg del transsecte sà que pot ser-ho, de manera que el transsecte actua només com a marc de mostreig.
El mostreig al llarg d'isolÃnies és una altra forma de mostreig espacial que utilitza elements lineals, en aquest cas de valor constant de l'atribut mesurat. El mostreig al llarg d'isolÃnies es pot fer servir per a escollir punts que representin adequadament la isolÃnia en lloc d'utilitzar la isolÃnia. En aquest cas es tracta essencialment d'una transformació de dades per a obtenir una representació espacial diferent.
Les isolÃnies també es poden fer servir com els transsectes per a mesurar caracterÃstiques al llarg de la isolÃnia. Cas en què es comporten també com a marc de mostreig.
La parcel·la experimental és una unitat de superfÃcie utilitzada sobretot en biogeografia per a realitzar-hi mesuraments a l'interior. Deixant a part efectes d'escala derivats de la mida de la parcel·la experimental, el mostreig en aquest cas consisteix a escollir els punts on ubicar la parcel·la experimental, cosa que es pot realitzar per qualsevol dels mètodes de mostreig espacial de punts.
Factors condicionants
El mostreig espacial presenta diversos condicionants i dificultats a tenir en compte. Algunes de caire metodològic en el moment de definir el mostreig espacial i d'altres de caire prà ctic a l'hora d'aplicar-lo i efectuar les observacions.
Entre les dificultats de caire metodològic hi ha l'error bastant freqüent d'aplicar un mostreig espacial a fenòmens que no varien de forma contÃnua a través de l'espai i que cal conceptualitzar correctament com a entitats, de les quals el mostreig consisteix a escollir individus, com per exemple en el cas de voler fer un mostreig de masies, establiments industrials o botigues. En tots aquests casos, cal fer una llista o cens dels casos i aplicar un mostreig no espacial, independentment del fet que els individus posseeixin localització que es pot recollir com una caracterÃstica de cara a anà lisis posteriors.
Una segona dificultat de caire metodològic es produeix quan es combina el mostreig d'observacions a través de l'espai i al llarg del temps. En aquest cas, els perÃode de temps (franges del dia, dies de la setmana, mesos, estacions de l'any, etc.) actuen com a marc de mostreig. Si a més el mostreig s'estratifica per à rees, es produeix aleshores un efecte de mostreig agrupat no desitjable, ja que incompleix els principis de mostreig probabilÃstic. Una manera de pal·liar aquest efecte és utilitzar perÃodes de temps i zones espacials el més petites possible en la mesura que sigui factible.
En el terreny prà ctic, per últim, la principal dificultat per aplicar un determinat mostreig és l'accessibilitat a tots els punts seleccionats. Alguns d'aquests poden ser simplement inaccessibles per condicions del terreny o pel fet que el fenomen a mostrejar es troba sota la superfÃcie del medi construït.
Temes relacionats
Referències
Berry, B. and Baker, A. (1968) "Geographic sampling" in Berry, B. and Marble, D. (eds.) Spatial analysis. New Jersey: Prentice-Hall.
Cochran, W. (1963) Sampling techniques. New York: Wiley.
Haggett, P. (1965) Locational analysis in human geography. London: Edward Arnold.
Stuart, A. (1962) Basic ideas of scientific sampling. London: Griffin.
Yates, F. (1960) Sampling methods for censuses and surveys. London: Griffin.
Zarkovich, S. (1966) Quality of statistical data. Rome: Food and Agriculture Organisation of the United Nations.
Lectures recomanades
Berry, B. and Baker, A. (1968) "Geographic sampling" in Berry, B. and Marble, D. (eds.) Spatial analysis. New Jersey: Prentice-Hall.
Dixon, C. and Leach, B. (1977) Sampling methods for geographical research. CATMOG (Concepts and Techniques in Modern Geography), 17, Norwich: GeoBooks.