Autor: Dr. Joan Nunes. Universitat Autònoma de Barcelona
Promotor: Institut Cartogrà fic de Catalunya, 2013
Â
El problema de la unitat espacial modificable (modifiable areal unit problem, MAUP) fa referència a la dependència que presenten els resultats de les anà lisis estadÃstiques de dades agregades en unitats espacials respecte de les unitats espacials emprades. AixÃ, per exemple, l'anà lisi de dades del cens de població, com és ara el percentatge de població de 65 anys i més, agregades en à rees, dóna resultats diferents per a cada tipus d'unitat espacial diferent (seccions, districtes, municipis o comarques) emparada per a agregar i analitzar les dades.
El problema de la unitat espacial modificable és una font de biaix estadÃstic, en la mesura que els resultats presenten una dependència sistemà tica respecte de la unitat d'anà lisi i per tant són qüestionables, però sobretot és una font d'incertesa respecte a dos aspectes fonamentals: a) quina és la validesa de l'anà lisi efectuada a un determinat nivell d'agregació, és a dir emprant una determinada unitat espacial d'agregació de les dades; i b) quina és la unitat espacial adequada per a l'agregació i anà lisi d'unes determinades dades, i per tant i en definitiva per a l'estudi d'u determinat fenomen i de la seva distribució espacial.
El problema afecta qualsevol anà lisi de dades agregades per zones, que ha estat el tipus de dades geogrà fiques disponible i utilitzat de forma predominant en geografia quantitativa en les dècades de 1960 i 1970, raó per la qual ha estat considerat com una de les limitacions fonamentals d'una part substancial de l'anà lisi espacial en geografia. Fora de l'à mbit de la geografia, el problema de la unitat espacial modificable ha estat considerat també en ecologia del paisatge, atès que presenta també casos similars d'anà lisi de dades agregades espacialment amb problemes de dependència d'escala, i també en epidemiologia, en econometria i en sociologia.
El problema de la unitat espacial modificable es relaciona amb altres aspectes de les dades espacials i de l'anà lisi de dades agregades, com la dependència d'escala i la fal·là cia ecològica, però és un problema diferent, especÃfic de la definició d'unitats zonals d'anà lisi. Segons les interpretacions es pot considerar un problema de mala conceptualització dels objectes d'anà lisi, que desapareix en especificar-los correctament i redefinir les dades i les anà lisis conformement, o bé com un problema intrÃnsec de la partició de l'espai en à rees significatives respecte de la distribució espacial d'un determinat fenomen, el qual, si bé és essencialment insoluble, pot ser aprofitat avantatjosament en favor d'un millor coneixement del comportament espacial del fenomen o de l'assoliment d'una partició de l'espai que maximitzi un determinat objectiu. La majoria de la recerca desenvolupada en relació al problema de la unitat espacial modificable s'ha adreçat en aquesta darrera direcció, aixà com a la reducció o objectivació del biaix estadÃstic introduït per l'agregació espacial de dades en à rees.
Sumari:
Â
Origen
El problema de la unitat espacial modificable va ser evidenciat per primer cop per Gehlke i Biehl (1934).en un estudi que mostrava com els coeficients de correlació entre dues variables (delinqüència juvenil i renda familiar mitjana) agregades en unitats territorials diferents augmentaven a mesura que les dades eren agregades en unitats territorials cada cop més grans. El biaix resultava sistemà tic quan les unitats territorials s'agrupaven en nivells superiors respectant la restricció de contigüitat entre à rees (és a dir, agrupant només à rees veïnes), mentre que l'agrupació aleatòria d'à rees no necessà riament contigües donava resultats també diferents per a cada agrupació d'à rees però no sistemà ticament creixents. A la vista dels resultats, els autors es qüestionaven: a) si l'anà lisi de correlacions entre variables per mitjà de dades agregades descriu o mesura realment la interrelació entre caracterÃstiques dels individus originals (problema de la fal·là cia ecològica); b) quin valor podien tenir les anà lisis fetes amb dades agregades; i c) si les unitats zonals són realment objectes d'estudi amb caracterÃstiques pròpies o simplement un atribut descriptiu de la localització dels individus reals (p.e., persones o famÃlies en el cas de l'estudi de Gehlke i Biehl).
Yule i Kendall (1950) presentaren resultats similars i demostraren que el coeficient de correlació augmenta amb l'escala pel simple fet que el nombre de casos es menor i la variabilitat disminueix. Sense fer referència al problema de la fal·là cia ecològica, ni al de la correcta conceptualització dels objectes d'estudi, Yule i Kendall qüestionaven igualment la validesa de les anà lisis i apuntaven la conclusió important que els resultats d'anà lisis fetes amb dades agregades per a una determinada unitat espacial són únicament và lids per a la unitat espacial escollida. Els resultats obtinguts per a una determinada unitat espacial no tenen validesa universal però tanmateix poden tenir un valor descriptiu i històric si la unitat espacial utilitzada té algun significat especÃfic (p.e., els comtats anglesos l'any 1936, en el cas de l'estudi de Yule i Kendall).
Altres treballs, simultanis o posteriors, aportaren evidències addicionals en relació als problemes de fal·là cia ecològica i de dependència d'escala. Robinson (1950) féu la comparació dels coeficients de correlació entre variables analitzades a nivell d'individus (persones, en aquest cas) i amb dades agregades en unitats territorials, amb resultats que demostraven com l'existència de correlació era un producte de l'agregació ja que no es donava a nivell dels individus originals. Blalock (1964), d'altra banda, féu la comparació dels coeficients de correlació obtinguts amb dades agregades agrupant aleatòriament unitats espacials o bé agrupant-les aleatòriament però respectant la contigüitat entre les unitats espacials originals, amb el resultat ja observat per Gehlke i Biehl que els coeficient de correlació calculats per a les agrupacions completament aleatòries, tot i donar valors diferents per a cada agrupació diferent, no presentaven el biaix sistemà tic creixent que mostraven les agrupacions d'à rees contigües per efecte de l'autocorrelació espacial, ja que la semblança entre à rees properes es mantenia en agrupar à rees contigües.
La formulació explÃcita del problema de la unitat espacial modificable apareixeria més tard, a finals de la dècada de 1970, arran dels treballs d'Openshaw (1977) i Openshaw i Taylor (1979, 1981), en els quals es planteja com l'efecte d'obtenir patrons artificials o incerts com a resultat d'imposar unitats espacials (à rees) arbitrà ries i modificables per a donar compte i analitzar de forma agregada dades sobre fenòmens geogrà fics continus.
Després de la formulació inicial i exploració d'algunes vies de solució (Openshaw, 1978; 1984), el problema de la unitat espacial modificable ha continuat rebent una certa atenció, tant en geografia (Fotheringham i Wong, 1991; Heywood, 1998; Openshaw i Alvandies, 1999), com en altres disciplines, entre les quals l'ecologia del paisatge (Jelinski i Wu, 1996), l'epidemiologia (Wong et al., 1999) o l'econometria (Arbia i Petrarca, 2011). Habitualment s'ha considerat que el problema de la unitat espacial modificable és un problema propi de l'anà lisi de dades socioeconòmiques i per tant de la geografia humana, però també s'ha plantejat en geografia fÃsica (Dark, 2007).
Definició
El problema de la unitat espacial modificable ha estat definit formalment (Openshaw, 1977; 1984; Heywood, 1998) com el problema que sorgeix de la imposició d'unitats espacials (à rees) arbitrà ries i modificables per a fer recomptes i analitzar de forma agregada fenòmens geogrà fics continus, la qual cosa dóna lloc a resultats variables segons el nivell d'agregació de les dades, i per tant incerts, o condicionats per les unitats espacials emprades, i per tant suposadament artificials.
El problema de la unitat espacial modificable té, segons Openshaw (1977), dos components: l'efecte d'escala i l'efecte de zonificació.
L'efecte d'escala produeix variacions en els resultats de les anà lisis a causa de l'agrupament i reducció del nombre de casos utilitzats en l'anà lisi quan les dades s'agreguen en zones, ja sigui a partir dels individus originals o de zones més petites (per exemple, diferències en l'anà lisi del nivell mitjà de renda per municipis o per comarques).
L'efecte de zonificació (o, en la terminologia original d'Openshaw, efecte d'agregació) produeix variacions en els resultats de les anà lisis a causa de les diferents possibles maneres d'agrupar les dades d'individus o de zones petites en un nombre determinat de zones més grans, és a dir mantenint el nivell d'escala constant.
Cal remarcar també que, l'efecte de zonificació pot ser força diferent si, tot i tenir en compte totes les possibles combinacions per a produir un cert nombre d'à rees agregades, es restringeix l'agregació únicament a les à rees contigües o bé si es poden agrupar à rees qualsevol encara que les à rees agregades resultants no siguin un sola zona contÃnua. En el cas de mantenir la restricció de contigüitat l'existència d'autocorrelació espacial entre les à rees veïnes produeix resultats més homogenis en les à rees agregades que reflecteixen un cert patró espacial. En canvi, quan s'agreguen à rees qualssevol, contigües o no, l'efecte de l'autocorrelació espacial desapareix i el resultat pot ser completament arbitrari, sense cap tendència sistemà tica, ni que sigui esbiaixada.
Segons Openshaw (1977, 1984) és l'efecte de zonificació, de caire combinatori, el que fa del problema de la unitat espacial modificable un problema especÃfic, diferent del problema de dependència d'escala, per bé que aquest té una part molt destacada en el problema de la unitat espacial modificable i efectes importants en els resultats. També, segons Openshaw, és aquest efecte de zonificació el que pot ser aprofitat com una eina d'anà lisi i proporcionar una de les possibles solucions al problema de la unitat espacial modificable.
Recerca de solucions
Segons els termes en què es plantegi, el problema de la unitat espacial modificable pot ser un problema inexistent o bé un problema insoluble o, si més no, endèmic i difÃcil de tractar. El mateix autor que més s'ha destacat en el reconeixement i recerca del problema, Openshaw, fa referència continuadament a aquesta dicotomia (Openshaw, 1984).
El problema de la unitat espacial modificable existeix perquè es desconeixen quines són les entitats espacials -en general, entitats o individus geogrà fics- que constitueixen l'objecte d'estudi (Openshaw, 1984). En aquest sentit, una gran part del problema, o de situacions en què es planteja el problema, són degudes a una mala conceptualització dels objectes d'estudi.
L'objecte d'estudi: Ã rees o entitats?
Tal com posen de manifest els primers estudis de les dècades de 1930 i 1950, procedents del camp de l'estadÃstica, molts dels casos aportats com a evidències són casos flagrants de fal·là cia ecològica, en el sentit que no plantegen l'anà lisi del fenomen estudiat a través dels individus reals i pertinents (per exemple, persones, famÃlies, empreses, etc.) sino a través d'agregacions (per exemple, totals per municipis o per provÃncies). Els mateixos Gehlke i Biehl (1934) es feien la pregunta de si les unitats espacials (zones) són entitats per si mateixes, amb caracterÃstiques pròpies, que poden ser estudiades, o si simplement són un atribut descriptiu dels individus originals que n'expressa amb major o menor resolució la localització geogrà fica. En molts casos és evident que es tracta d'aquest segon cas.
La significació dels resultats referits a à rees: utilitat limitada a les à rees emprades
Els resultats de les anà lisis amb dades agregades són dependents del criteri d'agregació imposat i per tant només và lids o descriptius de les unitats espacials per a les quals han estat realitzades les anà lisis. Aquest advertiment, també força inicial (Yule i Kendall, 1950), juntament amb la remarca que, malgrat tot, els resultats per a unes determinades unitats espacials poden ser útils per a descriure aquelles unitats espacials i tenir un valor històric i geogrà fic, dóna a entendre clarament que l'anà lisi de dades agregades pot ser và lid amb finalitats descriptives d'un determinat conjunt d'à rees, en el ben entès que no es tracta d'analitzar el fenomen, sinó de descriure les à rees, sempre que aquestes tinguin un determinat interès o significació (per exemple, el valor històric de ser una determinada divisió administrativa, o la significació geogrà fica de constituir l'à rea funcional d'un sistema urbà ). En altres paraules, les à rees a estudiar han de tenir una certa significació per si mateixes i cal ser conscient que l'anà lisi de les dades agregades per a un determinat conjunt d'à rees només descriu aquelles à rees.
Openshaw (1984) es refereix a aquest tipus d'aproximació com la solució no geogrà fica, quan les à rees tenen una definició independent del fenomen, o com la solució tradicional geogrà fica, quan les à rees tenen una definició independent del fenomen que reflecteix l'estructura del territori o un determinat procés. Significativament l'autor remarca que aquest tipus de solució funciona bé quan hi ha un coneixement geogrà fic suficient per a definir amb un alt nivell de precisió el tipus d'à rees que tenen més sentit per a un determinat propòsit. L'autor afegeix tot seguit que hi ha moltes à rees en geografia en què aquest coneixement no es té, la qual cosa és el corol·lari de la mala o insuficient conceptualització dels objectes d'estudi.
L'espai geogrà fic, continu?
Una darrera font del problema és l'assumpció, molt comuna en les dècades de 1960 i de 1970, que l'espai geogrà fic i tots els fenòmens geogrà fics són, per definició, necessà riament continus. Aquest supòsit, lligat a la vocació subjacent de la geografia de diferenciar zonalment la superfÃcie terrestre, permet entendre la visió imperant en la geografia quantitativa de la dècada de 1970, segons la qual es necessita alguna forma de discretització o de partició en à rees dels fenòmens continus per tal de poder descriure'ls en termes de diferenciació zonal de l'espai. D'altra banda, el fet que certament les dades agregades per mitjà d'unitats censals o administratives, sovint arbitrà ries, hagin estat durant dècades el tipus d'informació geogrà fica més corrent o gairebé l'únic, permet entendre que l'anà lisi espacial sembli haver de fer-se necessà riament mitjançant dades agregades en unitats espacials zonals (à rees).
Alguns dels errors associats a aquest tipus de visió van des de l'afirmació que les entitats no espacials (persones, famÃlies, empreses, etc.) no tenen propietats espacials com localització per poder analitzar els fenòmens espacialment per mitjà dels individus originals, fins a l'afirmació que les dades socioeconòmiques, ecològiques o epidemiològiques no poden ser mesurades en localitzacions puntuals, sinó que han de ser sempre referides a à rees que les continguin.
Una millor conceptualització dels objectes d'estudi inclou també una millor conceptualització de la seva localització, la qual, salvant raons o prà ctiques històriques de com es generen o publiquen les dades, sempre pot ser referida a una posició acurada. Després, la naturalesa del fenomen, segons que es tracti d'un fenomen de variació contÃnua o discreta a través de l'espai (Nunes, 1991), comportarà l'elecció d'una metodologia d'anà lisi o altra com a més adequada. En tot cas i per a aquells fenòmens veritablement continus, l'anà lisi per mitjà de dades agregades en unitats espacials (à rees) no sembla el més adequat en cap sentit. Les dades contÃnues es poden analitzar mitjançant nombrosos mètodes d'estadÃstica espacial, d'interpolació o de geoestadÃstica, que tracten efectivament de fenòmens de variació contÃnua en funció de la localització.
L'efecte d'escala
En relació a l'efecte d'escala nombrosos autors remarquen que l'ús d'unitats espacials (à rees) petites augmenta la variabilitat i tendeix a produir resultats massa divergents, mentre que l'ús d'à rees grans, tot i produir resultats més estables o homogenis, sovint homogeneïtza massa la variació i anul·la variacions significatives que tenen lloc amb unitats espacials d'escala més petita. L'elecció d'unitats espacials d'escala (grandà ria) adequada sembla precisament l'arrel del problema de la unitat espacial modificable quan s'assumeix o persegueix l'existència d'una escala (i d'una partició de l'espai) correcta. Quan s'assumeix que la variabilitat observable varia amb l'escala el problema sembla ser simplement el de descriure la variabilitat a diferents escales, cada una amb la seva significació especÃfica.
La unitat espacial modificable: problema o error?
Quan el problema de la unitat espacial modificable es planteja assumint la correcta conceptualització dels objectes d'estudi, la significació limitada de la descripció d'unitats espacials mitjançant dades agregades i la no necessà ria continuïtat de molts dels fenòmens que tenen lloc sobre la superfÃcie terrestre, el problema sembla més aviat una llista dels errors a evitar en el cas d'haver de treballar amb dades agregades en unitats espacials. En aquest sentit, les conclusions dels treballs inicials de la dècada de 1930 i 1950, procedents del camp de l'estadÃstica, potser eren simplement l'alerta dels efectes i errors a evitar.Â
El problema de la unitat espacial modificable, d'altra banda, pot o requereix ser tractat quan l'ús de dades agregades en unitats territorials és inevitable. El problema, plantejat en els seus propis termes, és, si no insoluble, dÃficil de tractar, ja que cada agregació produeix resultats diferents i, sense coneixement afegit, que permeti interpretar la variabilitat i atribuir significació especÃfica a una o altra partició de l'espai, no hi ha criteri de decisió.
Aquesta dificultat ha estat abordada de diverses maneres. Openshaw (1978, 1984), tot advertint que no hi ha solucions miraculoses, proposà aprofitar el problema i convertir-lo en una eina d'anà lisi espacial. En aquest sentit, avançà i experimentà amb la idea que, si les unitats espacials d'anà lisi són modificables, hom pot tractar de generar aquelles unitats espacials que satisfacin o maximitzin un determinat objectiu (per exemple, maximitzar la correlació espacial entre dues variables). La finalitat en aquesta aproximació no és tant produir les unitats espacials "correctes" i per tant donar solució al problema, com veure la forma espacial que pren la materialització d'una hipòtesi. Els resultats obtinguts amb aquesta aproximació combinatòria són en general estranys pel que fa a forma i distribució de les unitats espacials generades i no concloents. Anecdòticament, cal remarcar, com assenyala el mateix autor, que aquesta manera de procedir ha estat, de fet, una prà ctica amb aplicacions conegudes en l'administració pública per a la redefinició d'unitats territorials (redistricting) amb criteris com és ara assolir un determinat llindar d'habitants o d'altres, i també en polÃtica per l'establiment d'una divisió electoral fraudulenta (gerrymandering) mitjançant l'alteració dels lÃmits de les circumscripcions electorals de forma deliberada per tal d'afavorir una determinada opció polÃtica.
El problema és lluny d'haver trobat una solució i ha continuat generant esforços de recerca, més enllà de l'aproximació combinatòria apuntada. Alguns dels treballs recents de recerca de solucions al problema de la unitat espacial modificable es basen en altres aproximacions, com és ara l'aplicació d'estadÃstics de teoria de la informació (Nakaya, 2000) o bé l'ús d'estadÃstica bayesiana (Hui, 2009).
Temes relacionats
Referències
Arbia, G. and Petrarca, F. (2011) "Effects of MAUP on spatial econometric models", Letters in Spatial and Resource Sciences, 4, 3, 173-185.
Blalock, H. (1964) Causal inferences in nonexperimental research. Chapel Hill: University of North Carolina Press.
Dark, S.J. (2007) "The modifiable areal unit problem(MAUP) in physical geography", Progress in Physical Geography, 31, 5, 471-479.
Fotheringham, A.S. and Wong, D.W.S. (1991) "The modifiable areal unit problem in multivariate statistical analysis", Environment and Planning A, 23, 7, 1025-1044.
Gehlke, C. and Biehl, H. (1934) "Certain effects of grouping upon the size of the correlation coefficient in census tract material", Journal of the American Statistical Association Supplement, 29, 169–170.
Heywood, I. (1998) Introduction to Geographical Information Systems. New York: Addison Wesley.
Hui, C. (2009) "A bayesian solution to the modifiable areal unit problem" in Hassanien, A.E.; Abraham, A. and Herrera, F. (eds.) Foundations of Computational Intelligence, Volume 2. Berlin: Springer-Verlag.
Jelinski, D.E. and Wu, J. (1996) "The modifiable areal unit problem and implications for landscape ecology", Landscape Ecology, 11, 3, 129-140.
Nakaya, T (2000) "An information statistical approach to the modifiable areal unit problem in incidence rate maps", Environment and Planning A, 32, 1, 91-109.
Nunes, J. (1991) "Geographic Space as a Set of Concrete Geographical Entities" in Mark, D.M. and Frank, A.W. (eds.) Cognitive and Linguistic Aspects of Geographic Space. Dordrecht, Nederland: Kluwer Academic Publishers.     Â
Openshaw, S. (1977) "A geographical solution to scale and aggregation problems in region-building, partitioning, and spatial modelling", Transactions of the Institute of British Geographers, New series, 2, 459-472.
Openshaw, S. (1978) "An optimal zoning approach to the study of spatially aggregated data" in Masser, I. and Brown, P.J.B. (eds.) Spatial representation and spatial interaction. Leiden: Martinus Nijhoff.
Openshaw, S. (1984). The Modifiable Areal Unit Problem. CATMOG (Concepts and Techniques in Modern Geography), 38, Norwich: GeoBooks.
Openshaw, S, and Alvandies, S. (1999) "Applying geocomputation to the analysis of spatial distributions" in Longley, P.; Goodchild, M.; Maguire, D. and Rhind, D. (eds) Geograhpic Information Systems: Principles and Technical Issues. New York: John Wiley and Sons.
Openshaw, S. and Taylor, P.J. (1979) "A million or so correlation coefficients: three experiments on the modifiable areal unit problem" in Wrigley, N. (ed.) Statistical methods in the spatial sciences. London: Pion.
Openshaw, S. and Taylor, P.J. (1981) "The modifiable areal unit problem"  in  Wrigley, N. and Bennett, R.J. (eds.) Quantitative geography: a British view, London: Routledge and Kegan Paul.
Robinson, A.H. (1950) "Ecological correlation and the behaviour of individuals", American Sociological Review, 15, 351-357.
Wong, D.W.S.; Lasus, H. and Falk, R.F. (1999) "Exploring the variability of segregation index D with scale and zonal systems: an analysis of thirty US cities", Environment and Planning A, 31, 3, 507-522.
Yule, G.U. and Kendall, M.G. (1950) An introduction to the theory of statistics. London: Griffin.
Lectures recomanades
Openshaw, S. (1984) The Modifiable Areal Unit Problem. CATMOG (Concepts and Techniques in Modern Geography), 38, Norwich: GeoBooks.