Autor: Dr. Joan Nunes. Universitat Autònoma de Barcelona
Promotor: Institut Cartogrà fic de Catalunya, 2013
Â
L'anà lisi de superfÃcie de tendència (trend surface analysis) és un mètode estadÃstic d'anà lisi de la variació espacial contÃnua consistent a ajustar per regressió una funció de superfÃcie, generalment de tipus polinòmic, a un conjunt de punts de mostreig. L'anà lisi de superfÃcie de tendència descompon la variació espacial de la variable analitzada en dos components: el component de variació regional o de tendència de variació espacial, estimat per mitjà de la superfÃcie ajustada per regressió i el component de variació local, corresponent al residu o diferència entre el valor observat de la variable i el valor estimat per la regressió.
L'anà lisi de superfÃcie de tendència és un mètode d'anà lisi espacial senzill per a descriure la variació espacial sobre grans extensions, i s'utilitza principalment per a identificar tendències a partir de les dades mostrals, més que per a modelitzar acuradament una superfÃcie, ja que no té en compte aspectes com l'autocorrelació espacial ni l'estacionarietat de la variació espacial, i és molt sensible a la presència de valors extrems en les dades. Atès que es tracta d'una extensió de l'anà lisi de regressió convencional, en l'anà lisi de superfÃcie de tendència és crÃtic l'acompliment dels requeriments propis de l'anà lisi de regressió, aixà com l'adequació de les dades, que han de ser necessà riament dades de variació contÃnua a través de l'espai, com per exemple temperatura, pluviositat, granularitat o pH del sòl.
L'anà lisi de superfÃcie de tendència pot tenir diferents finalitats, entre les quals hi ha la descripció de la variació espacial d'una variable contÃnua, la interpolació de valors de la variable en posicions en què és desconeguda, l'eliminació de la tendència espacial regional d'una variable prèviament a la realització d'altres anà lisis, o l'elaboració de models predictius per a posar a prova hipòtesis sobre la variació espacial. Ha estat un mètode força utilitzat sobretot en en geologia, però té també nombroses aplicacions en geografia, ecologia i econometria.
Sumari:
- Origen
- Definició
- Funcions de superfÃcie utilitzades
3.1 Funció polinòmica de primer grau o funció lineal
3.2 Funcions polinòmiques de grau superior
3.3 Model de Fourier bidimensional - Requeriments del model de superfÃcie de tendència
4.1 Requeriments en relació al tipus de dades
4.2 Requeriments en relació a la significació estadÃstica - Tests de significació estadÃstica
5.1Â Bondat d'ajust
5.2 Significació de la superfÃcie ajustada
5.3 Significació de la millora aportada per una funció de grau superior
5.4 Altres tests de significació estadÃstica - Limitacions
- Extensions
7.1 SuperfÃcies de tendència amb quatre variables
7.2 SuperfÃcies de tendència per a altres tipus de dades - Alternatives
- Temes relacionats
- Referències
- Lectures recomanades
Â
Origen
Les primeres aplicacions de l'anà lisi de superfÃcie de tendència provenen del camp de la geologia (Krumbein, 1959; Grant, 1961), encara que sembla que les primeres formulacions de la idea es poden atribuir a l'estadÃstic Student. La utilització de l'anà lisi de superfÃcie de tendència en geografia data de mitjans de la dècada de 1960 (Tobler, 1964; Chorley and Haggett, 1965) aplicada a l'anà lisi de la tendència espacial de fenòmens tan diversos com superfÃcies d'erosió, circs glacials, distribució dels serveis urbans, agricultura, sòls, pluviositat o contaminació atmosfèrica.
Definició
L'anà lisi de superfÃcie de tendència assumeix que la variació d'una variable contÃnua a través de l'espai és una funció de la localització, de manera que els valors de la variable poden ser expressats mitjançant una funció de les coordenades x i y, és a dir una funció de superfÃcie. En particular, l'anà lisi de superfÃcie de tendència assumeix que la variació dels valors observats de la variable es poden descompondre en dos components, corresponents a dues escales de variació diferents (Grant, 1961; Krumbein and Graybill,1965):
- un component de tendència, de variació sistemà tica a escala regional, sobre una extensió espacial gran, que presenta una variació suau i pot ser predit mitjançant una funció.
- un component local o residu, que aparentment no presenta cap variació sistemà tica i que és el resultat de fluctuacions aleatòries o particulars a una escala local més l'efecte de l'error de mesurament de la variable en cada observació. Aquesta variació local, que pot tenir relació sistemà tica amb algun procés però de naturalesa no espacial, s'afegeix a la variació regional o tendència i n'altera puntualment els trets (és a dir, modifica localment la forma de la superfÃcie) però no canvia substancialment la tendència general.
En termes matemà tics, el comportament de la variable observada com una funció de les coordenades més un cert residu de fluctuació local s'expressa com:
Zobsi =  f ( xi , yi ) + ui
onÂ
Zobsi és el valor observat de la variable Z a la localització i
xi i yi són les coordenades de la localització i
f        és la funció de superfÃcie de tendència, i per tant f ( xi , yi ) és el component de variació regional predictible a la localització i
ui      és el residu o component de variació local aleatori o particular a la localització i
Â
Funcions de superfÃcie utilitzades
Hi ha moltes funcions possibles que poden ser utilitzades per a ajustar la superfÃcie de tendència a les dades observades. Les més emprades solen ser funcions senzilles de tipus polinòmic. La funció polinòmica més simple és la funció lineal o polinomi de primer grau, o de primer ordre, que resulta d'una regressió lineal per ajust de mÃnims quadrats. També s'utilitzen, però, polinomis de grau superior o models de Fourier.
Funció polinòmica de primer grau o funció lineal
L'ús d'un polinomi de primer grau com a funció de superfÃcie de tendència és el cas més simple d'anà lisi de superfÃcie de tendència. És l'extensió, en tres dimensions, de l'anà lisi de regressió lineal simple, que en aquest cas consisteix a ajustar un pla als punts de dades definits pels valors de x, y (variables independents) i Zobs (variable dependent), en lloc d'ajustar una recta als punts bidimensionals definits per només dues variables x (variables independent) i y (variable dependent) en el cas de la regressió simple. Dit d'altra manera, es tracta d'una regressió lineal múltiple amb dues variables independents, que són les coordenades de posició.
El polinomi de primer grau que defineix el pla de la superfÃcie de tendència lineal és el següent:
Zti = α + α1 xi  + α2 yi
on Â
Zti és el valor estimat de la variable Z a la localització i per mitjà de la funció lineal de superfÃcie de tendència
xi i yi són les coordenades de la localització i
α , α1 i α2 són els tres coeficients a determinar que defineixen la funció lineal d'un pla per a un determinat conjunt de dades i que representen, respectivament:
    α    és el valor de la superfÃcie de tendència en el punt origen de coordenades
    α1   és la taxa de variació de la superfÃcie de tendència al llarg de l'eix x
    α2   és la taxa de variació de la superfÃcie de tendència al llarg de l'eix y
La funció lineal permet calcular el component de variació sistemà tic o tendència, al qual d'acord amb la definició general de l'anà lisi de superfÃcie de tendència cal afegir el component de fluctuació local o residu. AixÃ, s'obté:
Zobsi = α + α1 xi  + α2 yi + ui
El pla que millor s'ajusta als valors observats de la variable Z és aquell que minimitza la distà ncia dels punts de les observacions al pla estimat, és a dir el que minimitza els residus per al conjunt dels punts. En particular, el millor ajust és el que minimitza la suma dels quadrats dels residus, ja que l'ajust per mÃnims quadrats és el millor estimador no esbiaixat i posseeis propietats estadÃstiques que permeten avaluar-ne la significació.
AixÃ, el criteri d'ajust per mÃnims quadrats és fer mÃnima l'expressió:
Â
i les equacions que permeten determinar els valors dels coeficients a , a1 i a2 d'acord amb l'ajust de mÃnims quadrats són les següents (Unwin, 1978):
Â
on  N  és el nombre d'observacions
És a dir, tres equacions per a determinar tres incògnites (els coeficients), que es poden resoldre a partir de les dades de les observacions. Normalment, però, s'utilitzen programes informà tics especÃfics, que permeten optar entre diferents tipus de funcions de superfÃcie de tendència a més de la funció lineal, o en el cas senzill de la funció lineal un programa estadÃstic general que permeti realitzar anà lisis de regressió múltiples.
Quan l'anà lisi de superfÃcie de tendència s'utilitza com a mètode d'interpolació espacial, el resultat obtingut per ajust per mÃnims quadrats és una superfÃcie que minimitza la desviació dels valors interpolats respecte dels valors originals, però no és un mètode d'interpolació exacta, ja que no reprodueix els valors observats originals. És a dir, la superfÃcie generada no passa pels punts originals, sinó que cada punt se’n desvia un cert residu, fruit del component local de variació aleatòria i d'error de mesurament.
Funcions polinòmiques de grau superior
La funció lineal sovint és massa simple per a poder ajustar-se adequadament a la forma de la superfÃcie corresponent a molts fenòmens geogrà fics. Per exemple, un pla inclinat és massa simple per poder descriure adequadament les formes de la superfÃcie del relleu o la variació de les temperatures. En una superfÃcie de tendència definida per un pla inclinat, les isolÃnies corresponents als diferents valors serien simplement lÃnies rectes, forma que no sol donar-se en gairebé cap fenomen real, encara que en casos senzills pugui ser una aproximació raonablement bona. AixÃ, s'utilitzen funcions polinòmiques de grau superior que proporcionen formes de la superfÃcie de tendència més complexes. Entre aquestes, les més habituals són les funcions polinòmiques de segon i de tercer grau, conegudes respectivament com a funció quadrà tica i funció cúbica.
L'equació de la funció polinòmica de segon grau, o funció quadrà tica de superfÃcie, és la següent:
Zti = b + b1 xi + b2 yi + b3 xi2 + b4 xi yi + b5 yi2
amb sis coeficients a determinar, que requereixen sis equacions, aplicant igualment el criteri d'ajust per mÃnims quadrats per tal de minimitzar la suma dels quadrats dels residus.
Semblantment l'equació de la funció polinòmica de tercer grau, o funció cúbica de superfÃcie, es defineix per mitjà de l'expressió següent:
Zti = c + c1 xi + c2 yi + c3 xi2 + c4 xi yi + c5 yi2 + c6 xi3 + c7 xi2 yi + c8 xi yi2 + c9 yi3
que dóna lloc a deu coeficients a determinar, i per tant requereix deu equacions per poder resoldre'ls.
En general, a part de la major dificultat de cà lcul, la utilització de funcions polinòmiques de graus progressivament superiors planteja dificultats d'interpretació, ja que difÃcilment es pot formular a partir de la teoria una hipòtesi sobre la forma de la variació espacial d'un fenomen real que justifiqui funcions de superfÃcie tan complexes, ni inversament, en cas d'aconseguir un bon ajust per a una funció de superfÃcie de grau molt elevat és fà cil donar-li una interpretació adequada d'acord amb la teoria (Unwin, 1978). Per aquest motiu, rarament s'utilitzen funcions polinòmiques de grau superior més enllà de la funció quadrà tica o cúbica, que sempre donen un millor ajust que la funció lineal, encara que en molts casos es dóna preferència a la funció lineal, més simple.
Model de Fourier bidimensional
Les funcions polinòmiques són adequades per a modelitzar superfÃcies de tendència de fenòmens que presenten una variació suau, sense canvis abruptes ni freqüents en la direcció ni el pendent de la superfÃcie. En casos en què la variació espacial de la variable analitzada presenta una variació oscil·latòria, s'han utilitzat models bidimensionals de Fourier (Krumbein, 1966), que s'expressen segons la fórmula:
Â
en la qual, la funció f pren la forma d'una funció oscil·latòria complexa:
f(bij Pi Qi) = ccij cosPi cosQi + csij cos Pi sin Qi + scij sinPi cosQi + ssij sinPi sinQi
on Pi i Qi són les coordenades de posició derivades de les expressions següents:
Pi = 2Ï€xi / m
Qi = 2Ï€yi / n
essent m i n constants que expressen l'extensió superficial en cada una de les dues dimensions x i y. Aquestes constants en el cas d'observacions distribuïdes segons una malla regular són respectivament el nombre de files i de columnes. En cas d'observacions distribuïdes irregularment cal especificar el valor apropiat d'aquestes constants a priori, abans d'estimar els coeficients de la funció.
En el model bidimensional de Fourier els coeficients de la funció de superfÃcie de tendència són cinc (b00, ccij, csij, scij, ssij) i es calculen igualment per ajust de mÃnims quadrats.
La comparació dels resultats obtinguts amb els models polinòmics i amb el model de Fourier (Krumbein, 1966) mostren que el model de Fourier produeix superfÃcies que concorden millor amb la forma de la distribució espacial dels fenòmens reals, però no és apropiat per a casos simples. El model de Fourier s'ha aplicat més a variables geofÃsiques i que presenten periodicitats significatives, que no pas a dades geogrà fiques de tipus socioeconòmic. En general, però, no ha estat gaire aplicat en geografia i en el seu lloc s'han fet servir altres mètodes d'anà lisi més potents que l'anà lisi de superfÃcies de tendència.
Requeriments del model de superfÃcie de tendència
Requeriments en relació al tipus de dades
L'anà lisi de superfÃcie de tendència només és aplicable a dades corresponents a una variable expressiva d'un fenomen que presenta variació contÃnua a través de l'espai. Dit d'altra manera, només és aplicable a variables que poden prendre valor en qualsevol posició de l'espai i que per tant es poden considerar funció de la posició, com correspon al concepte de superfÃcie.
En aquest sentit, l'ajust d'una superfÃcie de tendència és del tot inapropiat per a dades quantitatives referides a punts aïllats, com per exemple el nombre d'habitants dels assentaments de població o el nombre total de viatges generats o atrets des de les estacions d'una xarxa de transports, atès que es tracta de dades discontÃnues, que no es poden descriure per mitjà d'una funció contÃnua (Robinson, 1970). Per a aquest tipus de dades és més apropiat utilitzar mètodes d'anà lisi de distribucions de punts o altres mètodes d'estadÃstica espacial.
De la mateixa manera, l'anà lisi de superfÃcie de tendència tampoc és apropiat per a dades quantitatives referides, o atribuïdes convencionalment, a à rees, com per exemple la densitat de població o el nombre total d'habitants d'una unitat territorial de tipus administratiu o censal. En aquests casos, les dades a més de ser també discontÃnues són valors agegats assignats convencionalment al conjunt de cada à rea, sense que res justifiqui pensar que es distribueixen de forma contÃnua dins de cada à rea i a través del conjunt d'à rees, com si es tractés d'una superfÃcie. D'altra banda, les unitats territorials generalment són convencionals i donen lloc al problema de la unitat espacial modificable, pel qual diferents à rees d'agregació donen resultats d'anà lisi diferents.
Un darrer requeriment fonamental pel que fa a les dades és que aquestes han de constituir necessà riament una mostra per tal que tingui sentit aplicar un mètode d'estadÃstica inferencial com és l'anà lisi de regressió. Aquest supòsit es compleix sempre en el cas d'una superfÃcie contÃnua, ja que les observacions sempre són necessà riament algunes de les infinites mesures que es podrien realitzar. En canvi, en el cas de dades discontÃnues referides a punts o a à rees, generalment les dades no constitueixen una mostra sino el recull de tots els possibles casos, és a dir el conjunt de la població. Aquest sol fet invalida que l'anà lisi de superfÃcie de tendència es pugui aplicar a aquests altres tipus de dades espacials.
Requeriments en relació a la significació estadÃstica
L'anà lisi de superfÃcie de tendència, en tant que anà lisi de regressió, presenta un conjunt de requeriments o supòsits que s'han de complir necessà riament per tal que es pugui avaluar la significació estadÃstica dels resultats. Altrament, en cas de no complir-se, l'anà lisi de superfÃcie de tendència només té valor descriptiu.
Els requeriments a complir es refereixen especÃficament als residus, no a les dades de les observacions com sovint erròniament es pensa. Els requisits o condicions que han de complir els residus AixÃ, en l'anà lisi de regressió, i per tant en l'anà lisi de superfÃcie de tendència, els residus han de:
- tenir una mitjana esperada igual a zero.
- ser incorrelacionats.
- tenir una varià ncia constant (condició d'homoscedasticitat)
- seguir una distribució de probabilitat normal
A més, els valors de la variable analitzada i els de les coordenades de posició (x, y) han d'haver estat mesurats amb un grau d'error negligible per tal de no contenir cap biaix o component aleatori, i han de ser en nombre igual o superior al nombre de coeficients a determinar de la funció emprada.
Tests de significació estadÃstica
L'estadÃstic més emprat per a avaluar la bondat d'ajust de la funció de superfÃcie de tendència obtinguda per a un determinat conjunt de dades és el percentatge de reducció de la suma de quadrats (percentage reduction in sum of squares,%RSS) (Unwin, 1970), que es calcula segons l'expressió següent:
Â
El percentatge de reducció de la suma de quadrats és simplement el quocient entre la suma de quadrats corregida dels valors estimats segons la funció de superfÃcie de tendència i la suma de quadrats corregida dels valors observats, expressat en forma de percentatge. El percentatge de reducció de la suma de quadrats es pot interpretar directament com una mesura de la bondat d'ajust de la funció de superfÃcie de tendència calculada a les dades empÃriques, en una escala de 0 a 100, que de fet és anà loga al coeficient de determinació (R2) d'una anà lisi de correlació expressat en forma de percentatge. Altrament, a partir del percentatge de reducció de la suma de quadrats es pot calcular el coeficient de correlació mitjançant l'expressió següent i utilitzar aquest com a mesura de la bondat d'ajust:
Â
Cal notar, en qualsevol cas, que el percentatge de reducció de la suma de quadrats, igual que el coeficient de determinació, proporciona una mesura més acurada de la bondat d'ajust que el coeficient de correlació. AixÃ, un coeficient de correlació de 0,7, aparentment alt, correspon a només un 49% del %RSS o 0,49 de R2; és a dir menys del 50% de variació explicada pel component de tendència. En general, com en qualsevol correlació, és a partir de valors del %RSS superiors al 70% (coeficient de correlació superior a 0,8) que es pot parlar d'un alt grau d'ajust.
Significació de la superfÃcie ajustada
La mesura de la bondat d'ajust per mitjà del estadÃstic del percentatge de reducció de la suma de quadrats (%RSS) indica la millor o pitjor correspondència entre la funció de superfÃcie obtinguda per ajust de mÃnims quadrats i les dades observades o, en altres paraules, la força de la relació (o el grau de dependència) entre la variable observada i les coordenades de posició. Tanmateix, per si sol aquest estadÃstic no dóna idea del grau de significació estadÃstica. És a dir, no permet decidir si el valor obtingut de %RSS és significativament diferent de zero.
Per tal d'avaluar la significació estadÃstica del %RSS es pot aplicar un test de significació per acceptar o rebutjar la hipòtesi nul·la (valor de %RSS per al conjunt de la població igual a zero), de tipus anà lisi de varià ncia, calculant el ratio entre la variació corresponent a la funció de superfÃcie de tendència i la variació residual:
Â
onÂ
%RSS  és la variació deguda a la superfÃcie de tendència i el seu complementari, (100 - %RSS), és la variació residual
df1       són els graus de llibertat de la variació corresponent a la superfÃcie de tendència, igual al nombre de constants de la funció de superfÃcie menys 1
df2       són els graus de llibertat de la variació residual, igual al nombre d'observacions (N) menys 1 menys df1
Un cop obtingut el valor de F, la significació es pot avaluar cercant en taules estadÃstiques el valor crÃtic de F que permet rebutjar la hipòtesi nul·la, donat el nombre de graus de llibertat del cas analitzat, o bé calcular mitjançant un programa estadÃstic la probabilitat de complir-se la hipòtesi nul·la donat el valor obtingut de F i els graus de llibertat del cas analitzat, de manera que es pugui rebutjar en cas que el valor de probabilitat resulti inferior al nivell de significació escollit.
Significació de la millora aportada per una funció de grau superior
Com és sabut una funció polinòmica de grau n + 1 sempre donarà un millor ajust que una funció polinòmica de grau n. Per exemple, una funció quadrà tica, de grau 2, donarà millor ajust que una funció lineal, de grau 1. Tanmateix la diferència de bondat d'ajust pot ser petita i pot convenir poder decidir si la millora addicional de la bondat d'ajust aportada per una funció de grau superior és estadÃsticament significativa o bé negligible.
Per a determinar la significació de la millora addicional d'ajust aportada per una funció de grau superior s'efectua també un test d'anà lisi de varià ncia, calculant el rà tio de varià ncies F segons la següent expressió (Chayes, 1970):
Â
onÂ
%RSSn+1  és la variació deguda a la superfÃcie de tendència de grau n + 1
%RSSn     és la variació deguda a la superfÃcie de tendència de grau n
(100 - %RSS)  és la variació residual resultant de la superfÃcie de tendència de grau n + 1
df3       són els graus de llibertat de la variació addicional explicada, igual al nombre de constants afegides per la funció de superfÃcie de grau n + 1 (3 per a una funció quadrà tica respecte a una lineal, 4 per a una cúbica respecte a una quadrà tica, etc.)
df4       són els graus de llibertat de la variació residual corresponent a la superfÃcie de tendència de grau n + 1, que com abans és igual al nombre d'observacions (N) menys 1 menys el nombre total de constants de la funció de grau n + 1
La significació, com abans, s'obté a partir del valor crÃtic de F en taules calculades o calculant la probabilitat associada al valor obtingut de F. Si la significació obtinguda no permet rebutjar la hipòtesi nul·la (millora addicional de %RSS igual a zero), cal concloure que el fet d'utilitzar una funció polinòmica de grau superior no comporta una millora significativa de la bondat d'ajust de la superfÃcie de tendència respecte a l'obtinguda amb una funció de grau inferior, i per tant la funció de grau inferior és suficient.
Altres tests de significació estadÃstica
A més del test general de significació de la bondat d'ajust i del de la millora addicional aportada per funcions polinòmiques de grau superior, també es pot provar quina és la significació de cada un dels coeficients de la funció polinòmica per separat, per tal de determinar si eliminant de l'equació de la funció el terme corresponent al coeficient és produeix una pèrdua significativa en el grau d'ajust de la funció. Aquest tipus de prova de significació és equivalent a l'anà lisi de superfÃcie de tendència pas a pas (Miesch and Connor, 1968), que implementen alguns programes. En l'anà lisi pas a pas, els termes de l'equació de la funció de superfÃcie de tendència es van afegint successivament d'un en un i cada cop que se n'afegeix un es calcula un ratio F de varià ncia per avaluar-ne la significació, de manera que només es retenen els termes que afegeixen un guany significatiu a la bondat d'ajust de la funció.
D'altra banda, també es pot avaluar la significació de l'ajust de la funció de superfÃcie de tendència en diferents zones de l'à rea analitzada per mitjà del cà lcul d'intervals de confiança, de forma anà loga a com es fa amb qualsevol estadÃstic, per tal de determinar si les desviacions de les observacions respecte del valor de l'estadÃstic són o no significatives segons caiguin o no dins de l'interval de confiança a l'entorn de l'estadÃstic. En aquest cas, calculant superfÃcies de confiança per sobre i per sota de la superfÃcie de tendència és possible veure en quines zones de l'à rea coberta per les observacions les desviacions són prou grans per ser significatives (Krumbein, 1963, Krumbein and Graybill, 1965).
Limitacions
L'anà lisi de superfÃcie de tendència presenta limitacions i dificultats especialment en tres aspectes: l'adequació de les dades, l'elecció de la funció de superfÃcie adequada, i la validesa dels tests de significació.
Pel que fa a l'adequació de les dades, a més de la naturalesa contÃnua que necessà riament han de tenir, hi ha limitacions derivades de l'efecte de vora (pendents extrapolats fora de l'à rea coberta per les observacions) per la manca de suficients punts d'observació. També la forma de l'à rea d'estudi influeix en el sentit de produir superfÃcies que varien de forma alineada amb l'eix més llarg de l'à rea d'estudi. Finalment la distribució dels punts de les observacions dins l'à rea d'estudi també produeix efectes indesitjats quan els punts de mostreig presenten alineacions o agrupaments (Unwin, 1975).
L'elecció de la funció de superfÃcie de tendència apropiada per al fenomen analitzat és una de les dificultats principals de l'anà lisi de superfÃcie de tendència. D'acord amb una visió deductiva, l'anà lisi hauria de ser el procediment per a posar a prova una determinada hipòtesi i la funció de superfÃcie hauria de ser l'expressió matemà tica d'aquesta hipòtesi d'acord amb el coneixement a priori del fenomen analitzat (Norcliffe, 1969). A la prà ctica, però, l'anà lisi de superfÃcie de tendència se sol utilitzar amb una finalitat més descriptiva que permeti generar teoria a posteriori (Robinson, 1970).
En relació a la validesa dels tests de significació, a més de les dificultats generals de qualsevol anà lisi de regressió de que els residus compleixin tots els requeriments estadÃstics, l'anà lisi de superfÃcie de tendència afegeix alguns problemes especÃfics. El més important és la presència gairebé sempre important d'autocorrelació espacial entre els residus, la qual a més de violar el requeriment d'independència sol esbiaixar les estimacions de la variació residual a l'alça (autocorrelació espacial negativa) o a la baixa (autocorrelació positiva) i influir en els valors dels ratios F de varià ncia.
Extensions
L'anà lisi de superfÃcie de tendència és prou flexible per permetre un cert nombre d'ampliacions en diferents sentits.
SuperfÃcies de tendència amb quatre variables
L'anà lisi de superfÃcie de tendència bà sic utilitza tres variables, una corresponent a la variable que expressa el fenomen que varia a través de l'espai i dues per a expressar posicions en el pla. Una extensió immediata és utilitzar posicions definides per tres variables i per tant realitzar l'anà lisi de superfÃcie de tendència amb quatre variables. Aquesta ampliació de l'anà lisi original és útil tant per a calcular funcions d'hipersuperfÃcies a partir de posicions en l'espai de tres dimensions, en el qual les tres variables de posició són coordenades espacials (Peikert, 1962), o bé per a calcular funcions de variació en l'espai al llarg del temps, prenent dues de les tres variables de posició com les dues coordenades espacials en el pla i la tercera com a variable que expressi la posició en el temps.
SuperfÃcies de tendència per a altres tipus de dades
L'anà lisi de superfÃcie de tendència bà sic utilitza valors escalars associats a la posició. En determinats casos, però, el fenomen analitzat és descrit per vectors, amb magnitud i direcció, associats a les posicions. En aquests casos, s'han ideat mètodes per a ajustar superfÃcies a les dades empÃriques de tipus vectorial, tenint en compte, que la direcció és una magnitud periòdica. Aquests mètodes reben el nom d'anà lisi de tendències vectorial (Fox, 1967).
L'anà lisi de superfÃcie de tendència es pot aplicar també a dades de tipus multivariant, quan en lloc de predir un valor es tracta de predir simultà niament un conjunt de valors per a un conjunt de variables dependents de la posició. En aquests casos s'utilitzen funcions de correlació canònica i el mètode s'anomena anà lisi de tendències canònica (Lee, 1969).
Igualment, per al cas de dades de tipus categòric, especialment freqüent en fenòmens de caire socioeconòmic, existeix la possibilitat d'utilitzar models logit com a funció de superfÃcie (Wrigley, 1975).
Per últim, per a dades distribuïdes irregularment a l'espai s'ha proposat també l'ús de funcions polinòmiques ortogonals (Whitten, 1970).
Alternatives
L'anà lisi de superfÃcie de tendència no és l'únic mètode d'anà lisi de la variació espacial contÃnua com a funció de la localització, per a contrastar hipòtesis, descriure formes o interpolar superfÃcies. Possiblement és un dels mètodes més simples, ja que la descomposició de la variació en dos components (tendència i residu) és una formalització molt bà sica. Per tant hi ha un cert nombre alternatives a l'anà lisi de superfÃcie de tendència, especialment en el camp de la geoestadÃstica, sovint amb major sofisticació i capacitat d'anà lisi. Entre aquests, destaca el krigatge com a mètode per a descriure la variació espacial amb major complexitat i com a tècnica d'interpolació especialment acurada (Matheron, 1967).
Per a altres finalitats, com és ara la generalització (eliminació d'excés de detall local) d'una superfÃcie les tècniques de suavització i filtratge (Tobler, 1966), tÃpiques de l'anà lisi de dades rà ster en els SIG o del processament digital d'imatges, poden ser també més apropiats.
Finalment l'anà lisi espectral s'apunta també com una alternativa apropiada quan es tracta d'analitzar superfÃcies que són resultat de processos que operen a diferents escales (Rayner, 1971).
Temes relacionats
- Anà lisi espacial
- Autocorrelació espacial
- EstadÃstica espacial
- GeoestadÃstica
- Interpolació espacial
- Krigatge
- Problema de la unitat espacial modificable
- SuperfÃcie
Referències
Chayes, F. (1970) "On deciding whether trend surfaces of progressively higher order are meaningful", Geological Society of America, Bulletin, 81, 1273-1278.
Chorley, R.J. and Haggett, P. (1965) "Trend-surface mapping in geographical research", Transactions, Institute British Geographers, 37, 47-67.
Fox, W.T. (1967) "FORTRAN IV program for vector trend analysis of directional data". Computer Contribution, 11. State Geol. Survey, Univ. of Kansas.
Grant, F. (1961) "A problem in the analysis of geophysical data", Geophysics, 22, 309-344.
Krumbein, W.C. (1959) "Trend-surface analysis of contour-type maps with irregular control point spacing", Journal of Geophysical Research, 64, 823-834.
Krumbein, W.C.(1963) "Confidence intervals on low-order polynomial trend surfaces", Journal of Geophysical Research, 68, 5869-5878.
Krumbein W.C. (1966) "A comparison of polynomial and Fourier models in map analysis". Northwestern University, Department of Geography, Technical Report, 2 of O.N.R. Task 388-078.
Krumbein, W.C. and Graybill, F.A. (1965) An introduction to Statistical Models in Geology, New York: McGraw Hill.
Lee, P.J. (1969) "The theory and application of canonical trend surfaces", Journal of Geology, 77, 303-318.
Matheron, G. (1967) "Kriging or polynomial interpolation procedures"; Canadian Institute of Mining Bulletin, 60, 1041-1045.
Miesch, A.T. and Connor J.J. (1968) "Stepwise regression and non-polynomial models in trend analysis", Computer Contribution, (State Geol. Survey, Univ. of Kansas), 27.
Norcliffe, G.B. (1969) "On the uses and limitations of trend-surface models", Canadian Geographer, 13, 338-348.
Peikert, E.W. (1962) "Three dimensional specific gravity variations in the Glen Alpine Stock, Sierra Nevada, California", Geological Society of America, Bulletin, 73, 1437-1442.
Rayner, J.N. (1971) An introduction to Spectral Analysis. London: Pion.
Robinson, G. (1970) "Some comments on trend surface analysis", Area , 3, 31-36.
Tobler, W.R. (1964) "A polynomial representation of the Michigan population", Proceedings of the Michigan Academy of Science, Arts and Letters, 49, 445-452.
Tobler, W.R. (1966) "Of maps and matrices", Journal of Regional Science, 7, 234-252.
Unwin, D.J. (1970) "Percentage RSS in trend surface analysis", Area, 1, 25-28.
Unwin, D.J. (1975) "Numerical error in a familiar technique: a case study of polynomial trend surface analysis", Geographical Analysis, 7, 2, 197-203.
Unwin, D.J. (1978) An Introduction to Trend Surface Analysis. CATMOG (Concepts and Techniques in Modern Geography), 5, Norwich: GeoBooks.
Whitten, E.H.T. (1970) "Orthogonal polynomial trend surfaces for irregularly spaced data", Mathematical Geology, 62, 141-152.
Wrigley, N. (1975) "Analysing multiple alternative dependent variables", Geographical Analysis, 7, 2, 187-196.
Â
Lectures recomanades
Unwin, D.J. (1978) An Introduction to Trend Surface Analysis. CATMOG (Concepts and Techniques in Modern Geography), 5, Norwich: GeoBooks.