Acceder
  1. Introducción

 

Los datos de panel combinan cortes transversales (información de varios individuos en un momento dado) durante varios períodos de tiempo. El disponer de datos de panel constituye una ventaja y un inconveniente:

  • Ventaja porque disponemos de más datos y se puede hacer un seguimiento de cada individuo. ·Inconveniente porque si todas las cualidades relevantes del individuo NO son observables entonces los errores individuales estarán correlacionados con las observaciones y los MCO serán inconsistentes.

Supongamos que el modelo que pretendemos estimar es el siguiente:

        Yit = xit b + eit

    

Si no se disponen de todas las variables de influencia entonces Cov(Xit ,εit) 0, es decir los residuos no son independientes de las observaciones por lo que MCO estará sesgado. Para solucionarlo se proponen modelos alternativos a la regresión agrupada (pooled) mediante el anidamiento de los datos: el de efectos fijos y el de efectos aleatorios.

 

  1. Regresión agrupada (pooled)

 

Este modelo es el elemental. Estima el siguiente modelo:

 

        Yit = a + bXit + uit                                             (1)

 

Como se ha mencionado, es posible que Cov(Xit ; uit ) ≠ 0, entonces la regresión agrupada estará sesgada. Muchas veces dicha correlación es debida a un error de especificación por la ausencia de alguna variable relevante o la existencia de cualidades inobservables de cada individuo. Este problema puede solucionarse con una regresión de datos anidados.

 

  1. Efectos fijos

Los modelos de regresión de datos anidados, realizan distintas hipótesis sobre el comportamiento de los residuos, el más elemental y el más consistente es el de Efectos Fijos. Este modelo es el que implica menos suposiciones sobre el comportamiento de los residuos. Supone que el modelo a estimar es ahora:

 

       Yit = ai + bXit + uit                                            (2)

 

Donde αi = α + vi, luego reemplazando en (2) queda:

 

        Yit = a + bXit + vi + uit                                         (3)

 

Es decir supone que el error (εit) puede descomponerse en dos una parte fija, constante para cada individuo (vi) y otra aleatoria que cumple los requisitos MCO (uit) (εit = vi + uit), lo que es equivalente a obtener una tendencia general por regresión dando a cada individuo un punto de origen (ordenadas) distinto. Esta operación puede realizarse de varias formas, una de ellas es introduciendo una dummy por cada individuo (eliminando una de ellas por motivos estadísticos) y estimando por MCO. Otra es calculando las diferencias. Así, si (3) es cierto, también es cierto que:

        Yit = a + Xit b + vi + ui                                              (4)

 

Y también la diferencia (3) – (4):

 

( yit  - yit ) = ( Xit  - Xit ) b + ( uit - ui )                               (5)

 

(5) puede resolverse fácilmente por MCO. Los programas informáticos (i.e. stata) la estiman generalmente con este segundo método, descomponiendo, además la varianza en dos: intro y entre grupos.

 

Efectos aleatorios

 

El modelo de efectos aleatorios tiene la misma especificación que el de efectos fijos con la salvedad de que vi, en lugar de ser un valor fijo para cada individuo y constante a lo largo del tiempo para cada individuo, es una variable aleatoria con un valor medio vi y una varianza Var(vi) ≠ 0. Es decir la especificación del modelo es igual a (3)

 

        Yit = a + bXit + vi + uit                                          (6)

 

Salvo que ahora vi es una variable aleatoria. Este modelo es más eficiente (la varianza de la estimación es menor) pero menos consistente que el de efectos fijos, es decir es más exacto en el cálculo del valor del parámetro pero este puede estar más sesgado que el de efectos fijos.

 

¿Qué significa que Vi es una variable aleatoria? Significa que no estamos seguros del valor exacto en el origen que pueda tener cada individuo sino que pensamos que este, probablemente gravitará en torno a un valor central. Eso suele ocurrir cuando tomamos una muestra de un gran universo de individuos. Por ejemplo sabemos que los niños aprueban más si estudian más y sabemos que hay niños más inteligentes que otros entonces supondremos que cada niño parte de un punto de origen distinto (probablemente superior para los individuos más inteligentes) y, a partir de ahí, existe una relación entre trabajo y calificaciones.

Sin embargo no podemos evaluar a todos los niños del mundo sino sólo una muestra. En este caso es evidente que, es posible que, si en lugar de escoger esa muestra hubiésemos elegido otra los resultados del origen y de la pendiente fuesen distintos, es decir no estamos seguros del origen del que parten lo niños en función de su coeficiente intelectual, pues ¡ala! ya tenemos una vi aleatoria.

¿Te ha gustado mi artículo?
Si quieres saber más y estar al día de mis reflexiones, suscríbete a mi blog y sé el primero en recibir las nuevas publicaciones en tu correo electrónico
Lecturas relacionadas
¿Qué hace y cómo se hace un Corredor de Bolsa en México?
¿Qué hace y cómo se hace un Corredor de Bolsa en México?
¿Algún buen libro para aprender análisis de series temporales?
¿Algún buen libro para aprender análisis de series temporales?
Curso de Métodos Matemáticos para Finanzas Cuantitativas - opciones
Curso de Métodos Matemáticos para Finanzas Cuantitativas - opciones
Accede a Rankia
¡Sé el primero en comentar!