Predicciones de morosidad | Nota metodológica

1. Predicción de tasa de morosidad agregada

La morosidad agregada se refiere principalmente a los créditos morosos de los hogares y del total de los sectores productivos. Se entienden por créditos morosos aquellos instrumentos de deuda que tienen importes vencidos por cualquier concepto (principal, intereses...) bien con una antigüedad superior a 3 meses, bien por un importe superior al 25% de la deuda. Los datos sobre créditos morosos y total de créditos son publicados por el Banco de España alrededor del día 18 de cada mes y ambas series comienzan en 1962.

La tasa de morosidad agregada es el ratio de los créditos morosos entre el total de los créditos concedidos por las entidades de crédito:

El enfoque utilizado consiste en realizar predicciones del numerador y denominador por separado, y luego calcular su ratio para obtener la predicción de la tasa de morosidad. Las ventajas de este enfoque son varias. Una de ellas es que hay mayor flexibilidad a la hora de escoger las formas funcionales de las relaciones entre la variable a predecir y sus predictores . Otra ventaja de la modelización de numerador y denominador por separado es que, debido a las diferentes propiedades estadísticas de créditos morosos y total créditos, así como la diferente relación con sus predictores, la metodología econométrica usada para la modelización de una de estas variables puede diferir de la implementada para la otra.

Como análisis de robustez, se ha probado a predecir directamente la tasa de morosidad, pero los resultados han sido menos satisfactorios.

1.a Predicción del numerador

Para las predicciones del numerador se usa el modelo de corrección del error de Engle y Granger (1987). Básicamente, el enfoque de Engle y Granger consiste en dos pasos :

  1. Modelar una relación de equilibrio a largo plazo -llamada cointegración- entre la variable dependiente -la variable a predecir- y un conjunto de variables explicativas. Esto se hace mediante una regresión de las variables explicativas sobre la variable dependiente. Los residuos de dicha regresión son la estimación de la relación de cointegración.
  2. Usar dicha relación de equilibrio, retardos de la variable dependiente y otras variables que capturan su comportamiento a corto plazo para predecir los valores futuros de la variable dependiente.

La idea que subyace a este enfoque es que si existe una relación de equilibrio a largo plazo entre dos o más variables, toda desviación de dicho equilibrio es necesariamente temporal, es decir, las variables tenderán a volver a su relación de equilibrio. Ello mejorará la predicción de la(s) variables(s) respecto a un modelo que sólo tenga en cuenta el comportamiento a corto plazo de éstas.

La aplicación del paso 1 al numerador se encuentra en una relación de cointegración entre créditos morosos, deudores a la vista (ambas transformadas mediante logaritmo neperiano), paro registrado y euribor a 1 año . Los deudores a la vista son aquellos préstamos que han resultado impagados pero que no entran dentro de la categoría de morosos, en la mayoría de los casos porque aún no han pasado 3 meses desde su vencimiento. Dicha relación se estima mediante una regresión de las variables explicativas -a las que se añade una tendencia lineal sobre créditos morosos por Ordinary Least Squares (OLS), dado que OLS es superconsistente cuando existe cointegración, y se disponen de más de numerosas observaciones de las variables antes mencionadas.

Tras esto se realiza el paso 2, que es obtener las predicciones de créditos morosos mediante una regresión de varios predictores sobre la primera diferencia de su logaritmo . Dichos predictores son retardos (de la primera diferencia) de:

  • la propia variable dependiente
  • el principal medio de los nuevos préstamos hipotecarios
  • la inflación anual
  • el índice de confianza de los consumidores
  • los deudores a la vista (en logs.)
  • el importe de los efectos de comercio impagados (en logs.)
  • el valor de los inmuebles propiedad de las entidades de crédito (en logs.)
  • una variable dummy que refleja el cambio en la contabilidad de los créditos morosos a partir de Junio del 2005

A éstas variables explicativas se añade un retardo de los residuos de la regresión de cointegración. Todas aquellas variables que presentaban un comportamiento estacional han sido desestacionalizadas mediante el método X12.

1.b Predicción del denominador

Para la predicción del denominador -el total de créditos- se utiliza una metodología distinta, la de Box-Jenkins (1976). Mediante ella se desarrollan los procesos ARIMA (Autorregressive Integrated Moving Average Process) y SARIMA (Seasonal ARIMA). En estos modelos el valor que toma la variable dependiente en un determinado periodo se supone una función de sus valores pasados, así como de un conjunto de perturbaciones no observables presentes y pasadas . Estos modelos, estimados mediante el filtro de Kalman y Maximum Likelihood, pueden ser ampliados mediante la inclusión de variables exógenas o predeterminadas.

La variable dependiente del modelo de regresión utilizado es la primera diferencia del logaritmo de total créditos, la cual se puede interpretar como la tasa de crecimiento del crédito total. Dado que dicha serie presenta un claro componente estacional dentro de su estructura autorregresiva, su modelización se realiza mediante un modelo SARIMA, en concreto un SARIMA aditivo .

A dicho modelo se le añaden una serie de variables predeterminadas. Dichas variables son retardos (de la primera diferencia) de:

  • el paro registrado (en logs.)
  • el euribor a 1 año (en logs.)
  • el indicador de sentimiento económico (en logs.)
  • el índice de producción industrial (en logs.)
  • el número de matriculaciones de vehículos (en logs.)
  • el importe de los efectos de comercio impagados (en logs.)
  • el valor de los inmuebles propiedad de las entidades de crédito (en logs.)
  • el índice general de la Bolsa de Madrid (en logs.)

Las variables que presentan estacionalidad -tales como el paro y el ipi- no han sido previamente desestacionalizadas, dado que el modelo que las usaba desestacionalizadas presentaba peor ajuste dentro y fuera de muestra (Bayesian Information Criterion y Root Mean Squared Error, respectivamente).

1.c Factores de corrección

La evolución de la morosidad responde tanto a factores económicos como a intervenciones de naturaleza política o regulatoria. Por ejemplo, los traspasos de los activos inmobiliarios de las entidades nacionalizadas a Sareb en diciembre de 2012 y en febrero de 2013 provocaron una caída tanto en la cantidad de créditos concedidos a familias y empresas, como en el saldo total de préstamos dudosos. Como consecuencia, la tasa de morosidad registró descensos notables en los meses de diciembre de 2012 (de un 11,38% en noviembre a un 10,43% en diciembre) y de febrero de 2013 (de un 10,78% en enero a un 10,40% en febrero). Asimismo, en enero de 2014 cambiaron los criterios para asignar riesgo "normal", no dudoso, a los créditos refinanciados tras la reforma de la Ley Concursal, lo que provocó también un ligero descenso en la tasa de morosidad.

Como todos los modelos de predicción, nuestro modelo pretende hacer predicciones condicionadas. Concretamente el modelo hace predicciones condicionadas a que no tengan lugar intervenciones de naturaleza política o regulatoria, que son difíciles de predecir y cuantificar. Esto quiere decir que el modelo trata de predecir la respuesta de la morosidad a cambios en variables como la tasa de paro. Pero ni tiene, ni debería tener la capacidad de predecir los efectos sobre la tasa de morosidad de eventos como los traspasos de activos a la Sareb o el cambio en los criterios de clasificación de riesgo del Banco de España.

Cuando estos eventos ocurren, inevitablemente, la capacidad predictiva del modelo se ve mermada. Por ejemplo, el día antes de que el Banco de España publicara los datos para el mes de diciembre de 2012, el modelo predecía un morosidad agregada del 11,70% para el mes de diciembre de 2012 y del 12,06% para el mes de enero de 2013. En realidad, dado que los datos publicados por el Banco de España excluían los activos traspasados de las entidades nacionalizadas a la Sareb, la morosidad agregada del mes de diciembre de 2012 fue tan solo del 10,43% y la del mes de enero de 2013 fue tan solo del 10,78%.

Que estas desviaciones se produzcan es obviamente inevitable. Lo que es importante sin embargo es que una vez que los efectos inmediatos de estas intervenciones son conocidos, el modelo los aproveche para ajustar las predicciones. Para ello, tan solo aplicamos unas transformaciones lineales a las series históricas de crédito y crédito moroso, que el modelo utiliza en su componente autorregresiva. Con estas transformaciones, una vez publicados los datos del Banco de España para el mes de diciembre de 2012, la predicción de la tasa de morosidad para el mes de enero de 2013, pasaba a ser 10,78%, exactamente el dato publicado un mes más tarde por el Banco de España.

Las transformaciones lineales de las series históricas de crédito y créditos morosos a las que se hace referencia se aplican cuando se observan los efectos de eventos de naturaleza política o regulatoria sobre los créditos totales y los créditos morosos.

  • Para los créditos totales se calcula un factor de corrección que es el ratio entre el dato publicado por el Banco de España y la última predicción del modelo. Después del traspaso de activos de las entidades de créditos nacionalizadas a la Sareb en diciembre de 2012, por ejemplo el ratio era de 0,955. A partir de este momento, la serie histórica de créditos totales que el modelo de predicción de créditos totales utiliza en su componente autoregresiva es sustituida por otra en la que cada dato está multiplicado por este ratio, excepto el dato del mes de diciembre.
  • Para los créditos morosos se calcula un factor de corrección que es el ratio entre el dato publicado por el Banco de España y la última predicción del modelo. Después del traspaso de activos de las entidades de créditos nacionalizadas a la Sareb en diciembre de 2012, por ejemplo el ratio era de 0,852. A partir de este momento, la serie histórica de créditos morosos que el modelo de predicción de créditos morosos utiliza en su componente autoregresiva es sustituida por otra en la que cada dato está multiplicado por este ratio, excepto el dato del mes de diciembre.

La idea que subyace a este mecanismo de corrección es la de realizar un “back-of-the-envelope calculation” de los cambios determinados por las intervenciones de naturaleza política o regulatoria en los conjuntos de activos y transformar las series históricas para que las predicciones futuras tengan en cuenta estos cambios.

2. Predicción de tasa de morosidad del total de sectores productivos

La tasa de morosidad del total de sectores productivos (tmt) es el ratio de los créditos morosos entre el total de los créditos concedidos por las entidades de crédito a los sectores productivos, es decir:

Dichos datos son publicados por el Banco de España alrededor del día 16 de los meses de Marzo, Junio, Septiembre y Diciembre. La frecuencia de tanto créditos morosos tsp como total créditos tsp es trimestral y el valor de cada trimestre corresponde en realidad a la media del último mes del trimestre. Existen datos de total créditos tsp desde el cuarto trimestre de 1992, mientras que los datos de créditos morosos tsp comienzan en el cuarto trimestre de 1998. Esta es otra razón por la que en este caso es útil predecir numerador y denominador por separado y luego calcular la tasa: la predicción directa de la tasa implicaría desechar información potencialmente útil, dado que sólo se puede calcular desde el cuarto trimestre de 1998.

2.a Predicción del numerador

El principal obstáculo en la predicción del numerador, créditos morosos tsp, es el escaso número de observaciones de las que se dispone para esta variable, así como su frecuencia trimestral. Esto contrasta con la estimación de su variable análoga en la tasa de morosidad agregada, créditos morosos, para la que se dispone de muchas más observaciones. Por otro lado, dado que créditos morosos tsp es un subconjunto de créditos morosos, ambas variables están altamente correlacionadas o, visto de otro modo, la segunda capta una gran parte de la varianza de la primera. Por último, los datos sobre créditos morosos son publicados antes que sus análogos sobre créditos morosos tsp; por ejemplo, el dato correspondiente al primer trimestre de 2009 de créditos morosos tsp fue publicado a mediados de Junio, mientras que su análogo sobre créditos morosos -el dato de Marzo lo fue un mes antes, a mediados de Mayo.

Todas estas razones hacen que créditos morosos sea un predictor muy potente de créditos morosos tsp y para predecir el dato del primer trimestre de créditos morosos tsp se puede utilizar el dato observado de créditos morosos de Marzo, el cual es publicado un mes antes que el primero. Sin embargo, limitarse a usar el dato publicado de créditos morosos de Marzo permitiría tan solo realizar una predicción del dato de créditos morosos tsp del primer trimestre. Para poder realizar predicciones para un trimestre sucesivo, la predicción de créditos morosos tsp aprovecha por lo tanto la predicción del dato de créditos morosos para el tercer mes del trimestre. Formalmente:

donde D es la primera diferencia de la variable, e(t) es una perturbación estocástica no observable, y “…” expresa que hay otros regresores en la ecuación.

Sin embargo, el uso de créditos morosos como predictor tiene un problema obvio. Es claramente una variable endógena, dado que contiene toda la información presente en la variable dependiente más otra información adicional, y por lo tanto está correlacionada con la perturbación e(t). Dicha endogeneidad lleva a coeficientes sesgados e inconsistentes. Para solucionar este problema, empleamos como variables instrumentales los propios retardos de créditos morosos. El método de estimación utilizado es Limited Information Maximum Likelihood, dado que diversos estudios de Montecarlo muestran que presenta mejores propiedades en muestras pequeñas que Two-Stage Least Squares, y que Generalized Method of Moments en el presente caso de perturbaciones homocedásticas.

2.b Predicción del denominador

La estrategia para realizar la predicción del denominador de la tasa de morosidad del total de sectores productivos, total créditos tsp, es análoga a la usada para el numerador. Es decir, se usan los valores observados y los predichos de total créditos como la principal variable explicativa, corrigiendo por endogeneidad:

donde los otros regresores (“...”) son retardos de la primera diferencia de:

  • la propia variable dependiente (en logs)
  • expectativas de precios de la vivienda (en logs)
  • valor de los inmuebles propiedad de las entidades de crédito (en logs)

2.c Factores de corrección

Al igual que en el caso de las predicciones de la morosidad agregada, en el caso de las predicciones de la tasa de morosidad de los sectores productivos aplicamos unas transformaciones lineales a las series históricas de crédito y crédito moroso de los sectores productivos, que el modelo utiliza en su componente autorregresiva.

Las transformaciones lineales de las series históricas de crédito y créditos morosos del total de sectores productivos se aplican cuando se observan los mismos efectos de eventos de naturaleza política o regulatoria sobre los créditos totales y los créditos morosos mencionados en el apartado 1.c.

  • Para los créditos totales de los sectores productivos se calcula un factor de corrección que es el ratio entre el dato publicado por el Banco de España y la última predicción del modelo. Después del traspaso de activos de las entidades de créditos nacionalizadas a la Sareb en diciembre de 2012, que correspondería al cuarto trimestre de 2012, por ejemplo el ratio era de 0,917. A partir de este momento, la serie histórica de créditos totales de los sectores productivos que el modelo de predicción utiliza en su componente autorregresiva es sustituida por otra en la que cada dato está multiplicado por este ratio, excepto el dato del mes del cuarto trimestre de 2012.
  • Para los créditos morosos de los sectores productivos se calcula un factor de corrección que es el ratio entre el dato publicado por el Banco de España y la última predicción del modelo. Después del traspaso de activos de las entidades de créditos nacionalizadas a la Sareb en diciembre de 2012 (cuarto trimestre de 2012), por ejemplo el ratio era de 0,825. A partir de este momento, la serie histórica de créditos morosos de los sectores productivos que el modelo de predicción utiliza en su componente autorregresiva es sustituida por otra en la que cada dato está multiplicado por este ratio, excepto el dato del cuarto trimestre de 2012.

Datos y fuentes

  • Deudores a la vista: Banco de España, Boletín Estadístico capítulo 4.
  • Efectos de comercio impagados: INE, Estadística de Efectos de Comercio Impagados.
  • Euribor a 1 año: Banco de España, Estadísticas.
  • Expectativas de precios de la vivienda: Comisión Europea, Economic and Financial Affairs.
  • Indicador de sentimiento económico: Comisión Europea, Economic and Financial Affairs.
  • Índice de confianza de los consumidores: Comisión Europea, Economic and Financial Affairs.
  • Índice general de la Bolsa de Madrid: INE, Estadísticas Financieras y Monetarias.
  • Índice de producción industrial: INE.
  • Inflación anual (medida mediante el IPC): INE.
  • Inmuebles propiedad de las entidades de crédito: Banco de España, Boletín Estadístico capítulo 4.
  • Matriculaciones de vehículos: Ministerio de Economía y Hacienda, Dirección General de Análisis.
  • Macroeconómico y Económico Internacional.
  • Paro registrado: Ministerio de Trabajo e Inmigración.
  • Créditos totales y créditos morosos concedidos por entidades de crédito: Banco de España, Boletín Estadístico, capítulo 4.
  • Principal medio de los nuevos préstamos hipotecarios: INE, Estadísticas Financieras y Monetarias.

Bibliografía

  • Box, G. E. P. and G. M. Jenkins (1976): Time Series Analysis: Forecasting and Control, revised edition. Holden-Day, San Francisco, C.A.
  • Enders, Walter (1995): Applied Econometric Time Series. Wiley, Canada.
  • Engle, Robert E. and Clive W. J. Granger (1987): “Cointegration and Error-Correction: Representation, Estimation and Testing.” Econometrica 55 (March), 251-276
  • Harvey, Andrew C. (1993): Time Series Models, 2nd edition. The MIT Press.
  • Patterson, Kerry (2000): An Introduction to Applied Econometrics; a time series approach. Macmillan.
  • Poi, B. P. (2006): “Jacknife instrumental variables estimation in Stata”. Stata Journal 6, 364-376.
  • Stock, J. H., J. H. Wright and M. Yogo (2002): “A survey of weak instruments and weak identification in generalized method of moments”. Journal of Business and Economic Statistics 20, 518-529.

Descarga


FEDEA | Fundación de Estudios de Economía Aplicada
C/ Jorge Juan, 46 - 28001
Madrid. Spain

TEL. +34 91 435 90 20
FAX. +34 91 577 95 75

Morosidad agregada Morosidad total sectores productivos Histórico