Saltar al contingut principal

9. Recerca i desenvolupament

Aquesta memòria està pendent d'aprovació per la Junta de Govern.

Durant l'any 2023 s'han desenvolupat diverses línies d'innovació, entre les quals destaquen les línies d'àmbit transversal següents:

  • Estadística del grau d'urbanització
  • Registre estadístic de territori
  • Sistema integrat de metadades (Qualitas)
  • Sistemes d'informació geogràfica

D'altra banda, l'Idescat ha dedicat recursos a les següents línies d'innovació tècnica o metodològica de caràcter més vertical:

  • Desenvolupament de l'Estadística de comerç amb l'estranger i de l'Estadística de comerç amb l'estranger segons contingut tecnològic a la Plataforma Cerdà
  • Desenvolupament de l'Estadística de l'activitat del turisme rural a la Plataforma Cerdà
  • Desenvolupament dels mètodes de validació d'adreces i geocodificació de la informació d'afiliacions i comptes de cotització a la Seguretat Social
  • Enquesta d'usos lingüístics de la població (EULP) 2023
  • Enquesta de consums intermedis (ECI)
  • Enquesta de l'ús del temps (EUT)
  • Indicadors de l'economia circular
  • Indicadors de sostenibilitat del turisme
  • Projecte experimental de web scraping
  • Sistema estadístic d'informació laboral

També s'han fet millores conceptuals en estadístiques econòmiques sectorials, que es detallen a l'apartat corresponent.

9.1. Línies d'innovació estadística

Línies d'àmbit transversal

Estadística del grau d'urbanització

Objectiu: Eurostat va determinar una metodologia per classificar els municipis en tres categories: ciutats o àrees densament poblades, localitats o àrees semidenses i àrees rurals o àrees de densitat de població baixa. Aquesta metodologia parteix del grid estàndard europeu i, a partir del càlcul de la població dins de cada cel·la, s'han delimitat i classificat les unitats territorials de Catalunya en cadascuna de les tres categories.

L'any 2023, l'Idescat ha actualitzat l'estadística per als municipis de l'any 2021 i ha ampliat els càlculs del grau d'urbanització per a seccions censals i agrupacions censals, a més d'incorporar nous indicadors del percentatge de població resident en cada tipus de cel·la i la publicació de la població total inclosa en la quadrícula d'1 km2.

Registre estadístic de territori

Objectiu: Actualització del Registre estadístic de territori, que inclou tant les adreces de la població com les adreces dels comptes de cotització de la Tresoreria General de la Seguretat Social i les adreces de treball dels autònoms afiliats. Manteniment de l'aplicació en JAVA per al tractament de les adreces que no s'han pogut codificar de forma automàtica. Aquesta aplicació utilitza el Google Web Tool-kit (GWT) per desenvolupar en JAVA la part de client i s'han utilitzat eines d'Open Layers (OL) per a la visualització de les adreces en mapes. L'aplicació proporciona, per a cada adreça que s'ha de geocodificar, una llista d'adreces del mateix municipi similars quant al tipus i nom de la via. En seleccionar manualment una adreça de les candidates, aquesta es visualitza en un mapa i permet diferents opcions (assignar-la com a correcta, avançar a la següent sense eliminar-la o assignar-la com a adreça no localitzada). L'aplicació fa una sèrie de tractaments per extreure automàticament el tipus de via, eliminar les parts innecessàries de l'adreça o assignar el número de carrer. Addicionalment, permet assignar una adreça concreta a partir de la seva selecció al mapa.

Sistemes d'informació geogràfica

Objectiu: Dins de l'actuació estadística Sistemes d'informació geogràfica, s'ha mantingut la xarxa de transport per trobar camins òptims entre dos punts, així com per poder calcular els costos associats en espai i temps.

Es tracta d'una eina bàsica per conèixer la distribució de costos que té la població per arribar a certes infraestructures. L'eina utilitza la informació disponible en el projecte Open Street Maps (OSM). Inclou les dades de carreteres relatives al territori de Catalunya, així com les corresponents a l'Aragó i els departaments veïns de França. S'han descarregat també les dades de la xarxa de ferrocarrils, de metro i les corresponents a les xarxes de bus urbà i interurbà. Aquesta informació està integrada en una base de dades PostGIS amb l'extensió pgroute, que representa un graf complet de comunicacions.

La qualitat de la xarxa de carreteres i de les xarxes de transport de trens i metro és bona. En canvi, la xarxa d'autobús presenta molts problemes de qualitat, amb sentits de marxa erronis. Queda pendent veure si el projecte OSM farà versions més acurades per poder utilitzar la xarxa d'autobusos.

S'han desenvolupat funcions PostGIS/pgroute que serveixen per obtenir el camí òptim i els costos entre dos punts (dues adreces geocodificades) utilitzant l'algoritme Dijkstra bidireccional. Atès que el nombre de càlculs a realitzar pot ser relativament gran (potencialment tants càlculs com portals diferents) i que el càlcul és lent, s'han optimitzat al màxim les dades del graf, d'una banda utilitzant RTrees clusteritzats amb les dades i, de l'altra, limitant els càlculs a una zona rectangular prou gran que inclogui els punts d'origen i destinació. Addicionalment, s'ha desenvolupat una aplicació Java que fa el càlcul de rutes en paral·lel, fent una partició de conjunt total d'orígens/destinacions. El resultat final és que el càlcul és gairebé tant més ràpid com el factor de partició utilitzat.

L'any 2023 s'ha utilitzat aquesta eina per atendre una petició d'assistència tècnica estadística del Departament d'Educació, de càlcul dels costos de desplaçament en temps dels alumnes no universitaris, des dels seus domicilis fins als centres escolars.

Sistema integrat de metadades (Qualitas)

Objectiu: Millorar l'actual sistema integrat de metadades: perfeccionament i incorporació de millores en l'aplicació de gestió de la documentació de les metadades dels processos estadístics; elaboració de nous informes metodològics estandarditzats en el marc del model GSIM (Generic Statistical Information Model) i de l'SDMX (Statistical Data and Metadata Exchange), i continuació de la documentació de les variables associades als processos estadístics, a càrrec de l'Idescat.

Línies d'àmbit vertical

Desenvolupament de l'Estadística de comerç amb l'estranger i de l'Estadística de comerç amb l'estranger segons contingut tecnològic a la Plataforma Cerdà

Objectiu: Desenvolupament dels processos estadístics i d'estimació associats a l'Estadística de comerç amb l'estranger i a l'Estadística de comerç amb l'estranger segons contingut tecnològic utilitzant el programari desenvolupat per la Plataforma Cerdà, i desenvolupament de les tabulacions, rànquings i jerarquies de navegació de la informació ajustats al sistema de difusió actual.

Desenvolupament de l'Estadística de l'activitat del turisme rural a la Plataforma Cerdà

Objectiu: Desenvolupament dels processos estadístics i d'estimació associats a l'Estadística de l'activitat del turisme rural utilitzant el programari desenvolupat per la Plataforma Cerdà, i desenvolupament dels automatismes de generació i difusió del pla de tabulació per reduir les intervencions manuals.

Desenvolupament dels mètodes de validació d'adreces i geocodificació de la informació d'afiliacions i comptes de cotització a la Seguretat Social

Objectiu: Desenvolupament dels mètodes i processos de validació, imputació d'adreces i geocodificació amb l'objectiu de millorar la ubicació geogràfica de la informació, permetre desagregacions territorials d'àmbit inframunicipal i classificacions territorials diferents a la dels àmbits estàndard.

Enquesta d'usos lingüístics de la població (EULP) 2023

Objectiu: Elaboració del projecte tècnic de l'EULP 2023 en col·laboració amb la Secretaria de Política Lingüística del Departament de Cultura de la Generalitat de Catalunya. Desenvolupament de la primera fase del treball de camp i definició del pla de treball per a la segona fase, al qual s'han incorporat protocols d'incentivació de les llars catalanes. Treballs de desenvolupament de l'aplicació de gestió que els usuaris a enquestar hauran d'utilitzar. Desenvolupament dels qüestionaris en paper i electrònics adreçats a les llars, d'acord amb les seves característiques, així com de la resta de documentació metodològica.

Enquesta de consums intermedis (ECI)

Objectiu: Elaboració del projecte tècnic del Marc input-output de Catalunya 2021, en el qual s'encabeix l'ECI com a principal font d'informació. Inici del treball de camp de l'actuació estadística, a partir d'una mostra representativa per sectors de les empreses de menys de 100 treballadors i amb caràcter censal per a les empreses que superen els 100 treballadors. Treballs de desenvolupament de l'aplicació de gestió que els usuaris a enquestar hauran d'utilitzar. Desenvolupament dels diferents models de qüestionaris electrònics adreçats a les empreses, d'acord amb les seves característiques, així com de la resta de documentació metodològica.

Enquesta de l'ús del temps (EUT)

Objectiu: Finalització de l'elaboració del projecte tècnic de l'EUT i inici del treball de camp de l'actuació estadística, a partir d'una mostra representativa per a determinades àrees territorials i grau d'urbanització segons la classificació d'Eurostat (DEGURBA). Treballs de desenvolupament de l'aplicació de gestió que els usuaris a enquestar hauran d'utilitzar. Desenvolupament del qüestionari de la llar, qüestionari individual i diari d'activitats en paper i en format electrònic.

Indicadors de l'economia circular

Objectiu: Anàlisi de viabilitat, dificultats i limitacions per a la construcció i difusió d'un marc d'indicadors anuals dels indicadors de l'economia circular per a Catalunya prenent com a referència la bateria d'indicadors d'Eurostat, arran de la revisió i aplicació establerta per la Comissió Europea i publicada el maig del 2023.

Indicadors de sostenibilitat del turisme

Objectiu: Desenvolupament d'un conjunt d'indicadors per mesurar i monitoritzar la sostenibilitat del turisme, dut a terme en el marc d'un projecte de col·laboració amb l'OCDE, la Unió Europea i 4 regions (Andalusia, Catalunya, Comunitat Valenciana i Navarra).Aquest sistema d'indicadors cobreix àrees rellevants de la gestió de la sostenibilitat del turisme, com ara els beneficis econòmics, l'ocupació, l'estacionalitat, l'accessibilitat, la pressió, la satisfacció dels turistes i residents, la gestió ambiental i la gestió de l'aigua, l'energia i els residus. La definició del sistema d'indicadors, que s'ha de basar en les recomanacions metodològiques de les principals organitzacions internacionals amb responsabilitats en l'elaboració i producció d'estadístiques i indicadors del sector turístic, en concret, l'OMT, l'OCDE i l'Eurostat, es perfeccionarà en una fase pilot posterior.

Projecte experimental de web scraping

Objectiu: Desenvolupament d'un projecte pilot experimental per avaluar l'oportunitat d'utilitzar de manera estable l'ús de la tècnica del web scraping per disposar d'informació sobre les constitucions, modificacions i dissolucions d'empreses a Catalunya, i de les seves característiques i ubicació de seu social, amb finalitats estadístiques, que permeti enriquir el Directori d'empreses i establiments, el Registre estadístic d'entitats i el Sistema d'informació estadística laboral.

Sistema estadístic d'informació laboral

Objectiu: Desenvolupament conceptual del sistema integrat d'informació estadística laboral, concebut com un ecosistema de dades que es basa en el gran potencial dels registres administratius per generar informació de qualitat, però que també està integrat per fonts de base mostral i preveu l'aprofitament d'altres fonts internes i externes i/o de base agregada. Alhora, s'interconnecta amb els registres bàsics de població, entitats i territori i els seus respectius satèl·lits, fet que ha de permetre analitzar la informació segons diverses perspectives. L'objectiu principal és la producció eficient i enriquida d'estadístiques relacionades amb el mercat laboral. L'any 2023 s'han dut a terme treballs metodològics per a l'elaboració d'estadístiques de demografia empresarial a partir de diverses fonts disponibles.

9.2. Revista SORT (Statistics and Operations Research Transactions)

L'any 2023 és el vint-i-unè de la revista SORT (Statistics and Operations Research Transactions), publicació científica internacional coeditada per l'Idescat i set universitats catalanes, orientada a la recerca aplicada en l'àmbit de l'estadística, la investigació operativa, la bioestadística i l'estadística oficial.

Des del 2007 la revista SORT està indexada a les bases de dades del Science Citation Index Expanded. L'any 2022 el factor d'impacte es va situar a 1,6.

Factor d'impacte de la revista SORT. 2018–2022
Any 2022 2021 2020 2019 2018
Factor d'impacte 1,6 1,759 1,185 0,778 1,125

Durant l'any 2023 s'han publicat els dos números del volum 47 i s'ha continuat el procés de gestió editorial de la revista per mitjà de la plataforma RACO (Revistes Catalanes amb Accés Obert), en el marc del conveni amb el Consorci de Serveis Universitaris de Catalunya. El número dos del volum 47 ha estat dedicat al 9th International Workshop on Compositional Data Analysis (CoDaWork, 2022), i s'hi han inclòs set articles d'aquest congrés.

En aquest exercici, el nombre d'articles sotmesos a revisió ha estat de 58, una xifra molt similar a la de l'any passat.

D'altra banda, el nombre de pàgines publicades ha estat molt superior al de l'any anterior (360 pàgines per 260 l'any 2022), amb un total de dotze articles entre els dos números del volum 47.

Números de SORT publicats el 2022
Títol Data
Volume 47, Number 1, January–June 2023 Juny del 2023
Volume 47, Number 2, July–December 2023 Desembre del 2023