| País | Entidad | Número observaciones |
|---|---|---|
Agregadores financieros (aplicaciones financieras y Fintech) | ||
| Estados Unidos | Ready to Zero | 516 |
| Reino Unido | Money Dashboard | 8.350 |
| Estados Unidos | SaverLife | 5.746 |
| Estados Unidos | Confidencial | 156.606 |
| Islandia | Meninga | 66.262 |
| Islandia | Meninga | 55.545 |
| España | Fintonic | 236.053 |
| Estados Unidos | Check | 23.000 |
Bancos tradicionales | ||
| Francia | CIC (Credit Mutuel) / CB (Carte bancaire) | 300.000/1,8 millones de afiliados a CB |
| Dinamarca/Suecia | Danske Bank | 860.000 |
| España | Caixabank | 3.028.204 |
| Estados Unidos | JP Morgan | 5.014.672 |
| España | BBVA (tarjetas y TPV) | 2.200.000 empresas |
| Japón | Mizuho Bank | 2.800.000 |
| Países Bajos | ABN AMRO | 2.000.000 |
| Portugal | Sociedade Interbancária de Serviços | |
Introduction
Dans les derniers ans la disponibilité d'ingentes bases de données et l'accroissement de la capacité de calcul ont transformé foule de champs scientifiques et technologiques comme les réseaux neuronales, renombradas comme des procédures de “Deep learning” pour éviter les connotations négatives de son insuccès dans les ans 60 et 70 , ou la génétique. La recherche économique s'est aussi vu influencée par la disponibilité de bases de données chaque fois de majeure taille et granularidad. De cette forme la recherche empirique, que dans les ans 70 était marginal ( 11 % des articles les plus cités en des revues académiques) face à la dominancia de la théorie ( 77 %), dans l'actualité obtient le % 60 face au 10 % des articles théoriques 1 .
Dans ce travail se présente une vision de cette transition vers l'utilisation de grandes bases de données dans le champ de l'économie de travail dans le cas espagnol 2 . Le parcours se pose depuis une perspective personnelle à partir d'expériences dérivées de ma propre course professionnelle comme chercheur. Beaucoup de de les réflexions qu'ils s'exposent à suite est allé madurando à partir de réflexions présentées en García Montalvo ( 2021 à, b, c) et García Montalvo ( 2014 ). Bien que mes premiers travaux en utilisant données massives se remontent au 1995 , et ils se rapportent à la négociation en temps réel en marché de futurs de bons, dans cet article je me centrerai exclusivement dans mes expériences liées avec recherche dans le marché de travail 3 .
L'histoire de la généralisation des grandes bases de données 4 de travail en Espagne traverse diverse étapes. La première serait la préhistoire, qu'il viendrait caractérisée par le principe de “tu te le guisas, tu te le manges”. La deuxième étape serait l'Âge Moyen des stats de travail caractérisée par la construction de la grande cathédrale, l'Échantillon Continu de Vies De travail (MCVL), et le début d'une ouverture des producteurs de stats aux demandes des chercheurs. La troisième étape ou Âge Moderne, que nous aussi pourrions denominadar comme la période Israeliano, se caractérise par un accès un plus généralisé, mais sous le principe de “dis-moi à qui tu connais et je te dirai si tu le réussis” et “fais-le avant du changement de responsables”. Dans l'Âge Contemporain se passe de la méfiance généralisée à la collaboration limitée. Et à partir d'ils ici existent deux frontières: la première frontière ils la marquent la disponibilité de données administratives fusionnées pour la pratique totalité des citoyens d'un pays comme dans le cas du Danemark ou la Norvège. Le cas de l'Islande comprend même une base de données de l'ADN de tous les habitants du pays. La deuxième frontière passe par l'intégration de données de compagnies privées et données administratives. Celle-ci est l'actuelle frontière dans la construction de grandes bases de données pour la recherche économique.
1 Le reste sont des articles académiques qu'ils combinent théorie et simulation ou théorie et contrastación empirique.
2 Ce travail est une version élargie de la conférence inaugurale de l'I Workshop de Producteurs et Utilisateurs de Stats De travail qu'a eu lieu dans Madrid les jours 26 et 27 de novembre de .. 2024
3 Pour une vision une plus complète se peut consulter García Montalvo ( 2021 c)
4 Les références à des grandes bases de données comprennent aussi la consolidation ou fusion de bases de données plus petites.
1 . La préhistoire des stats de travail
À moitié des ans 90 existait une vision généralisée de l'université espagnole comme une “usine d'arrêtés”, que se basait sur l'élevée taxe de chômage des diplômés universitaires espagnols. En fait, le Sondage de Population Active montrait comme les universitaires jeunes moindres 29 d'ans avaient des taxes de chômage supérieurs aux diplômés de Formation Professionnelle et similaire à la des diplômés d'EGB ou CELA. Seulement le groupe de jeunes sans des études ils avaient des taxes supérieures. Malencontreusement l'EPA n'avait pas la suffisante granularidad pour pouvoir analyser si ils existaient des différences par des diplômes, ou cuales étaient les facteurs qu'ils déterminaient le succès ou insuccès individuel dans l'insertion des jeunes universitaires dans le marché de travail. À l'époque les données de la Sécurité sociale n'étaient pas une option et, par tellement, dans une tentative d'analyser les facteurs déterminants de l'insertion de travail des jeunes universitaires, il s'a contacté avec beaucoup d'universités pour solliciter sa collaboration en la programmation et développement d'un sondage spécifique. Les conversations avec les universités ont échoué devant la peur à que ils se pussent réaliser, avec postériorité, comparaisons entre des universités.
Devant cette situation, avec le financement de la Commission Européenne (programme TSER), et en collaboration avec des centres de recherche d'autres 10 pays européens (l'Autriche, la République tchèque, la Finlande, la France, l'Allemagne, l'Italie, la Norvège, la Suède, le Royaume-Uni et Pays-Bas) et le Japon, développons le projet CHEERS (Carreer after Higher Education: à European Research Survey). Pendant plus de un an s'a disputé la construction d'un questionnaire très complet, avec des adaptations nationales, que permettait faire un suivi des premiers ans des diplômés universitaires après terminer les études. il aussi se ramassait information sur l'accès aux études universitaires, les caractéristiques de la course, les concurrences et habilités développées pendant la même, ainsi que les travaux développés depuis la finalisation des études jusqu'au moment du sondage (quatre ans après terminer les études). Les résultats de l'étude s'ont reflétés postérieurement dans un livre (Teichler, 2007 ) que ramassait des chapitres transversels ainsi que spécialisés dans chaque pays 5 . Avec cette information nous avons appris que l'université espagnole n'était pas une usine d'arrêtés, mais qu'il était une usine de sobrecualificados, au moins subjectifs 6 .
Le questionnaire confectionné par les participants dans le projet a eu assez répercussion postérieurement donc foule d'opérations statistiques postérieures ils l'ont pris comme base, compris le terme ad-hoc de quatre ans après la graduation comme déterminante de la population objet d'étude. La première adoption s'a produit dans le Sondage d'Insertion De travail des Universitaires catalans de l'AQU, que déjà raconte 8 avec des éditions ( 2001 - 2005 - 2008 - 2011 - 2014 - 2017 - 2020 - 2023 ). L'INE il a aussi développé deux sondages sur insertion de diplômés universitaires (EILU), une en 2014 (rapportée à des diplômés du 2009 - 10 ) et la deuxième en 2019 (rapportée aux diplômés en 2013 - 14 ). Dans l'actualité la Sécurité sociale aussi publie un rapport sur la situation de travail des jeunes diplômés universitaires quatre ans après la finalisation de ses études.
5 Pour le cas espagnol, voir García Montalvo ( 2007 ).
6 Garcia Montalvo ( 2001 ) présente une analyse détaillée de tous les constats obtenues à partir de l'échantillon espagnol de diplômés universitaires.
2 . L'Âge Moyen
L'Âge Moyen des stats de travail en Espagne commence avec la construction de la “Grande Cathédrale” qu'a été l'Échantillon Continu de Vies De travail ( 2004 ) qu'il marque un énorme changement face aux sollicitudes ad-hoc de périodes antérieures ou l'utilisation de statistiques “prêt-à-porter”. À 2006 partir de se intégrent données fiscales. La MCVL aussi intégre dans l'actualité le Recensement Continu avec ce que résulte une source fondamentale d'information sur le marché de travail espagnol. La disponibilité généralisée de la MCVL a provoqué une explosion dans la recherche sur marché de travail et le système de pensions en Espagne.
3 . L'Âge Moderne (ou Israeliana)
L'Âge Moderne dans la recherche économique avec des grandes bases de données commence avec diverse propositions internationales. aux États-Unis Card et au. ( 2010 ) Ils proposent développer l'accès aux données administratives pour la recherche économique devant ce que décrivaient comme “erosión de l'avantage des EE.UU. dans la création de données pour la recherche économique”. Card et Au. ( 2010 ) Ils signalent l'importance pour les sciences sociales de raconter avec date de grande qualité et soulignent que les données administratives sont très supérieures aux sondages muestrales traditionnels: majeure taille (totalité de la population), structure longitudinal, moindre erreur de mesure, mise en examen et ne participation, etc. La priorité pour la recherche est développer un accès directeur et sûr à des données administratives pour recherche. Card et Au. ( 2010 ) Ils proposent un mécanisme, similaire au des pays scandinaves, pour développer le système selon lequel l'agence statistique nationale obtient des données administratives de tous les autres générateurs de stats, il prépare l'anonimización des données pour chaque projet de recherche, fournit un accès sûr aux chercheurs et enfin, seulement le résultat de la recherche est public. Dans ce procès se ressort que l'accès direct aux microdatos est critique pour le succès du programme. Les données synthétiques ou l'envoi de programmes aux agences depuis l'extérieur ne s'envisagent pas des bonnes alternatives.
En le le Royaume-Uni en 2014 se met en oeuvre l'Administrative Date Research Network (ADRN) comme une collaboration entre des universités, organismes gouvernementaux, agences statistiques et chercheurs pour faciliter l'accès à données administratives fusionnées entre des diverses sources. L'initiative a donné des énormes fruits comme commenterai avec postériorité.
La dernière borne dans cette série d'initiatives internationales est l'Opportunity Insight Lab fondé par Raj Chetty, John Friedman et Nathaniel Hendren en 2018 avec le financement de la Chan Zuckerberg Initiative. Quelques ans avant ces chercheurs avaient réussi l'accès aux données de l'Agence Tributaire des États-Unis pour réaliser recherche économique, ne sans certaine controverse sur les buts de la recherche et l'utilisation postérieure des données. L'information fournie par l'Agence Tributaire des EE.UU. a permis réaliser des recherches très intéressant et impossible avec antériorité, en comprenant le fameux Atlas d'Occasions que montrait, entre beaucoup d'autres choses, comme la mobilité sociale aux États-Unis il s'était écroulé estrepitosamente entre 1940 et moitié des ans 80 .
Tandis que, en Espagne, l'Agence Tributaire aussi se configure comme l'organisme avec les bases de données plus complètes et les procédures de “machine learning” plus devancés. Sûrement il n'y a pas aucune autre agence tributaire dans le monde avec la capacité de l'agence espagnole. L'AEAT possède la base de données Zujar nourrie par 30 billones de données, et utilise foule d'outils pour son analyse (Thésée, Électre, tu Mesures – ROI, Caractère-Infonor, procédures de “web scraping”, etc.).
Pourtant, à intervenus des 2010 , il encore est compliqué travailler avec des données administratives d'institutions espagnoles. En plus, en cas de connaître la personne appropriée et que celle-ci ait la disposition d'aider, il est précis développer pour chaque recherche une infrastructure légale et technicienne de certaine complexité. En 2015 ai eu l'occasion de travailler avec quelques données sur l'attribution aléatoire d'habitations à loyer modéré en País Vasco le . Le but de l'étude était analyser l'impact de la possession d'un logement et, en particulier, d'une dette en forme d'hypothèque, sur l'offre de travail. Logiquement, l'information sur les changements dans le marché de travail, associée à la date d'achat du logement, ils ne figuraient pas dans l'information administrative sur le mécanisme d'attribution du logement. De cette forme ils ont dû se signer quatre conventions, un d'ils avec la Trésorerie Générale de la Sécurité sociale, pour fusionner l'information dans la forme fixée par les “Notes d'échange de fichier, sécurité et anonimización” de la Trésorerie Générale. Cette procédure consistait à une triangularización de l'information de sorte que le chercheur n'avait jamais accès aux données identificadores des individus et seulement les administrations maniaient dite information pour réaliser la fusion.
Mon expérience pendant ces ans en ce qui concerne les facilités pour obtenir données et gérer la fusion de diverse bases de données il a été mixte. Les institutions les plus sensibles aux besoins de recherche ont été la Sécurité sociale, les Registradores de la Propriété et quelques gouvernements d'une communauté autonome. Entre les organismes peu de sensibles se trouvaient la Direction Générale de Trafic, l'Agence Tributaire et ANCERT (Stats Notariales) 7 .
7 Récemment, la situation a changé sustancialmente à l'égard des stats notariales. Le Notariado, qu'a toujours eu une énorme quantité d'information sur le secteur immobilier espagnol et un centre technologique très puissant, se montre dans l'actualité ouvertement disposée à collaborer avec les chercheurs en facilitant accès à ses données.
4 . L'âge contemporain
À la fin des ans 2010 l'AIREF promeut une série de réunions avec des chercheurs avec le but de stimuler une stratégie d'accès à des données administratives. À cette impulsion n'a pas été d'autrui le fait de que l'Israël Arroyo se fût incorporé à l'AIReF en 2018 après stimuler et faciliter, depuis le post de sous-directeur général de Budgets, Études Économiques et Stats dans la Trésorerie Générale de la Sécurité sociale, la collaboration fluide de la Sécurité sociale avec les chercheurs sur des thèmes liés avec le marché de travail. Comme résultat de ces réunions et d'une réflexion interne de l'AIReF se publie l'Opinion 1 / 20 (AIReF, 2020 ) que pose une proposition de stratégie pour l'accès aux données administratives en Espagne, ainsi qu'une série de changements normatifs nécessaires pour la développer.
À la fin du décennie des 2010 l'Agence Tributaire aussi commence une relative ouverture qu'il termine avec la collaboration avec l'INE dans la production de l'Atlas de la Distribution de la Rente des foyers ( 2019 ), qu'a un succès énorme, et la facilitation des données nécessaires pour la réalisation d'un Atlas d'Occasions en Espagne ( 2020 ) par part de la Fondation Felipe González et COTEC, bien que malheureusement cette deuxième application est beaucoup moins connue 8 . L'Agence Tributaire a aussi participé très activement, et il a été fondamentale dans la provision de l'information de base, dans la construction du Système De l'État d'indices de Loyer de Logement, que fournit information prix de loyer jusqu'à niveau d'arrondisement censitaire. Un autre signe de ce nouveau temps est que l'AEAT permît à l'AIReF utiliser les déclarations de rente anonimizas ( 35 , 5 millions) que se sont croisé avec le Sondage de Budget Familiers pour analyser la fiscalité conjointe d'IRPP et TVA des familles (AIReF, 2020 ), bien que ces données ne sont pas publics.
Dans les derniers ans se sont aussi fait des avances dans autres données administratives. Le PET (panneau de données d'entreprise-travailleurs) fournit une vision similaire à la MCVL mais depuis la perspective de l'entreprise à partir du raccorde des registres sur les entreprises et les vies de travail des travailleurs. Également, la création du laboratoire de données du Banc d'Espagne permettait accéder aux données de la Centrale de Bilans.
Dedans des collaborations entre des organismes publics et des institutions de recherche le DataReSS, une collaboration entre l'institut de statistique de (IDESCAT) Cataluña et la Graduate Barcelona School of Economics, facilite l'accès aux registres que produisent quelques administrations catalanes.
À des principes des ans 2020 se produisent autres deux bornes importantes. En premier lieu, se crear le Bureau de la Donnée, vendeur de la Secrétaire d'État de Digitalización et Intelligence Artificielle. La deuxième borne remarquable/remarquable est le communiqué institutionnel du 13 d'avril de 2021 dans lequel l'INE, l'Agence Tributaire, la Sécurité sociale et le Banc d'Espagne ils conviennent commencer à travailler conjointement dans le développement d'un système d'accès à ses bases de données avec des fins scientifiques d'intérêt public. Le de 12 février d'un 2024 nouveau communiqué institutionnel, cette fois confirmé par la Sécurité sociale, le SEPE, l'INE, le Banc d'Espagne et l'Agence Tributaire, informe de la signature d'un accord pour permettre l'accès conjoint à ses bases de données pour des travaux scientifiques de recherche avec intérêt public. L'accord, qu'a donné lieu à l'il EST_DataLab (est-datalab.Il est), il permet qu'autres institutions publiques se puissent adhérer aussi dans le futur.
8 Raj Chetty Fut en train de donner une conférence dans le département d'économie de l'Université Pompeu Fabra en 2023 et méconnaissait qu'en Espagne il se fût répliqué l'Atlas d'Occasions malgré connaître les applications dans autres pays. L'Atlas avec des données espagnoles se peut consulter en https://atlasoportunidades.fundacionfelipegonzalez.cotec.Il est/
5 . La prochaine frontière I: les pays scandinaves
L'appelé modèle nordique a été depuis toujours le miroir dans lequel beaucoup de pays ils ont voulu se refléter à l'heure de réussir développer l'usage de données administratives pour l'usage en recherche. Autant les bureaux statistiques de l'Islande, le Danemark, la Norvège et la Suède permettent l'accès aux chercheurs à des grandes bases de données administratives déjà fusionnés 9 . L'accès dans le cas norvégien aussi peut être intervenu par le Norwegian Social Sciences Date Service. Plus récemment pays comme l'Allemagne (IAB) et la France (CASD) ont aussi mis en oeuvre des organismes pour faciliter l'accès à des grandes bases de données administratives. Mais sans doute un des cas à succès est l'initiative du le Royaume-Uni. Un des motifs fondamentaux de cette initiative a été, de forme semblable à l'arrivé aux États-Unis, la sensation de que le le Royaume-Uni était en train de perdre le train de la recherche économique de frontière par les limitations qu'ils avaient les chercheurs pour accéder à des grandes bases de données administratives. En 2014 s'a mis en oeuvre l'Administrative Date Research Network du le Royaume-Uni (ADRN) comme une collaboration entre des universités, organismes gouvernementaux, agences statistiques et chercheurs pour faciliter l'accès à des données administratives déjà fusionnés entre des diverses sources. L'initiative a donné des énormes fruits. Dans ce sens génère envie saine que quelques mois après commencer la pandemia de COVID 19 chercheurs du le Royaume-Uni fussent capable de fusionner 17 millions d'historiales électroniques de santé et calculer la probabilité de mortalité par COVID 19 en fonction de dizaines de facteurs de risque (Opensafely Collaborative et au., 2020 ).
9 Pour une description une plus détaillée de ces expériences voir AIReF ( 2020 ).
6 . La prochaine frontière II: l'intégration de données d'entreprises privées et données administratives
Bien que les administrations génèrent des énormes quantités de données administratives, les compagnies privées encore produisent majeure quantité d'information. En plus, les entreprises privées fournissent une granularidad spatial et temporel et une inmediatez que difficilement se peuvent réussir avec les données administratives. L'advenimiento de la pandemia de COVID 19 et le besoin de raconter avec information de très de grande fréquence pour faire un suivi de l'évolution économique, et de l'impact des politiques adoptées pour mitigar l'effet de la pandemia, a plus fait importante la disponibilité rapide de grandes bases de données, en stimulant la collaboration public-privée. Dans ce cas le calificativo public peut se rapporter à des universités, organismes publics et centres de recherche en travaillant avec des grandes bases de données d'entreprises privées, bien que il aussi se peut rapporter à des bases de données publiques bâties à partir de microdatos d'entreprises privées.
Un exemple de cette collaboration a été le “economic tracker” de l'Opportunity Insight dont la construction a commencé en 2020 . Chetty et Au. ( 2023 ) Il décrit les données qu'ils utilisent pour faire un suivi de l'impact du COVID 19 en des différentes dimensions. Entre les entreprises privées que collaborent en apportant données sont Affinity Solutions (dépense en des cartes de crédit et débit), CoinOut (transactions en espèces), Womply (utilisation de cartes de crédit en des petites entreprises), Paychex (données sur emploi et des feuilles de paie de . 670 000 Petites et moyennes entreprises), Intuit (offre des services de paiement de feuilles de paie à des entreprises), Earnin (offre des services d'avance de la feuille de paie que permet accéder à la rente des travailleurs qu'ils se sont inscrit dans le web), Kronos (service de gestion de travailleurs que comprend à . 30 000 Entreprises et 3 . 2 Millions de travailleurs), Homebase (outil de gestion de petites entreprises) et Zearn (application pour l'apprentissage de mathématiques utilisée par 925 . 000 Étudiants).
La disponibilité d'information sur transaccionalidad bancaire (cartes de crédit et débit, TPV, vises en des comptes embauche d'actifs financiers, etc.) Il a eu une importance fondamentale dans la révolution de l'économie en temps réel. Dans les derniers ans se sont multiplié les collaborations à niveau international à travers des accords entre des universités et foule de bancs pour utiliser l'information bancaire. Le listage comprend déjà beaucoup de pays: les États-Unis, le Royaume-Uni, la France, le Japon, le Danemark, la Suède, l'Islande, le Portugal, Pays-Bas, la Chine et l'Espagne. Les entreprises collaboratrices comprennent tout type de sociétés financières depuis Fintechs jusqu'à des bancs traditionnels. Le Tableau 1 ramasse un compte rendu de pays où ils existent des recherches en part et les sociétés privées qui leur supportent.
| Pays | Établissement | Nombre observations |
|---|---|---|
Agregadores Financiers (applications financières et Fintech) | ||
| les États-Unis | Ready to Zero | 516 |
| le Royaume-Uni | Money Dashboard | 8 . 350 |
| les États-Unis | SaverLife | 5 . 746 |
| les États-Unis | Confidencial | 156 . 606 |
| l'Islande | Meninga | 66 . 262 |
| l'Islande | Meninga | 55 . 545 |
| l'Espagne | Fintonic | 236 . 053 |
| les États-Unis | Check | 23 . 000 |
Bancs traditionnels | ||
| la France | CIC (Credit Mutuel) / CB (Carte bancaire) | 300 . 000 / 1 , 8 Millions d'adhérents à CB |
| le Danemark/la Suède | Danske Bank | 860 . 000 |
| l'Espagne | Caixabank | 3 . 028 . 204 |
| les États-Unis | JP Morgan | 5 . 014 . 672 |
| l'Espagne | BBVA (cartes et TPV) | 2 . 200 . 000 Entreprises |
| le Japon | Mizuho Bank | 2 . 800 . 000 |
| Pays-Bas | ABN AMRO | 2 . 000 . 000 |
| le Portugal | Sociedade Interbancária De Serviços | |
Le but de ces collaborations est analyser des théories économiques comme la rente permanente, l'effet des confinamientos, l'impact des politiques de transferts de rentes face à la COVID 19 , l'évolution de la dépense pendant la pandemia ou l'impact distribucional de l'épidémie sur la dépense. Ces bases de données massives de sociétés financières aussi permettent aborder des aspects liés avec le marché de travail. Un exemple est la collaboration entre une équipe de chercheurs du département d'Économie de l'Université Pompeu Fabra et Caixabank Research dans l'analyse en temps réel de l'inégalité salariale en Espagne depuis le début de l'épidémie de COVID- 19 (Aspach et au. 2021 ) 10 , L'effet des ERTE sur l'inégalité salariale (Aspach et au. 2022 ), Ou l'impact du revenu minime vital, et la modification des conditions en 2023 , sur la consommation et l'emploi. Il est intéressant remarquer que récemment divers organismes nationaux de statistique se sont approché à des sociétés financières pour analyser la possibilité d'utiliser ses données comme source d'indicateurs statistiques officiels.
Un autre exemple d'usage de données privées se produit dans le cas de la collaboration entre des institutions publiques ou des organismes officiels et entreprises. Par exemple, le Banc Central Européen (BCE) use la base de données privée AnaCredit (“analytical credit date des manches”), qu'il contient des données harmonisées de la zone euro dans une base de données unique, pour ses analyses prudenciales et supervi soria s. Également, le Bank for International Settlements (BIS) recolecta et accuse information bancaire confidencial en collaboration avec des bancs centraux et des autorités nationales pour son International Date Hub.
Cependant, il surprend que quelqu'unes des collaborations entre des entreprises privées et des institutions publiques reçoivent critiques généralisées malgré pourchasser fins sociales. Un exemple clair en le cas espagnol a été l'annonce de l'INE d'acheter données des compagnies théléphoniques sur geolocalización des clients pour étudier la mobilité urbaine. Lorsqu'il s'a annoncé l'étude les médias ont intitulé de forme très critique: “il va ainsi pister l'INE ton mobile pendant 8 des jours: à des quelles opérateuses il affecte et comme l'éviter”; ”Les opérateurs toucheront moyen million d'euros par céder les données à l'INE”; “L'INE il va épier ton mobiles 8 jours: Qu'est-ce que tu peux faire”. Ce réaction est étonnant surtout lorsque la plupart des utilisateurs d'un téléphone mobile ils sont disposés à céder toute son information personnelle en donnant accès à toutes les données de son mobile pour s'installer une simple application de lanterne. Pourtant, si une institution publique fait une étude avec des données d'utilisateurs de téléphonie totalement anonimizados et ajoutés par des zones, mettent le cri dans le ciel. Dans ce sens manque clairement une majeure sensibilisation de la population sur l'importance des bases de données massives pour la recherche sociale.
10 Le suivi de cet indicateur se peut realizer à partir des données en https://inequality-tracker.caixabankresearch.com/
7 . La RGPD et le rapport Draghi
L'approbation du règlement du RGPD (Règlement Général de Protection de Données) de l'UE, adopté en 2016 et appliqué depuis 25 le de mai de , 2018 si s'interprète de forme restrictiva suppose un clair risque à l'ouverture et collaboration d'utilisateurs et producteurs de stats. En fait, il peut fournir la coartada parfaite à ces producteurs que veulent réduire le risque à zéro sans avoir en compte les bénéfices de la recherche. Par le général la transposition de la réglementation aux divers pays est en train de supposer une interprétation plus restrictiva que l'originalmente posée. Et ceci malgré toutes les salvaguardias que la RGPD présente dans le cas de la recherche. Quelques exemples:
( 26 ) … Par tellement, le présent Règlement il ne se rapporte pas au traitement de dite information anonyme, même pas avec des fins statistiques ou de recherche.
( 50 ) … Le traitement postérieur avec des fins d'archives en intérêt public, fins de recherche scientifique ou historique ou fins statistiques doit s'envisager des opérations de traitement compatible et licite.
( 53 ) Les catégories spéciales de données personnelles que méritent une majeure protection ils doivent se traiter avec des fins liées avec la santé uniquement lorsqu'il soit nécessaire pour obtenir dites fins au profit des personnes physiques et de la société dans son ensemble… ou avec des fins d'archives en intérêt public, fins de recherche scientifique ou historique ou fins statistiques.
Le récent rapport Draghi, dans son appel à la simplification et harmonisation de la régulation de l'UE pour ne nuire additionnellement à l'économie européenne, a foule d'appels d'attention sur l'impact dans la recherche de la faute d'harmonisation de la GDPR.
“La sobrerregulación du RGPD par part des Été membres et la faute de cohérence dans son application augmentent la charge administrative des entreprises de l'UE. Le RGPD, qu'a entré en vigueur en 2016 et il est directement applicable en tous les Été membres, a pour objectif d'offrir une approche harmonisée de l'UE pour l'application du caractère privé. Pourtant, il attribue aux Été membres la possibilité de définir normes de caractère privé en 15 des zones, ce que il génère fragmentation et incertitude juridique dérivée de l'usage généralisé de clauses de spécification, la sobrerregulación et l'application inconsistente par part des Autorités de Protection de Données (APD) nationales, et le fait de que quelques Été membres aient diverse APD que le fassent (par exemple, 16 en Allemagne). Ceci pourrait entraver l'emprendimiento et l'innovation transfrontaliers, compris le développement et l'implémentation de nouvelles technologies et solutions de ciberseguridad. Les estimations visent à quelques coûts élevés d'accomplissement du RGPD, de jusqu'à . 500 000 Euros pour les PMEs et de jusqu'à des 10 millions d'euros pour les grandes organisations. En plus, en raison de ces coûts d'accomplissement, les entreprises de l'UE ont réduit l'emmagasinage de données en 26 un % et le traitement de données en 15 un % en relation avec entreprises américaines comparables. Pourtant, en décembre de , 2023 les Été membres dans la formation du Conseil de Justice et Sujets d'Intérieur ils s'ont résistés à une majeure harmonisation.”
Un aspect important sur l'utilisation de données et les empêchements dans quelques interprétations de la RGPD est ce que le rapport Draghi dénomme Espace Européen de Données Sanitaires (EHDS). Sur ce point le rapport signale:
“Il existe un potentiel significatif sans exploser pour profiter des données sanitaires dans l'UE, comme le démontrent les considérables possibilités d'accéder et lier des ensembles de données dans le milieu de l'attention sanitaire en relation avec les EE. UU. Actuellement, le RGPD permet le traitement de données sanitaires pour la prestation d'assistance sanitaire ou sociale, santé publique et fins scientifiques avec base sur la législation de l'UE ou nationale. Les données peuvent s'accuser sans consentement explicite à condition qu'ils s'implémentent mesures appropriées et spécifiques pour sauvegarder les droits et libertés des intéressés. Quelques Été membres déjà se bénéficient de ces possibilités en vertu de sa propre législation nationale. Pourtant, l'adoption de ces options par part des Été membres a été inégal et il a donné lieu à un usage secondaire inefficace des données sanitaires. Pour surpasser ce défi, la Commission a proposé un règlement pour habiliter un Espace Européen de Données Sanitaires (EHDS) en profitant des possibilités qu'il offre le RGPD pour une loi spécifique de l'UE avec salvaguardias particulières. Dans le printemps de , 2024 le Parlement Européen et le Conseil ils sont arrivé à un accord politique sur le règlement proposé. La proposition prétend développer un cadre européen inspiré dans les mesures adoptées par divers Été membres qu'ils ont adopté une législation nationale similaire pour l'usage secondaire de données sanitaires.”
Le rapport Draghi aussi propose forcer l'implémentation harmonisée et simplifiée de la GDPR des états de l'UE et éliminer solapamientos regulatorios dans le cas du développement d'applications d'intelligence artificielle, en recommandant l'utilisation d'une procédure de révision régulière et rapide des régulations liées avec l'IA. Le rapport signale que, bien que les ambitions du RGPD et la Loi d'IA de l'UE sont encomiables, “sa complexité et le risque de superpositions et inconsistencias peuvent socavar les avances dans le champ de l'IA par part des acteurs industriels de l'UE. Les différences entre les Été membres en l'implémentation et accomplissement du RGPD, ainsi que les superpositions et zones de possible inconsistencia avec les dispositions de la Loi d'IA crear le risque de que les entreprises européennes soient exclues des innovations tempranas en IA en raison de l'incertitude des cadres regulatorios, ainsi que à des majeures charges pour les chercheurs et innovateurs de l'UE pour développer IA de fabrication propre.” Le rapport Draghi indique qu'il est précis “développer des normes simplifiées et faire accomplir l'implémentation harmonisée du RGPD dans les Été membres, en même temps que s'éliminent les superpositions regulatorias avec la Loi d'IA. Ceci garantirait que les entreprises de l'UE ne soient pas penalizadas en le développement et l'adoption d'IA d'avant-garde.”
8 . Constats
L'utilisation de données massives et algoritmos d'apprentissage automatique ont chaque fois un papier un plus remarquable/remarquable en recherche économique. La collaboration entre des institutions publiques peut avantager l'utilisation et fusion des énormes bases de données administratives qu'augmenteraient la capacité de réaliser recherche économique détaillée et nouvelle. Pour sa part la croissante participation du secteur privé dans la génération de données utiles pour la recherche économique (évaluations de politiques publiques, suivi de l'économie à grande fréquence, etc.) Il fait de plus en plus important la collaboration public-privée dans l'exploitation de ces bases de données. Dans ce contexte, l'accès à microdatos bancaires fournit une des sources d'information avec majeure potentielle. ils ainsi le montrent foule d'études récentes qu'utilisent ce type de données pour analyser, avec grande granularidad et grande fréquence, phénomènes économiques très remarquables/remarquables comme les conséquences de la pandemia de COVID- 19 ou l'impact des politiques destinées à atténuer ses effets.
Jusqu'à fait peu d'ans l'exploitation pour l'évaluation de politiques publiques des données administratives des institutions publiques espagnoles il a très été éloigné de l'énorme avance que s'était en produisant dans autres pays. Dans les derniers temps il se remarque une majeure sensibilisation des institutions publiques à l'égard de l'importance des données administratives pour la recherche économique, bien que il encore reste beaucoup de chemin par parcourir dans la sensibilisation du public et les médias. Bien que nous portons assez délai à l'égard d'autres pays ces initiatives ouvrent une fenêtre d'occasion que, en dépenant de comment se concrétise, il peut produire une avance très significative en la qualité et importance de la recherche économique en Espagne.
Références
AIREF ( 2020 ), Opinion pour une stratégie d'accès à des données administratives, Opinion 1 / 20 , septembre.
Aspachs, O., Durante, R., García-Montalvo, J., Graziano, A., Mestres J., y M. Reynal ( 2022 ), “Real-Time Inequality and the Welfare State in Motion: Evidence from COVID- 19 in Spain,” Economic Policy, Volume 37 , Issue 109 , 165 – 199 .
Aspachs, O., Durante, R., García-Montalvo, J., Graziano, A., Mestres J., y M. Reynal ( 2021 ), “Tracking the impact of COVID- 19 on economic inequality at high frequency,” 16 ( 3 ),PLoS ONE, 2021
Card, D., Chetty, R., Feldstein, M., y Saez, E. ( 2010 ), Expanding Access to Administrative Data for Research in the United States. en: Schultze, C. L., and Newlon, D. (eds), Ten years and Beyond: Economists Answer NSF’s Call for Long-Term Research Agendas. National Science Foundation
Chetty, R., Friedman, J. Stepner, M. y the Opportunity Insights Team ( 2023 ), “The economic impact of COVID- 19 : evidence from a new public dataset built using private sector data,” Quarterly Journal of Economics, 1 - 61 .
García Montalvo, J. ( 2021 À), “Recherche économique et données massives: marchés, fins sociales et collaboration public-privée,” Cahiers Économiques de l'ICE, 102 ( 2 ), 69 - 85 .
García Montalvo, J. ( 2021 b), “Big Date et économie en temps réel: l'utilité des microdatos bancaires,” Rapport Économique et Financier d'EsadePol, # 29 , 20 - 26 , 2021 .
García Montalvo, J. ( 2021 c), “Date science et ses applications économiques: une perspective personnelle,” Chapitre 1 in Peña, Poncela et Ruíz (Eds.),Analyse Econométrico et BigDate , 2021 .
García Montalvo, J. ( 2014 ), “L'impact du big date dans les services financiers,” Papiers d'Économie Espagnole, 43 - 59 .
García Montalvo, J., García, A. y G. Mora ( 2007 ), “The Employment situation of Spanish university graduates some four years after graduation,” en U. Teichler (Ed.), Careers of University Graduates, 2007 , Springer Publisher, 103 - 121 .
García Montalvo, J. ( 2001 ), Éducation et emploi des diplômés supérieurs en Europe et en Espagne, Fondation Bancaja, 340 pages.
OpenSAFELY Collaborative et al. ( 2020 ), “OpenSAFELY: factos associated with COVID- 19 -related hospital death in the linked electronic health records of 17 million adult NHS patients,” Nature, Julio.
Teichler, U. (Ed.) ( 2007 ), Careers of University Graduates, Springer Publisher, 103 - 121 .