Ciència i paritat de gènere. El congrés d’arxivística com a mirall d’un biaix preocupant.

26 abril, 2023 - Julio Quílez, coordinador del comitè científic del 19è congrés d’arxivística de Catalunya.

És necessari aturar-se a reflexionar sobre la paritat de gènere en el cas dels i de les ponents, un aspecte abastament debatut en el comitè científic.

A una setmana de la celebració del 19è congrés d’arxivística de Catalunya i amb el programa totalment tancat, és necessari detenir-se a reflexionar sobre la paritat de gènere en el cas dels i de les ponents, un aspecte abastament debatut en el comitè científic. Així, les primeres xifres no conviden a l’optimisme; més aviat al contrari. I és que de les 52  persones que intervenen –sense comptar  la representació de les empreses que participen en els showrooms- 34 són homes (un 65,4%) i 18 dones (34,6%).  Aquestes dades són encara més decebedores si es té en compte que la participació de les dones en cap cas supera a la dels homes en les diferents tipologies d’intervenció i només s’aconsegueix la paritat en un parell de casos. Així, si realitzem una anàlisi desagregada, de les 15 ponències, 11 les realitzen homes (64,7%) i només 6 dones (35,3%); en el cas de les experiències, la disparitat és encara més accentuada amb 18 homes (81,4%) i només 4 dones (18,2%). Només s’assoleix l’equilibri en el cas de les taules rodones així com en l’única presentació del congrés, amb 9 i 1 participants per cada sexe, respectivament. 

Si traslladem el focus a les persones de procedència estrangera, la diferència es redueix però a favor també dels homes: 9 homes (56,25%) i 7 dones (43,75 %). Hem de recórrer a una anàlisi del nivell de responsabilitat en el cas de les taules rodones, entesa com l’exercida pel càrrec de qui modera, per trobar una inversió radical de l’estadística; així, en la moderació de les 4 taules rodones, 3 són dones (75%) i només 1 home (25%). Tot i això, la tendència a la disparitat s’imposa de forma aclaparadora a favor dels homes en el cas de la taula rodona del dia 6 de maig que aplega una representació d’alt nivell institucional, amb un 80% d’homes i només un 20 % de dones –un fet molt significatiu i demostratiu del sostre de vidre del món laboral- que es compensa amb el mateix percentatge a favor, en aquest cas, de les dones en la primera de les taules rodones del congrés –aula polivalent, 4 de maig- integrada exclusivament per joves professionals de l’arxivística  i que podria ser indicatiu d’un canvi de tendència. 

A la vista dels resultats convindria plantejar-se un seguit de qüestions legítimes: ha existit un cert biaix en la tria de les persones per part dels i les integrants del comitè científic? S’ha treballat prou en la selecció paritària dels i les intervinents al congrés? 

La resposta a aquesta darrera pregunta és afirmativa atès que les alertes sobre la descompensació en matèria de gènere han estat una constant al llarg de les sessions de treball del grup, per la qual cosa considero que és necessari analitzar la situació de la correlació de gènere dins de l’àmbit acadèmic i, especialment, en el camp de les ciències com a resposta a la primera de les qüestions. Aquesta anàlisi s’abordarà a dos nivells: un més superficial, de context, sobre la situació de la segregació de gènere dins de l’àmbit científic i un altre molt més acurat en el cas d’un dels àmbits temàtics prioritaris del congrés. 

L’actual congrés d’arxivística és, probablement, el congrés més orientat al camp de les ciències de la computació de la seva història, motiu pel qual, bona part de les ponències i intervencions provenen de l’òrbita de les ciències de la computació que s’integren dins dels àmbits STEM (acrònim en anglès de ciència, tecnologia, enginyeria i matemàtiques), àmbits on tradicionalment la preponderància dels homes és molt superior a les de les dones. Aquesta realitat es manifesta en el camp laboral així com, especialment, en l’acadèmic, on té una forta repercussió en el nombre de publicacions científiques portades a terme per representants del gènere femení, sempre molt inferior al del gènere masculí. Existeixen estudis que posen de manifest aquesta realitat i que són la base de plans d’acció a escala governamental. Així, per exemple, en el cas espanyol, el nombre d’estudiants matriculats en carreres d’informàtica és d’un 86% en el cas dels homes; en el món de la recerca, només el 6% de les joves investigadores s’inscriuen en el camp de l’enginyeria i la tecnologia. Les xifres a escala internacional segueixen els mateixos patrons. A Catalunya, les dones representen només el 25% de l’alumnat en carreres STEM i només el 28% en la direcció de grups de recerca en l’àmbit de les ciències de la vida i la salut. Les causes d’aquests biaixos són múltiples i cal posar el focus en trencar el sostre de vidre de gènere així com treballar en el camp del foment de les dones en la formació STEM des dels estudis d’ensenyament primari. Per tant, el congrés és un reflex d’una menor representativitat de les dones en el món tant acadèmic com laboral, on són menys freqüents les seves publicacions així com són menys visibles en l’àmbit professional. 

Però si aquestes dades són prou significatives, una anàlisi d’un dels àmbits principals del congrés com és el de les tecnologies semàntiques és encara més revelador. Per portar-ho a terme, s’ha  procedit a l’estudi del principal repositori d’ontologies a escala internacional en el marc de la iniciativa Linked Open Data (LOD): Linked Open Vocabularies (LOV). 

Linked Open Vocabularies és una eina iniciada al llarg del mes de març de 2011 com a part del projecte de recerca DataLift en el marc de l’Open Knowledge Foundation. En l’actualitat es troba administrat i mantingut per l’Ontology Engineering Group de la Universitat Politècnica de Madrid des del que s’han realitzat contribucions importants al seu desenvolupament especialment per una enginyera, María Poveda. LOV permet la publicació, descobriment i reutilització d’ontologies, procés fonamental per fer accessible i harmonitzar la descripció de la semàntica de les dades en el marc concret de LOD però, en general, en el si de tot l’ecosistema d’aplicacions i desenvolupament del Web Semàntic. 

L’anàlisi es va portar a terme entre els mesos de febrer-abril de 2023. Mitjançant el punt d’accés SPARQL, es van descarregar la totalitat de les ontologies així com, posteriorment, es va recollir la informació relativa a l’autoria com a la profunditat i extensió d’aquestes. Les dades són sorprenents i abunden en la confirmació de la disparitat de gènere ja descrita. 

De les 783 ontologies o vocabularis disponibles, 146 informen de la seva autoria a nivell exclusivament institucional; en 635 s’indica els noms i cognoms dels desenvolupadors i únicament en 2 casos no consta menció d’autoria. En total, l’autoria en el seu conjunt està conformada per 1.027 autors i autores, dels quals 630 són homes (61,3%); 151 dones (14,7%); 222 institucions (21,7%) i 24 casos on no s’ha pogut identificar el gènere a conseqüència de la utilització exclusiva d’abreviatures. El percentatge entre homes i dones denota una clara inclinació a favor dels primers; així, de les 781 persones que consten com autores, un 80,66% són homes i només el 19,3% el conformen dones. Aquesta disparitat s’incrementa quan s’examina l’autoria de les ontologies exclusivament per gèneres: 443 ontologies desenvolupades només per homes davant de 29 dissenyades exclusivament per dones, és a dir, un 56,6% i un 3,7%, respectivament, de totes les ontologies existents al repositori semàntic. Tenint en compte que en 222 de les ontologies només consta exclusivament l’autoria de forma institucional és raonable concloure, per extrapolació, que d’haver disposat dels noms dels autors i autores aquesta desproporció seria encara més àmplia. 

Pel que fa a les ontologies de desenvolupament compartit per gèneres –desenvolupament mixt- consten 163 (20,8%) de les que només 23 (2,94%) compten amb una participació de dones superior a la dels homes; 19 (2,42%) igual nombre de participants per sexes i 52 (6,6%) més homes que dones. Així mateix, el nombre d’ontologies on participen dones és de 192 (24,52% ) i on participen els homes és de 606 (77,39%).

Des del punt de vista de la contribució d’homes i dones al desenvolupament d’ontologies sobre el total d’autors no institucionals (781 autors i autores), 223 (28,5%) homes i 51 (6,53%) dones consten com a autors de més d’una ontologia mentre que 399 (51%) homes i 99 (12,7%) dones consten com a autors d’una única ontologia. 

Un fet interessant és analitzar la riquesa semàntica de les ontologies en funció de la contribució per gèneres i partint de les dades ja desglossades. La riquesa semàntica i abast d’una ontologia ve determinada, fonamentalment, pel nombre de classes o conceptes; les propietats d’objecte o relacions així com els individus o instàncies. El conjunt dels 783 vocabularis o ontologies de LOV sumen 35.490 classes, 42.082 propietats d’objecte, 221 propietats de dades i 13.710 instàncies. Partint d’aquestes xifres, es pot valorar l’aportació per sexes. Així, les ontologies dissenyades exclusivament per homes (443) representen respecte a les desenvolupades per dones (29): 16.786 classes (47,3%) davant de 632 (1,8%); 34.302 propietats d’objecte –relacions- (57,7%) davant de 495 (1,2%) i 6.685 instàncies (48,8%) davant únicament 102 (0,74%). En el cas de les ontologies desenvolupades amb participació d’homes (606) i dones (192), les dades, demostren un més que evident desequilibri: 26.807 classes (75,5%) davant de 10.653 (30%); 31.602 propietats d’objecte (75%) davant de 7.795 (18,5%) i 11.928 instàncies (87%) davant de 5.345 (39%). 

Tot i que no es tracta d’una anàlisi exhaustiva del repositori, es podria realitzar una aproximació a la contribució per gèneres al desenvolupament d’ontologies que cobreixen l’activitat de les GLAM (per les seves sigles en anglès, arxiu, biblioteques, museus i galeries). S’han identificat com a ontologies GLAM totes les resultants de les extensions de CIDOC CRM (FRBR, FRAD, FRBRER), en el cas dels museus; BIBFRAME i la família de les RDA (biblioteques) així com l’ontologia RIC-0 en el cas dels arxius. Així mateix, també s’han inclòs d’altres més específiques orientades a àmbits concrets, com LOCAH, o bé d’altres –més dubtoses- que descriuen la forma de tractar recursos d’informació des d’una perspectiva més genèrica, d’entre els que destacaria DCterms, probablement l’aportació més important i decisiva dels  i les professionals de les ciències de la informació –de l’àmbit de les biblioteques en aquest cas- al desenvolupament del Web Semàntic. En total s’han identificat 49 ontologies GLAM que representen el 6,2% del total d’ontologies en LOV amb una semàntica definida per un total de 1.333 classes (3,7%); 6.084 propietats d’objecte (14,45%) i 128 instàncies (0,93%). El nombre total d’autors d’aquestes 49 ontologies és de 73, dels quals 55 són de tipus persona i la resta institucions. Per gèneres, sobre els 55 indicats, consten 38 homes que representen el 69,9% i 17 dones amb el 30,9%. 

Però, malgrat aquestes dades tant decebedores cal destacar que dins de l’àmbit de l’enginyeria ontològica consten dones amb una aportació extraordinàriament rellevant. Un cas seria Deborah Mcguinness, una de les primeres personalitats implicades en el desenvolupament del Web Semàntic i, en el cas concret dels arxius, Florence Clavaud, presidenta del grup EGAD i autora de l’ontologia Records In Context la qual participarà al congrés amb un seguit de novetats de la pròxima versió que apareixerà al llarg d’aquest mes de juny. 

Com a conclusió, les xifres de participació de dones al congrés són superiors en tots els casos als de la seva presència dins de l’àmbit STEM, com a marc de referència global, i també molt significativament per sobre del camp de l’enginyeria ontològica, com a camp d’anàlisi concreta. En aquest darrer cas, el percentatge de participació de ponents femenines al congrés és molt superior a tots els indicadors analitzats amb uns 20 punts percentuals de diferència en la majoria dels casos; l’única excepció la constitueix la relació entre homes i dones en el desenvolupament d’ontologies GLAM on la xifra ascendeix al 30,9%, inferior en tot cas al 34,4% de dones del congrés. 

D’altra banda, calen molts més estudis i més aprofundits en relació amb la segregació per gènere. En el cas del present article i en relació amb LOV, l’anàlisi no és completa atès que no s’han tingut en compte l’edat dels dissenyadors i dissenyadores de les ontologies –seria motiu  d’una investigació paral·lela atès que no queda recollida a les metadades del repositori-, que poden aportar llum sobre el sostre de vidre, el nivell de responsabilitat, la formació, l’evolució de les polítiques de gènere en funció de l’edat, de la procedència geogràfica, etc. 

Finalment, cal reflexionar sobre els biaixos en la representació del coneixement. Si tenim en compte que les ontologies són representacions de la realitat sotmeses a la interpretació dels humans que imprimeixen un primer nivell de biaix a raó de la seva idiosincràsia, un factor preocupant és que a dins d’aquesta distorsió es troba la del biaix de gènere, és a dir, que segons les dades procedents de LOV, ara mateix la realitat està sent dibuixada, en la seva immensa majoria, per homes. No cal insistir en el fet que aquesta disfunció té un impacte directe en la manera en què les màquines, a través de la intel·ligència artificial, processen i infereixen coneixement en un entorn invisible i transparent als humans que al seu torn incrementa i retroalimenta aquesta visió esbiaixada malgrat tot els esforços polítics i socials. Tot un espai obert per al debat. 

Deixa un comentari

L'adreça electrònica no es publicarà. Els camps necessaris estan marcats amb *