Conoce | Software Heritage: una Biblioteca de Alejandría del código fuente con 11.000 millones de ficheros

El científico Roberto Di Cosmo dirige un archivo que aspira a reunir las instrucciones de funcionamiento de todos los programas informáticos del mundo y ha conseguido que la Unesco declare al ‘software’ patrimonio cultural de la humanidad

Roberto Di Cosmo quiere reunir en un mismo lugar todo el código fuente del mundo. Esa especie de Biblioteca de Alejandría de la programación no puede tener ánimo de lucro y debe ser accesible para cualquiera, desde investigadores hasta empresas privadas o particulares. Que todos, o quienes quieran, conozcan la arquitectura de las aplicaciones informáticas que usamos ayudará a entenderlas y a mejorarlas. A generar más conocimiento, a la prosperidad de la sociedad.

Este año se cumplen cinco años desde que el sueño de este científico italiano afincado en París empezó a convertirse en realidad. Gracias a su empeño personal, la Software Heritage Inititative vio la luz en verano de 2016 en la sede del centro de investigación INRIA, ubicado en la capital francesa. Desde entonces ha recopilado más de 11.000 millones de ficheros únicos de más de 160 millones de repositorios. Todo ese código cabe en un petabyte (un millón de terabytes, que a su vez son 1.000 gigabytes), el equivalente a los datos que amasaría el Telescopio espacial Hubble durante 455 años. La copia maestra de ese superarchivo la tiene Software Heritage, aunque hay otras dos en los servidores en la nube de Microsoft (Azure) y de Amazon (AWS).

Di Cosmo y su equipo lograron que la Unesco declarara en 2017 al software patrimonio cultural de la humanidad, que debe preservarse como la música o la literatura. Y a eso se dedica Software Heritage, a cuya financiación contribuyen instituciones públicas como el Ministerio de Innovación de Francia y varias universidades, pero también bancos como Société Générale o empresas como Microsoft, Google, Intel o Huawei.

Fuente – elpais