基础设施


组织

主办机构

Zenodo由欧洲核子研究组织(CERN)托管,欧洲核子研究组织(CERN)自1954年成立以来,目前已为未来20多年定义了一项实验计划。欧洲核子研究组织是高能物理的存储机构,并以其在开放存取方面的开拓性工作而闻名。 Zenodo在组织上嵌入了IT部门,协作设备和应用程序组,数字存储库部分(IT-CDA-DR)。

Zeno由欧洲核子研究组织(CERN)提供,作为其使命的一部分,以提供其工作成果(《欧洲核子研究组织公约》第二条第1款)。

法律地位

欧洲核子研究组织是一个政府间组织,在所有欧洲核子研究组织成员国的大都市地区均具有法人资格(《欧洲核子研究组织公约》第九条),并享有国际公法的相应法律行为能力。

作为一个政府间组织,CERN享有某些特权和豁免权,例如享有国家法院管辖权的豁免权,以确保我们独立于各个会员国。这并不意味着CERN会在某种法律真空中运作,因为协议要求CERN通过其他方式解决其争端。在中阅读有关CERN的法律地位的更多信息 欧洲核子研究组织公报.

合法文件:

资金

Zenodo由以下机构资助:

Zenodo是作为边缘活动而开发和支持的,并托管在CERN的现有基础结构和服务之上,以降低运营成本并依靠现有的高能物理努力。欧洲核子研究组织(CERN)在运行大规模研究数据基础架构和我们依赖的数字存储库方面拥有一些世界顶级专家,以提供可信赖的数字存储库。

员工

Zenodo目前由以下公司运营:

  • 方向盘: 亚历山德罗斯·约阿尼迪斯-潘托普科斯,Jose Benito Gonzalez Lopez,Lars Holm Nielsen,Tim Smith
  • 服务经理: 亚历山德罗斯·约阿尼迪斯-潘托普科斯
  • 馆长: 斯蒂芬妮·范·德·桑特
  • 开发人员: 弗朗索瓦·Decourcelle,乔治·里格诺斯

但是,Zenodo隶属于一个更大的团队,由Jose Benito Gonzalez Lopez领导,该团队运营诸如 欧洲核子研究组织文件伺服器, 欧洲核子研究组织开放数据,CERN Analysis Preservation,我们在很大程度上依赖于通过 静脉数字图书馆框架.

会员资格

欧洲核子研究组织是以下组织和国际机构(非详尽无遗)的积极成员:

  • 数据城
  • ORCID
  • FORCE11(特别是数据引用原则和软件引用原则)
  • 研究数据联盟
  • SCOAP3

我们是多个由欧盟委员会资助的项目的合作伙伴,其中包括:


技术

Zenodo由 欧洲核子研究组织数据中心静脉数字图书馆框架 并一直在开源产品上完全运行。

从物理上讲,Zenodo的整个技术基础设施均位于CERN的场所内,并受CERN的法律地位约束(请参见上文)。

服务器管理

Zenodo服务器通过以下方式管理 OpenStack的木偶 配置管理系统,可确保我们的服务器始终具有最新的安全补丁。服务器通过CERN的基于Flume,Elasticsearch,Kibana和Hadoop的监视基础结构进行监视。应用程序错误被记录并聚集在本地 哨兵 实例。通过DNS负载平衡和HAProxy负载平衡器的组合来平衡对Zenodo前端服务器的流量。

此外,我们正在运行两个独立的系统:一个 生产 系统和一 质量保证 系统。这确保了在应用到我们的生产系统之前,可以在我们的质量保证系统上对所有更改(无论是基础结构级别还是源代码级别)进行测试和验证。

前端服务器

Zenodo前端服务器负责运行基于Python和Flask Web开发框架的Invenio存储库平台应用程序。前端服务器在应用程序的前面运行nginx HTTP服务器和uwsgi应用程序服务器,另外,nginx还负责提供静态内容。

数据存储

上传到Zenodo的所有文件都存储在CERN的 EOS服务 在一个18 PB的磁盘群集中。每个文件副本都有两个位于不同磁盘服务器上的副本。

对于每个文件,我们存储两个独立的MD5校验和。一个校验和由Invenio存储,用于检测从Invenio外部进行的文件更改。另一个校验和由EOS存储,并用于自动检测和恢复磁盘上的文件损坏。

Zenodo可能会根据未来的访问方式,将档案和/或在线副本移至CERN的离线长期磁带存储系统CASTOR,以最大程度地降低长期存储成本。

EOS是大型强子对撞机(LHC)的物理数据的主要低延迟存储基础架构,CERN当前正在运行多个实例,总计150+ PB的数据,预计每年以30-50 PB的速度增长。 欧洲核子研究组织的CASTOR系统目前管理100 PB以上的LHC数据,这些数据会定期检查是否存在数据损坏。

静脉在EOS之上提供了一个对象存储,例如文件管理层,它负责例如版本更改为文件。

元数据存储

Zenodo中的元数据和永久标识符存储在PostgreSQL实例中,该实例在CERN的按需数据库基础架构上运行,备份周期为12小时,每周一次将备份备份到磁带存储中。此外,元数据在Elasticsearch集群中建立索引,以进行快速而强大的搜索。元数据以版本JSONSchemas描述的结构以JSON格式存储在PostgreSQL中。 Zenodo上对元数据记录的所有更改都是版本化的,并且发生在数据库事务内部。

除了元数据和数据存储外,Zenodo还依靠Redis进行缓存,并依靠RabbitMQ和python Celery进行分布式后台作业。


安全

我们非常重视安全性,并尽力保护您的数据。

  • 欧洲核子研究组织数据中心:我们的数据中心位于欧洲核子研究组织的所在地,所有物理访问仅限于接受过适当培训且根据其专业职责被授予访问权限的有限数量的工作人员(例如Zendo工作人员无法实际访问CERN数据中心)。
  • 服务器:我们的服务器是根据CERN服务器安全基准进行管理的,例如只有经过适当培训的Zenodo员工才能远程访问我们的服务器,并且通过我们的自动配置管理系统Puppet可以使用最新的安全补丁来更新操作系统和已安装的应用程序。
  • 网络:CERN安全团队同时运行基于主机和网络的入侵检测系统,并监视进出CERN网络的流量,模式和内容,以检测攻击。除托管在GitHub Pages上的静态文档页面外,对zenodo.org的所有访问均通过HTTPS进行。
  • 数据:Zenodo使用强大的加密密码哈希算法(当前为PBKDF2 + SHA512)存储用户密码。用户对GitHub和ORCID的访问令牌已加密存储,只能使用应用程序的密钥解密。
  • 应用程序:我们采用了一套技术来保护您的会话,使其在您登录并对该应用程序运行漏洞扫描时不会被攻击者窃取。
  • 员工:有权访问用户数据的CERN员工在 欧洲核子研究组织操作通告5,这意味着
    • 除非明确履行职责,否则员工不得相互交换所获取的信息。
    • 访问用户数据必须始终与专业职责保持一致,并且仅允许用于解决问题,检测安全问题,监视资源等。
    • 工作人员应对因侵权而造成的损失负责,并且可以根据侵权的严重性撤回和/或受到纪律处分或法律诉讼。

关于封闭访问数据的特别说明

Zenodo允许用户在封闭访问下上传文件。封闭访问意味着zenodo.org用户将无法访问您上传的文件。但是,文件未加密存储,并且 可能 Zenodo运营人员会在特定条件下对其进行查看。这意味着Zenodo上的“封闭通道” 不是 适用于机密或机密数据。