数据存放
数据存放
作者: 来源: 时间:2015-12-28 09:35
中国调查数据资料库(以下简称资料库)鼓励研究机构或研究者个人存放各个领域的调查研究数据。数据存放者和使用者可以通过“北京大学开放研究数据服务平台”免费访问数据库。存放的数据将被列入数据平台的电子目录,实现对项目信息文本的在线搜索。
如果您存放的数据资料不需要资料库做任何监护处理和服务管理,以便及时公布,请您直接到“北京大学开放研究数据服务平台”[g1] 自行发布。
如果您委托资料库负责数据资料的管理监护和发布服务,请您按照以下流程完成数据存放。
一、 签署《数据资料存放协议》
1. 请您认真阅读《数据资料存放协议》,了解协议中规定的资料库和数据存放方的权利与义务。
2. 如果您同意协议中的条款,请打印《数据资料存放协议》(下载)并签字盖章。
二、 准备数据集
资料库倾向于接收经过清理、机器可读、文档完整准确的数据集,同时资料库也愿意向存放方提供数据清理、数据规范化、数据整理等方面的帮助。
在数据资料发布前,通常要经过以下步骤。
1. 删除个人身份识别信息。出于保护受访者隐私权以及尊重科学研究基本伦理的目的,所有的个人身份识别信息(如姓名、 住址、电话号码、QQ号等)在数据存入前均应从数据集中删除。一旦数据向公众发布,个人隐私的泄露将不可逆转,会造成诸如受访者受到伤害、法律纠纷等恶劣影响。
2. 规范化和整理数据。数据集格式要规范,如包含变量和值标签的 SPSS、SAS或 Stata 格式数据集,或具有完整格式信息的原始数据文件
3. 清理数据。数据集要经过基础的清理工作,如离散型变量没有变量标签以外的值,连续型变量没有极端离群值,缺失值定义清晰。
4. 准备调查问卷。调查问卷要和数据集同时发布,以方便数据使用者了解数据。调查问卷如果不能提供电子版本,可以提交纸质打印版。
5. 准备其他相关文件。丰富的文件资料将帮助数据使用者更好的理解和使用数据,因此有利于数据共享和提高数据使用率。我们鼓励存放方尽可能多的提供与数据集相关的文档,例如用户使用手册、抽样设计与实施技术文档、应答率计算文档、数据清理文档、权重计算文档以及基于提交数据集撰写的文章或报告。
三、 填写《数据存放登记表》
1. 《数据存放登记表》(下载)第一部分用于确认数据存放协议,以确保数据存放方认真阅读并签署数据资料存放协议。第二部分是关于数据存放者的信息,以明晰数据集的知识产权。第三和第四部分是对存放数据的详细描述,帮助数据使用者全面了解数据集,并且方便数据管理者提取元数据,实现数据库内的在线搜索。第五部分是存放数据的格式和文档类型。第六部分涉及数据的敏感性和使用限制。第七部分包含第一部分至第六部分没有涉及的有关数据存放的其他信息。最后是数据资料存放清单和发送地址。
2. 《数据存放登记表》需在文档中填写完毕后打印,并在第一部分“数据存放协议确认”后签名。
四、 发送数据资料
1. 请将已签署的《数据资料存放协议》和《数据存放登记表》中“数据存放协议确认”页的原件邮寄到资料库。
2. 请将填写完整的《数据存放登记表》电子版用电子邮件发送到资料库。
3. 我们接受多种媒体格式提供数据资料,包括与 IBM 兼容的磁盘和光盘,USB移动存储设备,或电子邮件的附件。
您在准备数据存放资料过程中如遇到问题,欢迎您联系我们,我们会尽力提供帮助。您提交的数据集及文件将会得到妥善保存。