OpenRefine就是这样的IDT工具,可以观察和操纵数据的工具。它类似于传统Excel的表格处理软件,但是工作方式更像是数据库,以列和字段的方式工作,而不是以单元格的方式工作。这意味着OpenRefine不仅适合对新的行数据进行编码,而且功能还极为强大。
数据清洗Data Cleaning:是尝试通过移除空的数据行或重复的数据行、过滤数据行、Openrefine数据集转换工具,http://openrefine.org,聚集或转换数据值、分开多值单元等,以半自动化的方式修复错误数据的过程。数据清洗是一个反复的过程,不可能在几天内完成,只有不断的发现问题,解决问题。对于是否过滤,是否修正一般要求客户确认。
Openrefine数据集转换工具是一个帮助用户转换数据集的工具,优化数据的质量以便于在真实场景中使用,你的数据是杂乱无章的。错误会散步到你的大数据集中,无论你有多么细心,Openrefine数据集转换工具错误总是存在。数据量越大,错误越多。正确且清晰地认识以上的现状,于是有了数据质量的说法。
美国,电脑网络,软件,Openrefine数据集转换工具官网:http://openrefine.org