东南大学硕士学位论文
术语描述
一的缩写数据抽取、转换、装载的过程。
东南大学计算机科学与工程系数据库组实现的工具。
根据 的定义 “数据仓库是面向主题的、集成的、稳定的、随时间变化的主要用于决策支持的数据库系统” 。
元数据。描述数据的数据指在数据仓库建设过程中所产生的有关数据源定义 目标定义转换规则等相关的关键数据。
利用网络协议 等或文件协议等在源和目标系统之间移动数据利用内存等在处理各组件中移动数据。
东南大学硕士学位论文
首先要设计出一种基于规则的交互式数据清洗框架并对其中的领域知识和清洗规则的表示、定义和执行加以详细阐述其次研究在已有领域知识的情况下如何实现自动检测数据中存在的错误和不一致并且需要研究相似重复记录处理的框架和相关算法作为必不可少的一部分最后要讨论如何提供元数据管理功能使得用户能够实现元数据统一管理和元数据交换。
本文余下部分是这样安排的
第二章提出一个基于规则的交互式数据清洗框架并扼要描述了该框架。
第三章详细阐述清洗规则的表示、交互式定义和执行进一步深化清洗框架 同时阐述领域知识的表示方法。
第四章讨论了清洗框架中的数据分析模块的实现方法。
第五章中将相似重复记录问题单独提出来进行分析和处理。描述了相关算法并提出了基于专家系统的相似重复记录处理子框架。
第六章阐述了数据转换和清洗工具必不可少的基于标准的元数据管理及其功能框架。
第七章对全文做了总结。
BuyVM在昨天宣布上线了第四个数据中心产品:迈阿密,基于KVM架构的VPS主机,采用AMD Ryzen 3900X CPU,DDR4内存,NVMe硬盘,1Gbps带宽,不限制流量方式,最低$2/月起,支持Linux或者Windows操作系统。这是一家成立于2010年的国外主机商,提供基于KVM架构的VPS产品,数据中心除了新上的迈阿密外还包括美国拉斯维加斯、新泽西和卢森堡等,主机均为1Gbps带...
有一段时间没有分享Gcore(gcorelabs)的信息了,这是一家成立于2011年的国外主机商,总部位于卢森堡,主要提供VPS主机和独立服务器租用等,数据中心包括俄罗斯、美国、日本、韩国、新加坡、荷兰、中国(香港)等多个国家和地区的十几个机房,商家针对不同系列的产品分为不同管理系统,比如VPS(Hosting)、Cloud等都是独立的用户中心体系,部落分享的主要是商家的Hosting(Virtu...
已经有一段时间没有分享阿里云服务商的促销活动,主要原因在于他们以前的促销都仅限新用户,而且我们大部分人都已经有过账户基本上促销活动和我们无缘。即便老用户可选新产品购买,也是比较配置较高的,所以就懒得分享。这不看到有阿里云金秋活动,有不错的促销活动可以允许产品新购。即便我们是老用户,但是比如你没有购买过他们轻量服务器,也是可以享受优惠活动的。这次轻量服务器在金秋活动中力度折扣比较大,2G5M配置年付...