一、数据仓库技术与应用(论文文献综述)
刘志平[1](2020)在《达州银行数据仓库系统的准实时客户行为模型研究》文中进行了进一步梳理达州银行是四川省东北部的城市商业银行。它既有发展的必然性,也存在发展的局限性,它是市场的产物,却又有地域的限制。相比于国内外大中型商业银行,它晚发展数十年,无论在技术上,还是业务上,都处于起步阶段,也是蓬勃发展的阶段。在发展的过程中,出现了许多技术上的问题和业务上的问题。本文以达州银行数据仓库系统为研究对象,阐述如何解决达州银行在发展过程中遇到的一些问题。本文主要研究内容如下:(1)研究Shark Start工具的批量数据自动匹配采集方法。以Shark Start工具的点对点手工配置采集为基础,研究Shark Start工具的批量数据配置采集方法、自动匹配采集方法与非法字符的预处理方法,降低人工干预,缩短开发周期,提高开发效率。(2)研究基于银行传统数据仓库系统的准实时客户行为主题模型。采用Hadoop大数据技术,包含Kafka实时数据采集技术、Stream实时数据分析技术、Map Reduce实时数据计算技术、HDFS实时数据存储技术,对客户行为数据进行实时加工处理。再结合银行传统数据仓库系统的静态数据主题模型,研究准实时客户行为主题模型,实现银行数据仓库系统的动态与静态为一体的数据主题模型,提高业务数据的综合使用价值。(3)研究数据可视化技术。以Moia Visual工具的静态表格形式的数据可视化为基础,研究在Moia Visual工具中集成可以动态图形化的永洪BI可视化开发工具,提高准实时数据可视化的展现效果。本文建立在上述研究内容的基础之上,主要研究成果和创新点如下:(1)提出了一种基于银行数据仓库系统的准实时客户行为主题模型。针对客户行为分析需求,在传统的静态数据模型基础上,设计了结合数据仓库动态客户数据的主题分析模型,初步实现了准实时客户的行为分析,为客户行为分析提供了更能反映实际情况的手段。(2)提出了一种基于Shark Start的数据批量自动匹配采集方法。在Shark Start数据采集功能基础上,使用了Excel模板配置,采用了Python和SQL技术,改进了原系统的数据采集方式,实现了数据的批量自动采集功能,提高了数据采集的效率。综上,通过对达州银行数据仓库系统的建设,解决了ETL过程中存在的技术问题;解决了数据可视化过程中存在的技术问题;完成了准实时客户行为主题模型设计;实现了高管驾驶舱准实时数据可视化运用;实现了行内综合报表和监管报表的静态数据可视化运用,提高了市场竞争力,防范了经营风险,满足了人民银行的监管要求。
许诗怡[2](2020)在《森林资源数据仓库管理系统研建与数据分析应用技术研究》文中提出本研究首先论述了森林资源异构数据集成以及数据仓库技术在林业上的研究现状。森林资源数据仓库在实际应用中还面临着以下两大问题:一是数据存储存在差异,且数据表中的统计字段名称、类型、代码等的表达形式也存在差异;二是数据存储的差异性造成数据利用率不高,深层次的多维分析、数据挖掘等是基于规范化的数据进行的。针对这些问题,研究以历史上存储的森林资源数据为基础,针对森林生产功能分析、适地适树规则提取、生长收获预测模型拟合等的分析需求,设计建立了两个数据仓库:森林资源小班数据仓库以及标准地/样地数据仓库,并完成对两个数据仓库事实表、维度表字段结构的详细设计。通过对ETL技术的研究,实现对森林资源异构数据源的抽取、清洗和转换,并将处理后的规范化数据存储在目标数据仓库中进行统一管理。在此基础上,研建一个基于B/S体系架构的森林资源数据仓库管理系统。系统的主要功能包括异构数据源获取、森林资源异构数据的清洗转换、森林资源数据多维分析、数据挖掘等。本研究高效的利用已有的森林资源数据可以为林场等经营单位提供生长收获、抚育间伐、规则提取等方面的决策支持。
常有学[3](2020)在《基于智能制造的数据仓库的设计与实现》文中研究说明《中国制造2025》提出了建设制造业强国的目标,中国的制造业逐渐迈入智能制造时代。随着智能制造的发展和信息化建设的普及,制造业企业的智能终端、传感器和工业软件在生产中会产生海量的业务数据,这些海量的业务数据一般都具有大数据的基本特征,但是企业对这些工业大数据的存储和计算都相对困难。同时,在企业中信息化建设中,由于信息隔离、数据驳杂和标准不统一等原因,各个工业软件间数椐隔离,在企业中产生了“信息孤岛”现象。“信息孤岛”现象使得生产数据未得到充分整合和应用,严重制约了以数据为驱动的智能制造模式的发展。如何解决工业大数据的存储与计算问题,帮助企业消除“信息孤岛”现象,从海量的数据中找到有价值的信息,在企业智能制造的发展中具有重要的意义。针对上述问题,本文以制造业中仓储业务为例进行研究,采用大数据+数据仓库的方式对仓储历史订单数据进行处理和分析,主要解决数据存储、计算困难和数据不互通的问题。设计并实现了一个基于Spark+Impala的分布式数据仓库系统,对制造业仓储业务的相关数据进行统一处理,最后利用数据挖掘和可视化技术将工业软件中的数据进行应用,解决仓库货位摆放的问题,实现工业软件中数据的互联互通,为企业提供数据支撑的决策优化支持。本文所做的主要工作如下:(1)针对生产数据不规则、有缺失和异构等问题,设计并实现基于Kettle+Sqoop 的分布式ETL系统,对数据进行抽取、转换和加载,提高ETL速度的同时解决数据更新问题,实现数据的完整和统一。(2)针对生产数据中存储不一致的问题,设计并实现基于Spark+Impala的数据仓库系统,确定该系统中的多种事实表、维度表、维度模型和总体架构。使用 Spark和Hive对数椐进行转换,使用Impala对数据进行交互式查询,提高不同场景下的计算速度,实现数椐的统存储和快速查询。(3)针对工业数据难以共享和利用的问题,对数据仓库系统进行应用。首先对历史订单数据进行关联规划挖掘,以优化货位摆放位置,同时把货品和销量数据进行可视化展示,实现数据的共享和有利数据的挖掘。
田晚彤[4](2019)在《数据仓库和联机分析在医院数据决策分析的研究和应用》文中研究表明很多医院非常注重医疗服务信息化建设,医疗信息系统的大量应用提高了诊治过程和医疗服务的透明度,医疗质量得到较大提升。使用很长时间之后,这些系统中存在着大量数据,虽然这些历史数据与不断产生的新的数据之间还存在着关联性,但是因为受系统功能限制,数据并没有得到充分利用,其价值被忽视和浪费。因此,对于医院管理系统中的历史医疗数据进行数据清理,多维分析医疗业务并为管理者提供有价值的决策支持信息,成为各医疗机构开始重视的问题。本文研究了当前医院管理信息系统在数据使用中存在的问题,经过实地调研,了解了医院管理者的具体业务需求,利用数据仓库技术和联机分析技术设计数据仓库模型并对进行数据清理和分析。具体的解决方案是首先确定数据仓库主题,设计并搭建了数据仓库逻辑模型;其次,利用数据仓库数据清理工具对医院管理信息系统数据进行数据清理;然后,依据数据仓库主题,利用联机分析技术分析了医院管理者所关注的一些医院业务,结合SQL Server Analysis Services工具以图形化形式展示数据分析结果;最后,据此提出一些决策支持建议,为管理者的科学决策提供数据支持。本文设计的基于联机分析技术的数据仓库在运行期间表现良好,对医院管理信息系统多年积累的数据重新进行了数据清理,将医院业务中存在的业务需求以图形方式清晰展示给医院管理者,极大方便了用户从医院管理信息系统历史数据中发现有价值的信息,同时为医院管理者提供决策建议,具有较好的实用价值。
张申[5](2019)在《数据仓库技术在高校招生就业决策中的应用研究》文中提出随着科技的发展,社会已进入大数据时代,人们对信息的价值越来越重视,数据仓库的重要性达到了空前的高度。数据仓库是以数据库的技术为基础,在当下需要研究大量、多源、异构、动态的海量数据中,日益发展起来的。当下就业形势日益严峻,全国各个高校对招生就业的问题引起高度重视,学生选择高校的意向是什么,哪些专业的学生在什么样的工作部门就业率高,都是值得我们关注的焦点问题。本论文围绕如何更好地指导招生就业管理和决策提出一系列的问题,利用OLAP以及数据挖掘两项技术开展对论文数据的分析研究。首先,为了更好的、更合理的对数据仓库进行设计,本文运用了三种设计模型,分别是:物理模型、概念模型以及逻辑模型。同时,为保障数据仓库的顺利建立,本文处理了招生和就业两大系统的数据源,对招生和就业数据分别进行了抽调、转换、清洗、加载等工作。其次,本文在熟悉了解招生就业业务流程的基础上,针对录取情况、生源质量、各专业增减生源的数量以及各年龄层的招生就业数据仓库进行分类分析和OLAP处理,从而获得了更具说服力的结果。第三,为探寻招生就业数据仓库中各数据的内在联系,本论文利用三种数据挖掘算法,包括关联分析、决策树分析和聚类分析进行数据挖掘,主要对决策树分析进行了属性值空缺和简化熵算法的优化和改进,分析得出函授站点、录取年份、学历层次、成绩档次、文化程度及报到注册率之间都存在关联。统计分析以上OLAP处理和数据挖掘的结果,最终对高校招生就业决策提出了建议及策略。本文的研究将数据仓库技术应用在招生就业领域,从众多历史数据中发现了各种潜在的有价值的规则,从而进一步科学地指导就业、高效地开展招生宣传,这将有助于提高高校招生的质量以及毕业生就业质量,对整个高校的发展、提高生源人才质量具有重要的实践意义。
黄浩[6](2016)在《基于数据仓库的商品流通企业决策分析系统的研究与开发》文中指出本文基于商品流通企业原有的ERP系统,综合应用目前先进的数据仓库技术、OLAP技术、数据挖掘技术、HTML5网页设计技术和企业管理理论及模型,构建一个适用于商品流通企业的决策分析子系统,从而为企业的决策提供帮助。该系统的实施,有助于改变企业原有ERP中的集中式数据管理模式的局限,使得企业能够对企业的经营的状况有更深层次的把握,再在这个基础上提出有效的企业决策,从而提升企业的市场竞争力和实现利润的最大化。本文对数据仓库技术、OLAP技术和数据挖掘技术的最新进展进行了研究,在此基础上,通过综合运用数据仓库技术和供应链管理思想,来建立商品流通企业决策分析系统的系统框架。本文的商品流通企业决策分析系统解决方案所需的数据挖掘和联机分析处理均基于数据仓库技术,并通过对系统数据仓库和模型库的研究而形成。通过综合应用数据仓库技术、OLAP技术和关联规则数据挖掘Aporiori算法,对商品流通企业的商品采购信息、商品存储信息、商品销售信息和客户关系信息等海量营业数据进行数据挖掘,并把数据挖掘的结果通过HTML5进行了呈现。通过商品流通企业的实际应用,本文对应用中发现的问题进行了有针对性的改进,从而更加贴合企业的使用需求,增强了商品流通企业的分析与决策能力。本文在查询性能改进方面,通过采用聚合表、索引视图、界面异步执行等措施,使系统查询性能大幅提升,最高的项目甚至有超过1000%的提升。在体系结构方面,本文充分考虑了商品流通企业具有多个经营场所的情况,除了增加了数据缓冲区来提高数据仓库的性能外,还通过增加通用元数据层、ETL服务器和中间数据库,在各营业场所服务器上执行分布式预处理等措施,大大提升了系统的性能。另外,本文通过精心分析,采用维映射的方式实现了跨主题域的查询,解决了数据仓库应用中跨主题域查询的难题。利用本系统挖掘出的规则应用,商品流通企业可以制定合适的采购、销售和仓储策略。本系统可以对商品流通企业的客户购买行为进行挖掘分析,也可以对商品销售和采购的数据进行综合分析,这对于商品流通企业的客户划分、仓储管理以及促销政策制定,均有实际的指导作用。该系统的实施大大提高了企业的决策效率,例如企业原先需要花费一整天来进行备货决策,而启用该系统后,利用该系统提供的数据分析结果,可将备货决策缩短到一个小时内完成。
王汝林[7](2016)在《基于SAP BW中国生物财务数据仓库的设计与实现》文中认为在日益激烈的市场竞争中,医药企业越来越重视信息在企业中所发挥的作用。本文以中国生物技术股份有限公司(以下简称中国生物)为例,随着中国生物SAP (System Applications and Products)ERP (Enterprise Resource Planning)系统的运行,每天产生大量财务相关数据,受竞争环境的迫使,管理层需要将这些数据转化成分析决策信息,为企业发展提供决策支持。本文是以中国生物的商务智能(Business Intelligence, BI)系统即业务信息仓库(SAP Business Information Warehouse, SAP BW)的实施为基础,并与财务相关数据的联机分析处理(On-Line Analytical Processing, OLAP)相结合,达到为管理层提供可信可靠高效的分析报表的目的,作者完成以下工作:(1)对财务信息化的发展进行简要阐述,并对医药行业的数据仓库信息化建设情况从国内外进行研究分析,对商务智能,数据仓库技术进行研究综述,对SAP BW实施中的关键数据对象进行详细研究。(2)根据用户需求对中国生物财务数据仓库分析平台划分为四大主题域:总账、应付账款、应收账款和在建工程;并基于SAP BW对中国生物财务数据仓库进行了整体结构、概念模型、逻辑模型和物理模型的设计。(3)对基于SAP BW中国生物财务数据仓库进行实现,包括创建业务模型,通过ETL (Extract-Transform-Load)技术实现了数据的抽取、转换和装载。(4)通过SAP BW的业务浏览器工具实现了对财务数据仓库的查询和展现,并通过OLAP技术展现分析。本文为企业海量业务数据转换为分析决策信息提供了解决方案。本文中的理论具有通用性和代表性,对其他企业数据仓库的实施工作具有借鉴作用;SAPBW数据仓库又有其产品技术上的独特性,本文对技术的详细研究阐述,能够帮助技术人员学习到企业级主流数据仓库的设计架构理念。
徐璐[8](2015)在《基于数据仓库的客户关系管理系统研究》文中研究指明在市场经济迅速发展的这三十年,各大企业将客户作为服务的第一目标。此背景之下,客户关系管理(英文Customer Relationship Management,简写CRM)的营业需求出现了。客户关系管理的工作是以客户为中心开展运营,通过现代化IT技术基础,设计客户所需产品,优化相关服务规范,对用户做好挽留与吸引的工作。数据仓库计算对于客户关系管理来说,是系统的基础技术平台,几乎所有的客户关系运营都是围绕数据仓库来进行的。通过数据仓库的分析、运行,产生营销策略,发掘商机,配合销售部门、客户服务部门进行参与,提升企业的收入。数据仓库技术是计算机界最近几年的研究热点之一,并且在金融、电信、制造、保险、证券等领域得到了广泛的应用,技术也日臻成熟。目前,在国内,数据仓库技术在客户关系管理系统(CRM)中的应用还不成熟,在技术上有待改进和完善。论文根据本人对CRM和数据仓库技术的分析和研究,结合CRM对数据仓库技术需求,改进了数据仓库对应与在客户关系管理系统中的技术应用,并将这种应用的改进,用在电信运营商的CRM系统设计中得以体现。论文从分析数据仓库技术的现状入手,给出了一个完整的数据仓库定义,阐述了数据仓库的四个基本特征,分析和研究了数据仓库的数据索引、体系架构和数据管理方式,说明了本课题数据仓库的设计方法、步骤和数据模型。通过对CRM概念和内涵的分析研究,构建了CRM软件系统的业务和功能模型,结合CRM系统的构成和对数据仓库计算的应用场景进行了研究探讨,其中重点讨论了数据转移和数据的存储与管理在客户关系管理系统(CRM)中的改进及应用,并在研究CRM和数据仓库技术的基础上,结合某电信运营商CRM系统的应用场景需要和需求,构建了电信运营商客户关系管理系统的架构、功能和部分业务模型。最后,通过某电信运营商CRM数据仓库的设计,改进了数据仓库的用法。
俞忆青[9](2016)在《基于数据仓库的四重采集系统的设计与实现》文中提出随着社会信息化的高速发展,公安机关目前亟需解决的问题是如何将信息化发展过程中积累的结构异化、种类丰富、数量不断增长的海量业务数据进行有效的整合共享、消除信息孤岛,为一线实战提供强大的数据合成、分析和综合查询功能,满足公安机关从不同角度进行数据分析的要求。本文为解决这一难题,采用数据仓库技术,基于大量公安已建业务数据库,完成了四重采集系统的模型建立、框架设计、系统实现与验证,实现了从海量异构的业务数据中提取出四重数据并建立统一的数据仓库,为公安信息化工作提供统一、高效、全面的数据管理,可应用于公安信息分析研判、决策支撑等领域。本论文主要进行了以下几个方面的研究工作:1.本论文分析了当前公安信息化建设中存在的数据异构、信息孤岛、数据利用不充分、缺乏数据综合分析和决策能力等问题。整理了数据仓库的现状、常用的建模方法及数据集成的过程,研究了当前流行的ETL(即数据抽取Extract、转换Transform、装载Load)(简称ETL)工具特点。提出了基于数据仓库的四重采集系统的建设思路,为公安信息研判提供统一的数据基础。2.本论文对四重采集系统进行详细的需求分析,完成了主题分析、数据建模、功能模块分析和总体架构设计。系统使用Oracle数据库,采用基于JAVA技术实现的B/S架构,由重点对象、重点事件、重点阵地、重点群体等业务功能模块组成。3.本论文实现了基于数据仓库的四重采集系统。利用ETL工具对业务数据进行抽取、转换、清理和装载等数据集成过程,完成了数据仓库功能的实现,及重点事件、重点对象、重点阵地、重点群体等模块的设计与实现。4.本论文最后验证了四重采集系统的功能和性能。本论文通过对基于数据仓库的四重采集系统的研究,验证了该系统在公安信息分析研判及决策支撑系统中的可用性。该系统的应用对公安机关汇聚、关联、整合及管理四重数据,完成四重数据资源的深入挖掘,为公安机关信息分析、信息研判、科学决策构建坚实的数据基础并提供强有力的服务支持。有效地促进公安信息化应用的进一步深化,提升公安机关的核心战斗力,确保各项公安工作的可持续发展。
魏红雨[10](2014)在《基于4G地学空间数据集成关键技术研究》文中认为随着计算机和网络技术的飞速发展,地学研究也相应出现适应计算机和网络技术创新发展的新特点。20世纪中后期地理信息系统(Geographic Information System,简称GIS)引入地学研究后,地学数据集成与地学科学决策得到长足发展、取得丰硕成果,吉林大学地学G4I系统随之应运而生。本文所指4G地学空间数据,是对地质学(Geology)、地理学(Geography)、地球化学(Geochemistry)、地球物理学(Geophysics)数据(首字母都为G,简称4G)的统称。地学G4I系统研究所涉及4G地学空间数据具有多学科综合的特点,存在多元、语义和多维复杂空间结构等因素引起的异构问题,系统应用必须进行数据分析、处理、融合等集成操作以构建地学数据模型进而满足用户需求。数据集成操作因此成为地学研究的基本前提和必须步骤。特别是受4G地学空间数据在数据结构、空间模型与格式转换上的较大差异影响,数据共享难以有效实现。较好地研究解决数据集成面临的这些难题,可以大幅减少数据重复采集冗余,降低数据采集成本,充分挖掘数据信息,提高数据利用率,实现数据网络共享,增强经济效益。本文针对4G地学空间数据多源异构分布的特点和集成数据质量控制难的实际,在认真分析国际国内数据集成及其关键技术研究现状的基础上,采用地学空间数据仓库和数据质量评价控制等关键技术加以研究解决,并对空间数据质量保障及质量评价技术进行改进。该研究便于进一步数据挖掘和信息融合并利于4G地学空间数据共享操作的实现。现将本论文的工作和成果简述如下:1.数据集成技术研究现状阐明4G地学空间数据集成各主要方面的研究现状和发展趋势,提出4G地学空间数据集成中的关键问题及研究现状,说明解决4G地学空间数据集成的关键技术。2.4G地学空间数据特征研究讨论4G地学空间数据的来源,分析了4G地学空间数据特征,详细分析地学研究对4G地学空间数据集成的需求,讨论了集成结果的数据特征,讨论了4G地学空间数据的预处理,重点研究物探数据与化探数据的特征提取技术。3.应用数据仓库技术构建4G地学空间数据集成模型通过比较数据集成主要方法,指出应用数据仓库技术处理4G地学空间数据集成问题是可行的与必要的。根据4G地学空间数据特点和各种数据集成的方式,以及应用数据仓库技术进行4G地学空间数据进行数据集成的方案。根据数据仓库技术、中间件技术在集成数据时存在的各自优缺点,本文采用数据仓库和中间件相结合的方法。同时介绍应用数据仓库构建4G地学空间数据集成模型的方法流程,重点论述了地学地质数据仓库的设计架构,并通过SQL Server数据仓库工具进行实例验证。4.4G地学空间数据集成中的元数据研究概述元数据的定义、内容、作用、元数据研究现状及标准,重点讨论了数据集成中元数据的设计与元数据管理系统架构。5.4G地学空间集成数据质量控制体系研究讨论了4G地学空间集成数据质量及质量控制的概念,阐述4G地学空间集成数据质量问题的来源,提出4G地学空间集成数据质量评价标准,给出质量评价流程。重点介绍4G地学空间数据集成质量评价方法,根据集成数据自身存在的规律,分析集成数据过程中的常见误差,应用改进的层次分析法对4G地学空间数据质量进行评价,以达到数据质量控制的目的。本文的4G地学空间数据集成关键技术研究为数据集成和信息共享提供尝试性的方法,并为后续的数据挖掘和数据融合处理奠定了基础。文中的地质空间数据集成技术、元数据和数据质量控制技术等关键内容对地学G4I系统升级开发有所助益。同时,对于地学数据研究中的集成问题有一定借鉴作用。
二、数据仓库技术与应用(论文开题报告)
(1)论文研究背景及目的
此处内容要求:
首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。
写法范例:
本文主要提出一款精简64位RISC处理器存储管理单元结构并详细分析其设计过程。在该MMU结构中,TLB采用叁个分离的TLB,TLB采用基于内容查找的相联存储器并行查找,支持粗粒度为64KB和细粒度为4KB两种页面大小,采用多级分层页表结构映射地址空间,并详细论述了四级页表转换过程,TLB结构组织等。该MMU结构将作为该处理器存储系统实现的一个重要组成部分。
(2)本文研究方法
调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。
观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。
实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。
文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。
实证研究法:依据现有的科学理论和实践的需要提出设计。
定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。
定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。
跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。
功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。
模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。
三、数据仓库技术与应用(论文提纲范文)
(1)达州银行数据仓库系统的准实时客户行为模型研究(论文提纲范文)
摘要 |
Abstract |
第1章 绪论 |
1.1 研究背景 |
1.2 国内外研究现状 |
1.2.1 国外研究现状 |
1.2.2 国内研究现状 |
1.3 研究的来源 |
1.4 研究内容和研究成果 |
1.4.1 研究内容 |
1.4.2 研究成果和创新点 |
1.5 论文组织结构 |
1.6 本章小结 |
第2章 相关理论与技术概述 |
2.1 数据仓库概述 |
2.1.1 数据仓库产生 |
2.1.2 数据仓库特点 |
2.2 ETL技术 |
2.2.1 SharkStart背景 |
2.2.2 SharkStart技术 |
2.2.3 SharkStart算法 |
2.3 可视化技术 |
2.3.1 MoiaVisual背景 |
2.3.2 MoiaVisual技术 |
2.3.3 MoiaVisual功能 |
2.4 大数据技术 |
2.4.1 分布式文件系统 |
2.4.2 分布式计算框架 |
2.4.3 实时流技术 |
2.5 本章小结 |
第3章 基于数据仓库系统的准实时客户行为模型的需求分析 |
3.1 系统需求概述 |
3.2 准实时客户行为功能需求 |
3.2.1 数据采集需求分析 |
3.2.2 数据标准化需求分析 |
3.2.3 准实时客户行为主题模型需求分析 |
3.2.4 数据可视化需求分析 |
3.3 系统非功能需求 |
3.4 本章小结 |
第4章 基于数据仓库系统的准实时客户行为模型的设计 |
4.1 系统总体设计 |
4.2 系统结构设计 |
4.2.1 数据采集设计 |
4.2.2 数据标准化设计 |
4.2.3 准实时客户行为主题模型设计 |
4.2.4 数据可视化设计 |
4.2.5 数据库设计 |
4.3 本章小结 |
第5章 基于数据仓库系统的准实时客户行为模型的实现 |
5.1 数据仓库系统开发环境 |
5.2 数据仓库系统实现 |
5.2.1 数据采集实现 |
5.2.2 数据标准化实现 |
5.2.3 数据逻辑模型实现 |
5.2.4 数据可视化实现 |
5.3 实验结果与分析 |
5.3.1 SharkStart采集实验结果与分析 |
5.3.2 准实时数据可视化实验结果与分析 |
5.4 本章小结 |
第6章 基于数据仓库准实时客户行为的测试与应用 |
6.1 数据仓库系统测试 |
6.1.1 系统功能测试 |
6.1.2 系统非功能测试 |
6.2 数据仓库系统应用 |
6.2.1 准实时数据应用 |
6.2.2 静态数据应用 |
6.3 系统测试结果与分析 |
6.4 本章小结 |
第7章 结论与展望 |
7.1 结论 |
7.2 展望 |
致谢 |
参考文献 |
附录 |
(2)森林资源数据仓库管理系统研建与数据分析应用技术研究(论文提纲范文)
摘要 |
abstract |
1 绪论 |
1.1 研究背景及意义 |
1.2 国内外研究现状 |
1.2.1 森林资源异构数据集成的研究现状 |
1.2.2 数据仓库在林业上的应用研究 |
1.2.3 ETL技术的研究 |
1.2.4 OLAP技术的研究 |
1.2.5 林业数据挖掘技术的研究 |
1.2.6 小结 |
1.3 研究目标和内容 |
1.3.1 研究目标 |
1.3.2 研究内容 |
1.3.3 研究拟解决的关键问题 |
1.4 研究方法与研究技术路线 |
1.4.1 研究方法 |
1.4.2 研究的技术路线 |
1.5 研究数据 |
1.6 项目来源与经费支持 |
1.7 论文组织结构 |
2 研究的理论与技术基础 |
2.1 数据仓库技术 |
2.1.1 数据仓库的概念 |
2.1.2 数据仓库建模方法 |
2.2 ETL技术 |
2.3 OLAP技术 |
2.3.1 OLAP技术基本概念 |
2.3.2 多维分析的基本操作 |
2.4 数据挖掘技术 |
2.4.1 数据挖掘的概念 |
2.4.2 常用的森林资源数据挖掘算法 |
2.5 本章小结 |
3 森林资源数据仓库设计与构建 |
3.1 森林资源小班数据仓库设计 |
3.1.1 概念模型设计 |
3.1.2 逻辑模型设计 |
3.1.3 物理模型设计 |
3.2 标准地/样地数据仓库设计 |
3.2.1 逻辑模型设计 |
3.2.2 物理模型设计 |
3.3 本章小结 |
4 森林资源异构数据的ETL技术研究 |
4.1 森林资源异构数据ETL需求分析 |
4.2 数据抽取子模型 |
4.3 数据转换子模型 |
4.3.1 数据清洗模块 |
4.3.2 数据转换模块 |
4.4 数据加载子模型 |
4.5 本章小结 |
5 森林资源数据仓库数据分析实例 |
5.1 OLAP与数据挖掘 |
5.2 森林资源数据OLAP技术应用 |
5.2.1 多维数据立方体的建立 |
5.2.2 森林生产功能分析 |
5.2.3 龄组、林种多样性及动态变化分析 |
5.3 森林资源数据挖掘技术应用 |
5.3.1 适地适树规则提取 |
5.3.2 生长收获预测模型拟合 |
5.4 本章小结 |
6 森林资源数据仓库管理系统的研建 |
6.1 系统需求分析 |
6.1.1 用户需求分析 |
6.1.2 功能需求分析 |
6.2 系统结构设计 |
6.2.1 系统体系结构设计 |
6.2.2 系统功能结构设计 |
6.3 森林资源数据仓库管理系统运行实例 |
6.3.1 异构数据源获取 |
6.3.2 数据清洗、转换 |
6.3.3 数据仓库管理 |
6.4 本章小结 |
7 总结与展望 |
7.1 总结 |
7.2 展望 |
参考文献 |
个人简介 |
导师简介 |
致谢 |
(3)基于智能制造的数据仓库的设计与实现(论文提纲范文)
摘要 |
ABSTRACT |
第1章 绪论 |
1.1 选题依据及意义 |
1.2 国内外研究现状 |
1.2.1 智能制造的研究现状 |
1.2.2 数据仓库研究现状 |
1.2.3 分布式计算平台研究现状 |
1.3 课题主要研究内容 |
1.4 本文的组织结构 |
第2章 理论基础、关键技术与需求分析 |
2.1 数据仓库 |
2.1.1 数据仓库的概念和特点 |
2.1.2 数据仓库和数据库的对比 |
2.1.3 数据仓库的架构 |
2.2 大数据理论 |
2.3 Hadoop |
2.4 Spark |
2.4.1 Spark简介 |
2.4.2 Spark的架构 |
2.4.3 Spark和Hadoop自的对比 |
2.5 Hive |
2.6 Impala |
2.7 Kettle |
2.8 需求分析 |
2.9 本章小结 |
第3章 ETL系统的设计 |
3.1 智能制造中ETL系统分析 |
3.1.1 传统ETL系统的介绍及其劣势 |
3.1.2 分布式ETL系统的介绍及其优势 |
3.2 ETL系统的架构设计 |
3.3 分布式ETL系统的模型设计 |
3.3.1 数据抽取 |
3.3.2 数据转换 |
3.3.3 数据加载 |
3.4 本章小结 |
第4章 数据仓库系统的设计 |
4.1 智能制造中仓储业务分析 |
4.2 数据仓库系统的架构设计 |
4.3 建模方法介绍及选择 |
4.3.1 范式建模 |
4.3.2 维度建模 |
4.3.3 独立数据集市 |
4.3.4 数据仓库模型选择 |
4.4 数据仓库的模型设计 |
4.4.1 选择业务过程 |
4.4.2 声明粒度 |
4.4.3 维度表设计 |
4.4.4 事实表设计 |
4.4.5 模型设计 |
4.5 本章小结 |
第5章 系统的实现、应用与性能分析 |
5.1 系统环境部署 |
5.2 系统的实现 |
5.2.1 ETL系统的实现 |
5.2.2 数据仓库系统的实现 |
5.3 系统的应用 |
5.3.1 基于数据挖掘的货位优化 |
5.3.2 数据可视化 |
5.4 系统性能实验分析 |
5.4.1 MapReduce和Spark数据处理速度的对比 |
5.4.2 Impala、Hive和MySQL的查询速度对比 |
5.5 本章小结 |
第6章 结论与展望 |
6.1 结论 |
6.2 展望 |
致谢 |
参考文献 |
攻读学位期间的研究成果 |
(4)数据仓库和联机分析在医院数据决策分析的研究和应用(论文提纲范文)
摘要 |
ABSTRACT |
1 绪论 |
1.1 课题研究背景 |
1.2 国内外研究现状 |
1.3 论文研究目的 |
1.4 论文组织结构 |
2 相关理论和关键技术 |
2.1 数据仓库和数据库 |
2.1.1 数据仓库和数据库的特点 |
2.1.2 数据仓库与操作数据库区别 |
2.2 联机分析技术 |
2.2.1 联机分析系统组件 |
2.2.2 联机分析体系结构 |
2.2.3 联机分析规则 |
2.2.4 联机分析、数据挖掘和数据仓库的关联 |
2.3 本章小结 |
3 需求分析和数据仓库设计 |
3.1 需求分析 |
3.1.1 医院历史数据文件 |
3.1.2 医院总体需求 |
3.2 整体设计 |
3.2.1 解决方案 |
3.2.2 方案整体架构 |
3.2.3 系统开发环境和工具 |
3.3 数据仓库设计 |
3.3.1 数据仓库主题 |
3.3.2 维度设计 |
3.3.3 维表设计 |
3.3.4 事实表设计 |
3.3.5 逻辑模型设计 |
3.4 本章小结 |
4 医院数据分析决策应用 |
4.1 数据清理 |
4.1.1 数据抽取 |
4.1.2 数据有效性检查 |
4.1.3 数据转换 |
4.1.4 数据载入 |
4.2 联机分析应用 |
4.2.1 建立多维数据集 |
4.2.2 联机分析技术应用 |
4.2.3 图形化数据分析 |
4.3 决策支持建议 |
4.4 本章小结 |
5 总结与展望 |
参考文献 |
致谢 |
作者简历 |
附录 |
(5)数据仓库技术在高校招生就业决策中的应用研究(论文提纲范文)
摘要 |
Abstract |
第1章绪论 |
1.1 课题研究背景及研究意义 |
1.2 国内外研究现状 |
1.3 论文主要目标 |
1.4 论文主要工作 |
1.5 论文的组织 |
第2章相关技术与理论 |
2.1 数据仓库技术 |
2.2 OLAP技术 |
2.3 数据挖掘技术 |
2.4 决策支持系统技术 |
第3章业务流程和模型 |
3.1 某大学基本情况 |
3.2 招生业务流程和模型 |
3.2.1 高职院校招生业务流程 |
3.2.2 录取业务流程 |
3.2.3 系统登录与退出业务流程 |
3.2.4 新生报到业务流程 |
3.3 就业业务流程和模型 |
3.3.1 基本信息管理 |
3.3.2 毕业生管理流程 |
3.3.3 招聘管理业务流程 |
3.3.4 就业指导管理业务流程 |
3.3.5 签约管理业务流程 |
3.3.6 就业推荐管理业务流程 |
3.3.7 就业统计管理业务流程 |
第4章 招生就业决策数据仓库的设计与分析 |
4.1 需求分析 |
4.1.1 确定决策主题 |
4.1.2 系统结构需求 |
4.1.3 系统功能模块需求 |
4.1.4 系统开发环境需求 |
4.1.5 决策方案需求 |
4.2 决策数据仓库的设计与分析 |
4.2.1 数据仓库体系结构 |
4.2.2 招生就业数据仓库建模 |
第5章基于决策树算法的改进 |
5.1 决策树算法基本思想 |
5.1.1 决策树的生成 |
5.1.2 决策树的剪枝 |
5.2 常见决策树算法描述 |
5.2.1 ID3算法 |
5.2.2 C4.5 算法 |
5.2.3 CART算法 |
5.3 优化决策树算法 |
5.3.1 属性值空缺的优化 |
5.3.2 简化熵 |
5.4 克服属性选择的多值偏向优化 |
5.4.1 基于修正函数的算法 |
5.4.2 加权简化熵算法 |
5.4.3 基于用户兴趣度的简化熵算法 |
第6章招生就业决策系统的实现与应用 |
6.1 招生就业决策数据仓库的实现 |
6.1.1 源数据准备 |
6.1.2 数据仓库的创建与ETL |
6.1.3 OLAP的实现 |
6.1.3.1 多维数据集的建立 |
6.1.3.2 基于OLAP立方下的数据分析 |
6.2 高校招生就业决策支持系统的实现应用 |
6.2.1 系统环境 |
6.2.2 系统运行结果 |
结论 |
参考文献 |
攻读硕士学位期间所发表的学术论文 |
致谢 |
(6)基于数据仓库的商品流通企业决策分析系统的研究与开发(论文提纲范文)
摘要 |
abstract |
第一章 绪论 |
1.1 本课题的背景及意义 |
1.1.1 本课题的背景及可行性分析 |
1.1.2 本课题的目的和意义 |
1.2 本课题的主要研究内容 |
1.2.1 数据仓库 |
1.2.2 联机分析技术 |
1.2.3 数据挖掘 |
1.3 本文的组织结构 |
第二章 相关技术研究 |
2.1 数据仓库技术 |
2.1.1 数据仓库概念 |
2.1.2 数据仓库的体系结构 |
2.1.3 数据仓库模型设计 |
2.1.4 数据仓库的抽取、转换和加载 |
2.1.5 数据仓库技术的最新发展 |
2.2 联机分析技术 |
2.2.1 联机分析技术简述 |
2.2.2 Microsoft Analysis Services中两种分析模型的比较 |
2.2.3 联机分析技术的最新发展 |
2.3 数据挖掘技术 |
2.3.1 数据挖掘简述 |
2.3.2 数据挖掘模型和步骤 |
2.3.3 关联规则挖掘和Apriori算法 |
2.3.4 Apriori算法的改进研究 |
2.4 HTML5 网页设计技术 |
2.5 基于数据仓库的的商品流通企业决策分析系统 |
2.6 小结 |
第三章 决策分析系统的需求分析 |
3.1 应用背景 |
3.2 需求分析 |
3.2.1 数据导入功能需求 |
3.2.2 销售策略分析的功能需求 |
3.2.3 商品库存分析的功能需求 |
3.2.4 采购策略分析的功能需求 |
3.2.5 企业客户关系分析的功能需求 |
3.3 系统体系结构 |
3.4 小结 |
第四章 决策分析系统的设计与实现 |
4.1 系统体系结构设计 |
4.2 数据仓库模型设计 |
4.2.1 概念模型设计 |
4.2.2 逻辑模型设计 |
4.2.3 物理模型设计 |
4.3 数据预处理过程模型设计 |
4.4 元数据存储平台设计 |
4.5 决策分析系统的实现 |
4.5.1 实现数据导入模块 |
4.5.2 创建数据仓库 |
4.5.3 创建多维数据集 |
4.5.4 关联规则数据挖掘功能实现 |
4.5.5 数据分析结果展示功能实现 |
4.6 实际应用中的问题以及改进 |
4.6.1 查询性能问题的分析和改进 |
4.6.2 分布式数据来源的数据统一性问题以及改进 |
4.6.3 组合多个主题域的问题 |
4.7 小结 |
第五章 系统测试、运行与评价 |
5.1 系统测试 |
5.2 测试用例设计 |
5.3 系统测试结果 |
5.4 系统评价 |
5.5 小结 |
第六章 总结与展望 |
6.1 结论 |
6.2 下一步工作展望 |
参考文献 |
附录 |
致谢 |
攻读学位期间发表的学术论文 |
(7)基于SAP BW中国生物财务数据仓库的设计与实现(论文提纲范文)
摘要 |
Abstract |
第一章 绪论 |
1.1 课题背景与意义 |
1.2 本课题的历史与现状 |
1.2.1 财务管理信息化发展历史 |
1.2.2 欧美医药企业数据仓库建设情况 |
1.2.3 国内医药企业数据仓库建设情况 |
1.3 本课题主要研究内容 |
1.4 本课题的组织结构 |
第二章 数据仓库技术综述 |
2.1 商务智能概述 |
2.1.1 商务智能概念及功能点分析 |
2.1.2 主流商务智能解决方案研究 |
2.1.3 SAP商务智能发展与模块功能研究 |
2.2 数据仓库技术概述 |
2.2.1 数据仓库概念及业务特点 |
2.2.2 数据仓库的数据粒度研究 |
2.2.3 数据仓库的数据分割研究 |
2.2.4 数据库、数据仓库与运营数据存储研究比较分析 |
2.2.5 SAP BW数据仓库结构研究 |
2.2.6 SAP BW改进型星型结构研究 |
2.2.7 SAP BW加速技术BWA研究 |
2.2.8 构建SAP BW的6个数据对象研究 |
2.3 本章小结 |
第三章 中国生物财务数据仓库的设计 |
3.1 中国生物财务需求分析 |
3.1.1 财务总账相关需求分析 |
3.1.2 财务应收相关需求分析 |
3.1.3 财务应付相关需求分析 |
3.1.4 财务在建工程相关需求分析 |
3.2 中国生物财务数据仓库整体结构设计 |
3.2.1 两种数据仓库建设方法思路分析 |
3.2.2 SAP BW多层逻辑模型结构 |
3.2.3 中国生物数据仓库整体结构设计 |
3.3 中国生物财务数据仓库概念模型设计 |
3.3.1 总账主题域的概念设计 |
3.3.2 应收主题域的概念设计 |
3.3.3 应付主题域的概念设计 |
3.3.4 在建工程主题域的概念设计 |
3.4 中国生物财务数据仓库逻辑模型设计 |
3.4.1 总账主题的逻辑设计 |
3.4.2 应收主题的逻辑设计 |
3.4.3 应付主题的逻辑设计 |
3.4.4 在建工程主题的逻辑设计 |
3.5 中国生物财务数据仓库物理模型设计 |
3.5.1 数据仓库软硬件配置 |
3.5.2 数据仓库物理结构设计 |
3.6 本章小结 |
第四章 中国生物财务数据仓库的实现 |
4.1 SAP BW数据仓库实现过程 |
4.2 中国生物财务数据仓库业务模型实现 |
4.2.1 建立信息对象 |
4.2.2 创建数据存储对象 |
4.2.3 创建信息立方体、多信息提供者 |
4.2.4 逻辑模型对应的模型实现结果展示 |
4.3 中国生物财务数据仓库ETL实现 |
4.3.1 数据仓库数据抽取实现 |
4.3.2 数据仓库数据转换实现 |
4.3.3 数据仓库数据加载实现 |
4.4 本章小结 |
第五章 中国生物财务数据仓库OLAP展现 |
5.1 OLAP应用技术 |
5.1.1 OLAP和维的概念 |
5.1.2 OLAP的多维分析 |
5.1.3 OLAP分析实现方法 |
5.1.4 OLAP与OLTP功能比较 |
5.2 中国生物财务数据仓库数据展现 |
5.2.1 SAP BW展现工具和形式 |
5.2.2 中国生物OLAP展现实现 |
5.3 中国生物财务数据仓库OLAP效果展现 |
5.3.1 总账主题域OLAP效果展现 |
5.3.2 应收主题域OLAP效果展现 |
5.3.3 应付主题域OLAP效果展现 |
5.3.4 在建工程主题域OLAP效果展现 |
5.4 本章小结 |
第六章 结论与展望 |
6.1 本论文工作总结 |
6.2 本论文工作展望 |
参考文献 |
致谢 |
个人简历 |
(8)基于数据仓库的客户关系管理系统研究(论文提纲范文)
摘要 |
Abstract |
第一章 绪论 |
1.1 研究背景 |
1.2 数据仓库技术的研究现状 |
1.2.1 数据仓库技术的发展阶段 |
1.2.2 数据仓库技术的研究概况 |
1.2.3 数据仓库技术在CRM中的应用概况 |
1.3 课题研究的意义 |
1.4 主要研究内容 |
1.4.1 研究的设想及实现 |
1.4.2 论文的组织结构 |
第二章 数据仓库理论概述 |
2.1 数据仓库说明 |
2.2 数据仓库体系结构 |
2.3 核心模型 |
2.4 仓库系统的组织的结构 |
2.4.1 组织结构 |
2.4.2 组织系统 |
2.5 系统数据的索引 |
2.5.1 平衡树索引 |
2.5.2 Hash索引 |
2.5.3 位图索引 |
2.5.4 索引规则 |
2.6 仓库系统的设计 |
2.6.1 仓库系统设计方法 |
2.6.2 仓库系统的设计步骤 |
2.6.3 仓库系统的数据模型 |
第三草 客户关系管理CRM系统的概述 |
3.1 CRM概述 |
3.1.1 CRM的概念 |
3.1.2 应用系统和方法 |
3.2 CRM软件系统的业务与功能模型 |
3.2.1 CRM软件系统的业务模型 |
3.2.2 CRM软件系统的一般功能模型 |
3.2.3 集成平台环境下CRM软件系统功能模型 |
3.3 CRM软件系统的主要组成 |
3.4 CRM中的数据仓库逻辑结构 |
第四章 CRM中的数据仓库技术的研究 |
4.1 某电信运营商CRM系统需求说明 |
4.2 某电信运营商CRM体系结构 |
4.2.1 某电信运营商CRM系统组织结构 |
4.2.2 某电信运营商CRM体系结构 |
4.3 某电信运营商CRM系统业务模型 |
4.3.1 某电信运营商CRM系统业务流程 |
4.3.2 某电信运营商CRM系统总体业务模型 |
4.3.3 某电信运营商CRM系统营销业务模型 |
4.3.4 基础运营商客户关系管理系统服务模型 |
4.4 某电信运营商CRM系统功能模型 |
4.4.1 某电信运营商CRM系统总功能模型 |
4.4.2 某电信运营商CRM系统客户分析模型 |
4.5 某电信运营商CRM数据仓库初步研究 |
4.5.1 概念模型的研究 |
4.5.2 分析主题域 |
4.5.3 逻辑模型的研究 |
4.5.4 物理模型的研究 |
4.5.5 数据迁移 |
4.5.6 数据切分和层次分割 |
4.5.7 数据组织方式 |
第五章 CRM系统关键技术实现和系统测试 |
5.1 本系统的日志记录 |
5.2 短信接口 |
5.3 文件导入接口 |
5.4 客户信息变更 |
5.5 测试的方案 |
5.6 测试的结果 |
5.7 测试的结论 |
第六章 总结和展望 |
6.1 总结 |
6.2 展望 |
致谢 |
参考文献 |
(9)基于数据仓库的四重采集系统的设计与实现(论文提纲范文)
摘要 |
abstract |
1 绪论 |
1.1 研究背景 |
1.2 研究意义 |
1.3 国内外研究现状 |
1.4 论文的主要工作 |
2 数据仓库技术理论 |
2.1 基本概念及体系结构 |
2.2 数据仓库建模 |
2.3 数据立方体及数据集成 |
2.4 联机分析处理技术(OLAP) |
2.5 建立数据仓库 |
2.6 性能优化及ETL工具 |
2.7 本章小结 |
3 四重采集系统需求分析与架构设计 |
3.1 系统总体需求分析 |
3.2 数据仓库主题分析 |
3.2.1 重点事件主题分析 |
3.2.2 重点对象主题分析 |
3.2.3 重点阵地主题分析 |
3.3 业务功能模块分析 |
3.3.1 重点事件模块分析 |
3.3.2 重点对象模块分析 |
3.3.3 重点阵地模块分析 |
3.3.4 重点群体模块分析 |
3.4 系统总体架构设计 |
3.5 本章小结 |
4 四重采集系统详细设计 |
4.1 数据仓库的模型设计 |
4.1.1 逻辑模型设计 |
4.1.2 物理模型设计 |
4.2 业务功能模块设计 |
4.2.1 重点事件模块设计 |
4.2.2 重点对象模块设计 |
4.2.3 重点阵地模块设计 |
4.2.4 重点群体模块设计 |
4.3 本章小结 |
5 四重采集系统的具体实现 |
5.1 数据仓库功能实现 |
5.1.1 数据抽取 |
5.1.2 数据转换和清洗 |
5.1.3 数据加载 |
5.2 业务功能实现 |
5.2.1 重点事件模块 |
5.2.2 重点对象模块 |
5.2.3 重点阵地模块 |
5.2.4 重点群体模块 |
5.3 本章小结 |
6 基于数据仓库的四重采集系统验证 |
6.1 系统部署 |
6.2 系统功能验证 |
6.2.1 应用场景 |
6.2.2 验证方法 |
6.2.3 验证结论 |
6.3 系统测试 |
6.4 本章小结 |
7 总结与展望 |
7.1 总结 |
7.2 展望 |
参考文献 |
致谢 |
攻读学位期间发表的学术论文目录 |
(10)基于4G地学空间数据集成关键技术研究(论文提纲范文)
中文摘要 |
Abstract |
第1章 绪论 |
1.1 选题背景 |
1.2 研究目的及意义 |
1.3 研究现状分析 |
1.3.1 4G 地学空间数据集成的研究现状 |
1.3.2 4G 地学空间数据集成关键技术的研究现状 |
1.4 主要研究内容 |
1.5 论文组织结构 |
第2章 4G 地学空间数据特征研究 |
2.1 4G 地学空间数据来源 |
2.1.1 4G 地学空间数据主要内容 |
2.1.2 4G 地学空间数据主要获得渠道 |
2.2 4G 地学空间数据集成需求 |
2.2.1 4G 地学空间数据特征 |
2.2.2 4G 地学空间数据集成需求 |
2.3 4G 地学空间数据集成结果 |
2.4 4G 地学空间数据特征提取 |
2.4.1 4G 地学空间特征提取的需求 |
2.4.2 4G 地学空间特征提取的方法 |
2.5 本章小结 |
第3章 应用于 4G 地学空间数据集成的数据仓库技术 |
3.1 地学空间数据集成常用方法 |
3.1.1 联邦数据库方法 |
3.1.2 中间件集成方法 |
3.1.3 数据仓库方法 |
3.1.4 各种方法的比较选择 |
3.2 4G 地学空间数据仓库 |
3.2.1 4G 地学空间数据仓库的研究发展现状 |
3.2.2 4G 地学空间数据仓库的工作原理 |
3.2.3 4G 地学空间原始数据仓库的架构组成 |
3.3 基于数据仓库的 4G 地学空间数据集成 |
3.3.1 4G 地学空间数据集成对数据仓库构建的需求 |
3.3.2 数据仓库的功能设计 |
3.3.3 数据仓库的体系设计 |
3.4 本章小结 |
第4章 基于 SQL Server 的 4G 地学空间数据仓库设计实现 |
4.1 数据仓库开发工具 |
4.1.1 Oracle 数据仓库开发工具 |
4.1.2 IBM 数据仓库开发工具 |
4.1.3 Sybase 数据仓库开发工具 |
4.1.4 Informix 数据仓库开发工具 |
4.1.5 NCR 数据仓库开发工具 |
4.2 SQL Server 数据仓库开发应用工具 |
4.2.1 概述 |
4.2.2 SQL Server 数据仓库开发应用工具开发数据仓库的步骤 |
4.3 基于 SQL Server 2000 的 4G 空间数据集成实例 |
4.3.1 设计思路 |
4.3.2 程序片段 |
4.3.3 结果显示 |
4.4 本章小结 |
第5章 4G 地学空间数据集成中的元数据研究 |
5.1 元数据概述 |
5.1.1 元数据的定义 |
5.1.2 元数据的内容 |
5.1.3 元数据的作用 |
5.1.4 元数据研究现状 |
5.1.5 元数据的管理和维护 |
5.2 4G 地学空间元数据 |
5.2.1 4G 地学空间元数据概述 |
5.2.2 4G 地学空间元数据标准化问题 |
5.2.3 4G 地学空间数据集成研究中元数据研究的重点及发展方向 |
5.3 4G 地学空间数据仓库的元数据 |
5.3.1 4G 地学空间数据仓库元数据系统构成 |
5.3.2 4G 地学空间数据仓库元数据系统设计 |
5.4 本章小结 |
第6章 4G 地学空间集成数据质量控制体系 |
6.1 4G 地学空间集成数据质量及质量控制概念 |
6.1.1 4G 地学空间集成数据质量概念 |
6.1.2 4G 地学空间集成数据质量控制概念 |
6.2 4G 地学空间集成数据质量问题来源 |
6.3 4G 地学空间集成数据质量评价 |
6.3.1 4G 地学空间集成数据质量评价的标准 |
6.3.2 4G 地学空间集成数据质量评价的流程 |
6.4 4G 地学空间集成数据质量评价方法 |
6.4.1 常见空间数据质量评价方法 |
6.4.2 层次分析法 |
6.4.3 改进的层次分析法 |
6.5 基于改进的层次分析法的 4G 地学空间集成数据质量评价 |
6.6 本章小结 |
第7章 总结及展望 |
附录 |
参考文献 |
致谢 |
四、数据仓库技术与应用(论文参考文献)
- [1]达州银行数据仓库系统的准实时客户行为模型研究[D]. 刘志平. 成都理工大学, 2020(04)
- [2]森林资源数据仓库管理系统研建与数据分析应用技术研究[D]. 许诗怡. 北京林业大学, 2020
- [3]基于智能制造的数据仓库的设计与实现[D]. 常有学. 南昌大学, 2020(01)
- [4]数据仓库和联机分析在医院数据决策分析的研究和应用[D]. 田晚彤. 大连海事大学, 2019(07)
- [5]数据仓库技术在高校招生就业决策中的应用研究[D]. 张申. 北京工业大学, 2019(03)
- [6]基于数据仓库的商品流通企业决策分析系统的研究与开发[D]. 黄浩. 上海交通大学, 2016(03)
- [7]基于SAP BW中国生物财务数据仓库的设计与实现[D]. 王汝林. 中国科学院大学(工程管理与信息技术学院), 2016(06)
- [8]基于数据仓库的客户关系管理系统研究[D]. 徐璐. 南昌大学, 2015(08)
- [9]基于数据仓库的四重采集系统的设计与实现[D]. 俞忆青. 上海交通大学, 2016(01)
- [10]基于4G地学空间数据集成关键技术研究[D]. 魏红雨. 吉林大学, 2014(03)