当前位置: 查字典论文网 >> 基于MapReduce和AprioriAll的分布式序列挖掘算法

基于MapReduce和AprioriAll的分布式序列挖掘算法

格式:DOC 上传日期:2022-11-19 00:56:27
基于MapReduce和AprioriAll的分布式序列挖掘算法
时间:2022-11-19 00:56:27     小编:

摘 要:序列挖掘技术,能够从大量杂乱的数据中挖掘出用户的潜在访问模式。然而,传统的挖掘技术,由于其性能和扩展性的诸多限制,并不适合现今大数据下的挖掘任务。本文基于传统的挖掘算法AprioriAll,在结合国内外研究进展的基础上引入分布式概念格模型,提出了分布式序列挖掘算法PAHDP。通过在分布式系统上构建算法原型,并加以评估,本文证明了该算法的正确性和有效性,具有一定的应用价值。

关键词:数据挖掘;分布式计算;概念格;Hadoop

中图分类号:TP311

分布式计算的思想,可以将仅仅由单个计算机难以计算和维护的计算任务分为很多小的、相互独立的部分,然后把这些部分分配给很多台计算机进行处理。在这个基础上,利用分布式系统架构MapReduce,用户可以在不了解分布式底层细节的情况下,充分利用其框架下集群的高传输率与容错率的优点进行计算与存储。

正是在这种背景下,采用分布式计算以实现庞大数据集的数据挖掘,成为了目前国内外的研究热点。利用分布式计算,人们可以把庞大的数据集分为小的、相对独立的部分,并部署于集群的计算机中进行计算,最后将结果综合。本文在此基础上,对传统的数据挖掘算法AprioriAll进行了分布式探索,并针对影响性能的多个因素进行了分析与改进。

1 基于AprioriAll的分布式挖掘算法设计与实现

1.1 AprioriAll算法

AprioriAll算法是由R.Agrawal等人提出的,该算法采用迭代增长的思想,首先在数据库中找出所有频繁项集,并在每一次迭代过程中,将上一次得到的序列相互链接以生成新序列。接着,在扫描数据库的同时去掉不满足最小支持度阈值的序列,并将结果作为下一次迭代的候选,直到无法再产生更长的新序列为止。最后,扫描生成的频繁序列,去除包含于其它序列的子序列,留下来的就是最终的结果。该算法结构简单,然而面临着重复扫描哦数据库、难以并行化等问题,需要进行优化。

1.3 改进点分析

2 实验评测

实验时,共对三种情况下的序列模式挖掘(AprioriAll算法,伪分布式环境下的PAHDP算法与分布式环境下的PAHDP算法)进行了比较与测试。实验设置8组交易数据,其中顾客数目与商品数目相等,并从20增长到2000。顾客平均交易数目与平均每次购买商品数目分别固定为8与2.5。结果如下图所示:

图1 实验结果

通过对比可以发现,当顾客数目与商品数目相等,且交易数据小于9000时,PAHDP算法执行时间远远大于AprioriAll的单机算法。而当数据量继续提升时,AprioriAll的执行时间则随之从53.385秒增加到了405.418秒(记录数为18906),并超过了PAHDP算法。当数据量继续增长时,AprioriAll算法内存溢出而无法计算,而PAHDP算法增速较缓(伪分布式节点的计算时间仅从116秒增长到了153秒,增长率为31.9%)。从对比实验可以看出,传统的AprioriAll算法在顾客数目小于商品数目的时候,其计算时间的增长比顾客数目大于商品数目的情况下更为缓慢,因此该算法对于数据的内在结构是敏感的。而对于PAHDP算法来说,则在三种情况下的运行速度差异不大,因此其对于数据是不敏感的。

3 结束语

本文深入分析了AprioriAll算法的实现流程和相关局限,从而提出了新算法的改进目标。基于这些改进点,本文提出了分布式挖掘算法PAHDP,并对整个算法的流程和其中的关键技术进行了阐述。本文证明了PAHDP算法的有效性,论述了在较大规模数据库的情况下PAHDP算法所具有的优势。作为集群化序列挖掘的一个有效解决方案,本文设计的算法能够在大规模序列挖掘领域具备研究价值。

参考文献:

[2]吕峰等.4种序列模式挖掘算法的特性研究[J].武汉理工大学学报,2006,28

(2):57-60

[3]周嘉伟等.新多维序列挖掘算法:对AprioriAll算法的改进[J].科技经济市场,2006,4:26~27

[5]王宇.序列模式挖掘的并行算法研究[D].哈尔滨.哈尔滨理工大学.2007

全文阅读已结束,如果需要下载本文请点击

下载此文档

相关推荐 更多

基于数据挖掘的会计管理与分析研究
发布时间:2015-08-05
摘要:随着计算机技术的飞速发展,会计管理也逐步实现了计算机化,计算机进行会计管理过程中会产生大量的数据,而这些数据含有很宝贵的潜在价值,值得去进行分析。而要对这些大数据进行分析,光依赖人工是无法实现的,因此,基于数据......
基于Web数据挖掘技术研究
发布时间:2022-11-25
摘要:基于Web的数据挖掘是采用数据挖掘技术对网页资源进行挖掘的一个热门研究方向,此文分析了了网页数据挖掘的概念、分类、挖掘原理以及相关技术。 关键词:数据挖掘;Web数据挖掘;分类;挖掘技术 Abstract: Web based data ......
基于位置序列的广义后缀树用户相似性计算方法
发布时间:2022-12-13
摘要:为了解决移动数据形成的轨迹间用户相似性问题,提出了一种基于位置序列的广义后缀树(LSGST)用户相似性计算方法。该算法首先从移动数据中抽取位置序列,同时将位置序列映射为字符串,完成了对位置序列的处理到对字符串处理的转......
Web内容挖掘算法模拟器设计
发布时间:2022-12-15
摘要:各种数据源的大量出现,数据的分析算法的研究已成为Web挖掘一个热点研究课题。本论文提针对Web内容挖掘,采用回归算法、趋势分析方法、cure算法及分类,利用MATLAB和VC++设计了一个Web内容挖掘算法模拟器,从不同的角度来观看数......
一种基于数理统计的数据挖掘方法研究
发布时间:2022-11-26
一种基于数理统计的数据挖掘方法研究 一种基于数理统计的数据挖掘方法研究 信息技术论文 更新:2006-4-8 阅读: 一种基于数理统计的数据挖掘方法研究 吴良刚 周海涛 湖南长沙中南大学 摘要:本文分析了......
基于人工免疫算法的多无人机分布式任务分配方法的探讨
发布时间:2023-07-24
引言 随着战场环境日益复杂,多无人机协同攻击任务已成为了当前的热点研究方向。为了充分利用资源,提高无人机的效能,本文对多无人机攻击型任务分配进行了研究。多无人机任务分配问题是寻求一种合理的方法将M个位置、价值不同的任务......
一种基于句法规则的文本挖掘技术的设计
发布时间:2022-12-16
〔摘 要〕文本挖掘是数据挖掘技术的一个重要方面,本文根据句法规则的特征,利用文本挖掘技术,提出基于句法规则的文本知识挖掘设计模型,从数据准备、句法规则构造、文本预处理、文本知识挖掘、挖掘结果评价等方面对工作原理进行了分......
基于PMML的电子商务数据挖掘研究
发布时间:2023-05-04
〔摘要〕随着互联网技术的发展,电子商务进入了海量数据时代,从这些海量数据里挖掘出有用的模式具有非常高的商业价值。常规的数据挖掘模型会依赖于特定的数据挖掘平台,而目前的数据挖掘平台并不能做到随时随地跨平台交换数据挖掘模型。文章提出基于PMML的电子商务数据挖掘方法,只要数据挖掘平台兼容了PMML规范就可以真正做到跨台平交换数据挖掘模型。文章重点研究了PMML语言是如何表示完整数据挖掘模型,并就某电商.........
基于数据挖掘网络诊断法的网络图书馆建设
发布时间:2023-06-26
[摘 要]随着网络技术与应用的不断发展,计算机网络在图书馆建设中已经变得越来越普遍。网络图书馆建设严重依赖于计算机网络,因此网络运行的稳定性、可靠性就显得至关重要,于是网络管理就应运而生。本文是通过数据挖掘网络诊断法应用......
基于数据挖掘的网络入侵检测技术
发布时间:2013-12-14
毕业论文 【 关键词 】 网络安全 网络入侵检测系统 数据挖掘 误用检测模型 异常检测模型 【文摘语种】 中文文摘 【论文页数】 1-61 ......
一种基于云计算数据挖掘平台架构的设计与实现
发布时间:2022-12-26
【 摘 要 】 随着网络技术的飞速发展,不仅给人们生产和生活提供更多有价值的信息,而且又能提升人类从大量数据中发现有价值信息的能力。现阶段,数据挖掘技术已广泛应用在各行各业当中,并且已取得了较好成果。本文主要针对基于云计......
基于情境体验的用户需求挖掘研究
发布时间:2023-03-23
摘要: 通过情境体验的理论方法研究用户在产品使用过程中对于情境的理性认知和感性认知,目的是挖掘用户的期望需求和用户痛点。用户对现实情境的需求是产品在解构用户需求阶段的依据,根据用户对现实情境的需求,帮助产品在交互设计......
基于数据挖掘的客户购买行为分析系统研究
发布时间:2023-06-27
【摘要】客户就上帝,客户是企业盈利的源泉,如何保留老客户、不断开发新客户成为企业发展的关键所在。在客户购买行为分析中使用数据挖掘技术可以帮助企业更好的分析客户行为、进行交叉销售、实施客户细分。为此本文提出了基于数据挖......
基于MapReduce并行SVM的垃圾邮件分类
发布时间:2023-07-09
摘要:针对垃圾邮件大量存在的问题,提出基于MapReduce并行SVM的垃圾邮件分类算法,用支持向量机作为分类器,基于MapReduce将各子分类器进行合并,并通过重训练得到模型,利用该模型对测试集进行分类,得到结果。为解决算法精度损失、准确率低等问题,引入KNN,在原算法基础上进行循环迭代。关键词:MapReduce;SVM;KNN分类算法DOIDOI:10.11907/rjdk.161466中.........
序列音乐的基础与前沿分析
发布时间:2022-10-14
摘要:20世纪以来,音乐向多样化方向发展,各式各样的创作手法的出现、变化和没落表现得十分错综复杂。这是音乐文化进步变化势必经历的过程,是音乐类型越来也越多样化的表现。,其中勋伯格和他的创作是音乐语言在此发展中最具有典型性的,也......
基于自组织数据挖掘的住宅空置影响因素分析
发布时间:2023-06-22
【摘要】空置是反映房地产市场状况的一个重要因素。本文运用自组织数据挖掘 方法 来 分析 中国 住宅空置面积的 影响 因素,我们发现,在所有的因素中,人均住宅面积是影响空置面积的最重要的因素,其中也有其他因素的较小的相关影响。......
基于贪心算法的光伏板布置及智能分区
发布时间:2023-07-23
摘要:背包问题可分为0/1背包问题、完全背包问题以及多重背包问题等,一直是算法与复杂性研究的热点之一,应用于多个行业和领域。贪心算法在求最优解问题过程中,依据某种贪心标准,从问题初始状态出发,直接计算出每一步的最优解,通过若干次的贪心选择,最终得出整个问题的最优解。在光伏电站布置及分区过程中,分别应用解决背包问题的动态规划算法和贪心算法划分规则形状以及边界部分非规则形状。关键词:背包问题;贪心算法.........
论基于差分累积函数特征挖掘的数据库层析集成分析
发布时间:2016-10-14
引言 飞机在飞行控制中,其姿态数据是一个庞大的数据库信息系统,飞机姿态控制数据库的层析集成算法设计是提高对飞行姿态控制数据库的准确访问能力的基础。通过对飞行姿态控制数据库的指向性特征进行数据挖掘算法设计,提取飞行姿态控......
基于时间序列模型的中国GDP增长预测分析
发布时间:2014-01-08
基于时间序列模型的中国GDP增长预测分析 1 引言作为度量一个国家或地区所有常住单位在一定时期之内所生产和所提供的最终产品或服务的重要总量指标,国内生产总值(英文Gross Domestic Product,简写为GDP)对于判断经济态势运行、衡量经......
Web使用模式挖掘中路径分析技术研究
发布时间:2023-05-25
摘要:Web使用模式挖掘是Web数据挖掘的重要研究内容。本文详细介绍了Web使用模式挖掘中的路径分析技术,并将AprioriAll算法引入路径分析过程,对其发展前景做了合理的展望。关键词:Web数据挖掘Web使用模式挖掘路径分析技术中图分类号:TP393文献标识码:A文章编号:1007-9416(2010)10-0028-021引言数据挖掘(DataMining)就是从数据库中发现隐藏在其中的、潜.........
荻MsFT1及MsFT2基因的克隆及序列分析
发布时间:2023-03-28
关键词 荻;光周期;Hd3a;FT Key words Miscanthus Sacchariflorus;photoperiod;Hd3a;FT 1 材料与方法 1.1 试验材料及光周期诱导 2 结果与分析 采用改良Trizol法提取荻叶片的总mRNA用琼脂糖凝胶电泳检测后,条带(图2)......
浅谈基于MPLS―VPN的分布式校园网
发布时间:2015-08-20
摘 要:随着校园虚拟专用网的逐步普及,各大高校都在建设自己的虚拟专用网络;传统的基于二层VLAN的虚拟专用网络存在很多问题,而MPLS-VPN是一种成熟的三层VPN技术,特别适合于多校区的分布式校园网络,本文从组网架构以及网络安全等......
驴生长激素基因序列初步分析
发布时间:2022-12-28
摘要:通过对驴(Equusasinus)GH基因序列进行生物信息学分析,结果表明,驴GH基因共包含5个外显子和4个内含子。5个外显子连接形成651nt的CDS区序列,整个CDS区翻译出216个氨基酸构成的多肽。驴GH基因编码的216个氨基酸中,大多数氨基酸为亲水性氨基酸。原始肽链的前20多个氨基酸序列出现一个典型的疏水峰,为该原始肽链的信号肽片段。驴的GH基因中的氨基酸以亮氨酸所占的比例最高(13.........
基于编前编中编后管理分析电视新闻采编的深度挖掘
发布时间:2022-12-12
我国当前的社会经济发展促进我国的文化事业也在不断进步,我国社会文化事业的发展越来越明显,同时也导致电视新闻报道的深度化发展要求逐渐凸显,而这样的发展趋势就为新闻采编工作提出了比较高的要求,新闻采编部门使新闻报道的重要生产和加工部门,而其中新闻采编工作者使这些生产和加工环节的主要操作人员,对电视新闻采编工作具有重要的影响,因此,能够积极调整和应对社会发展中的新要求,就需要不断对自身的发展做出改变,促.........
绵羊IGFBP―1基因的克隆及序列分析
发布时间:2023-01-29
关键词:IGFBP-1基因;克隆;绵羊 Key words: IGFBP-1 gene; clone; sheep Ou等[9]运用PIRA-RFLP技术检测北京油鸡的IGFBP-1基因5′的单核苷酸多态性,发现该多态性与北京油鸡群体的生长有密切关系,赵秀华等[10]采用SSCP技术检......
有效的不确定数据概率频繁项集挖掘算法
发布时间:2023-02-04
摘要:针对已有概率频繁项集挖掘算法采用模式增长的方式构建树时产生大量树节点,导致内存空间占用较大以及发现概率频繁项集效率低等问题,提出了改进的不确定数据频繁模式增长(PUFPGrowth)算法。该算法通过逐条读取不确定事务数据......
基于数据挖掘的数字档案信息管理研究浅析
发布时间:2022-07-23
随着社会主义现代化的发展,计算机技术的进步,信息技术在社会发展的各个领域都扮演着极其重要的角色。查字典范文网为您编辑了“基于数据挖掘的数字档案信息管理研究浅析” 基于数据挖掘的数字档案信息管理研究浅析 在信息化发展的今......
基于cadence的七位伪随机序列电路的研究
发布时间:2023-03-08
摘 要 伪随机信号具有类似于随机噪声的一些统计特性,同时又便于重复产生和处理。目前广泛使用的伪随机信号都是由数字电路产生的周期序列得到的。一般采用的伪随机码产生电路是线性反馈的移位寄存器。伪随机码具有周期性和类似随机噪......
行政法论文8000字:数据挖掘
发布时间:2023-06-05
论文的选定不是一下子就能够确定的.若选择的毕业论文题目范围较大,则写出来的毕业论文内容比较空洞,下面是编辑老师为各位同学准备的行政法论文8000字。 根据波特的影响企业的利益相关者理论,企业有五个利益相关者,分别是客户、竞......
基于VB的分布式监控系统通信设计
发布时间:2022-11-25
基于VB的分布式监控系统通信设计 基于VB的分布式监控系统通信设计 信息技术论文 更新:2006-4-8 阅读: 基于VB的分布式监控系统通信设计 基于VB的分布式监控系统通信设计 郭爱文 (武汉大学动力工程系自动化专......
挖掘“重点段”教学功能的基本策略
发布时间:2015-09-16
【摘 要】文章结合教学实践,从读想结合、读演结合、读悟结合三个层面阐述了增强小学语文重点段训练实效的基本策略。 【关键词】小学语文;重点段;策略;美 一、何谓“重点段” 在语文教学中,如果总是全方位地考虑教材的教学......
浅谈n阶行列式的计算方法
发布时间:2013-12-18
浅谈n阶行列式的计算方法 摘要:行列式是高等代数课程里基本而重要的内容之1,在数学中有着广泛的应用,懂得如何计算行列式显得尤为重要。本文先阐述行列式的......
基于数据挖掘的产品功能与结构关联关系发现
发布时间:2023-05-01
摘要:在运用关联规则算法对产品数据进行配置知识挖掘时,所发现的功能参数值与实例模块间的强关联规则不能反映出功能与结构间的关联关系,因而缺少一种从功能与结构关系角度判断强关联规则效用性的依据。为解决这一问题,引入了功能......
软件工程数据挖掘进展分析
发布时间:2023-07-22
【摘要】随着改革的开放,科技的飞速发展,科技的发展速度已经超过了人们的脚步,近年来,我们国家的计算机技术越来越成熟,计算机软件也越来越广泛,人们从前获取计算机软件信息的方法是手动获取,但手工获取的信息量是有一定限度的,不能满足现代软件的需求,所以,为了解决这个问题,本文着重于软件工程数据挖掘的研究进展。分别从几个不同的方面对软件工程数据挖掘研究进行了探讨。【关键词】软件工程;数据挖掘;数据表示;数.........
基于嵌入式技术的分布式系统研究与应用
发布时间:2023-05-05
1.基于嵌入式技术的分布式系统的关键性因素 1.1结构 在分布式系统结构当中,所谓的分布并不是人们常说的分散,而是说整个系统的数据采集包括系统运行过程当中的相应控制等功能上时相对比较分散的,分布系统中的每一个功能都是相对独......
捕捉、挖掘、交流
发布时间:2023-07-24
11月,一个阳光明媚的日子,在成为《中文自修》小编一周后,我们6人娘子军团接到了一项采访任务--我们将以实习编辑的身份回到我们再熟悉不过的建平校园,以本校的社会实践与语文学科建设为主题,对校方进行一次采访工作。 初看到编......
基于数据挖掘技术的医保欺诈行为的主动发现
发布时间:2023-01-22
【摘 要】随着数据挖掘技术的不断发展与成熟,对数据挖掘的研究和应用逐渐深入到各个行业。在医疗保险领域,医保诈骗的现象时有发生,造成医药基金的损失,损害广大参保人的利益。运用数据挖掘技术,构建较为完整的医保数据仓库,实现......
银杏MECT基因启动子克隆及序列分析
发布时间:2022-07-29
摘要:以前期获得的银杏(GinkgobilobaL.)MECT基因的cDNA序列为模板,通过设计特异性引物及采用染色体步移的方法从银杏基因组中克隆到GbMECT翻译起始位点上游982bp的启动子序列,研究银杏MECT基因启动子的结构及功能特点。生物信息学分析结果表明,该启动子序列中含有多种类型的顺式作用元件,主要有典型的光响应调节元件、激素响应调控元件、抗病虫害响应元件TGTCA序列、抗损伤应答元.........
一种基于麦克风阵列的声源定位算法研究
发布时间:2022-10-20
一种基于麦克风阵列的声源定位算法研究 引 言 基于麦克风阵列的http://wWw.LWlm.Com声源定位是声学信号处理领域中的一个重要问题。麦克风阵列声源定位技术是指利用空间分布的多路麦克风拾取声音信号,通过对麦克风的多路输出信号进行分......
基于XML 的IA 分布式系统网络重组策略
发布时间:2022-09-17
摘要:随着信息技术的快速发展,人们对网络的实时性和可靠性要求也越来越高。该文在python语言下,通过提取IA分布式系统的网络监测结果,依据网络节点的等级属性,提出一种基于XML的网络重组策略,实现在节点状态突变的情况下的动态网......
数据挖掘在企业财务核算中的运用
发布时间:2015-08-05
关键词:第三方支付、欺诈交易、数据挖掘、损失核算 中图分类号:C93 文献标识码: A 一、引言 伴随经济社会快速发展,企业经营业态日趋多样化,对会计核算出现了更为具体更为复杂的要求。作为资金结算中介的第三方支付公司,每......
基于交通分配算法的城市客运方式划分研究
发布时间:2022-10-08
摘要:本文针对我国城市轨道 交通 网络 覆盖率低的特点,提出采用网络标识确定轨道交通的空间布局。综合考虑各种交通方式的特点及其运输网络的连通程度,提出基于交通分配算法中路线选择模型,且考虑轻轨线网布局的城市客运交通方式划......
充分挖掘校园文化的德育功能
发布时间:2022-08-11
校园文化是学校物质财富和精神财富的总称。它包括物质文化、制度文化及由课余文化、舆论文化、人际关系等组成的精神文化。校园文化作为一种环境教育力量,对学生的健康成长有着巨大的影响。充分挖掘校园文化的德育功能,创设一种氛围,......
试论基于数据挖掘的数字档案信息管理研究的论文
发布时间:2023-01-01
随着社会主义现代化的发展,计算机技术的进步,信息技术在社会发展的各个领域都扮演着极其重要的角色。本文对数据挖掘的功能深入阐述和探讨,试论基于数据挖掘的数字档案信息管理研究的详细内容请看下文。 信息化建设更是被我国列为经......
基于混合算法的物流园区布局优化研究
发布时间:2023-04-11
摘 要:物流园区的合理布局是降低物流园区成本和提高物流园区作业效率的有效途径之一。考虑园区内部物流总量最小、各功能区作业最为紧密以及土地利用率最大化,建立数学模型,然后构造混合算法求解。最后对国内某物流园区的实际计算,......
浅谈充分“挖掘”习题的教育价值
发布时间:2023-05-29
以《平面解析几何》抛物线习题为例,进行“挖潜”与“变式探讨”,用以说明深挖习题训练功能的巨大教育价值。 习题挖潜变式探讨用好一些典型例习题,研究其内涵与解法,充分“挖潜”与“变式探讨”,并力求“举一反三,推陈出新”,......
挖掘素材,激发情趣
发布时间:2013-12-18
挖掘素材,激发情趣 ——作文教学之我见 百胜学校 邱艳芳 作文教学是小学语文教学的重要内容,也是语文教学的难点。学生长期以来感到作文难写,不知从何下手。如何挖掘出学生感兴趣的素材,激发他们的写作情趣,让他们将生活中......
挖掘自身全面抗敌
发布时间:2015-09-09
近日笔者就遇到了“网络连接不可用”的故障,原来的有线连接突然无法连接网络(图1)。 此时只要点击“打开网络和共享中心”,在打开的窗口中点击下方的“疑难解答→网络和Internet→Internet连接”,此时就会自动启动系统自带的网络......
数学新教材中美育因素的挖掘和提炼
发布时间:2014-01-28
数学新教材中美育因素的挖掘和提炼 实施素质教育离不开美的教育,而美的教育不仅能培养学生健全的人格,良好的气质,高雅的情趣,而且能优化数学课堂教学结构,丰富教学内容,提高教育教学质量,从而全面发展学生个性,提高学生整体素质......
李氏大足蝗线粒体全基因组序列分析
发布时间:2013-12-18
Aeropus licenti 关键词 线粒体基因组;rRNA二级结构;李氏大足蝗;槌角蝗科;直翅目 作者个人主页: 高 佳; 程春花; 黄 原* ......
充分挖掘教材,发展说话能力
发布时间:2022-08-08
" 说话,即输出信息,是把自己听到的、看到的、想到的用口头语言表达出来。说话的过程是人类所独有的复杂的心理活动过程。据一份资料表明,在语言交流活动中,说的比例占32%,稍低于听的方面。可见,在语言活动中,说占了重要位置。结合......
基于云平台的分布式网络仿真实验研究
发布时间:2022-12-17
摘要:基于云平台技术和虚拟技术,在云平台上构建三个虚拟局域网络。每个虚拟网络采用三层结构设计,在虚拟网络中可以进行各种路由与交换配置。并且采用VPN技术,将分布在不同云平台上的虚拟网络连接起来,最大程度的对分部网络的工作......
一种基于Hadoop平台的分布式数据检索系统
发布时间:2023-02-22
摘要:企业级检索不同于普通的数据检索和网站检索,它包括复杂结构的数据检索、安全检索、高可靠的查全和查准、智能化的数据检索服务和实时的数据更新服务等。虽然可以利用已有数据检索系统提供的站内数据检索功能来构建企业级数据检索系统,但这种站内检索功能难以满足绝大多数企业自身检索需求。随着大数据时代来临,为处理海量数据,建立大数据平台成为趋势,使用分布式文件存储系统,通过云计算技术来分析海量数据,开发企业级.........
一种基于免疫算法的盲信号分离算法
发布时间:2023-02-15
摘要:针对现有盲源分离算法性能受限于非线性函数选择且算法实现复杂、计算量大的问题,文章提出了一种基于人工免疫算法的盲信号分离算法,达到满足实际应用中有效分离的需求。该算法不依赖于源信号概率密度的非线性函数估计,通过免疫算法最小化信号的互信息,实现对观测混合信号的分离。基于免疫算法的盲信号分离,利用免疫算法隐形并行处理,具有较好的全局搜索性能和易收敛到最优解的特点。仿真分析表明,与传统的ICA盲分离.........
基于数据挖掘技术的图书馆个性化信息服务探讨
发布时间:2022-08-10
关键词:图书馆;个性化信息服务;数据挖掘技术;关联规则 摘要:文章从数据挖掘技术的相关原理出发,构建了图书馆个性化信息服务系统,并对数据挖掘的实施过程进行了简要论述,并从关联规则的角度介绍了基于数据挖掘技术的图书馆个性......
基于零件虚拟工序队列的FMS动态调度研究
发布时间:2023-04-02
基于零件虚拟工序队列的FMS动态调度研究 基于零件虚拟工序队列的FMS动态调度研究 基于零件虚拟工序队列的FMS动态调度研究 基于零件虚拟工序队列的FMS动态调度研究 使用者请注明文章内容出处赵天奇陈禹六李培根 ......
挖掘机消声器效果的测量与分析
发布时间:2022-09-07
挖掘机消声器效果的测量与分析 引言 挖掘机的发动机在工作过程中会产生诸多高强度噪声,例如进排气噪声、壳体辐射噪声、齿轮噪声等,其中排气噪声是工作过程中重要的噪声源之一,严重影响了挖掘机产品的整机性能。对排气噪声进行测量与......
基于数据挖掘的严世芸治疗心律失常用药规律研究
发布时间:2015-08-27
关键词:心律失常;数据挖掘;严世芸;名医经验 Key words:arrhythmia;data mining;Yan Shiyun;famous doctor experience 上海中医药大学严世芸教授数十年来悉心研究中医药治疗心血管疾病的理论,临床注重辨病与辨证相结合,中......
基于Hadoop分布式文件系统的单点问题的研究
发布时间:2016-10-19
1 引言 如今网络的飞速发展,数据量的增多,这就要求数据库能够具有处理超大规模数据的能力。Hadoop分布式平台的出现,很好地解决了处理海量数据的难题。Hadoop集群架构有两个核心的设计,分别是HDFS(Hadoop Distributed FileSystem)......
一种改进的喷泉多选择序列峰均比降低算法
发布时间:2016-03-23
摘要:针对非连续正交频分复用(NC_OFDM)系统具有边带功率(Sidelobe power)大及峰均比(PAPR)高等问题,提出一种基于喷泉编码(Fountain code)的改进算法,同时考虑认知无线电环境下NC_OFDM系统旁瓣干扰及峰均联合优化.采用喷泉......
基于模拟退火的多跑道飞机排序算法研究
发布时间:2022-12-17
0 引言 近来,航空运输的运输量越来越大。作为客货集散中心的机场,如何合理有效地使用各种资源成为了需要深入研究和解决的问题。其中,飞机在滑行道上的滑行效率对机场和航空公司的经济效益影响很大;滑行过程也是飞机事故多发环节等......
PowerBuilder的分布式计算技术及其应用
发布时间:2013-12-18
PowerBuilder的分布式计算技术及其应用 PowerBuilder的分布式计算技术及其应用 PowerBuilder的分布式计算技术及其应用 PowerBuilder的分布式计算技术及其应用 浙江大学计算机系 梁荣华 浙江大学计算机系 史......
CAT挖掘机液压系统发热的故障分析
发布时间:2023-01-07
论文摘要:液压系统发热是指液压系统的油温超出系统规定的温度较多。如CAT挖掘机正常工况下,液压系统油温应在50oC以下,(油泵的温度较之高5-10oC),如果温度超出80 oC,,则为液压系统发热。液压系统发热会造成操作不灵活、作业不连......
面向内心的挖掘(访谈)
发布时间:2023-02-26
文珍:先做一个简短的自我介绍吧。 文珍:你在《情感教育》这篇小说里展现了不俗的文学素养,看得出文学准备很充分,而据我所知此前你并未在正式期刊上发表过小说,只参加过一些学校的文学社团活动,以及在校刊和豆瓣上发表作品,那......
基于串行通讯的分布式超声波测距仪设计
发布时间:2023-02-16
基于串行通讯的分布式超声波测距仪设计 1相关研究的内容 我们设计一个超声波测距器,如果足够理想的话,将可以应用于汽车倒车、建筑施工工地以及一些工业现场的位置监控,也可用于如液位、井深、管道长度测量、治疗、机器人定位和安......
挖掘失败实验的价值
发布时间:2022-10-20
摘 要: 实验失败是常有现象。在很多时候,实验的失败往往得不到应有重视,甚至当我们面对实验失败的时候会加以“掩饰”。其实,失败的实验也是一种难得的资源,从失败实验中可以挖掘出很多闪光点。 关键词: 物理教学 失败实验 价......
基于数据挖掘的治疗老年性痴呆中药组方配伍研究
发布时间:2023-06-06
关键词:老年性痴呆;用药规律;中医文献;数据挖掘 Key words:Alzheimer disease;medication rules;TCM literature;data mining 阿尔茨海默病(Alzheimer disease,AD)又称老年性痴呆,是一种与高龄有关的智能障碍性疾病。我......
统计学方法在数据挖掘中的应用探究
发布时间:2022-11-15
数据挖掘就是指从众多实际应用数据中获取批量大、有噪声、且随机性强的数据,将潜在的信息与数据提取出来,就是从数据中挖掘有价值的知识,.........
探讨基于混沌序列扩频通信系统的仿真研究
发布时间:2022-11-30
1 引言 扩频通信,即扩展频谱通信技术(Spread Spectrum Communication),它与光纤通信、卫星通信一同被誉为进入信息时代的三大高新技术通信传输方式[1].到目前为止,扩频通信已经成为比较成熟的一门技术,在个人通信方面,它具......
基于LON平台的现代农业全分布式监控系统
发布时间:2015-09-09
摘要:为促进我国现代化农业发展,实现农业管理的高效性和科学性,设计了一种基于LON平台的现代农业全分布式监控系统,系统由现场采集层、数据通信层和远程数据处理中心层3层组成。系统的现场采集层采用LON平台实时监控农业现场参数,......
基于时间序列的中国制造业能源利用效率研究
发布时间:2022-09-28
摘要:制造业作为碳排放大户,其能源利用效率的高低决定了我国工业发展的可持续性。对制造业能源利用效率的衡量指标及影响因素进行理论分析,以1994-2013年间制造业的时间序列数据为样本,选取能源强度、能源价格、技术投入和企业规模几个变量构造模型,使用Johansen-Juselius协整分析方法对模型进行估计,研究发现能源价格、技术投入和企业规模均能引起能源强度的反向变化趋势,弹性系数反映出不同因素.........
基于Visual C++计算器程序设计中CCalculatorDlg类的设计分析
发布时间:2022-10-24
摘 要 在Visual C++环境中进行计算器程序设计的整体思路是:计算器的运行界面相对较为简单,从CDialog类直接派生出计算器对话框类CCalculatorDlg;在IDD_CALCULATOR_DIALOG对话框上添加操作控件,作为人机交互;最后实现CCalculatorD......
基于时间序列的西安市私家车保有量预测研究
发布时间:2022-09-02
1引言 经济的快速发展为我国私人汽车提供了巨大的发展空间。汽车价格不断下降,使城市私家车保有量不断上升,私家车的快速增长,一方面促进了汽车行业的极大发展和地区经济的发展,也改变了居民的生活方式,提高了生活品质;另一方面,......
数据挖掘技术分析及其应用评价
发布时间:2023-01-22
摘 要:本文在审视数据挖掘技术发展的重要性基础上,通过了解数据挖掘的概念,进而对现时所用的十三种数据挖掘技术依次进行分析。最后,通过评分表方式对数据挖掘技术多种进行了评价,并对研究结果进行了思考。 关键词:数据挖掘;......
小学生的潜能探索与挖掘
发布时间:2022-07-21
[摘要]对于小学生的潜能,我们要运用科学的手段来进行探索与挖掘。学生的潜若是得到恰当的感官刺激,会产生让人意想不到的迸发力。 [关键词]潜能 探索 挖掘 感官刺激 潜能,顾名思义,从广义上讲是指潜在的力量,从狭义上讲是隐藏......
浅议数据挖掘技术在计算机审计中的应用
发布时间:2022-12-08
浅议数据挖掘技术在计算机审计中的应用 随着网络的发展,我国的审计事业步入了计算机审计时代,这样以来大大提高了审计工作的效率。在实际审计过程中,审计人员还要改变自身的审计分析思路,要打破传统的审计模式,能够运用系统论的思......
基于耦合度的分布问题研究
发布时间:2023-04-18
基于耦合度的分布问题研究 基于耦合度的分布问题研究 基于耦合度的分布问题研究 基于耦合度的分布问题研究 中共广州市委办公厅自动化中心 汪胜 广州工程总承包集团有限公司 时亚弘 【摘要】 本文主要讨......
三种沼虾的COI基因序列变异及其分类地位探讨
发布时间:2022-09-17
三种沼虾的COI2. 农业部海洋与河口渔业资源及生态重点开放实验室,中国水产科学研究院东海水产研究所,上海 200090 Macrobrachium rosenbergii)和日本沼虾(M. nipponense)已经在我国得到广泛的养殖,产生巨大的经济效益。祁连沼虾......
客户关系管理中客户细分的数据挖掘分析
发布时间:2023-02-08
【摘 要】主要研究客户关系管理中的客户细分的数据挖掘,对客户关系管理、客户细分以及数据挖掘的内涵与相关理论进行了认真学习,并对客户细分的数据挖掘方法进行了研究,对客户关系为中心的企业管理模式提供了技术支持。 【关键词......
思想史教学应充分挖掘“外史”中的背景成分
发布时间:2017-01-29
科学史研究有“内史”与“外史”之分,内史主要研究“某一学科本身发展的过程,包括重要的事件、成就、仪器、方法、著作、人物等”,外史侧重于研究“该学科发展过程中与外部环境之间的相互影响和作用,以及该学科在历史上的社会功能......
论挖掘化学中的另类课堂
发布时间:2016-08-08
初中化学新课标指出,通过化学课程的学习,要培养学生主动与他人进行交流和讨论的能力,要使学生初步养成勤于思考、敢于质疑、严谨求实、乐于实践、善于合作、勇于创新等科学品质. 要让学生学会创新,教师必须适时改变自己的教学方式,......
挖掘手机上的按钮潜力
发布时间:2023-02-04
和键位丰富的笔记本相比,手机上通常只有电源和音量键,最多就是高端机加上了指纹识别器,格外寒酸。如果你想让手机用得更惬意,不妨考虑给这些有限的物理按键赋予快捷功能。 音量键也能点亮屏幕 为了延长电源键的寿命,很多Andr......
充分挖掘地方资源,培养学生语文素养
发布时间:2023-01-22
" 清明节又称三月节、踏青节。清明是农历二十四个节气中唯一俗演为节日的节气。清明节有三个明显的特色:一是兼有节气与节日两种“身份”,二是以户外活动(扫墓、踏青等)为主,三是兼有肃穆(或悲伤)(在扫墓祭奠活动中)与欢乐(在踏......
经济统计中数据挖掘技术的使用分析
发布时间:2016-09-08
经济统计工作对我国的经济发展有着至关重要的作用,以下是小编搜集整理的一篇探究数据挖掘技术应用的论文范文,欢迎阅读查看。 伴随着经济统计发展,经济统计的经验累积,目前的经济统计所需要统计的数据已经非常庞大,数据统计者......
从“把”看数量名序列的句法结构
发布时间:2015-08-20
关键词: 系数词;位数词;数词短语;核心移位;粘着性 摘要: “把”是数词,也是系数词,具有粘着性。在数词内部可激发位数词进行核心移位,推导出“位数词+把”格式;在数词内部如果没有位数词满足其融合要求,就会激发量词进行核心移......
大数据时代下 对冲基金的数据挖掘技术探析
发布时间:2022-08-21
2015年全球对冲基金表现2015年,全球范围内对冲基金经历了2008年以来的第二次业绩寒冬。根据对冲基金研究机构HFR(HedgeFundResearchInc.)公布的资料显示,2015年四季度全球新成立对冲基金183家,较第三季度的269家下降32%,是2009年以来新增数量最少的季度。2015年全年累计新成立对冲基金968家,较上一年度下降7%。此外,诸多对冲基金在惨淡的业绩面前纷纷清盘。.........
地基计算的一系列问题
发布时间:2013-12-13
1 引言 我国现行规范是利用地基容许承载力进行基础及地基设计,所采用的容许承载力是利用极限承载力除以定值安全系数而得到的,即所谓的定值安全系数法。在计算极限承载力时使用了传统的定值分析模式,没有考虑各个参数的变异性对极限承......
基于多Agent技术的分布式电压无功优化控制系统
发布时间:2015-11-12
  摘 要:电压无功优化控制关系到整个电网的正常运行,必须具备很高的可靠性。在电力系统中需要分层去平衡无功功率,保证区域电压无功之.........
基于Linux和S3C2410平台的应用程序的开发
发布时间:2015-08-17
【摘 要】随着信息化的发展,基于Linux和ARM内核的嵌入式开发平台已经成为市场主流。随着ARM技术的广泛应用,在ARM架构的嵌入式开发平台上进行应用程序的开发成为当前研究的热点问题。文章以Hello World应用程序为例,简单介绍了嵌入......
Frame页面网络日志数据挖掘预处理方法
发布时间:2023-05-01
摘 要 本文结合网络日志数据挖掘技术,通过对Frame页面和SubFrame页面进行分析,提出基于改进的Frame页面数据挖掘预处理方法。该方法从SubFrame页面信息着手,从而提高预处理过程中的信息识别能力。实验表明,该方法在网络日志的数......