基于模糊聚类的电子信息资源整合方法

作者：孙前进(晋中职业技术学院,山西晋中 030600) 时间：2023-08-08 来源：电子产品世界

加入技术交流群
- 扫码加入
  和技术大咖面对面交流
  海量资料库查询

编者按：由于进行电子信息资源整合的过程中，没有进行资源转换降维处理，导致资源整合效率低，为此提出基于模糊聚类的电子信息资源整合方法。通过模糊ORM技术抽取电子信息资源，采用等效转换降维的方法对抽取的电子信息资源进行转换降维处理，根据处理结果，结合模糊聚类分析，构建EAD电子信息资源整合模型，采用模糊聚类分析的方式，将所属的信息资源依据特征或者属性划分为不同额定整合区域，计算整合隶属度，布设信息资源的整合层级。

摘要：由于进行电子信息资源整合的过程中，没有进行资源转换降维处理，导致资源整合效率低，为此提出基于模糊聚类的电子信息资源整合方法。通过模糊ORM技术抽取电子信息资源，采用等效转换降维的方法对抽取的电子信息资源进行转换降维处理，根据处理结果，结合模糊聚类分析，构建EAD电子信息资源整合模型，采用模糊聚类分析的方式，将所属的信息资源依据特征或者属性划分为不同额定整合区域，计算整合隶属度，布设信息资源的整合层级。最终的测试结果表明：与传统的LAM信息资源整合测试组及传统改进ORM信息资源整合测试组相对比，所设计的模糊聚类信息资源整合测试组最终得出的响应时间相对较短，电子信息资源整合效率较高，所提方法具有实际的应用价值。

本文引用地址：//www.cghlg.com/article/202308/449387.htm

关键词：模糊聚类；电子信息；信息汇总；资源整合；数据控制

电子信息资源是以数字化形式( 即二进制代码0,1)把文字、图象、声音、动画等多种形式的信息存储在光、磁等非印刷型介质上，并以光信号、电信号的形式传输，通过响应的计算机和其他外部设备再现出来的信息资源。电子信息资源整合主要是针对于庞大的数据信息群，构建的一种特殊的数据汇总方法^[1]。近年来，随着计算机以及网络技术的成熟普及，数据资源急剧增长，逐渐成为资源处理的主流。通常情况下，数字资源自身具有复杂性、异构性、海量性以及多元性等特征，这在一定程度上也增加了信息资源整合的速度以及效率，增加元数据的可靠性，给未来信息发展奠定更为坚实的基础^[2]。

模糊聚类，实际上指的是一种按模糊界限以及基本要求对事物进行分类的数学方法^[3]。本质上是客观的划分，并采用数理统计的方式，获取最终处理结果。模糊聚类为信息整合处理提供了极大的便利条件，进一步确保数据计算的精准度，同时，关联系统聚类法和逐步聚类法等方法，形成一个可无限延伸与扩展的资源整合体系，优化需要整合的信息资源，避免出现信息孤岛这一类问题，推动信息整合相关企业迈入一个新的发展阶段。因此，本文提出一种基于模糊聚类的电子信息资源整合方法。考虑到最终测试结果的精准性与可靠性，本文会在较为真实的背景下进行实验测试，并验证本文方法能够安全、高效的进行信息资源整合。

1 模糊聚类下电子信息资源整合方法

1.1 基于模糊ORM技术的电子信息资源抽取

在对模糊聚类下电子信息资源整合方法设计之前，需要先采用模糊ORM 技术对电子信息资源抽取。通常情况下，针对于不同的整合范围，所导出的资源以及定向整合目标也是不同的，这也使得内部执行程序存在差异^[4-6]。可以采用双向处理模式，在平台中构建多层级的模糊ORM 资源整合程序，与数据库相关联的同时，获取数据集，在聚类中心，对信息划归分类，计算出聚类质心数，具体如式(1)所示。

(1)

式（1）中： B 表示聚类质心数； p 表示聚类范围； Z 表示质心集合；f 表示映射系数。通过上述计算，最终可以得出实际的聚类质心数^[7]。根据得出的聚类质心数，核定不同层级数值资源的占比，以此为基础，在特定的电子信息资源库中，利用双向信息集成法来代替传统的单一信息集成方式，结合模糊ORM 技术，电子信息资源抽取，具体如式（2）所示。

(2)

式（2）中：H表示数据定向抽取结果；a 表示叠合距离；d 表示集成次数； s 表示允许出现的极限差值。此时，完成对信息的抽取，随后，在标定的资源整合范围之内，依据实际的处理标准，更改调整ORM 模糊引导指令，在确保数据唯一性、准确性、及时性、完整性的同时，实现整合目标的更改调整，为后续的汇总处理奠定基础^[8]。

1.2 电子信息资源转换降维处理

在通过模糊ORM 技术对信息资源进行抽取后，对电子信息资源进行转换降维处理。所谓转换降维处理，主要指的是在对信息资源抽取的过程中，信息资源通常处于集合的状态，资源维数也存在较大的差异，而维数的存在并不利于数据的整合、汇总，严重的甚至会造成数据误差等，因此，需将高维信息资源转换为低维信息资源。可以采用等效转换降维的方法，按照统一的元数据标准或者降维格式进行周期性转换，计算出转换降维比率，具体如式（3）所示。

(3)

式（3）中：A 表示转换降维比率；n 表示中心整合距离；c表示聚类差值。通过上述计算，最终可以得出实际的转换降维比率。根据信息资源的属性与特征，结合转换降维比率，实现定向转换。

接下来，在实现标定信息资源的转换降维后，结合定向集成信息资源整合现状，计算出信息资源处理的单元速度，具体如式（4）所示。

(4)

式（4）中： U 表示信息资源处理单元速度； x 表示纵向整合距离； q 表示传输路径； t 表示动态平均值。通过上述计算，最终可以得出实际的信息资源处理单元速度。在中心元数据库中，依据降维映射规则将统一元数据标准分化为几个转换降维层级。不同降维层级的转换格式也是不同的，可以根据所设定的整合目标，作出更改调整，举例来说：可以赋予定义XML、RDF 等输出格式，一定程度上扩大整体的信息整合降维范围，以此来适应用户的不同需求。

1.3 EAD模糊聚类整合模型构建

在完成电子信息资源转换降维处理后，构建EAD模糊聚类整合模型。将上述转换降维处理后的电子信息资源输入到模型之中，将模型调整为可共享的形式化概念模型，关联局域网以及聚类数据中心，调整数据组织形式为单向。将不同元数据指令应用到本体集成框架中，设定具体的集成速度和资源整合映射比，具体如表1所示。

表1 集成速度、资源整合映射比测定表

根据表1，可以完成对集成速度、资源整合映射比的测定。随后，遵循标定的整合目标，结合模糊聚类分析，构建EAD 信息资源整合结构，具体如图1所示。

图1 EAD信息资源整合模型结构图示

根据图1，可以完成对EAD 信息资源整合模型结构的建立。此时以本体为中心的，调整定向映射标准，使用多层级的映射描述框架，综合EAD 模型执行基准，完成对EAD 模糊聚类整合模型的构建，细化信息资源的整合效果。

1.4 分布式自适应处理实现信息资源整合

在完成对EAD 模糊聚类整合模型的构建之后，接下来，需要采用分布式自适应处理，实现信息资源整合。首先，采用模糊聚类分析的方式，将所属的信息资源依据特征或者属性划分为不同额定整合区域，设定整合目标为动态，依据虚拟整合的范围，对定向目标作出更改和调整，计算出信息资源整合的隶属度，具体如式（5）所示。

K=3.5T+(7y−1) (5)

式（5）中： K表示隶属度； T表示质心聚类系数； y表示欧氏距离。通过上述计算，最终可以得出实际的隶属度。与此同时，利用所得的隶属度，布设自适应模糊整合区域，细化引导的指令，采用EAD 模糊聚类整合模型测定出此时电子信息的自适应程度，具体如式（6）所示。

F=5W−1.5+6G (6)

式（6）中： F 表示自适应程度； W表示定向资源分析速度； G 表示特征向量。通过上述计算，最终可以得出实际的自适应程度，依据得出的自适应程度，布设信息资源的整合层级，采用分布式的整合方式，对信息资源定向分类，结合模糊聚类法实现最终的整合分析。构建对应的信息资源整合环节，具体如图2所示。

图2 信息资源整合环节

2 方法测试

为了验证本文提出的基于模糊聚类的电子信息资源整合方法在实际应用中的效果，选取A 数据库作为测试的主要目标，通过在Matlab 软件进行测试分析。分别设定传统LAM 信息资源整合测试组、传统改进ORM信息资源整合测试组以及本文所设计的模糊聚类信息资源整合测试组。采用对比的方式，确保3 种方法在相同的环境之下同时测试，最终得出的结果以对比的方式展开分析，接下来，进行测试环境的搭建。

2.1 测试准备

在对模糊聚类下电子信息资源整合方法的实际应用效果进行分析与研究，需要先搭建相关的测试环境。根据测定的实际需求以及执行标准，先对测试基础指标参数进行预设，具体如下表2所示。

表2 基础指标参数预设表

根据表2，可以完成对基础指标参数的预设。实验数据主要针对RBI、AWS、UCI、KDD Cup、MovieLens相关数据。

表3 数据集

随后，利用测定的设备，营造相应的信息整合环境。为进一步确保信息资源整合的稳定性，采用无线局域网的通信模式，结合模糊聚类框架，对数据资源的基础整合情况作出分析，具体如图3所示。

图3 信息资源整合程度对比分析图示

根据图3，可以完成对信息资源整合程度的对比分析。调整信息资源的单元处理速度，调整整合处理标准，完成对测试环境的搭建。核定测试的设备与网络是否处于稳定的运行状态，同时确保不存在影响最终测试结果的外部因素，核定无误后，开始具体的测定分析。

2.2 测试过程及结果分析

在完成对上述测试环境的搭建之后，接下来，需要进行具体的测试。首先，为了提升信息资源整合的速度，本文选择使用指令引导的方式，关联对应的局域网和数据库，在网络中寻找所需要的信息资源，并采用特殊的格式，按照指令的归纳顺序，分批次导入数据库的对应位置中，结合数据的种类，划定对应的处理阶层，获取基础指标数值。计算信息资源的整合定向范围，具体如式（7）所示。

(7)

式7中： Y表示整合定向范围； V表示单向引导距离。通过上述计算，最终可以得出实际的整合定向范围。在标定的范围之内，结合模糊聚类方式，将所属的信息资源整合，划归至对应的整合层级之中。在模糊聚类分析背景下，构建批量信息资源的整合环节，具体如图4所示。

图4 信息资源模糊聚类整合环节设计图示

根据图4，可以完成对信息资源模糊聚类整合环节的设计。与此同时，关联无线局域网络，构建定向的信息整合程序，赋予每一个层级对应的聚类指令，营造稳定的信息处理整合环境。随后，将测试数据库与XML数据中心相关联，可以更好地完成局部数据模式向全局数据模式的定向转化，实现信息资源的适配处理之后，对数据库中的元数据定义，将所选择的数据划定为4 个小组，每一个小组的数据量均不同，利用模糊聚类分析法，对电子信息资源整合的响应时间计算，具体如式（8）所示。

M=3b-0.2+ (8)

式8中:M 表示响应时间; b 表示定向测定距离;g表示虚拟迭代次数。通过上述计算，最终可以得出实际的响应时间。对得出的结果对比分析，如表3 所示。

表3 测试结果对比分析表

根据表3，可以完成对测试结果的对比分析：与传统的LAM 信息资源整合测试组及传统改进ORM 信息资源整合测试组相对比，本文所设计的模糊聚类信息资源整合测试组最终得出的响应时间相对较为迅速，表明在对电子信息资源整合的处理上，效率较高，误差较小，整合环节得到了更好地处理，具有实际的应用价值。

3 结束语

综上所述，便是对基于模糊聚类的电子信息资源整合方法的分析和研究。对比于传统的信息资源整合方法，本文在模糊聚类分析的辅助之下，构建更为灵活、多变的信息整合模式，在复杂的背景环境之下，可以更为迅速、清晰地完成目标任务的处理，最大程度降低信息整合误差的发生概率，与网络相关联，形成动态的信息处理程序，通过指令引导，营造一个稳定、安全的处理环境，更加符合现代化发展的需求，促使信息资源整合配置更为高效，通信效率大幅提升，发展前景广阔。

参考文献：

[1]朱智斌. 大数据背景下不动产登记档案信息资源整合方法研究[J]. 城建档案,2020,14(12):109-110.

[2]孟学尧,郭倩倩,郭海儒. 一种改进萤火虫算法的模糊聚类方法[J]. 小型微型计算机系统,2021,42(6):1165-1170.

[3]王慧,王海江,高攀,等. 新疆生产建设兵团农业资源数据采集与整合方法研究[J].农业大数据学报, 2021,3(2):31-41.

[4]顾羽. 基于FCM模糊聚类方法以变电站为单元的电力系统负荷分类研究[J]. 机电信息,2020, 25(33):22-23+25.

[5]熊学锋,彭小庆,曹鑫. 基于改进ORM的Oracle数据库异构资源整合方法研究[J]. 电子设计工程,2020,28(21):38-41 +46.

[6]张小静,杨晓灵,刘青松. 数字转型背景下科研档案资源整合实践路径和方法研究[J]. 城建档案,2021, 34(12):44-45.

[7]冯国礼,李蓉,吴双. 基于人工智能技术的电力信息系统运维数据整合方法[J]. 电力信息与通信技术, 2022, 20(1): 68-73.

[8]贾君枝. LAM馆藏资源的元数据整合方法比较分析[J]. 档案学研究,2022, 21(1):79-84.

（本文来源于必威娱乐平台杂志2023年7月期）

新闻中心

基于模糊聚类的电子信息资源整合方法

评论

相关推荐

技术专区