行业标准网
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202111627225.6 (22)申请日 2021.12.28 (71)申请人 天翼数字生活科技有限公司 地址 200072 上海市 静安区万 荣路1256、 1258号1423室 (72)发明人 董唱 陆涛 徐忠胜 邵羽丰  何铠  (74)专利代理 机构 上海专利商标事务所有限公 司 31100 专利代理师 亓云 蔡悦 (51)Int.Cl. G06F 16/2457(2019.01) G06K 9/62(2022.01) G16Y 30/00(2020.01) (54)发明名称 一种基于改进密度聚类的物联网实体搜索 方法 (57)摘要 本申请公开了一种基于改进密度聚类的物 联网实体搜索方法。 该算法综合了密度聚类和k 均值聚类的优点, 得到规模相差不大的结果, 同 时防止噪音点的丢失, 减少簇头位置受极端点的 影响。 根据本申请的基于改进密度聚类的物联网 实体搜索方法符合物联网实体分布不均匀的特 点, 能得到既满足地理区域限制且规模相差不大 的实体簇划分, 减小了搜索空间, 提高了搜索效 率和准确性。 权利要求书1页 说明书7页 附图1页 CN 114925104 A 2022.08.19 CN 114925104 A 1.一种基于改进密度聚类的物联网实体搜索方法, 其特 征在于, 所述方法包括: 接收并解析用户的搜索查询请求, 所述 查询请求包括类型子查询; 基于所述类型对所述实体进行类型划分; 使用所述改进密度聚类算法并基于所述实体的地理位置对所述实体进行聚类划分; 以 及 基于所述类型划分和所述聚类划分来搜索所述实体。 2.如权利要求1所述的搜索方法, 其特 征在于, 所述改进密度聚类算法结合 k均值算法。 3.如权利要求1或2所述的搜索方法, 其特征在于, 基于所述类型划分和所述聚类划分 来搜索所述实体进一 步包括以下步骤: 搜索与请求的实体 类型匹配的实体簇的集 合; 确定距离最近的实体簇; 以及 基于相似度对所述实体簇进行排序, 以获得搜索结果。 4.如权利要求3所述的搜索方法, 其特 征在于, 所述相似度包括: 距离接近程度; 属性相似度; 和 时间接近度。 5.如权利要求3所述的搜索方法, 其特征在于, 所述相似度的计算权重基于用户的反馈 来调整。 6.如权利要求3所述的搜索方法, 其特 征在于, 所述方法进一 步包括: 基于所述相似度的搜索结果与所述搜索查询请求的其他子查询结果进行融合处理并 返回给用户。 7.如权利要求1或2所述的搜索方法, 其特征在于, 所述改进密度聚类算法包括以下步 骤: 使用密度聚类算法以获得初步簇划分; 计算再划分阈值; 基于当前簇的规模是否大于所述阈值来确定是否使用k均值算法进行二次划分, 并计 算簇头信息; 将噪音点划分到距离最近的簇中; 以及 输出簇划分和簇 头节点集合。 8.如权利要求7所述的搜索方法, 其特征在于, 基于簇规模来确定是否进行二 次划分进 一步包括: 若所述当前簇的规模大于所述阈值, 则使用k均值 算法进行二次划分; 以及 若所述当前簇的规模不大于所述阈值, 则直接将所述当前簇作为结果簇, 并计算簇头 信息。 9.如权利要求1或2所述的搜索方法, 其特征在于, 当实体情况发生变化 时, 执行聚类结 果动态维护。 10.如权利要求9所述的方法, 其特征在于, 所述聚类结果动态维护定义一阈值, 所述阈 值用于确定是否需要对所述实体进行重新聚类。权 利 要 求 书 1/1 页 2 CN 114925104 A 2一种基于改进密 度聚类的物联网实体 搜索方法 技术领域 [0001]本申请涉及属于新兴信息技术领域, 并且更为具体地, 涉及物联 网实体搜索领域, 更具体地, 涉及一种基于改进密度聚类的物联网实体搜索方法。 背景技术 [0002]物联网实现了物理世界中的物理对象与网络系统的互联, 并创造了很多有价值的 应用, 诸如智慧城市、 智能家居、 智慧农业、 智慧医疗等。 大量的物联网设备已经被部署在 全 球各地, 并会随时间持续 地增长, 从而为各种各样的物联网应用产生了 重要的数据来源。 [0003]然而, 并非所有数据都对应用或用户都是具有价值的。 例如, 如果要想知道某地的 粮仓是否具有火灾隐患, 则需要收集到该粮仓中所有相关的温度传感器和湿度传感器的信 息等, 而不需要其他粮仓的数据, 也无需该粮仓中不相关的其他信息。 因此, 物联网中对指 定目标的搜索服 务至关重要。 [0004]物联网中的搜索与互联 网中的搜索存在很多不同之处。 互联网中的搜索对象是网 络中的文本、 图片、 视频等缓慢变化的资源, 并且对时效性的要求并不高。 然而, 与之不同, 物联网中的搜索除了要搜索文本、 图片等资源, 还包括物联网实体的位置、 状态等其他信 息。 由于物联网实体的动态变化性, 物联网中的搜索还对时效性要求非常高。 除此之外, 物 联网中搜索空间也比互联网的空间大得多, 并且更加动态化。 所以, 传统的互联网搜索技术 并不适用于物联网搜索。 那么, 如何在 海量的、 动态的、 异构的搜索空间中, 搜索出最满足用 户需求的物联网实体是目前物联网搜索研究的一大挑战。 [0005]同时, 针对不同的应用需求, 物联 网企业会相应地在特定区域部署不同种类、 不同 数量的物联网设备, 这就进而造成物联网实体分布的非均匀性。 所以, 在进行物联网搜索 时, 也需要考虑到实体的非均匀分布所 带来的诸多困难。 [0006]随着物联网的迅猛发展, 国内外关于物联网搜索的研究也产生了一些成果。 这些 成果主要分为基于内容的方法和基于上下文的方法。 基于内容的方法往往需要构建预测模 型, 其主要需要面对由于物联网数据的动态特性所带来的挑战。 CASSARAM和AntClust算法 两者是常见的基于上下文的物联网搜索方法, 它们都是从大量功能相似的传感器中选择性 能最接近需求的传感器子集。 但他们都需要和中间件配合使用, 用户无法直接用其满足搜 索需求, 即无法直接搜索到例如某某地方的某某状态的物联网实体。 也有一些物联网搜索 方法引入了聚类算法, 这与上面的有 所不同。 但随着传感器数量的不断增多, 簇规模也不断 增大, 这使得搜索时间不断增 加, 从而搜索效率较低, 完全无法满足时效性的要求。 [0007]因此, 在物联网搜索领域急需一种改进的物联网实体搜索方法, 以满足搜索效率 高、 搜索时间短并且易于用于使用的需求。 发明内容 [0008]以下给出一个或多个方面的简要概述以提供对这些方面的基本 理解。 此概述不是 所有构想到的方面的详尽综览, 并且既非旨在标识出所有方面的关键性或决定性要素亦非说 明 书 1/7 页 3 CN 114925104 A 3

.PDF文档 专利 一种基于改进密度聚类的物联网实体搜索方法

文档预览
中文文档 10 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共10页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种基于改进密度聚类的物联网实体搜索方法 第 1 页 专利 一种基于改进密度聚类的物联网实体搜索方法 第 2 页 专利 一种基于改进密度聚类的物联网实体搜索方法 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-19 00:18:19上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。