网站开发之美wordpress 重定向次数-内蒙古自治区网站建设公司-Seo优化

网站开发之美,wordpress 重定向次数,wordpress虚拟空,网站建设中的发布维护包括北京航空航天大学联合澳门大学#xff0c;共同开发了跨 POI、道路、地块的统一地图要素表征学习工具库#xff1a;VecCity。该工具库通过统一数据、统一流程、统一测评#xff0c;集成了 9 座城市数据、复现 21 种主流的时空要素表征模型#xff0c;覆盖 POI /道路/地块城市…北京航空航天大学联合澳门大学共同开发了跨 POI、道路、地块的统一地图要素表征学习工具库VecCity。该工具库通过统一数据、统一流程、统一测评集成了 9 座城市数据、复现 21 种主流的时空要素表征模型覆盖 POI /道路/地块城市地图全要素为研究者和开发者提供一站式的建模、预训练、微调与评测支持的工具集。基于 VecCity 这一翔实的工具库论文还对不同地图表示学习技术路线进行了对比进一步揭示了各路线的优势与不足。例如完整的 “token–graph–sequence” 三阶段模型在道路场景中表现最优序列增强与对比学习在 POI 任务中优势显著而图神经网络在复杂关系建模中更具鲁棒性。VecCity 算法库基于论文作者团队北航 BIGSCITY 实验室此前所提出的 “LibCity 时空数据处理统一基座平台”http://www.libcity.ai将为地图数据表示学习MapRL提供重要基础设施。本文第一作者为北京航空航天大学计算机学院博士生张文涛通讯作者为北京航空航天大学计算机学院王静远教授。目前该研究已被 VLDB 2025 正式接收相关代码与模型已经全部开源。论文标题VecCity: A Taxonomy-guided Library for Map Entity Representation Learning论文链接https://arxiv.org/abs/2411.00874代码链接https://github.com/Beihang-BIGSCity/VecCity研究背景电子地图由多种类型的实体组成包括兴趣点POI、路段Road Segment和地块Land Parcel分别对应着几何学中的点、线、面三类核心要素。这些实体承载了丰富的时空信息在智能交通系统ITS和基于位置的服务LBS等关键应用中扮演着不可或缺的角色。地图实体表示学习Map Entity Representation LearningMapRL 旨在利用预训练技术生成通用且可复用的数据表示为高效管理与利用地图实体数据提供了关键技术支撑。然而尽管 MapRL 发展迅速目前仍面临两个核心挑战限制了领域的进一步发展1. 研究碎片化Fragmented Research Fields现有研究通常按“点、线、面”等实体类型进行划分。这种割裂导致不同实体间的技术难以复用例如为路段设计的图编码器难以直接用于地块阻碍了技术的融通。2. 缺乏统一基准Lack of Standardized Benchmark不同模型往往在不同的数据集和实验设置下进行评估。缺乏标准化的 Benchmark 使得横向对比变得极其困难难以总结出通用的设计原则。为了应对这些挑战本文提出了一种全新的 MapRL 模型分类方法不再以实体类型为划分标准而是从模型的功能模块出发围绕编码器、预训练任务与下游任务等核心组件对现有方法进行统一归类。在此基础上我们构建了一个以分类体系为核心指导的开源算法库 VecCity并对经典模型进行了全面的评估分析。本文的主要贡献包括全新的分类体系提出 Method-based 的时空数据表征分类体系将模型解构为编码器、预训练任务与下游任务打破了按实体类型划分的传统壁垒实现了跨实体技术的统一梳理统一的开源算法库构建了 VecCity 库实现数据处理、模型实现、训练流程与评估方法的深度解耦支持高效复用与灵活组合显著提升模型开发效率标准化评测基准整合来自九座城市的数据集复现了 21 个主流 MapRL 模型建立了领域内首个标准化的 Benchmark并进行了全面的系统评估与归因分析。基于方法的分类方法为了打破“碎片化”的僵局本文不再以实体类型为核心而是围绕模型的功能模块进行解构提出了一种 Method-based 的分类体系。我们发现MapRL 模型的核心组件——编码器Encoder和预训练任务Pre-training Tasks——并不与特定的地图实体类型强耦合。因此我们将 MapRL 模型解构为四个核心要素1. 地图数据Map Data数据是表征学习的基石。本文将地图数据抽象为两个层面首先是地图实体Map Entities无论是点状的 POI、线状的路段还是面状的地块都被统一建模为包含 ID、类型、几何形状及属性特征的通用对象。其次是辅助数据Auxiliary Data整合了轨迹数据Trajectories与关系网络Relation Networks旨在为模型引入动态时序信息与全局拓扑结构从而显著增强表征的上下文感知能力。2. 编码器模型Encoder Models编码器是将原始数据映射到潜在向量空间的核心引擎根据处理的数据结构不同可划分为三大范式Token-based 编码器负责处理实体的静态属性特征如 POI 类别、地理坐标构建基础语义嵌入Graph-based 编码器利用图神经网络GNN建模实体间的拓扑关联如路网连接、OD 交互捕捉空间结构信息Sequence-based 编码器则利用序列模型如 Transformer、RNN处理轨迹数据捕捉实体在时间维度上的动态演化规律。3. 预训练任务Pre-training Tasks本文提炼出了一套跨越实体类型的通用学习目标通过构造自监督信号驱动编码器学习鲁棒表征。其中包括旨在强化语义判别力的 Token 级任务如属性推理 TokRI、对比学习 TRCL旨在保留全局拓扑特性的 Graph 级任务如图结构重构 GAu、邻域对比学习 NCL以及旨在捕捉长程时序依赖的 Sequence 级任务如掩码轨迹恢复 MTR、轨迹预测 TrajP。4. 下游任务Downstream Tasks该部分是模型与实际应用对接的接口也是唯一与实体类型强相关的组件。它负责将预训练好的表征适配于特定的应用场景如 POI 分类、路段速度推断及地块人流预测等从而量化模型的泛化性能。现有模型总结基于这一分类体系我们对现有的主流模型进行了重新梳理。我们发现大多数先进模型都遵循 “Token → Graph → Sequence” 的建模流水线首先提取基础特征然后融合关系结构最后捕捉时序依赖。VecCity分类学指导的开源算法库基于上述分类体系我们开发了 VecCity 算法库。它不仅仅是一个代码集合更是一个标准化的开发平台。其核心架构包含三个功能模块并通过统一的配置Config与评估Evaluation模块串联覆盖了 MapRL 开发的全流程1. 数据模块Data Module1原子文件Atomic FilesVecCity 定义了三种原子文件格式—— geo存储地图实体、traj存储轨迹数据和 rel存储关系网络。这种设计屏蔽了原始数据如 ShapefileGeoJSONNPZ 等的格式差异实现了数据的统一加载与处理。2丰富的内置数据库中预置了来自纽约、芝加哥、东京、新加坡、波尔图、旧金山、北京、成都、西安等 9 个城市的标准化数据集涵盖了不同规模和类型的城市形态。同时我们还提供了数据转换脚本支持导入私有数据。2. 上游模块Upstream Module1标准化接口通过 encode() 和 pretraining _loss() 两个核心接口将编码器实现与预训练任务解耦。encode() 负责将原子文件转化为向量而 pretraining_loss() 则封装了数据掩码、负采样、数据增强等复杂的预训练逻辑。2全面覆盖我们集成了 21 个主流 MapRL 模型覆盖 POI、路段和地块三大类实体每类 7 个模型为研究人员提供了简单易用的 Baseline 库。3. 下游模块Downstream Module1灵活微调提供 downstream_model() 接口实现微调模型如 MLP 分类器、LSTM 回归器以及 finetuning_loss() 接口定义优化目标如交叉熵、MSE、InfoNCE。2多任务支持内置了 9 类典型的下游任务包括 POI 分类、下一跳预测、路段速度推断、旅行时间估计、地块功能分类、人流预测等支持对表征质量进行全方位的评估。4. 配置与评估Configuration Evaluation通过统一的配置文件即可控制“数据加载 → 预训练 → 微调 → 评估”的全生命周期用户无需编写繁琐的胶水代码即可运行实验。实验分析利用 VecCity本文建立了领域内首个标准化的 Benchmark对 21 个主流模型在统一环境下进行了全方位的评测与分析。4.1 总体性能对比我们在 POI、路段和地块的三类下游任务上进行了广泛的对比实验不仅给出了准确的性能排名还通过深度分析总结了每类实体的建模关键。POI 表征学习实验结果显示CTLE 和 CACSR 等引入了序列编码器Sequence-based Encoder的模型表现显著优于仅依靠静态特征的模型。这主要是因为轨迹数据中蕴含了丰富的用户移动模式信息。进一步分析发现相比于传统的下一跳预测TrajP采用掩码轨迹恢复MTR和增强轨迹对比学习ATCL的任务表现更好。这是因为 TrajP 仅关注相邻点的短期依赖而 MTR 和 ATCL 能够迫使模型捕捉整条轨迹中的长距离时序依赖Long-range dependencies从而生成更具判别力的 POI 表征。Takeaway轨迹序列建模与长程依赖捕捉是 POI 表示学习的关键。路段表征学习路段表征因涉及路网拓扑与动态交通流的耦合复杂度最高。实验发现JCLRNT 和 START 等模型凭借 “Token Graph Sequence” 的全流程建模拔得头筹。这表明要精准刻画路段特性既不能脱离静态的路网结构Graph也不能忽视动态的交通流序列Sequence。此外多视角预训练在其中也发挥了关键作用例如 JCLRNT 巧妙结合了图对比学习和轨迹对比学习相比单一视角的模型展现出更强的性能。Takeaway“TokenGraphSequence” 的全流程建模与多视角预训练是路段表征学习的制胜法宝。地块表征学习对于地块而言其功能属性如商业区、住宅区很大程度上由其内部包含的 POI 决定。实验数据清晰地表明ReMVC 和 HREP 等显式融合 POI 语义特征的模型显著优于仅利用移动流Mobility Flow的模型。POI 类别分布为地块提供了关键的上下文信息Contextual Information有效弥补了仅靠人流数据在功能区分度上的不足。值得注意的是目前该领域的主流仍是 Token Graph 架构序列信息的利用尚有巨大的挖掘空间。TakeawayPOI 语义特征的显式融合是精准理解地块功能属性的核心要素。4.2 深入探究预训练任务的组合效应除了基准测试我们利用 VecCity 的模块化特性进行了系统性的消融实验以探究不同类别预训练任务的组合效果。实验结果深度分析了多视角预训练Multi-view Pre-training策略即融合 Token、Graph 和 Sequence 异构视角的任务对模型性能的影响。进一步的分析揭示了针对不同地图实体的最优任务配置对于 POI 实体POI 表征的核心在于兼顾静态的功能语义与动态的访问模式。实验表明TokRI关系推理 MTR掩码轨迹恢复是最有效的任务组合。TokRI 专注于捕捉显式的类别与属性语义而 MTR 通过对轨迹序列的掩码重建有效捕捉了长距离的时序依赖两者在特征空间上形成了良好的互补。然而在数据稀疏如低频访问的场景下TrajP轨迹预测任务因其更关注局部时序依赖表现出更强的鲁棒性。对于路段实体路段数据天然受限于路网的拓扑结构。实验显示AGCL增强图对比学习展现出显著的性能优势这表明捕捉地理关系网络中的空间依赖是路段表征的基础。在此基础上若数据密度较高引入 MTR 任务可进一步增强时序特征的表达而在稀疏数据条件下TrajP 则是更为适宜的辅助任务。对于地块实体地块的功能属性通常隐含在复杂的 POI 分布中易受噪声干扰。实验发现AToCL增强 Token 对比学习的表现最优。通过数据增强与对比学习机制AToCL 能够有效过滤冗余的语义特征提炼出地块的核心功能属性从而生成更具鲁棒性的表征。此外在涉及社交关系网络如人流移动的场景中基于图重建的 GAu 任务通过建模节点间的相似性连接也提供了重要的补充信息。4.3 效率与可扩展性分析除了性能指标模型的效率与可扩展性决定了其能否真正落地于大规模城市应用。我们从参数量、训练时间及推理时间三个维度对模型进行了全面分析。Token-based 模型Token-based 模型如 P2VecTale展现出了极佳的可扩展性。由于结构相对简单它们在处理海量数据时依然能保持较低的训练耗时和参数规模。对于对实时性要求极高、数据规模巨大的应用场景这类模型是性价比极高的选择。Graph-based 模型Graph-based 模型的效率高度依赖于预训练任务的复杂度。例如采用图自编码器GAu任务的模型如 HRNR随着图节点数量的增加其训练时间呈现出超线性增长的趋势这在大规模路网中可能成为瓶颈。相比之下采用更高效采样策略或简化图结构的模型如 HREP则表现出更强的鲁棒性。Sequence-based 模型虽然引入序列编码器显著提升了模型在轨迹相关任务上的精度但这并非“免费的午餐”。实验数据显示Sequence-based 模型普遍面临参数量激增和推理延迟的问题。特别是在在线推理阶段复杂的序列计算使得其响应速度远低于其他两类模型。因此它们更适合对精度敏感但对延时容忍度较高的离线分析场景。总之在实际部署中不存在绝对的“完美模型”。开发者需要在模型复杂度精度与推理时延效率之间寻找最佳平衡点全流程模型适合追求极致精度的场景而轻量级模型则是大规模实时服务的首选。总结面对电子地图中庞大且多样的实体数据VecCity 以原创“方法学驱动”的统一分类体系突破现有研究碎片化困境首次实现跨 POI、道路、地块的通用化建模框架。基于统一的原子化数据格式VecCity 集成了来自 9 座城市的真实数据复现 21 种主流 MapRL 模型构建了该领域首个系统化、可复现的标准基准。更重要的是VecCity 对不同技术路线进行了系统、细致的对比评测揭示了各类模型在特征表达、结构建模与时空依赖捕捉方面的优势与不足。例如完整的 “token–graph–sequence” 三阶段模型在道路场景中表现最优序列增强与对比学习在 POI 任务中优势显著而图神经网络在复杂关系建模中更具鲁棒性。这些结论为研究者选择模型范式、优化算法设计提供了清晰的实证依据。凭借模块化、标准化与全面评测能力VecCity 不仅提升了模型复用与实验效率更为 MapRL 领域的理论研究、算法创新和应用落地提供了坚实的基础设施。相关信息如果你觉得本文有用的话请引用article{10.14778/3742728.3742749, author {Zhang, Wentao and Wang, Jingyuan and Yang, Yifan and U, Leong Hou}, title {VecCity: A Taxonomy-Guided Library for Map Entity Representation Learning}, year {2025}, volume {18}, number {8}, doi {10.14778/3742728.3742749}, journal {Proceedings of the VLDB Endowment.}, pages {2575–2588}, }指导教师王静远教授https://www.bigscity.com/jingyuan-wang/课题组北京航空航天大学计算机学院 BIGSCITY 实验室https://www.bigscity.com/智慧城市大数据智能组BIGSCITY专注于数据智能驱动的城市智能关键技术重点涵盖城市计算、时空数据挖掘、可解释机器学习等方向。团队已在智慧城市、数据挖掘、人工智能等领域发表 PNAS、UTD24、CCF A 等高水平论文近百篇。相关技术已落地城市规划、智能交通、医疗服务等场景在北京、天津、深圳、无锡、成都等地应用。实验室长期招聘青年教师、博士后招收博士研究生以及实习生。有意者请联系 bigscity126.com.更多阅读#投稿通道#让你的文字被更多人看到如何才能让更多的优质内容以更短路径到达读者群体缩短读者寻找优质内容的成本呢答案就是你不认识的人。总有一些你不认识的人知道你想知道的东西。PaperWeekly 或许可以成为一座桥梁促使不同背景、不同方向的学者和学术灵感相互碰撞迸发出更多的可能性。PaperWeekly 鼓励高校实验室或个人在我们的平台上分享各类优质内容可以是最新论文解读也可以是学术热点剖析、科研心得或竞赛经验讲解等。我们的目的只有一个让知识真正流动起来。稿件基本要求• 文章确系个人原创作品未曾在公开渠道发表如为其他平台已发表或待发表的文章请明确标注• 稿件建议以markdown格式撰写文中配图以附件形式发送要求图片清晰无版权问题• PaperWeekly 尊重原作者署名权并将为每篇被采纳的原创首发稿件提供业内具有竞争力稿酬具体依据文章阅读量和文章质量阶梯制结算投稿通道• 投稿邮箱hrpaperweekly.site• 来稿请备注即时联系方式微信以便我们在稿件选用的第一时间联系作者• 您也可以直接添加小编微信pwbot02快速投稿备注姓名-投稿△长按添加PaperWeekly小编现在在「知乎」也能找到我们了进入知乎首页搜索「PaperWeekly」点击「关注」订阅我们的专栏吧·

网站开发之美wordpress 重定向次数

重庆网站制作长沙哪些网站可以做推广

网站开发外包公司坑网络营销和电子商务的区别

软环境建设网站湖南seo推广软件

私人定制哪个网站做的比较好者珠海市建设局网站

天河网站(建设信科网络)网站建设中关村

seo自学教程做移动网站优化快