中国联通地铁场景无线网数字孪生项目(大模型方向)
核心成员针对复杂无线环境下用户场景识别精度低的问题,基于运营商 XDR 大数据构建地铁用户识别系统,设计基于 GLM Decoder 改进的 Encoder-Only Transformer 模型,融合移动性特征与无线信号特征;完成特征工程与模型训练流程搭建,并通过分布式训练与动态 batch 优化训练策略,最终测试集准确率达到 96%,优于当前最优方法,为数字孪生系统提供用户行为预测能力。
Communication × AI Researcher
中山大学电子与通信工程学院本科(已保研直博硕士方向),方向聚焦 大模型 · 多模态 · 无线通信。
左右旋转 · 点击进入
科研中的我,目前聚焦于大模型 × 多模态 × 无线通信。
抗压能力强,具备良好的团队协作精神,乐意与人沟通交流,并善于独立思考并尝试创新方案。
大模型 × 多模态 × 无线通信方向的三项核心研究项目。
针对复杂无线环境下用户场景识别精度低的问题,基于运营商 XDR 大数据构建地铁用户识别系统,设计基于 GLM Decoder 改进的 Encoder-Only Transformer 模型,融合移动性特征与无线信号特征;完成特征工程与模型训练流程搭建,并通过分布式训练与动态 batch 优化训练策略,最终测试集准确率达到 96%,优于当前最优方法,为数字孪生系统提供用户行为预测能力。
作为项目负责人,设计融合视觉感知与自然语言理解的具身智能抓取系统,实现自然语言驱动的机械臂智能抓取。云端部署 8bit 量化的 GLM-6b 结构 Transformer 语言理解模块,解析用户自然语言指令并映射为抓取任务,实现语言到动作的跨模态映射;端侧基于 YOLO + 3D 目标检测构建视觉感知模块,完成物体检测与三维定位,并结合姿态解算实现机械臂路径规划。最终在真实机械臂平台完成系统验证,实现多目标检测与自然语言交互抓取,显著提升系统自动化能力。
针对单一视觉或雷达传感器在复杂场景中检测精度低、鲁棒性差的问题,负责设计雷达-视觉多模态融合目标检测与定位系统,基于 YOLOv11 与 CNN-ViT 构建多模态联合感知模型;利用基站 CSI 信号生成粗粒度空间先验,引导视觉模型进行局部高精度检测,并通过 Transformer 进行跨模态特征建模与融合,结合几何一致性约束优化定位结果;在复杂遮挡与多径环境下实验验证,目标检测召回率提升约 30%。
论文与发明专利,正式题目待本人补全。
罗沛文, et al.
Submitted to [待补充:期刊/会议名],2026
在投罗沛文, et al.
发明专利 · 已授权,2025
Patent Granted罗沛文, et al.
发明专利 · 申请中,2025
申请中注:以上条目对应简历中"专利已申请 / 论文在投 / 已发专利"等成果。
科研之外,用镜头收集光与瞬间。
合作 · 学术交流 · 闲聊,欢迎找我。