华体会游戏-华体会（中国）

报告题目：

1.探索扩散模型的智能图像生成的未来

2.X光安检图像智能分析技术研究与应用

3.仿生机器人及其应用

报告时间：2024年11月15日（星期五）19:00-21:00

报告地点：腾讯会议199848215

主办单位：计算机与软件工程学院

报告人：吴庆甜、张海刚、谢锋然

报告人简介：

吴庆甜：研究方向涵盖高保真智能数字人生成、基于扩散模型的图像生成技术、文本到图像生成、面部驱动及视觉控制机器人等。累计发表SCI、EI论文26篇，其中以第一作者在TITS、TIM等IEEE顶级期刊发表5篇和ICIP等顶会累计3篇，拥有10余项专利。曾荣获吴文俊人工智能科技进步奖，并在第七届IEEE PRCV大规模安检挑战赛复赛中取得第一名的成绩。

张海刚：工学博士，硕士生导师，深职大人工智能应用技术研究院副研究员，深圳南山领航卡获得者，深圳市优秀科技创新人才。张海刚博士研究方向聚焦计算机视觉领域，长期从事于X光安检图像智能分析、工业视觉检测、零样本学习领域，积累了丰富的科研成果。张海刚博士目前主持国家级项目1项，省部级项目2项，市级项目1项，横向课题1项；以第一作者或通讯作者发表科技论文20余篇，其中包括14篇SCI检索论文，以第一发明人身份授权国家发明专利7项。

谢锋然：博士，深圳市海外高层次人才，现为深圳职业技术大学人工智能学院教师。本硕博分别毕业于华南理工大学、浙江大学以及香港中文大学。主要研究方向为智能仿生机器人，主持国家自然科学基金青年基金项目、广东省基础与应用基础研究基金项目、深圳市高端人才科研启动项目、中国科学院深圳先进技术研究院优秀青年创新基金项目等，以第一作者/通讯作者发表SCI收录期刊论文8篇，申请国家发明专利5项，PCT专利3项，获深圳市第二届优秀科技学术论文奖、“挑战杯”香港赛区“一等奖”等，相关研究成果获得过中央电视台、广东省电视台等国内知名媒体的报道。

报告内容简介：

1.本报告将带领听众探索扩散模型在智能图像生成领域的前沿进展与广阔应用前景。报告内容涵盖扩散模型的核心原理及在文本到图像生成、面部驱动、虚拟数字人等应用中的创新性成果。通过展示我们研究小组在扩散模型与高保真图像生成中的工作，将介绍如何利用高性能计算资源推动模型的训练与优化。希望通过此次报告，吸引对图像生成和视觉技术充满兴趣的同学加入研究小组，共同探索智能图像生成的未来潜力。

2.利用X光机探测⾏李、包裹等运输或携带物品是否包含违禁品是当前货物、客运、运输等领域保障公共安全的⼀项重要检查措施。2023年，全国快递服务企业业务量累计完成2105.81亿件；民航旅客运输总量达到了6.2亿⼈次，铁路旅客发送量36.85亿⼈次。同时，每天数以亿计的快递包裹对于安检有着极⼤的需求。当前的安检主要依赖人工作业，安检⼈员在经过系统培训后，通过⾁眼判断X光图像中是否存在违禁品。超体量的工作为安检⼈员带来了巨⼤的⼼理和生理压力。本报告将介绍团队在智能安检方面的相关工作。我们聚焦X光安检图像智能分析理论与应用算法研究，开创了双视角X光安检图像特征融合与目标检测理论方向。我们构建了国内外第⼀个双视角X光安检数据集-Dualray，自研发了双视角X光安检图像智能分析算法，并研发了第⼀代智能安检盒⼦。

3.水下游得最快的是旗鱼，陆地上跑得最快的是猎豹、天空中飞行速度最快的是游凖。现代社会，即使最先进的潜艇、汽车和飞机，也很难在性能与效率上媲美自然界中这些生物。仿生机器人是通过将生物学原理融入机器人技术，创造出具有生物特征和能力的人工系统，以更好地适应和应对多样化的环境和任务。换而言之，就是通过学习自然界中各种生物的运动、感知、控制等仿生学知识，结合信息电子技术和人工智能技术，提高机器人系统的整体性能。本讲座将会介绍现有的仿生机器人种类，各自的特点、原理和应用场合，以及其未来的发展方向。

学术预告：计算机学院学术活动月报告会