当前位置:乐搜资讯网 >> 互联网 >> 文章正文

李翔 博士 南京理工大学:单级目标检测器的高效表征学习|公开课预习

发布于:2020-11-30 被浏览:3347次

CV前沿讲座是智慧与事物公开课中关于计算机视觉的讲座,重点介绍计算机视觉前沿领域的研究成果和进展。我们将继续邀请研究人员、专家和高级开发人员为您现场授课。

虽然目标检测是计算机视觉领域的一项基本任务,但由于其大量的应用需求,一直受到研究者的关注。如何设计性能更高的网络结构,如何提高现有检测模型的性能,已经成为研究者关注的热点。

单级目标检测的基本任务是分类和定位。分类任务通常由聚焦损失函数优化,而位置回归通常在狄拉克分布上学习。同时,在单级检测器中增加了一个额外的分支来评估位置回归的质量。例如,在FCOS,该模型不仅预测目标分类和位置回归,而且有一个中心性分支用户来评估监测点是否在bbox中心。因此,网络的最终输出是三种表示:分类表示、检测盒表示和检测盒质量估计。

南京理工大学的李翔博士在《神经科学2020》中针对现有表征中的两个问题:1)分类分数和中心性分数在训练和推理上不一致;2)bbox回归所采用的表示方式不够灵活(单一狄拉克分布)无法对复杂场景建模,因此提出了一种新的Res表示法——GFL(广义焦点损失)。

什么是GFL?总之,基于任何一级检测器,调整帧本身的表示和帧质量估计,并用广义版本的GFocal Loss训练改进的表示。没有成本上升点(一般领先一个点)AP。这只是GFL的第一个版本。在GFLV2中,作者首次引入包围盒的不确定性统计量来高效地指导检测领域的定位质量估计,从而在几乎没有成本的情况下(包括训练和测试阶段)提高一级检测器的性能,增加1 ~ 2个AP点。是一项非常尽责的技术。

12月2日晚8点,一个智力事物公开课邀请了南京理工大学的GFL和李翔博士参加“CV前沿讲座”第24讲,带来了一个主题为《单阶段目标检测器的高效表示学习》的现场讲座。李翔博士将从单阶段目标检测的定义入手,分析表征学习存在的问题,最后深入分析GFLV1和GFLV2的设计思路和应用。

李翔,南京科技大学博士生,导师杨健教授。入选2020年博士后创新人才计划。曾在微软亚洲研究院上塘科技研究院实习,在Momenta做访问学者。他的团队在阿里巴巴天池(7186个团队中排名第一)和滴滴(7664个团队中排名第一)的第一次大数据算法大赛中获奖,并发表了CVPR、神经科、AAAI、IJCAI和T-ITS等10余篇论文为第一或共同第一作者,谷歌学者引文760篇,代表作有SKNets、广义焦点损失(GFL)和理解灾难系列。

课程内容

课程主题

《单阶段目标检测器的高效表示学习》

课程提纲

1.单阶段目标检测的定义及表征学习存在的问题

2.GFLV1:分类和回归表示学习的高效改进和优化

3.GFLV2:质量评估表示学习的有效改进

讲师介绍

李翔,博士,南京理工大学,导师杨健教授,入选2020年博士后创新人才计划;曾在微软亚洲研究院上塘科技研究院实习,在Momenta做访问学者。他的团队获得了阿里巴巴天池第一次大数据大赛(7186个团队排名第一)、滴滴第一次大数据算法大赛(7664个团队排名第一);发表CVPR、神经科、AAAI、IJCAI、T-ITS等10余篇论文为第一或共同第一作者,谷歌学者引文760篇;代表作品有SKNets、广义焦点损失(GFL)和理解灾害系列。

直播信息

直播时间:2033年12月2日36000

直播地点:智能事物开放类小程序

加入讨论群

加入讨论组,除了免费看直播,还可以结识讲师,多和同行、同学学习,深入讨论。

加个小助理肖凯(ID: hikai 19)申请,注意“姓名-公司/学校/单位-职位/专业”的朋友先批~

标签: 表示 高效 阶段