您的位置
主页 > 国内新闻 » 正文

获ICME人脸106关键点检测比赛冠军 百度大脑彰显AI实力

来源:www.onolishn.com 点击:702

这一消息的成功,百度大脑再次走上了国际舞台。在今年4月初结束的106-p面部地标本地化大挑战中,百度脑视觉技术团队与包括阿里在内的20多个来自世界各地的优秀团队进行了比赛。华为,美团,中国科技大学等拥有强大国内视觉技术的团队一举夺得冠军。

ICME面临106个关键点检测竞赛名单

ICME竞赛中TOP3相对误差分布示意图

IEEE ICME(IEEE国际多媒体和博览会)是IEEE计算机学会,电路与系统学会,信号处理学会和通信学会共同赞助的计算机多媒体领域最重要的国际会议之一。文本分析,图形,视频,音频和音频,多媒体数据处理,传输,分析和应用等主题。

106-p面部地标定位的重大挑战是ICME 2019上的四个事件之一。测试样本涵盖各种困难和复杂的情况,如大姿势,极端表情和遮挡,并且训练样本很少,对算法的泛化能力,准确性和鲁棒性提出了很大的挑战。丰富的学术和实践价值吸引了百度,阿里,华为,美团,中国科技大学等数十家公司和大学的参与者。

据报道,今年的比赛主要测试复杂场景中的算法的鲁棒性和准确性,例如大姿势,极端表情和遮挡。百度,SA-NAS使用的自主开发的AutoDL技术可以显着提高算法的鲁棒性和准确性,从而在众多参与团队中脱颖而出并取得第一名。

SA-NAS是百度自主研发的AutoDL技术,在人脸检测领域有着长期的积累和研究。它以游戏任务的特点为基础,以模型的准确性和结构的多样性为指导,实现了自动化模型的构建。此外,与RL-NAS相比,该方法提高了搜索速度30倍以上,收敛过程更加稳定,使得设计深度神经网络模型摆脱了低效的人工调整困境。此外,百度在算法中引入了分段密集监督,加权热像监控和多种数据增强方法,充分利用小样本训练数据中的特征信息,消除了模型训练中的量化误差。同时,基于模型结构的多样性,依靠测试结果的统计特性,他们创新地提出了关键点一致性估计算法,显着提高了关键点检测算法的准确性和鲁棒性。

据悉,AutoDL-SA-NAS网络结构自动化设计工具在本次大赛中亮相,基于百度的开源深度学习平台PaddlePaddle。它已进入预发布阶段,将正式开源。在未来,开发人员可以使用开源PaddlePaddle平台灵活地搜索自己的算法开发任务的最佳网络结构,并获得比手动调整更好的模型结果,以提高开发效率。以前PaddlePaddle开源了一系列基于AutoDL设计的神经网络,共有六个模型训练过CIFAR10数据,包括网络结构和相应的权重。每个开发人员都可以轻松使用PaddlePaddle和公共CIFAR10数据在这六个模型上执行推理和模型融合,实现超过98%的准确率。

PaddlePaddle是百度视觉技术团队的主要技术研发平台。它是一个技术领先且功能齐全的开源深度学习平台,集成了深度学习核心框架,工具组件和服务平台。 PaddlePaddle在视觉技术方面有着深厚的积累。官方开源包括分类,检测,语义分割,OCR,GAN,人体关键点检测等类别,基于现实生活中的高质量模型业务场景验证。上个月,PaddlePaddle发布了一个视频识别工具集,涵盖了主流的实用序列建模算法和端到端视频识别模型。它可用于一键式任务启动,公共数据集下载,数据预处理,模型训练和模型。推论到位。

PaddlePaddle还优化了深度学习模型训练的内存使用。以语义分区Deeplabv3 +为例,对于内存消耗分析和解析,冗余前向计算,GPU CPU内存交换,使用16位浮点数等,允许开发人员在同一计算设备上训练更大的模型,并完成培训在消费者显卡上。

为了进一步帮助开发人员进入深度学习领域,基于PaddlePaddle的一站式深度学习开发平台AI Studio,还发出了1亿元的免费计算能力,打破了普通开发者的力量。

PaddlePaddle官方支持模式

百度大脑赢得了ICME面临的106个关键点检测竞赛,突出了百度深厚的AI技术实力,同时也代表了百度基于PaddlePaddle的视觉处理技术将进一步推进,并将在未来继续赋予各行各业。行业的智能化发展为AI领域创造了更多的可能性。

http://wap.tjpf120.cn