
原标题:西交利物浦大学学者为图画辨认供给更优计划
我国首个单模型弱监督语义切割研讨
西交利物浦大学学者为图画辨认供给更优计划
近来,西交利物浦大学电气与电子工程系关于弱监督语义切割的研讨成果被第34届人工智能范畴尖端会议AAAI大会spotlight论文录入,该项目也在2019年获得了国家自然科学基金面上项目的赞助。
据论文的榜首作者、电气与电子工程专业博士生张冰峰介绍,他们的论文是我国首个单模型弱监督语义切割研讨。张冰峰的指导老师肖继民博士表明:“树立端到端可测验的(即单模型)弱监督语义切割一直是计算机视觉研讨的难点,咱们的研讨成果不只提高了模型的鲁棒性,一起也提高了测验精度。咱们提出的办法在节约人力标示投入、缩短耗时的一起,提高了计算机图画辨认的准确率,终究的测验功能乃至超过了现在学术界最好的非端到端模型。”
语义切割是人工智能范畴的重要分支之一,是经过将图画中的像素进行分类来辨认图画内容,这项技术被大范围的应用于地理信息系统、无人驾驶、医疗印象剖析等范畴,而弱监督语义切割的研讨也是这一分支中的前沿研讨方向。
张冰峰解释道:“当咱们给计算机进行强监督语义切割练习的时分,需求对许多样本图片进行像素等级的人工标示,比方说图片中有人、车和路途,需求人工标示出哪些像素别离归于人、车或路途,每一张图的每一个像素都需求标示其类别;计算机在‘学习’了这些标示过的图片之后,就能够终究靠分辩像从来辨认出新的图片中有什么。”
“但这种强监督语义切割需求投入许多的人力本钱,弱监督语义切割便是期望削减人工标示——只进行图画等级的标示,即只需求供给这张图片中有什么,而不需求对每个图画的像素进行标示。”
他弥补说,当时大多数弱监督语义切割都需求至少两个模型,榜首个模型经过图画的显着特征定位种子点,第二个模型经过延伸种子点定位整个图画的方位。“比方图片中有行人,计算机经过榜首个模型定位出行人的头部,经过第二个模型定位出整个行人的方位。”
“两个模型的优势是使命清晰,但下风是练习周期长,并且需求人工设置许多参数。”张冰峰说,“咱们提出的单模型能够一起进行两个使命,因而耗时更短、更节约人力。”
经过计算机视觉范畴揭露数据集Pascal VOC的测验,张冰峰提出的单模型弱监督语义切割显着优于别的一个英国学者的单模型办法。为了优化功能,张冰峰和团队在单模型的算法基础上提出了两个双模型办法,测验成果也优于其他弱监督语义切割。
(图片说明:Pascal VOC数据集的定性测验成果。a行至d行依次为原始图片、官方供给的实在值、英国学者的单模型、张冰峰和团队提出的单模型,e行和f行是张冰峰和团队提出的两个双模型办法。)
肖继民博士表明,论文提交到arXiv渠道之后,收到了包含北京大学在内的国内多所高校研讨人员的活跃反应,将在后续协作中一起深化弱监督语义切割的研讨。(通讯员:胡秋辰)
责任编辑: