全文摘要
本公开的实施例公开了眼底图像的分割方法和装置。该方法的一具体实施方式包括:获取待检测的眼底图像;将待检测的眼底图像输入图像生成模型,得到待检测的眼底图像对应的杯盘掩膜图像;基于待检测的眼底图像对应的杯盘掩膜图像,拟合出待检测的眼底图像中的视杯区域的掩膜图像和视盘区域的掩膜图像。该实施方式可以准确地分割出眼底图像中的视盘区域和视杯区域。
主设计要求
1.一种眼底图像的分割方法,包括:获取待检测的眼底图像;将所述待检测的眼底图像输入图像生成模型,得到待检测的眼底图像对应的杯盘掩膜图像,所述待检测的眼底图像对应的杯盘掩膜图像表征待检测的眼底图像中的视杯和视盘之间的差分区域;基于所述待检测的眼底图像对应的杯盘掩膜图像,拟合出所述待检测的眼底图像中的视杯区域的掩膜图像和视盘区域的掩膜图像。
设计方案
1.一种眼底图像的分割方法,包括:
获取待检测的眼底图像;
将所述待检测的眼底图像输入图像生成模型,得到待检测的眼底图像对应的杯盘掩膜图像,所述待检测的眼底图像对应的杯盘掩膜图像表征待检测的眼底图像中的视杯和视盘之间的差分区域;
基于所述待检测的眼底图像对应的杯盘掩膜图像,拟合出所述待检测的眼底图像中的视杯区域的掩膜图像和视盘区域的掩膜图像。
2.根据权利要求1所述的方法,其中,所述基于待检测的眼底图像对应的杯盘掩膜图像,拟合出待检测的眼底图像中的视杯区域的掩膜图像和视盘区域的掩膜图像,包括:
采用椭圆拟合方法对待检测的眼底图像对应的杯盘掩膜图像的内边界和外边界进行拟合,得到视杯区域的掩膜图像和视盘区域的掩膜图像。
3.根据权利要求2所述的方法,其中,所述方法还包括:
基于所述视杯区域的掩膜图像和所述视盘区域的掩膜图像,确定出所述待检测的眼底图像中的视杯区域和视盘区域的边界信息;
控制显示设备显示包含边界信息的待检测的眼底图像。
4.根据权利要求1所述的方法,其中,所述图像生成模型是按照如下方式生成的:
获取样本集,其中,样本集中的样本包括眼底图像以及与眼底图像对应的样本掩膜图像,样本掩膜图像表征对应的样本的眼底图像中视杯和视盘的差分区域;
获取初始生成对抗网络,其中,初始生成对抗网络包括生成网络和判别网络;
从样本集中选取样本,以及执行以下训练步骤:利用生成网络预测选取的样本的眼底图像中的视杯和视盘之间的差分区域,得到样本的眼底图像对应的预测掩膜图像;以及将预测掩膜图像和选取的样本掩膜图像输入判别网络,得到样本掩膜图像和对应的预测掩膜图像的类别判定结果;将类别判定结果与预设的期望类别判定结果进行比较;根据比较结果确定生成网络是否训练完成;响应于确定生成网络训练完成,将生成网络确定为图像生成模型。
5.根据权利要求4所述的方法,其中,所述选取的样本的眼底图像中的视杯和视盘之间的差分区域是利用生成网络按照如下方式预测出的:
在样本的眼底图像中叠加噪声后输入生成网络以预测样本的眼底图像中的视杯和视盘之间的差分区域。
6.一种眼底图像的分割装置,包括:
获取单元,被配置为获取待检测的眼底图像;
生成单元,被配置为将所述待检测的眼底图像输入图像生成模型,得到待检测的眼底图像对应的杯盘掩膜图像,所述待检测的眼底图像对应的杯盘掩膜图像表征待检测的眼底图像中的视杯和视盘之间的差分区域;
拟合单元,被配置为基于所述待检测的眼底图像对应的杯盘掩膜图像,拟合出所述待检测的眼底图像中的视杯区域的掩膜图像和视盘区域的掩膜图像。
7.根据权利要求6所述的装置,其中,所述拟合单元进一步被配置为按照如下方式拟合出待检测的眼底图像中的视杯区域的掩膜图像和视盘区域的掩膜图像:
采用椭圆拟合方法对待检测的眼底图像对应的杯盘掩膜图像的内边界和外边界进行拟合,得到视杯区域的掩膜图像和视盘区域的掩膜图像。
8.根据权利要求7所述的装置,其中,所述装置还包括:
确定单元,被配置为基于视杯区域的掩膜图像和视盘区域的掩膜图像,确定出待检测的眼底图像中的视杯区域和视盘区域的边界信息;
显示单元,被配置为控制显示设备显示包含边界信息的待检测的眼底图像。
9.根据权利要求6所述的装置,其中,所述图像生成模型是按照如下方式生成的:
获取样本集,其中,样本集中的样本包括眼底图像以及与眼底图像对应的样本掩膜图像,样本掩膜图像表征对应的样本的眼底图像中视杯和视盘的差分区域;
获取初始生成对抗网络,其中,初始生成对抗网络包括生成网络和判别网络;
从样本集中选取样本,以及执行以下训练步骤:利用生成网络预测选取的样本的眼底图像中的视杯和视盘之间的差分区域,得到样本的眼底图像对应的预测掩膜图像;以及将预测掩膜图像和选取的样本掩膜图像输入判别网络,得到样本掩膜图像和对应的预测掩膜图像的类别判定结果;将类别判定结果与预设的期望类别判定结果进行比较;根据比较结果确定生成网络是否训练完成;响应于确定生成网络训练完成,将生成网络确定为图像生成模型。
10.根据权利要求9所述的装置,其中,所述选取的样本的眼底图像中的视杯和视盘之间的差分区域是利用生成网络按照如下方式预测出的:
在样本的眼底图像中叠加噪声后输入生成网络以预测样本的眼底图像中的视杯和视盘之间的差分区域。
11.一种电子设备,包括:
一个或多个处理器;
存储装置,其上存储有一个或多个程序,
当一个或多个程序被一个或多个处理器执行,使得一个或多个处理器实现如权利要求1-5中任一的方法。
12.一种计算机可读介质,其上存储有计算机程序,其中,该程序被处理器执行时实现如权利要求1-5中任一的方法。
设计说明书
本公开的实施例涉及计算机技术领域,具体涉及图像处理领域,尤其涉及眼底图像的分割方法和装置。
背景技术
当前,随着计算机技术的发展,各种图像分割技术不断涌现。图像分割技术能够解决很多实际问题。其中一个典型的应用是医学影像的分割处理,图像分割可以定位出影像中的关键部位,从而帮助诊断和治疗。
在眼底图像的图像处理中,期望通过图像分割技术来分割视杯区域和视盘区域。目前的眼底图像分割技术大多是基于视杯和视盘的图像的像素值进行阈值分割。
发明内容
本公开的实施例提出了眼底图像的分割方法和装置。
第一方面,本公开的实施例提供了一种眼底图像的分割方法,该方法包括:获取待检测的眼底图像;将待检测的眼底图像输入图像生成模型,得到待检测的眼底图像对应的杯盘掩膜图像,待检测的眼底图像对应的杯盘掩膜图像表征待检测的眼底图像中的视杯和视盘之间的差分区域;基于待检测的眼底图像对应的杯盘掩膜图像,拟合出待检测的眼底图像中的视杯区域的掩膜图像和视盘区域的掩膜图像。
在一些实施例中,基于待检测的眼底图像对应的杯盘掩膜图像,拟合出待检测的眼底图像中的视杯区域的掩膜图像和视盘区域的掩膜图像,包括:采用椭圆拟合方法对待检测的眼底图像对应的杯盘掩膜图像的内边界和外边界进行拟合,得到视杯区域的掩膜图像和视盘区域的掩膜图像。
在一些实施例中,该方法还包括:基于视杯区域的掩膜图像和视盘区域的掩膜图像,确定出待检测的眼底图像中的视杯区域和视盘区域的边界信息;控制显示设备显示包含边界信息的待检测的眼底图像。
在一些实施例中,图像生成模型是按照如下方式生成的:获取样本集,其中,样本集中的样本包括眼底图像以及与眼底图像对应的样本掩膜图像,样本掩膜图像表征对应的样本的眼底图像中视杯和视盘的差分区域;获取初始生成对抗网络,其中,初始生成对抗网络包括生成网络和判别网络;从样本集中选取样本,以及执行以下训练步骤:利用生成网络预测选取的样本的眼底图像中的视杯和视盘之间的差分区域,得到样本的眼底图像对应的预测掩膜图像;以及将预测掩膜图像和选取的样本掩膜图像输入判别网络,得到样本掩膜图像和对应的预测掩膜图像的类别判定结果;将类别判定结果与预设的期望类别判定结果进行比较;根据比较结果确定生成网络是否训练完成;响应于确定生成网络训练完成,将生成网络确定为图像生成模型。
在一些实施例中,选取的样本的眼底图像中的视杯和视盘之间的差分区域是利用生成网络按照如下方式预测出的:在样本的眼底图像中叠加噪声后输入生成网络以预测样本的眼底图像中的视杯和视盘之间的差分区域。
第二方面,本公开的实施例提供了一种眼底图像的分割装置,该装置包括:获取单元,被配置为获取待检测的眼底图像;生成单元,被配置为将待检测的眼底图像输入图像生成模型,得到待检测的眼底图像对应的杯盘掩膜图像,待检测的眼底图像对应的杯盘掩膜图像表征待检测的眼底图像中的视杯和视盘之间的差分区域;拟合单元,被配置为基于待检测的眼底图像对应的杯盘掩膜图像,拟合出待检测的眼底图像中的视杯区域的掩膜图像和视盘区域的掩膜图像。
在一些实施例中,拟合单元进一步被配置为按照如下方式拟合出待检测的眼底图像中的视杯区域的掩膜图像和视盘区域的掩膜图像:采用椭圆拟合方法对待检测的眼底图像对应的杯盘掩膜图像的内边界和外边界进行拟合,得到视杯区域的掩膜图像和视盘区域的掩膜图像。
在一些实施例中,该装置还包括:确定单元,被配置为基于视杯区域的掩膜图像和视盘区域的掩膜图像,确定出待检测的眼底图像中的视杯区域和视盘区域的边界信息;显示单元,被配置为控制显示设备显示包含边界信息的待检测的眼底图像。
在一些实施例中,图像生成模型是按照如下方式生成的:获取样本集,其中,样本集中的样本包括眼底图像以及与眼底图像对应的样本掩膜图像,样本掩膜图像表征对应的样本的眼底图像中视杯和视盘的差分区域;获取初始生成对抗网络,其中,初始生成对抗网络包括生成网络和判别网络;从样本集中选取样本,以及执行以下训练步骤:利用生成网络预测选取的样本的眼底图像中的视杯和视盘之间的差分区域,得到样本的眼底图像对应的预测掩膜图像;以及将预测掩膜图像和选取的样本掩膜图像输入判别网络,得到样本掩膜图像和对应的预测掩膜图像的类别判定结果;将类别判定结果与预设的期望类别判定结果进行比较;根据比较结果确定生成网络是否训练完成;响应于确定生成网络训练完成,将生成网络确定为图像生成模型。
在一些实施例中,选取的样本的眼底图像中的视杯和视盘之间的差分区域是利用生成网络按照如下方式预测出的:在样本的眼底图像中叠加噪声后输入生成网络以预测样本的眼底图像中的视杯和视盘之间的差分区域。
第三方面,本公开的实施例提供了一种电子设备,该电子设备包括:一个或多个处理器;存储装置,其上存储有一个或多个程序;当一个或多个程序被一个或多个处理器执行,使得一个或多个处理器实现如第一方面中任一实现方式描述的方法。
第四方面,本公开的实施例提供了一种计算机可读介质,其上存储有计算机程序,该程序被处理器执行时实现如第一方面中任一实现方式描述的方法。
本公开的实施例提供的眼底图像的分割方法和装置,通过获取待检测的眼底图像,将待检测的眼底图像输入图像生成模型,得到待检测的眼底图像对应的杯盘掩膜图像,待检测的眼底图像对应的杯盘掩膜图像表征待检测的眼底图像中的视杯和视盘之间的差分区域,最后,基于待检测的眼底图像对应的杯盘掩膜图像,拟合出待检测的眼底图像中的视杯区域的掩膜图像和视盘区域的掩膜图像。从而能够得到一种图像分割的方法,实现准确快速的分割图像区域。
附图说明
通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本公开的其它特征、目的和优点将会变得更明显:
图1是本公开的一个实施例可以应用于其中的示例性系统架构图;
图2是根据本公开的眼底图像的分割方法的一个实施例的流程图;
图3是根据本公开的实施例的眼底图像的分割方法的一个应用场景的示意图;
图4是上述图像生成模型的生成方法的一种实现方式的流程图;
图5a、图5b是根据本公开的实施例的样本眼底图像和对应的样本掩膜图像的示例图;
图6是根据本公开的实施例的眼底图像的分割装置的一个实施例的结构示意图;
图7是适于用来实现本公开的实施例的电子设备的结构示意图。
具体实施方式
下面结合附图和实施例对本公开作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释相关发明,而非对该发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与有关发明相关的部分。
需要说明的是,在不冲突的情况下,本公开中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本公开。
图1示出了可以应用本公开的眼底图像的分割方法或眼底图像的分割装置的示例性架构100。
如图1所示,系统架构100可以包括终端101、102,网络103、数据库服务器104和服务器105。网络103用以在终端101、102,数据库服务器104与服务器105之间提供通信链路的介质。网络103可以包括各种连接类型,例如有线、无线通信链路或者光纤电缆等等。
用户110可以使用终端101、102通过网络103与服务器105进行交互,以接收或发送消息等。终端101、102上可以安装有各种客户端应用,例如模型训练类应用、图像处理类应用、购物类应用、支付类应用、网页浏览器和即时通讯工具等。
这里的终端101、102可以是硬件,也可以是软件。当终端101、102为硬件时,可以是具有显示屏的各种电子设备,包括但不限于智能手机、平板电脑、电子书阅读器、MP3播放器(Moving Picture Experts Group Audio Layer III,动态影像专家压缩标准音频层面3)、膝上型便携计算机和台式计算机等等。当终端101、102为软件时,可以安装在上述所列举的电子设备中。其可以实现成多个软件或软件模块(例如用来提供分布式服务),也可以实现成单个软件或软件模块。在此不做具体限定。
数据库服务器104可以是提供各种服务的数据库服务器。在一些应用场景中,例如数据库服务器104中可以存储有样本集。样本集中包含有大量的样本。其中,样本可以包括眼底图像以及与眼底图像对应的样本掩膜图像。这样,用户110也可以通过终端101、102,从数据库服务器104所存储的样本集中选取训练样本。
服务器105也可以是提供各种服务的服务器,例如对终端101、102上运行的各种应用提供支持的后台服务器。后台服务器可以对接收到的待检测的眼底图像进行处理,并将处理结果(待检测的眼底图像对应的杯盘掩膜图像)反馈给终端101、102。在一些应用场景中,后台服务器也可以利用终端101、102发送的样本集中的样本,对初始的生成对抗网络进行训练,并可以将训练结果(如生成的图像生成模型)发送给终端101、102。这样,终端用户可以应用生成的图像生成模型得到表征待检测的眼底图像中的视杯和视盘之间的差分区域的掩膜图像。
这里的数据库服务器104和服务器105同样可以是硬件,也可以是软件。当它们为硬件时,可以实现成多个服务器组成的分布式服务器集群,也可以实现成单个服务器。当它们为软件时,可以实现成多个软件或软件模块(例如用来提供分布式服务的多个软件或软件模块),也可以实现成单个软件或软件模块。在此不做具体限定。
需要说明的是,本公开的实施例所提供的眼底图像的分割方法一般由服务器105执行。相应地,眼底图像的分割装置一般也设置于服务器105中。
需要指出的是,在服务器105可以实现数据库服务器104的相关功能的情况下,系统架构100中可以不设置数据库服务器104。
应该理解,图1中的终端、网络、数据库服务器和服务器的数目仅仅是示意性的。根据实现需要,可以具有任意数目的终端、网络、数据库服务器和服务器。
继续参考图2,示出了根据本公开的眼底图像的分割方法的一个实施例的流程200。该眼底图像的分割方法可以包括以下步骤:
步骤201,获取待检测的眼底图像。
在本实施例中,图像生成的方法的执行主体(例如图1所示的服务器105)可以通过多种方式来获取待检测的眼底图像。例如,上述执行主体可以从数据库服务器(例如图1所示的数据库服务器104)中获取存储于其中的待检测的眼底图像。再例如,上述执行主体也可以接收终端(例如图1所示的终端101、102)或其他眼部检测设备采集的待检测的眼底图像。
在这里,眼底图像通常指包括视杯区域和视盘区域的图像。其可以是彩色图像(如RGB(Red、Green、Blue,红绿蓝)照片),也可以是灰度图像。该图像的格式在本申请中并不限制,如jpg(Joint Photo graphic Experts Group,一种图片格式)、BMP(Bitmap,图像文件格式)或RAW(RAW Image Format,无损压缩格式)等格式,只要可以被执行主体读取识别即可。
步骤202,将待检测的眼底图像输入图像生成模型,得到待检测的眼底图像对应的杯盘掩膜图像,待检测的眼底图像对应的杯盘掩膜图像表征待检测的眼底图像中的视杯和视盘之间的差分区域。
在本实施例中,图像生成模型可以是人工神经网络。基于步骤201所获取的待检测的眼底图像,上述执行主体可以将待检测的眼底图像输入至预先训练的人工神经网络来确定待检测的眼底图像对应的杯盘掩膜图像。在这里,待检测的眼底图像对应的杯盘掩膜图像表征待检测的眼底图像中的视杯和视盘之间的差分区域。视盘即视网膜由黄斑向鼻侧约3mm处有一直径约1.5mm,境界清楚的淡红色圆盘状结构。视杯是视盘中心的白色杯状区域。上述图像生成模型可以是利用已标注的眼底图像的视杯和视盘之间的差分区域训练得到的。可以理解的是,视杯和视盘之间的差分区域可以用多种形式来表达,例如,可以采用视杯和视盘之间的差分区域的边界坐标值来表示差分区域在眼底图像上的位置。
在本实施例的一些可选的实现方式中,图像生成模型可以是采用如图4实现方式所描述的方法而生成的。具体生成过程可以参见图4实现方式的相关描述。
步骤203,基于待检测的眼底图像对应的杯盘掩膜图像,拟合出待检测的眼底图像中的视杯区域的掩膜图像和视盘区域的掩膜图像。
在本实施例中,由于视杯的边界和视盘的边界通常是椭圆状的,上述执行主体可以利用这一特性从眼底图像中定位出视杯和视盘的边界,进而通过拟合处理,从杯盘掩膜图像中得到待检测的眼底图像中的视杯区域的掩膜图像和视盘区域的掩膜图像。
在本实施例的一些可选的实现方式中,该方法还包括:采用椭圆拟合方法对待检测的眼底图像对应的杯盘掩膜图像的内边界和外边界进行拟合,得到视杯区域的掩膜图像和视盘区域的掩膜图像。
在该可选的实现方式中,上述执行主体通过得到待检测的眼底图像对应的杯盘掩膜图像,根据待检测的眼底图像对应的杯盘掩膜图像表征待检测的眼底图像中的视杯和视盘之间的差分区域,可以对待检测的眼底图像对应的杯盘掩膜图像进行像素值反转操作,获取出视杯区域的连通域,提取出杯盘掩膜图像的内边界即视杯区域的边界。然后,将提取出的视杯区域和待检测的眼底图像对应的杯盘掩膜图像进行叠加操作,提取出杯盘掩膜图像的外边界,即视盘区域的边界。最后,对上述提取出视杯区域的边界和视盘区域的边界分别进行椭圆拟合处理,得到视杯区域的掩膜图像和视盘区域的掩膜图像。
在本实施例的一些可选的实现方式中,该方法还包括:基于视杯区域的掩膜图像和视盘区域的掩膜图像,确定出待检测的眼底图像中的视杯区域和视盘区域的边界信息;控制显示设备显示包含边界信息的待检测的眼底图像。
在该可选的实现方式中,根据从上述视杯区域的掩膜图像和视盘区域的掩膜图像中提取出的视杯区域的边界和视盘区域的边界,可以得到待检测的眼底图像中的视杯区域和视盘区域的边界信息。这里的边界信息可以是视杯区域的边界和视盘区域的边界的坐标位置信息。
在该可选的实现方式中,显示设备可以是与上述执行主体通信连接的、用于显示上述执行主体发送的图像的设备(例如图1所示的终端101、102)。实践中,上述执行主体可以向显示设备发送控制信号,进而控制显示设备显示包含边界信息的待检测的眼底图像。例如可以将视杯和视盘的边界坐标的像素值为指定的像素值,使得眼底图像中的视杯和视盘的边界被高亮显示。
在本实施例中,上述执行主体可以基于视杯区域的掩膜图像和视盘区域的掩膜图像,确定出待检测的眼底图像中的视杯区域和视盘区域的边界信息,以及控制显示设备显示包含边界信息的待检测的眼底图像。一方面,可以直接显示包含边界信息的待检测的眼底图像,确定生成的图像是否准确的完成区域分割。另一方面,生成的图像完成一次性对视杯区域和视盘区域的分割,再进行简单的拟合处理得到视杯区域图像和视盘区域图像,提高了图像分割的速度和准确性。
继续参考图3,其示出了根据本公开的实施例的眼底图像的分割方法的一个应用场景的示意图。在图3的应用场景图中,用户从终端设备301中获取待检测的眼底图像302,对图像生成模型应用提供后台支持的服务器303对待检测的眼底图像302进行处理,得到待检测的眼底图像对应的杯盘掩膜图像304,最后经过拟合处理得到待检测的眼底图像中的视杯区域的掩膜图像305和视盘区域的掩膜图像306。
上述眼底图像的分割方法,首先获取待检测的眼底图像。然后,将待检测的眼底图像输入至图像生成模型,得到待检测的眼底图像对应的杯盘掩膜图像。最后,通过图像拟合处理得到待检测的眼底图像中的视杯区域的掩膜图像和视盘区域的掩膜图像。该方法实现了眼底图像中视杯和视盘区域的准确分割。
继续参见图4,其示出了上述图像生成模型的生成方法的一种实现方式的流程图。该图像生成模型的生成方法的流程400可以包括以下步骤:
步骤401,获取样本集,其中,样本集中的样本包括眼底图像以及与眼底图像对应的样本掩膜图像,样本掩膜图像表征对应的样本的眼底图像中视杯和视盘的差分区域。
在本实施例中,上述执行主体可以从数据库服务器(例如图1所示的数据库服务器104)中获取存储于其中的现有的训练样本集合。再例如,用户可以通过终端(例如图1所示的终端101、102)来收集训练样本。这样,上述执行主体可以接收终端所收集的样本,并将这些样本存储在本地,从而生成训练样本集。
在这里,样本集中可以包括至少一个样本。其中,样本可以包括眼底图像以及与眼底图像对应的样本掩膜图像。这里的样本掩膜图像可以表征对应的样本的眼底图像中视杯和视盘的差分区域。可以理解的是,这里的样本掩膜图像可以是基于人工标注等方法预先得到的。例如,上述执行主体可以根据眼底图像中视杯区域与视盘区域的位置进行标注,得到上述的掩膜图像。在数学图像处理领域,上述执行主体也可以用选定的图像或者图形,对处理的图像(全部或者局部)进行遮挡,来控制图像处理的区域或处理过程。此选定的图像或者图形称之为掩膜。掩膜图像可以为二维矩阵数组。
图5a和图5b是根据本公开的实施例的样本眼底图像和对应的样本掩膜图像的示例图。如图5a和图5b所示,图5a是样本眼底图像,其中,图像区域501是眼底图像中的视盘区域,图像区域502是眼底图像中的视杯区域。图5b是上述样本眼底图像对应的样本掩膜图像,其中,样本掩膜图像中圆环状区域可以是样本眼底图像中视杯和视盘的差分区域。
步骤402,获取初始生成对抗网络,其中,初始生成对抗网络包括生成网络和判别网络。
在本实施例中,上述执行主体可以获取初始生成对抗网络。其中,初始生成对抗网络可以包括初始的生成网络和初始的判别网络。上述执行主体可以利用生成网络预测选取的样本的眼底图像中的视杯和视盘之间的差分区域,得到样本的眼底图像对应的预测掩膜图像。判别网络可以用于确定生成网络输出的样本的眼底图像对应的预测掩膜图像是否为样本的眼底图像对应的真实的掩膜图像。
生成网络可以包括但不限于以下至少一项:深度神经网络模型、隐马尔可夫模型(Hidden Markov Model,HMM)、朴素贝叶斯模型、高斯混合模型。判别网络可以包括但不限于以下至少一项:线性回归模型、线性判别分析、支持向量机(Support Vector Machine,SVM)、神经网络。应当理解,初始生成对抗网络可以是初始化参数后,未经训练的生成对抗网络,也可以是预先训练过的生成对抗网络。
步骤403,从样本集中选取样本,执行训练步骤。
在本实施例中,上述执行主体可以从步骤401中获取的样本集中选取样本,以及执行步骤4031至步骤4035的训练步骤。其中,样本的选取方式和选取数量在本公开中并不限制。例如上述执行主体可以选取至少一个样本。
更具体地,训练步骤包括如下步骤:
步骤4031,利用生成网络预测选取的样本的眼底图像中的视杯和视盘之间的差分区域,得到样本的眼底图像对应的预测掩膜图像。
在本实施例中,上述执行主体可以在选取的样本的眼底图像中添加预设噪声,然后将该添加了噪声的样本的眼底图像输入生成网络,以预测样本的眼底图像中的视杯和视盘之间的差分区域,得到样本的眼底图像对应的预测掩膜图像。例如,这里的预设噪声可以是椒盐噪声,高斯噪声。这里添加噪声的目的是为了提高生成网络的抗干扰性,提高泛化能力。
步骤4032,将预测掩膜图像和选取的样本掩膜图像输入判别网络,得到样本掩膜图像和对应的预测掩膜图像的类别判定结果。
在本实施例中,上述执行主体可以将步骤4031中生成网络得到的预测掩膜图像和选取的样本的与眼底图像对应的样本掩膜图像输入判别网络。判别网络可以输出得到样本掩膜图像和对应的预测掩膜图像的类别判定结果。在生成对抗网络中,判别网络用于判别合成图像是否与真实图像表现的一致。如果判别网络给出的判别结果显示生成网络生成的合成图像与真实图像的类别一致,或者判别网络无法区分生成网络生成的合成图像与真实图像哪一个是真实的图像,则可以认为生成网络生成的合成图像与真实图像的相似度非常高。应用在本实施例中,判别网络判定的类别可以根据样本的眼底图像对应的合成的预测掩膜图像是否为样本的眼底图像对应的真实的样本掩膜图像。作为一种示例,这里的类别判定结果可以是基于预测掩膜图像和样本掩膜图像的类别标签来表示,对上述两种图像进行判定得到的类别判定结果,假定样本掩膜图像的图像标签为1,预测掩膜图像的图像标签可能被判定为0或1。需要说明的是,图像标签也可以是其他预先设置的信息,不限于数值1和0。损失函数就是基于样本掩膜图像的标签和类别判定结果得到的。
步骤4033,将类别判定结果与预设的期望类别判定结果进行比较。
在本实施例中,基于步骤4032得到的类别判定结果达到预设的期望类别判定结果时,可以认为类别判定结果接近或者近似预设的期望类别判定结果。其中,预设的期望类别判定结果可以是本领域技术人员根据经验预先设置的,且本领域技术人员可以对预设的期望类别判定结果进行调整。
作为示例,预设的期望类别判定结果可以是:判别网络无法区分出预测掩膜图像和样本掩膜图像的类别,作为示例,预测的期望类别判定结果可以是:判别网络对生成网络生成的掩膜图像的类别的预测概率接近0.5。
步骤4034,根据比较结果确定生成网络是否训练完成。
在本实施例中,根据步骤4033中的比较结果,上述执行主体可以确定生成网络是否训练完成。作为示例,如果步骤4033中选取有多个样本,那么在每个样本的类别判定结果达到预设的期望类别判定结果,上述执行主体可以确定生成网络训练完成。再例如,上述执行主体可以统计总的类别判定结果达到预设的期望类别判定结果的样本占选取的样本的比例。且在该比例达到预设训练样本比例(如95%),可以确定生成网络训练完成。若上述执行主体确定生成网络已训练完成,则可以继续执行步骤4035。
在本实施例的一些可选的实现方式中,若上述执行主体确定生成网络未训练完成,则可以调整初始生成对抗网络中的相关参数。从训练样本集中选取样本,返回重新执行上述训练步骤。调整参数的方式可以例如采用反向传播算法等。这样,可以使初始生成对抗网络进行循环性的训练,最终保证迭代训练后得到最优的初始生成对抗网络。
需要说明的是,这里的选取方式在本公开中也不限制。例如在训练样本集中有大量样本的情况下,执行主体可以从中选取未被选取过的样本。
步骤4035,响应于确定生成网络训练完成,将生成网络确定为图像生成模型。
在本实施例中,若上述执行主体确定生成网络训练完成,则可以将该生成网络(即训练完成的生成网络)作为图像生成模型。
可选地,上述执行主体可以将生成的图像生成模型存储在本地,也可以将其发送给终端或数据库服务器。
上述方法流程400基于生成对抗网络训练模型,并将训练完成生成网络作为图像生成模型,得到了可以生成“以假乱真”的掩膜图像的图像生成模型,通过生成网络和对抗网络在训练过程中不断对抗来优化生成网络,能够得出准确、可靠的图像生成模型。进而采用该图像生成模型来进行眼底图像的分割,进一步提升了对眼底图像中视杯和视盘区域分割的精准度。
继续参考图6,作为对上述图2所示方法的实现,本申请提供了一种眼底图像的分割装置的一个实施例。该装置实施例与图2所示的方法实施例相对应,该装置具体可以应用于各种电子设备中。
如图6所示,本实施例的眼底图像的分割装置600可以包括:获取单元601,被配置为获取待检测的眼底图像;生成单元602,被配置为将待检测的眼底图像输入图像生成模型,得到待检测的眼底图像对应的杯盘掩膜图像,待检测的眼底图像对应的杯盘掩膜图像表征待检测的眼底图像中的视杯和视盘之间的差分区域;拟合单元603,被配置为基于待检测的眼底图像对应的杯盘掩膜图像,拟合出待检测的眼底图像中的视杯区域的掩膜图像和视盘区域的掩膜图像。
在一些实施例中,上述装置600还可以包括:确定单元(图中未示出),被配置为基于视杯区域的掩膜图像和视盘区域的掩膜图像,确定出待检测的眼底图像中的视杯区域和视盘区域的边界信息;显示单元(图中未示出),被配置为控制显示设备显示包含边界信息的待检测的眼底图像。
在本实施例的一些可选的实现方式中,拟合单元603进一步被配置为按照如下方式拟合出待检测的眼底图像中的视杯区域的掩膜图像和视盘区域的掩膜图像:采用椭圆拟合方法对待检测的眼底图像对应的杯盘掩膜图像的内边界和外边界进行拟合,得到视杯区域的掩膜图像和视盘区域的掩膜图像。
在本实施例的一些可选的实现方式中,图像生成模型是按照如下方式生成的:获取样本集,其中,样本集中的样本包括眼底图像以及与眼底图像对应的样本掩膜图像,样本掩膜图像表征对应的样本的眼底图像中视杯和视盘的差分区域;获取初始生成对抗网络,其中,初始生成对抗网络包括生成网络和判别网络;从样本集中选取样本,以及执行以下训练步骤:利用生成网络预测选取的样本的眼底图像中的视杯和视盘之间的差分区域,得到样本的眼底图像对应的预测掩膜图像;以及将预测掩膜图像和选取的样本掩膜图像输入判别网络,得到样本掩膜图像和对应的预测掩膜图像的类别判定结果;将类别判定结果与预设的期望类别判定结果进行比较;根据比较结果确定生成网络是否训练完成;响应于确定生成网络训练完成,将生成网络确定为图像生成模型。
在本实施例的一些可选的实现方式中,选取的样本的眼底图像中的视杯和视盘之间的差分区域是利用生成网络按照如下方式预测出的:在样本的眼底图像中叠加噪声后输入生成网络以预测样本的眼底图像中的视杯和视盘之间的差分区域。
可以理解的是,该装置600中记载的诸单元与参考图2描述的方法中的各个步骤相对应。由此,上文针对方法描述的操作、特征以及产生的有益效果同样适用于装置600及其中包含的单元,在此不再赘述。
下面参考图7,其示出了适于用来实现本公开的实施例的电子设备(例如图1中的服务器)700的结构示意图。图7示出的服务器仅仅是一个示例,不应对本公开的实施例的功能和使用范围带来任何限制。
如图7所示,电子设备700可以包括处理装置(例如中央处理器、图形处理器等)701,其可以根据存储在只读存储器(ROM)702中的程序或者从存储装置708加载到随机访问存储器(RAM)703中的程序而执行各种适当的动作和处理。在RAM 703中,还存储有电子设备700操作所需的各种程序和数据。处理装置701、ROM 702以及RAM703通过总线704彼此相连。输入\/输出(I\/O)接口705也连接至总线704。
通常,以下装置可以连接至I\/O接口705:包括例如触摸屏、触摸板、键盘、鼠标、摄像头、麦克风、加速度计、陀螺仪等的输入装置706;包括例如液晶显示器(LCD)、扬声器、振动器等的输出装置707;包括例如磁带、硬盘等的存储装置708;以及通信装置709。通信装置709可以允许电子设备700与其他设备进行无线或有线通信以交换数据。虽然图7示出了具有各种装置的电子设备700,但是应理解的是,并不要求实施或具备所有示出的装置。可以替代地实施或具备更多或更少的装置。图7中示出的每个方框可以代表一个装置,也可以根据需要代表多个装置。
特别地,根据本公开的实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本公开的实施例包括一种计算机程序产品,其包括承载在计算机可读介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信装置709从网络上被下载和安装,或者从存储装置708被安装,或者从ROM 702被安装。在该计算机程序被处理装置701执行时,执行本公开的实施例的方法中限定的上述功能。
需要说明的是,本公开的实施例的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本公开的实施例中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本公开的实施例中,计算机可读信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读信号介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:电线、光缆、RF(Radio Frequency,射频)等等,或者上述的任意合适的组合。
上述计算机可读介质可以是上述电子设备中所包含的;也可以是单独存在,而未装配入该电子设备中。上述计算机可读介质承载有一个或者多个程序,当上述一个或者多个程序被该电子设备执行时,使得该电子设备:获取待检测的眼底图像;将待检测的眼底图像输入图像生成模型,得到待检测的眼底图像对应的杯盘掩膜图像,待检测的眼底图像对应的杯盘掩膜图像表征待检测的眼底图像中的视杯和视盘之间的差分区域;基于待检测的眼底图像对应的杯盘掩膜图像,拟合出待检测的眼底图像中的视杯区域的掩膜图像和视盘区域的掩膜图像。
可以以一种或多种程序设计语言或其组合来编写用于执行本公开的实施例的操作的计算机程序代码,程序设计语言包括面向对象的程序设计语言—诸如Java、Smalltalk、C++,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
附图中的流程图和框图,图示了按照本公开各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,该模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和\/或流程图中的每个方框、以及框图和\/或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
描述于本公开的实施例中所涉及到的单元可以通过软件的方式实现,也可以通过硬件的方式来实现。所描述的单元也可以设置在处理器中,例如,可以描述为:一种处理器,包括获取单元、生成单元,拟合单元,或者:一种处理器,包括图像获取单元和图像处理单元。其中,这些单元的名称在某种情况下并不构成对该单元本身的限定,例如,第一获取单元还可以被描述为“获取待检测的眼底图像的单元”。
以上描述仅为本公开的较佳实施例以及对所运用技术原理的说明。本领域技术人员应当理解,本公开的实施例中所涉及的发明范围,并不限于上述技术特征的特定组合而成的技术方案,同时也应涵盖在不脱离上述发明构思的情况下,由上述技术特征或其等同特征进行任意组合而形成的其它技术方案。例如上述特征与本公开的实施例中公开的(但不限于)具有类似功能的技术特征进行互相替换而形成的技术方案。
设计图
相关信息详情
申请码:申请号:CN201910590552.5
申请日:2019-07-02
公开号:CN110298850A
公开日:2019-10-01
国家:CN
国家/省市:11(北京)
授权编号:授权时间:主分类号:G06T 7/11
专利分类号:G06T7/11;G06T7/136
范畴分类:40B;
申请人:北京百度网讯科技有限公司
第一申请人:北京百度网讯科技有限公司
申请人地址:100085 北京市海淀区上地十街10号百度大厦2层
发明人:孙钦佩;杨叶辉;王磊;许言午;黄艳
第一发明人:孙钦佩
当前权利人:北京百度网讯科技有限公司
代理人:王达佐;马晓亚
代理机构:11204
代理机构编号:北京英赛嘉华知识产权代理有限责任公司
优先权:关键词:当前状态:审核中
类型名称:外观设计