一、快速输入大写金额数字(论文文献综述)
孟洋[1](2021)在《基于深度学习的发票图像信息识别算法研究》文中研究表明近年来,我国发票的使用量剧增,其中增值税专用发票和增值税普通发票使用量极大,占各类发票总量的90%。发票的报销流程十分繁琐,需要手动录入发票中关键信息,浪费大量人力和时间,所以设计一种用于发票信息智能识别的算法尤为重要。目前,传统算法可以对扫描的发票图像进行信息的识别,但对手机拍摄的缩放比、模糊程度、亮度、倾斜角度、尺寸以及背景干扰各不相同的发票图像中的信息进行识别还存在挑战。本文提出的基于深度学习的发票图像信息识别算法,结合计算机视觉技术和文本检测识别算法对手机拍摄的发票图像信息进行识别,信息准确率高达99.10%。首先,提出一种基于霍夫变换的HTA算法,对自然场景下倾斜的发票图像进行智能倾斜矫正。接着,创新性地结合YOLOv3深度学习算法和Open CV裁减技术对已倾斜矫正的发票图像进行区域定位、分割及提取,有效去除发票图像上的冗余信息,并对信息进行归类。然后,通过CDNets算法对提取到的发票区域图像上的信息进行文本检测和识别。最后,提出一种基于OCR的格式化文本处理方法对识别后的结果进行本文格式化输出。接着,针对发票图像中价税合计区域中大写中文金额字符进行识别。本文提出基于深度学习的发票图像文字识别算法模型,该模型连续使用卷积核为5×5组成的卷积层,连续卷积层后连接批归一化层一种新的卷积神经网络架构,实验表明该模型优于对比模型,识别准确率高达99.79%。最后,对基于深度学习的发票图像文字识别算法模型进行压缩,提出剪枝网络用于发票图像文字识别算法,对模型进行逐层通道剪枝,压缩后轻量级模型权重大小为2537KB,识别准确率为99.38%。
闫茹[2](2021)在《基于语义增强与语法规则的复杂场景文本识别算法研究》文中研究表明随着互联网技术的发展,图像已经成为人们信息交流的重要媒介。图像中的文本具有精准的语义,准确的识别可以对机器视觉等领域的人工智能应用产生重要影响。尽管光学字符识别技术的研究已经取得了很大的进展,但在现实应用场景中很多情况下是比较复杂的文本图像,例如自动驾驶、盲人导航、票据自动化处理等。这些场景图像中的文本往往具有较强的不规范性,包括丰富的布局排列、干扰性的背景,手写体文本随意的书写风格、字符之间的粘连以及采集设备和采集方式不专业造成的图像模糊、低分辨率等。从这些复杂场景图像中准确的识别文本仍然是一项艰巨的任务。本文对两种类型的复杂场景文本识别技术进行研究,主要研究内容及成果如下:(1)针对现有方法在场景文本识别中的局限性,提出了一种基于文本注意与语义增强的场景文本识别算法。首先,针对背景干扰问题设计了基于文本注意的视觉特征提取模块,利用全卷积的框架对图像进行像素级别的预测,实现文本注意机制。该模块可以自适应地抑制背景特征的干扰,提取到更有效的前景特征。然后,针对基于一维序列的场景文本识别方法不能处理竖排文本的问题,设计了旋转矫正网络。通过预测场景图像中文本的排列方向、阅读顺序生成矫正方案,对提取到的二维视觉特征做矫正。最后,构建了融合时序卷积和Transformer编码器的语义增强模型,不仅有效地提高了低分辨率、噪声严重的文本图像的识别准确率,而且提高了模型的可并行度。实验结果表明,基于文本注意与语义增强的场景文本识别模型识别效果大大超过了基准模型,在多个数据集上的准确率提高了4%以上。(2)采用基于分割的文本识别框架,对票据中手写体大写金额的识别进行了研究,提出了基于有限状态自动机的手写体大写金额识别算法。首先,通过对字符进行分类、分析各类字符之间的语法逻辑构造出用于语法检查的确定有限状态自动机。然后,在路径搜索中利用构建的自动机优化搜索性能,并在识别结果中选择出符合语法规则的字符串。最后,针对低质量票据中字符笔画缺失的问题,利用构建的自动机实现模糊字符预测算法。实验结果表明,结合有限状态自动机的手写体大写金额识别算法在票据识别中的文本行识别准确率达到了96.6%。
蒋泽晟[3](2021)在《资产处置类合同的辅助审核系统的设计与实现》文中指出合同是商业活动中约束活动双方权利与义务的文件,在诸多大型金融集团中,合同审核业务常作为其业务流程的重要环节。由于合同文档信息量大且页数多,在其人工审核时,会消耗大量人力、财力,且存在一些无法避免的操作风险。目前一些通用合同文档的审阅工具,无法满足一些针对资产处置合同的审核场景,其次,一些审核系统作为办公自动化系统(OA系统)的子系统,依赖该系统的业务,无法完成特定场合的合同审核业务,并且存在着一些操作风险。本课题根据中国华融资产管理公司中合同审核环节相关业务和数据,针对合同多轮审核、合同信息提取这两种主要业务存在审核效率低、操作风险高、审核业务与其他系统耦合高等问题,结合现有的关于资产处理合同相关专家经验规则和文本处理技术,搭建了以合同版本对比功能、合同风险审查功能、合同要素抽取与识别功能和合同合规提示功能为主的资产处置类合同的辅助审核系统。本课题所使用的相关数据,主要来源于中国华融资产管理公司,相关数据主要包括100多篇资产处理合同文档与合同模板、该企业业务人员整理得到的200多个合同要素和该企业600多篇合同相关的法律文档。本系统是一个前后端分离架构的项目,前端使用了 Vue.js框架作为用户交互平台,而后端基于MVC架构,使用了 Flask、SpringBoot等框架和技术提供合同审核相关服务,并使用Docker容器对本系统进行了部署,从而搭建了一个交互良好、高效便捷的合同审核辅助平台。在系统功能实现上,采用一些文本处理算法,如MD5信息摘要算法、Simhash算法、Diff文本差异算法和使用Word2Vec词向量计算文本相似度等算法共同实现合同对比功能,使用正则表达式、位置匹配等方式提取合同文本的合同要素,并且这两个功能作为本系统的基础功能模块,复用到了合同风险审查以及合同合规提示这两个功能中。本系统在通过了完整的测试后,有效的实现了设定的目标功能,满足了合同审核业务人员的需求。
董泽信[4](2021)在《互联网环境中用户信息安全倦怠实证研究》文中研究说明当今互联网蓬勃发展,与之快速发展共同衍生的则是用户无休止的信息安全交互行为,而且各种交互方式更新迭代的节奏非常快。但是学界当前有关于用户信息安全多以技术层面研究居多,对于用户心理体验研究数量较少。大量的密码、验证码,反复无休止的找回密码,都给用户使用心理带来了极大的不悦。本文便通过扎根研究法和问卷待查法针对用户的这种信息安全倦怠心理进行相关研究。首先,通过扎根研究法进行30份用户访谈,对所得到的访问材料进行进行开放式编码、主轴编码、选择性编码三步。其中开放式编码33项;主轴编码8项;选择性编码3项。分别为硬性因素、软性因素、人为影响因素。并初步得出用户在当前互联网环境中是存在信息安全倦怠情绪的。其次,通过377份调查问卷,并对所收集数据进行信度分析、效度分析和一般描述性统计量检验。这377份调查问卷所揭示出,在当前的互联网环境中,的确是存在用户信息安全倦怠情绪,且归纳总结得出当前造成用户信息安全倦怠的影响因素;同时,也得到了能够有效提升用户信息安全交互体验的几种模式和方法。最后,结合问卷调查和扎根研究法的研究结果,根据用户使用场景以及个性化需求建立信息安全交互模型。并据此针对用户、软件开发者、网站建设者和政府有关部门提出相应改进建议。
闫茹,孙永奇,朱卫国,李宇霞[5](2021)在《基于CNN与有限状态自动机的手写体大写金额识别》文中研究说明手写票据识别是模式识别中的研究难点之一,手写体风格多样、票据背景复杂等原因导致手写票据识别的准确率不高。大写金额作为票据中最重要的部分,对其进行准确识别是手写票据自动识别的关键。对基于分割的手写体大写金额识别及处理问题进行研究,提出一种基于卷积神经网络(CNN)与有限状态自动机的手写体大写金额识别方法。在利用过分割和组合过分割项得到单字符后使用CNN对其进行识别。通过对字符进行分类、定义各类字符之间的逻辑关系构造用于语法检查的有限状态自动机,通过语法自动机在识别结果中选择符合语法规则的字符串,并在路径搜索中利用语法自动机优化搜索性能。在此基础上,运用语法自动机对模糊字符进行预测,以纠正CNN的识别错误。实验结果表明,该方法在对大写金额单字符和文本行进行识别时准确率分别高达98.2%与96.6%。
王慧婷[6](2020)在《基于OCR技术的智能报账平台设计与实现》文中提出费用报销是企业日常经营管理中必不可少的工作之一,在费用报销的过程中涉及大量原始凭证的流转以及报销单的填制,在大多企业中原始凭证由财务人员手工收集、整理,费用报销的审批过程中无法将原始凭证作为报销佐证参与审批,而报销单的填制繁琐,补助计算复杂,整个业务流转过程中极大的消耗人力物力。随着OCR技术的发展以及企业项目管理水平的不断提升,较多的领域在图像识别方面有所突破,利用OCR技术进行原始凭证如增值税发票的图像处理、识别进行有效信息的提取,并利用所提取的信息进行智能化自动填单,能有效提高前端业务人员以及财务人员的工作效率。本文对企业日常经营过程中的报销业务进行了需求分析,设计了一款基于OCR技术的智能报账平台。首先采用扫描仪对原始凭证进行扫描,对原始凭证图像进行图像归一化、图像旋转以及图像二值化等预处理;然后对已得到的二值图像进行形态学运算,之后通过连通域算法对图像进行版面分析,采用投影法进行字符分割以得到单个字符;最后采用SVM算法完成字符识别,采用Tesseract完成文字识别,成功提取原始凭证中的有效结构化信息。同时系统实现过程中使用SpringMVC+Hibernate框架,遵循软件工程方法论中的设计开发思想,给出了设计过程中关键技术点,实现了包含智能化填单功能、单据流程流转功能、财务处理功能以及查询统计功能的智能报账平台。
施琳琳[7](2020)在《基于分布式架构的商业化短信平台》文中提出当今信息时代,各种通信手段和方法层出不穷,虽然越来越多电信增值服务的出现对短信这种传统通信方式的应用产生了一定的影响,但是在银行、就医、办公等与个人生活息息相关的业务中,短信的作用仍然无可取代。例如2020年初的新型冠状病毒防疫期间,为了将防疫知识、国家最新政策以及最新的防治消息及时传达到每一个公民手中,各省战“疫”短信每天发送数亿条,以每人每天至少三条短信的形式,向广大群众直接的传达了国家最新的防疫动态相关信息。由此可以看出,短信业务这一传统媒介在关键时期的信息传递作用是其他新兴业务及通信手段所不能替代的。如何做到每天精确发送数亿条短信,其数据处理、并发控制等方面的技术是如何实现的,这一课题值得深入研究和探讨。本系统在实现基本的短信收发功能的同时,从平台的角度出发,搭建了短信发送系统用户端(MSUI)、短信发送系统接口端(MSAPI)、短信系统管理后台(MSM)、短信处理中间件(MSCM)、短信发送终端(MST)五大核心系统模块,融合了用户自主发送信息功能、用户权限模板管理功能、信息审核处理分发功能、信息发送终端功能。本系统采用.Net Core开源框架为基础搭建用户访问平台,同时结合分布部署通信协议、分布式缓存读写分离、负载均衡等技术确保平台稳定高效的运行。在传统短信平台中,信息到达的时间是随机的,信息的类型是多样的,这些外界环境的变化会增加系统的不确定性,同时第三方短信代理商处理信息的能力也会受到外界以及自身状态的影响。本系统作为短信业务的核心能够充分发挥第三方的优势,接收到短信订单之后,根据平台的设置规则,区分短信行业、手机运营商等关键信息,并将其分配到最为匹配的优势运营商的处理程序中,将配合好的任务订单实时的分配给条件最优的第三方。系统上游面向海量客户需求,处理大量数据,屏蔽非法短信、无效手机号码及黑名单用户等信息,下游面向优势不同的短信服务商资源,及时将合适的信息分发给优势的短信服务商,这些功能的实现都需要运用软件工程等专业知识对系统进行合理的设计和规划。本文以软件工程的思想和方法为指导,通过对各行业应用场景的深入调研,对短信平台的功能需求的分析与研究,以分布式的角度理解和设计平台整体架构,从而形成能够实现合理的整合上下游资源、灵活的信道匹配、统一的平台管理、可扩展操作的系统模块等设计要求的商业化短信平台。系统模块化,深度解耦,便于扩展和应用。
李世强[8](2020)在《静态数据脱敏系统的设计与实现》文中指出继第三次工业革命以来,互联网技术以惊人之势迅猛发展,信息化技术越来越发达。众多组织机构或者个人保存了大量公民个人各种各样的数据信息。如何保证这些数据的不被泄露,避免个人隐私数据落入不法之徒的手中已经成为数据安全领域的一项重要研究问题。现有的保护个人隐私敏感数据的方式方法易造成丢失原数据的实际意义,且支持处理的数据类型单一。另一方面,系统脱敏结果不可逆,并且在处理大量数据时,耗时较长。因此本论文设计并实现了一种新的静态数据脱敏系统,实现该系统主要是分成为四个步骤。第一步,基础工作环境信息的配置以及相应的源数据库,目标数据库的连接,确定数据脱敏的模式;第二步,读取数据库中待处理的个人隐私敏感数据,识别出该个人隐私敏感数据的类型,对识别结果进行梳理,并统计出相应类型的个人隐私敏感数据占总体数据量的比例;第三步,将个人隐私敏感数据根据已知的配置信息进行脱敏处理,然后将结果写入目标数据库;第四步,将脱敏前后的敏感数据进行对比,方便用户验证脱敏结果的有效性。因此,本论文主要进行以下工作:(1)编写个人隐私敏感数据类型扫描器。个人隐私敏感数据类型扫描器的功能主要是实现从源数据库中读取数据并写入到一个中间文件中,然后根据各个类型的个人隐私敏感数据的编码特征,以及应用调整个别敏感类型识别的优先级等策略,实现准确识别各个类型的个人隐私敏感数据的类型。(2)分析系统所支持处理的三十余种类型敏感数据的编码规则,并根据各个类型敏感数据的编码特点,分别编写对应的随机脱敏,正向脱敏,逆向脱敏和遮蔽脱敏四种脱敏模式下的脱敏算法。本文实现的系统的创新点在于识别未知类型敏感数据时,正确率达到96%,减少人工梳理操作,且具有支持处理的个人隐私敏感数据的类型种类多的特点。可以根据用户应用的具体场景需求实现支持处理的敏感数据类型的增删,并且随机脱敏、正向脱敏和逆向脱敏模式下的脱敏结果保持数据的原有实际意义,正向脱敏与逆向脱敏相结合实现了脱敏结果的可逆。相比现有的数据脱敏系统在处理T级别的数据量上,具有时间短,效率高的优势。
袁怡[9](2020)在《基于自然语言处理的行政案件快速办理系统的设计与实现》文中研究说明近年来,为实现执法行为系统化与规范化管理,国务院办公厅与中共中央办公厅相继印发了《关于深化公安执法规范化建设的意见》和《公安机关办理行政案件程序规定》,提出了关于实施行政案件快速办理程序的规章制度。该程序的实施主要针对基层公安机关与派出所案多人少,警力不足的现象,它的应用可以有效减轻基层民警的工作压力,提升办案效率,降低执法成本。结合案件快速办理程序的应用需要与智慧警务系统的建设需要,本文设计并实现了基于自然语言处理的行政案件快速办理系统,在证据收集、案件处理与行政处罚三个过程中辅助民警进行案件办理。在行政案件快速办理系统的研发过程中,本人主要工作为实现了笔录制作、语义分析、行政量罚三个子系统。其中,笔录制作子系统依托对话管理算法对违法行为人进行笔录询问,并对笔录中出现的错别字词进行纠正,同时判别问答句是否一致,快速制作询问笔录;语义分析子系统中,对笔录中出现的关键要素进行提取,便于办案民警进行阅读;智慧量罚子系统中,建立了完备的量罚知识图谱,并结合实际情况对违法行为人做出相应的量罚审定。本项目前端部分基于Vue框架开发;后端部分采用Java开发,系统架构为Spring MVC架构;算法部分采用Python开发,使用Tensorflow作为深度学习开发框架,模型训练完成后存储权值文件,将其封装在Docker中,对外提供服务。笔录制作子系统中,笔录问答部分采用系统主导的多轮对话管理技术实现,并使用了基于KenLM语言模型的文本纠错算法和基于Bert模型的文本分类算法,辅助进行笔录合规性检测;语义分析子系统中,采用基于BiLSTM+CRF的命名实体识别算法,提取笔录中出现的关键要素;智慧量罚子系统中,采用Neo4j图数据库作为量罚知识图谱存储库,将查询条件转换为Cypher语言进行查询操作。目前,本项目中三个子系统已经开发完成并在试点派出所投入使用,高效快速办理多起行政案件,取得了良好的效果。
蒋璎[10](2019)在《基于深度学习的发票识别系统》文中研究表明目前,发票报销依旧以人工报销为主,并且工作效率低,流程长,耗时多,易出错。与此同时,经济的增长也促使了票据和报销工作的日益增多。所以实现发票智能识别势在必行。针对这一课题,本文主要从发票分类和文字识别两方面来阐述如何实现发票智能识别。首先,本文对现有的文字识别和深度学习的现状进行简述,并在叙述了深度神经网络之后,搭建了AlexNet网络,进行发票数据集的训练,以实现发票分类的目的。而AlexNet网络和随机森林这两种架构都分别用于测试。其次,本文采用了完成发票中有效信息的定位以及对倾斜图像的校正的方法。基于图像增强的二次分割法用于实现发票有效信息定位与截取。第一步,对图像进行图像增强,便于后续的机打字符与印刷字符的分割,即第一次分割;第二步则是采用反色,开运算,最大矩形边界等图像处理方法进行信息截取,即第二次分割。而切斜检测和校正算法则用于检测大写金额字符的倾斜角,并校正图像。最后,本文搭建了深度卷积神经网络和残差网络架构,分别进行大写金额字符分类的训练及测试,最终实现大写金额数字的识别。在这个过程中还需对预处理后的大写金额采用投影变换将单行的大写金额切割为单个字符,即数据集的制作。在发票分类中,AlexNet网络和随机森林的分类准确率分别为92%和94%。在大写金额的识别中,深度卷积神经网络和残差网络的识别准确率分别为97%和99%。本文中的智能识别方法不仅可以应用于发票报销中,还可以应用于档案数字化等其他领域。
二、快速输入大写金额数字(论文开题报告)
(1)论文研究背景及目的
此处内容要求:
首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。
写法范例:
本文主要提出一款精简64位RISC处理器存储管理单元结构并详细分析其设计过程。在该MMU结构中,TLB采用叁个分离的TLB,TLB采用基于内容查找的相联存储器并行查找,支持粗粒度为64KB和细粒度为4KB两种页面大小,采用多级分层页表结构映射地址空间,并详细论述了四级页表转换过程,TLB结构组织等。该MMU结构将作为该处理器存储系统实现的一个重要组成部分。
(2)本文研究方法
调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。
观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。
实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。
文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。
实证研究法:依据现有的科学理论和实践的需要提出设计。
定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。
定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。
跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。
功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。
模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。
三、快速输入大写金额数字(论文提纲范文)
(1)基于深度学习的发票图像信息识别算法研究(论文提纲范文)
摘要 |
Abstract |
专用术语注释表 |
第一章 绪论 |
1.1 研究背景与意义 |
1.2 国内外研究现状 |
1.2.1 深度学习 |
1.2.2 计算机视觉 |
1.2.3 文本检测识别 |
1.3 研究内容安排 |
第二章 深度学习相关知识介绍 |
2.1 神经网络 |
2.2 卷积神经网络 |
2.2.1 输入层 |
2.2.2 卷积层 |
2.2.3 批归一化层 |
2.2.4 池化层 |
2.2.5 输出层 |
2.3 剪枝神经网络 |
2.3.1 权重剪枝 |
2.3.2 通道剪枝 |
2.3.3 卷积核剪枝 |
2.4 本章小结 |
第三章 基于深度学习的发票图像信息识别算法设计 |
3.1 图像区域定位、分割及提取 |
3.1.1 图像预处理 |
3.1.2 YOLO算法实现区域定位 |
3.1.3 边框回归预测及提取 |
3.2 光学字符识别 |
3.2.1 CDNets算法实现文本 |
3.2.2 CDNets算法实现文本识别 |
3.2.3 格式化文本处理方法 |
3.3 实验结果及分析 |
3.3.1 实验环境搭建 |
3.3.2 实验结果 |
3.4 本章小结 |
第四章 基于深度学习的发票图像文字识别算法设计 |
4.1 基于深度学习的发票图像文字识别模型设计及实验结果 |
4.1.1 数据集制作 |
4.1.2 模型架构设计 |
4.1.3 模型训练 |
4.1.4 实验结果 |
4.2 对比模型用于文字识别 |
4.2.1 卷积神经网络CNN用于文字识别 |
4.2.2 胶囊网络CapsuleNet用于文字识别 |
4.2.3 分类网络VGG用于文字识别 |
4.3 实验结果及分析 |
4.3.1 实验环境搭建 |
4.3.2 对比实验结果 |
4.4 本章小结 |
第五章 剪枝网络用于发票图像文字识别 |
5.1 整体流程 |
5.1.1 流程介绍 |
5.1.2 运行环境 |
5.2 剪枝网络用于发票图像文字识别算法设计 |
5.2.1 网络逐层剪枝 |
5.2.2 重新训练 |
5.3 实验结果及分析 |
5.3.1 实验环境搭建 |
5.3.2 实验结果 |
5.4 本章小结 |
第六章 总结与展望 |
参考文献 |
附录 1 程序清单 |
附录 2 攻读硕士学位期间撰写的论文 |
附录 3 攻读硕士学位期间申请的专利 |
附录 4 攻读硕士学位期间参加的科研项目 |
致谢 |
(2)基于语义增强与语法规则的复杂场景文本识别算法研究(论文提纲范文)
致谢 |
摘要 |
ABSTRACT |
1 绪论 |
1.1 研究背景和意义 |
1.2 国内外研究现状 |
1.2.1 场景文本识别现状 |
1.2.2 手写中文文本识别现状 |
1.3 本文主要工作 |
1.4 本文组织结构 |
2 复杂场景文本识别相关工作 |
2.1 基础知识 |
2.1.1 视觉特征提取 |
2.1.2 语义特征提取 |
2.2 场景文本识别算法 |
2.2.1 基于一维序列的场景文本识别算法 |
2.2.2 基于二维视角的场景文本识别算法 |
2.3 手写中文文本识别算法 |
2.3.1 基于分割的手写中文文本识别 |
2.3.2 基于无分割的手写中文文本识别 |
2.4 本章小结 |
3 基于文本注意与语义增强的场景文本识别算法 |
3.1 整体框架 |
3.2 基于文本注意的视觉特征提取模块 |
3.3 旋转矫正网络 |
3.4 基于语义增强的上下文特征提取模块 |
3.5 并行预测 |
3.6 实验与结果分析 |
3.6.1 实验环境 |
3.6.2 数据集与评价指标 |
3.6.3 实验以及与不同模型的对比分析 |
3.6.4 消融实验结果与分析 |
3.7 本章小结 |
4 基于有限状态自动机的手写体大写金额识别算法 |
4.1 票据识别算法 |
4.1.1 票据预处理 |
4.1.2 过分割与组合 |
4.1.3 单字符分类器 |
4.2 基于有限状态自动机的语法检查器 |
4.2.1 大写金额语法规则 |
4.2.2 构建确定有限状态自动机 |
4.2.3 动态约束 |
4.2.4 路径搜索 |
4.2.5 模糊字符预测 |
4.3 实验结果与分析 |
4.3.1 实验数据及评价指标 |
4.3.2 基于有限状态自动机的语法模型效果分析 |
4.3.3 有限状态自动机对票据识别结果的影响 |
4.4 本章小结 |
5 总结与展望 |
5.1 总结 |
5.2 展望 |
参考文献 |
作者简历及攻读硕士学位期间取得的研究成果 |
学位论文数据集 |
(3)资产处置类合同的辅助审核系统的设计与实现(论文提纲范文)
摘要 |
ABSTRACT |
第一章 绪论 |
1.1 课题研究的背景和意义 |
1.2 研究现状 |
1.3 主要研究内容 |
1.3.1 主要研究内容 |
1.3.2 本人主要承担的工作 |
1.4 论文结构 |
第二章 相关技术的介绍 |
2.1 前端技术 |
2.2 后端技术 |
2.2.1 Flask框架 |
2.2.2 Spring相关框架 |
2.2.3 Redis缓存 |
2.3 本章小结 |
第三章 合同辅助审核系统需求分析 |
3.1 业务需求分析 |
3.2 系统用例分析 |
3.2.1 审核人员 |
3.2.2 系统管理员 |
3.3 功能需求分析 |
3.3.1 合同版本对比功能 |
3.3.2 合同风险审查功能 |
3.3.3 合同要素抽取与识别功能 |
3.3.4 合同合规提示功能 |
3.3.5 后台数据管理功能 |
3.4 本章小结 |
第四章 合同辅助审核系统概要设计 |
4.1 总体设计 |
4.2 架构设计 |
4.3 数据库设计 |
4.4 界面设计 |
4.5 本章小结 |
第五章 合同辅助审核系统详细设计与实现 |
5.1 合同对比算法设计与实现 |
5.1.1 合同对比算法流程 |
5.1.2 合同文档的划分 |
5.1.3 相关文本算法计算 |
5.1.4 Word2vec模型训练与计算 |
5.1.5 文本差异对比 |
5.2 合同版本对比功能模块设计与实现 |
5.2.1 模块类与接口设计 |
5.2.2 服务层类的设计 |
5.3 合同要素抽取与识别功能模块设计与实现 |
5.3.1 模块类与接口设计 |
5.3.2 合同要素抽取流程 |
5.4 合同风险审查功能模块设计与实现 |
5.4.1 模块类与接口设计 |
5.4.2 风险审核相关细节 |
5.5 合同合规提示功能模块设计与实现 |
5.5.1 模块的类的设计 |
5.5.2 合规提示相关细节 |
5.6 本章小结 |
第六章 系统测试 |
6.1 系统测试环境 |
6.2 系统功能测试 |
6.2.1 合同版本对比功能 |
6.2.2 合同风险审查功能 |
6.2.3 合同要素抽取与识别功能 |
6.2.4 合同合规提示功能 |
6.3 本章小结 |
第七章 总结与展望 |
7.1 论文工作总结 |
7.2 问题和展望 |
参考文献 |
致谢 |
(4)互联网环境中用户信息安全倦怠实证研究(论文提纲范文)
中文摘要 |
Abstract |
第一章 绪论 |
1.1 研究背景与意义 |
1.1.1 研究背景 |
1.1.2 研究意义 |
1.1.3 国内外研究现状 |
1.1.4 研究现状述评 |
1.2 研究方法和内容 |
1.2.1 研究方法 |
1.2.2 研究内容 |
1.3 本文创新点 |
第二章 概念和相关属性要素 |
2.1 相关概念 |
2.1.1 信息安全概念 |
2.1.2 信息安全倦怠概念 |
2.2 基本属性及要素 |
2.2.1 信息安全服务基本属性 |
2.2.2 影响信息安全的要素 |
2.2.3 倦怠情绪基本属性 |
2.2.4 影响倦怠情绪的关键要素 |
第三章 研究方法与市场调研 |
3.1 移动终端信息安全交互架构 |
3.1.1 社交软件 |
3.1.2 支付软件 |
3.1.3 学习、办公软件 |
3.2 电脑端信息安全交互架构 |
3.2.1 社交平台 |
3.2.2 学习、办公网站 |
3.3 互联网信息安全交互架构的经验 |
第四章 实证研究 |
4.1 基于扎根理论的研究 |
4.1.1 数据收集 |
4.1.2 开放编码、主轴编码与选择性编码 |
4.1.3 理论饱和度检验 |
4.2 问卷调查法研究 |
4.2.1 基本假设 |
4.2.2 问卷的设计与发放 |
4.2.3 问卷调查回收情况 |
4.3 问卷统计分析 |
4.3.1 问卷信度分析 |
4.3.2 问卷效度分析 |
4.3.3 其他调查结果基本描述 |
4.4 研究结果分析 |
4.4.1 信息安全倦怠原因 |
4.4.2 信息安全倦怠后续影响 |
第五章 解决方案及对策 |
5.1 信息安全倦怠解决方案 |
5.1.1 解决方案模型构建 |
5.1.2 用户信息安全倦怠情绪解决方案模型阐释 |
5.2 建议对策 |
5.2.1 对用户的建议 |
5.2.2 对软件开发者的建议 |
5.2.3 对网站建设者的建议 |
5.2.4 对政府及有关部门的建议 |
第六章 结论与展望 |
6.1 研究结论 |
6.2 研究局限与不足 |
6.3 研究展望 |
参考文献 |
致谢 |
攻读硕士学位期间独立发表学术论文情况 |
附录一:用户信息安全倦怠的具体情况及改进方法的访谈 |
附录二:用户信息安全倦怠调查 |
(5)基于CNN与有限状态自动机的手写体大写金额识别(论文提纲范文)
0概述 |
1 相关研究 |
1.1 手写体大写金额识别 |
1.2 有限状态自动机 |
2 票据识别 |
2.1 票据预处理及文本定位 |
2.2 过分割与组合过分割 |
2.3 字符识别 |
3 大写金额语法自动机 |
3.1 大写金额语法规则 |
3.2 有限状态自动机构造 |
3.3 自动机动态约束 |
3.4 自动机与路径搜索 |
3.5 自动机与模糊字符预测 |
4 实验结果与分析 |
4.1 实验数据及评价指标 |
4.2 自动机语法检查和模糊字符预测结果 |
4.3 票据识别结果 |
5 结束语 |
(6)基于OCR技术的智能报账平台设计与实现(论文提纲范文)
摘要 |
Abstract |
变量注释表 |
1 绪论 |
1.1 研究背景及意义 |
1.2 课题研究现状 |
1.3 论文主要内容及结构安排 |
1.4 本章小结 |
2 系统需求分析 |
2.1 系统概述 |
2.2 需求分析 |
2.3 本章小结 |
3 系统设计 |
3.1 系统架构设计 |
3.2 系统功能设计 |
3.3 数据库设计 |
3.4 系统集成设计 |
3.5 本章小结 |
4 图像处理及字符分割 |
4.1 图像预处理 |
4.2 形态学处理 |
4.3 图像版面分析 |
4.4 字符分割 |
4.5 本章小结 |
5 字符识别 |
5.1 基于SVM的数字及字母识别 |
5.2 基于Tesseract的文字识别 |
5.3 实验结果分析 |
5.4 本章小结 |
6 系统实现 |
6.1 客户端接口实现 |
6.2 服务端接口实现 |
6.3 关键问题的技术解决 |
6.4 非功能技术实现 |
6.5 系统实现效果 |
6.6 本章小结 |
7 总结与展望 |
7.1 总结 |
7.2 展望 |
参考文献 |
作者简历 |
致谢 |
学位论文数据集 |
(7)基于分布式架构的商业化短信平台(论文提纲范文)
摘要 |
ABSTRACT |
第1章 绪论 |
1.1 平台研发背景 |
1.2 平台研发现状 |
1.3 论文的主要工作 |
1.4 论文的组织结构 |
第2章 短信平台需求分析 |
2.1 平台用户端需求分析 |
2.2 平台接口端需求分析 |
2.3 平台管理端需求分析 |
第3章 短信平台系统设计 |
3.1 短信平台总体架构设计 |
3.1.1 平台总体架构 |
3.1.2 平台上游架构 |
3.1.3 平台下游架构 |
3.2 短信平台系统功能设计 |
3.2.1 短信发送系统用户端 |
3.2.2 短信发送系统接口端 |
3.2.3 短信系统管理后台 |
3.2.4 短信处理中间件 |
3.2.5 短信发送终端 |
3.3 数据库设计 |
3.3.1 系统相关表设计 |
3.3.2 用户相关表设计 |
3.3.3 订单相关表设计 |
3.3.4 配置相关表设计 |
3.3.5 接口相关表设计 |
3.3.6 日志相关表设计 |
第4章 短信平台系统实现 |
4.1 短信发送系统用户端 |
4.1.1 用户端系统框架 |
4.1.2 权限和状态过滤 |
4.1.3 短信管理功能 |
4.1.4 通讯录管理功能 |
4.2 短信发送系统接口端 |
4.2.1 接口端系统架构 |
4.2.2 异步处理方式 |
4.3 短信系统管理后台 |
4.3.1 管理后台系统架构 |
4.3.2 订单管理功能 |
4.3.3 接口管理功能 |
4.4 短信处理中间件 |
4.4.1 中间件系统架构 |
4.4.2 中间件订单分发 |
4.4.3 中间件订单状态管理 |
4.5 短信发送终端 |
4.5.1 短信发送终端系统架构 |
4.5.2 HTTP短信终端实例 |
4.5.3 CMPP短信终端实例 |
第5章 短信平台系统测试 |
5.1 测试环境网络部署架构 |
5.2 系统测试软/硬件环境 |
5.3 系统测试报告 |
5.3.1 接口功能测试结果 |
5.3.2 接口性能测试结果 |
第6章 总结和展望 |
参考文献 |
致谢 |
攻读学位期间参与科研项目 |
学位论文评阅及答辩情况表 |
(8)静态数据脱敏系统的设计与实现(论文提纲范文)
摘要 |
ABSTRACT |
第一章 绪论 |
1.1 研究背景及意义 |
1.2 国内外研究现状 |
1.3 本文主要研究内容 |
1.4 论文组织结构 |
第二章 相关理论基础 |
2.1 数据脱敏 |
2.1.1 静态数据脱敏系统定义 |
2.1.2 常见的保护数据安全措施 |
2.1.3 常见数据脱敏方法 |
2.1.4 脱敏模式的定义 |
2.1.5 脱敏原理 |
2.2 各个类型敏感数据编码特征 |
2.3 JDBC介绍 |
2.3.1 JDBC的定义 |
2.3.2 JDBC的使用 |
2.4 Mysql与Oracle |
2.4.1 Mysql简介 |
2.4.2 Oracle简介 |
2.6 本章小结 |
第三章 系统需求分析与总体设计 |
3.1 静态数据脱敏系统的总体目标 |
3.2 系统需求 |
3.2.1 功能性需求 |
3.2.2 非功能性需求 |
3.2.3 系统流程图与用户用例图 |
3.3 系统总体设计与模块划分 |
3.3.1 系统设计 |
3.3.2 模块设计 |
3.4 数据库设计 |
3.4.1 E-R图 |
3.4.2 数据表设计 |
3.5 本章小结 |
第四章 系统的详细设计与实现 |
4.1 数据管理模块的实现 |
4.1.1 数据管理模块设计 |
4.1.2 数据的获取 |
4.2 敏感类型识别模块的实现 |
4.3 可视化模块的实现 |
4.4 已知信息库管理模块的实现 |
4.5 本章小结 |
第五章 详细算法实现 |
5.1 脱敏选项配置参数 |
5.1.1 非遮蔽脱敏选项配置参数 |
5.1.2 遮蔽脱敏选项配置参数 |
5.2 金融账号类脱敏 |
5.3 中文汉字类脱敏 |
5.4 联系方式类脱敏 |
5.5 证件号码类脱敏 |
5.6 本章小结 |
第六章 系统测试 |
6.1 测试简介 |
6.2 测试环境 |
6.3 单元测试 |
6.4 单个算法测试及其结果 |
6.5 集成测试 |
6.6 本章小结 |
第七章 总结与展望 |
7.1 工作总结 |
7.2 未来展望 |
参考文献 |
致谢 |
(9)基于自然语言处理的行政案件快速办理系统的设计与实现(论文提纲范文)
致谢 |
摘要 |
ABSTRACT |
1 引言 |
1.1 项目背景及研究意义 |
1.2 国内外研究现状 |
1.2.1 自然语言处理 |
1.2.2 强化学习 |
1.2.3 知识图谱 |
1.3 论文研究内容 |
1.4 论文组织架构 |
1.5 本章小结 |
2 相关理论与技术概述 |
2.1 自然语言处理相关技术 |
2.1.1 对话管理系统 |
2.1.2 文本纠错 |
2.1.3 文本分类 |
2.1.4 命名实体识别与关系抽取 |
2.2 强化学习相关技术 |
2.2.1 Q-learning算法 |
2.2.2 深度强化学习DQN算法 |
2.3 Docker相关技术 |
2.4 Flask相关技术 |
2.5 Neo4j图数据库相关技术 |
2.6 本章小结 |
3 系统需求分析 |
3.1 系统整体需求概述 |
3.2 功能需求分析 |
3.2.1 笔录制作功能分析 |
3.2.2 语义分析功能分析 |
3.2.3 智慧量罚功能分析 |
3.3 非功能需求分析 |
3.4 本章小结 |
4 系统概要设计 |
4.1 系统功能模块设计 |
4.2 系统整体架构设计 |
4.3 数据库设计 |
4.3.1 实体-关系说明 |
4.3.2 数据库表存储结构设计 |
4.3.3 知识图谱存储结构设计 |
4.4 本章小结 |
5 算法设计与实现 |
5.1 对话管理系统 |
5.1.1 数据预处理 |
5.1.2 自然语言理解 |
5.1.3 对话管理 |
5.1.4 自然语言生成 |
5.1.5 实验结果分析与展示 |
5.2 文本纠错算法 |
5.2.1 语言模型训练 |
5.2.2 错误检测 |
5.2.3 错误纠正 |
5.2.4 实验结果分析与展示 |
5.3 问答一致性检测算法 |
5.3.1 数据预处理 |
5.3.2 模型搭建与训练 |
5.3.3 实验结果分析与展示 |
5.4 命名实体识别算法 |
5.4.1 数据预处理 |
5.4.2 命名实体识别 |
5.4.3 关键要素提取 |
5.4.4 实验结果分析与展示 |
5.5 本章小结 |
6 系统详细设计与实现 |
6.1 笔录制作子系统 |
6.1.1 对话管理系统模块流程设计 |
6.1.2 对话管理系统模块类设计 |
6.1.3 文本纠错模块流程设计 |
6.1.4 文本纠错模块类设计 |
6.1.5 问答一致性检测模块流程设计 |
6.1.6 问答一致性检测模块类设计 |
6.1.7 笔录制作子系统整体流程设计 |
6.1.8 笔录制作子系统整体类设计 |
6.1.9 笔录制作子系统界面展示 |
6.2 语义分析子系统 |
6.2.1 命名实体识别模块流程设计 |
6.2.2 命名实体识别模块类设计 |
6.2.3 语义分析子系统整体流程设计 |
6.2.4 语义分析子系统整体类设计 |
6.2.5 语义分析子系统界面展示 |
6.3 智慧量罚子系统 |
6.3.1 量罚知识图谱构建模块流程设计 |
6.3.2 量罚知识图谱构建模块类设计 |
6.3.3 量罚知识图谱构建模块实现效果 |
6.3.4 智慧量罚子系统整体流程设计 |
6.3.5 智慧量罚子系统整体类设计 |
6.3.6 智慧量罚子系统界面展示 |
6.4 本章小结 |
7 系统测试 |
7.1 测试环境配置 |
7.2 功能测试 |
7.3 非功能测试 |
7.4 本章小结 |
8 总结与展望 |
8.1 全文总结 |
8.2 不足与展望 |
参考文献 |
作者简历及攻读硕士/博士学位期间取得的研究成果 |
学位论文数据集 |
(10)基于深度学习的发票识别系统(论文提纲范文)
摘要 |
abstract |
第一章 绪论 |
1.1 研究背景与意义 |
1.1.1 背景 |
1.1.2 关键技术 |
1.2 研究现状 |
1.2.1 文字识别研究现状 |
1.2.2 深度学习研究现状 |
1.3 主要研究工作 |
1.4 论文结构 |
第二章 深度神经网络 |
2.1 发展进程 |
2.2 卷积神经网络概述 |
2.3 卷积神经网络结构 |
2.3.1 卷积层 |
2.3.2 池化层 |
2.3.3 激活函数 |
2.3.4 全连接层 |
2.3.5 目标函数 |
2.4 本章小结 |
第三章 基于深度学习的发票分类 |
3.1 整体方案 |
3.2 AlexNet网络 |
3.3 随机森林 |
3.3.1 决策树 |
3.3.2 随机森林原理 |
3.4 算法实现 |
3.4.1 数据集的制作 |
3.4.2 网络的训练 |
3.4.3 实验结果 |
3.5 本章小结 |
第四章 基于图像处理的发票信息截取 |
4.1 机打字符的提取 |
4.1.1 图像增强 |
4.2 二次分割 |
4.2.1 第一次分割 |
4.2.2 第二次分割 |
4.3 倾斜检测与校正 |
4.4 OCR调研与分析 |
4.4.1 Tesseract |
4.4.2 微软Azure OCR |
4.4.3 深度识别(Deep OCR) |
4.4.4 百度云OCR |
4.4.5 腾讯云OCR |
4.4.6 GOCR.js |
4.4.7 总结 |
4.5 本章小结 |
第五章 基于卷积神经网络的大写金额识别 |
5.1 卷积神经网络算法 |
5.1.1 卷积神经网络 |
5.1.2 残差网络 |
5.2 大写金额的预处理 |
5.2.1 大写金额定位 |
5.2.2 发票大写金额的分割 |
5.3 算法实现 |
5.3.1 数据集的制作 |
5.3.2 网络的训练 |
5.3.3 实验结果 |
5.4 本章小结 |
第六章 总结与展望 |
6.1 总结 |
6.2 展望 |
参考文献 |
附录1 攻读硕士学位期间撰写的论文 |
附录2 攻读硕士学位期间申请的专利 |
致谢 |
四、快速输入大写金额数字(论文参考文献)
- [1]基于深度学习的发票图像信息识别算法研究[D]. 孟洋. 南京邮电大学, 2021
- [2]基于语义增强与语法规则的复杂场景文本识别算法研究[D]. 闫茹. 北京交通大学, 2021(02)
- [3]资产处置类合同的辅助审核系统的设计与实现[D]. 蒋泽晟. 北京邮电大学, 2021(01)
- [4]互联网环境中用户信息安全倦怠实证研究[D]. 董泽信. 黑龙江大学, 2021(09)
- [5]基于CNN与有限状态自动机的手写体大写金额识别[J]. 闫茹,孙永奇,朱卫国,李宇霞. 计算机工程, 2021(09)
- [6]基于OCR技术的智能报账平台设计与实现[D]. 王慧婷. 山东科技大学, 2020(06)
- [7]基于分布式架构的商业化短信平台[D]. 施琳琳. 山东大学, 2020(12)
- [8]静态数据脱敏系统的设计与实现[D]. 李世强. 北京邮电大学, 2020(05)
- [9]基于自然语言处理的行政案件快速办理系统的设计与实现[D]. 袁怡. 北京交通大学, 2020(03)
- [10]基于深度学习的发票识别系统[D]. 蒋璎. 南京邮电大学, 2019(02)