正则表达式论文_高阳阳,徐烈伟,俞剑,许薇

导读:本文包含了正则表达式论文开题报告文献综述、选题提纲参考文献及外文文献翻译,主要关键词:正则表达式,数据,可编程,门阵列,自动机,虚词,复杂度。

正则表达式论文文献综述

高阳阳,徐烈伟,俞剑,许薇[1](2019)在《一种新型动态可重构的正则表达式匹配引擎设计》一文中研究指出针对大规模数据处理和动态更新规则的网络计算需求,本文提出了一种新型动态可重构的正则表达式匹配(DRR)算法.算法采用参数化一致性表达方法,提高了正则表达式的动态匹配能力;采用专用电路与可重构电路的混合计算框架,设计了正则表达式匹配的并行计算加速引擎.在软硬件协同工作模式下,新型动态可重构的匹配加速引擎不仅可以最大化利用FPGA电路的可编程特性实现表达式匹配规则的动态更新,提高匹配的预处理速度,设计的专用ASIC并行匹配电路更大幅提高了正则表达式的匹配计算速度.本文采用TSMC 28nm CMOS工艺完成芯片的设计和流片,实验结果表明:本文设计实现的动态可重构的匹配加速引擎可以有效地适用于大多数应用场景下的正则表达式匹配,匹配计算的吞吐率达到280Gb/s,相比于同类型基于FPGA的匹配计算引擎实现了5倍以上的匹配速度提升.(本文来源于《复旦学报(自然科学版)》期刊2019年06期)

罗恒洋,张林[2](2019)在《Java中的正则表达式应用探讨》一文中研究指出随着信息技术的高速发展,计算机面临着大量的数据处理业务。文本字符串处理是一种经常性的业务,正则表达式在复杂字符串处理方面有着得天独厚的优势。文章介绍了Java语言中的正则表达式处理方法,分析了复杂字符串的分割、查找、替换和提取特殊子串的方法,总结了构建正则表达式重要性。(本文来源于《电脑知识与技术》期刊2019年32期)

徐帅,许海[3](2019)在《正则表达式快速入门》一文中研究指出该文主要介绍正则表达式的最基础的快速入门,以便从未了解过正则表达式的人对它初步了解及简单使用。(本文来源于《电脑知识与技术》期刊2019年29期)

苻玲美[4](2019)在《正则表达式在python爬虫中的应用》一文中研究指出数据是新一轮技术革命最重要的生产资料,爬虫是获取数据最直接的方式,但爬出来的数据代码夹杂文字,面对大量杂乱的代码夹杂信息,通过正则表达式检索匹配出有用的信息,过滤无用的数据。本文介绍正则表达式在python爬虫中的应用,总结python爬虫中正则表达式的应用技巧。(本文来源于《电脑知识与技术》期刊2019年25期)

更藏卓玛,安见才让[5](2019)在《基于正则表达式的藏文虚词“???”类识别算法研究》一文中研究指出藏文虚词"???"类是藏文语法中的非依他关联词,共有14个虚词。是藏文语法中的基础,并且是藏文信息处理的基础研究内容之一。本文结合藏文虚词添接规则和正则表达式对虚词"???"类进行识别算法研究。以6本初中藏文教科书作为实验语料,通过实验得出藏文虚词"???"类识别准确率达到99.94%。(本文来源于《数字通信世界》期刊2019年09期)

杨花雨,李银地[6](2019)在《JavaScript技术利用正则表达式验证表单的探讨》一文中研究指出在WEB前端开发设计中表单常用于收集用户输入的信息,用户输入的信息在被传输到服务器时需要对其进行验证,表单信息通常需要使用JavaScript技术来验证。该文使用JavaScript技术,利用正则表达式,完成文本字符串的检测、替换等功能。给出了在实现用户注册页面中表单验证的过程中,设置每个表单元素的JavaScript技术验证方法,并分析了每个正则表达式的具体定义及应用方法。(本文来源于《电脑知识与技术》期刊2019年24期)

李晓欧,刘军[7](2019)在《一种基于Prolog有限自动机的正则表达式算法研究》一文中研究指出正则表达式用于人工阅读比较容易,但是对于计算机阅读与理解则相对很困难。介绍了Prolog人工智能语言的结构与特性、正则表达式与有限自动机的定义,阐述了它们之间的关系与转换方式,并提出了实现了一种基于Prolog的通过有限自动机匹配正则表达式算法。(本文来源于《电脑编程技巧与维护》期刊2019年07期)

常征,吕勇[8](2019)在《基于正则表达式的海量数据清洗系统》一文中研究指出针对目前主流的数据提取、变形、加载(ETL)工具和受限环境下一些应用的不足之处,结合受限应用场景下的特殊要求,提出一种基于正则表达式的海量数据清洗系统(REMCS)。REMCS首先针对超长错误数据问题、批量数据源文件融合问题、数据源文件自动分拣问题等典型的6个问题找到数据的特点,其次根据数据的特点设置合适的正则表达式和预处理算法,然后使用算法模型去除数据中的错误完成数据预处理工作。同时详细阐述了REMCS的系统逻辑结构、常见问题、对应的解决算法和代码实现方案。最后通过对兼容的数据源文件格式、能够处理的问题种类、问题处理时间、处理数据极限值等4个方面进行对比,从几组常见的数据处理问题的对比实验可知,相较于传统的ETL工具,REMCS支持csv格式、json格式、dump格式等典型的9种文件格式,能够处理全部的6种常见问题,处理时间更短,能够支持的数据极限值更大。实验结果验证了针对受限应用场景下常见的数据处理问题,REMCS具有很好的适用性和准确性。(本文来源于《计算机应用》期刊2019年10期)

沈宇桔[9](2019)在《正则表达式复杂度攻击自动化检测技术研究》一文中研究指出正则表达式是当今最流行的字符串处理工具之一,在爬虫、文本编辑器、Web应用、搜索引擎、数据库、命令行工具等场景中广泛应用。然而,设计不合理的正则表达式的匹配时间复杂度为超线性甚至指数,容易被攻击者利用造成系统的拒绝服务(又称ReDoS问题,Regular Expression Denial-of-Service)。ReDoS是一种常见的算法复杂度攻击,目前已得到研究者的广泛关注。ReDoS检测技术包括静态的Pumping分析技术、匹配过程转换分析技术、NFA不确定性分析技术、对抗自动机构造技术和动态的黑盒模糊测试技术。然而,已有的静态、动态ReDoS检测技术在现代扩展正则表达式上存在重大缺陷,针对需要复杂长前缀的攻击字符串,要么无法生成,要么需要耗费无法承受的计算资源。为了实现高效、有效的ReDoS检测,本文提出了一种用于描述扩展正则表达式匹配过程的e-NFA模型,并在此模型的基础上提出一种叁阶段的ReDoS检测方法。在前两个阶段中,使用不同的评估函数分别针对e-NFA的覆盖率和匹配代价进行优化;在第叁阶段中,利用正则表达式的PumpingLemma高效地得到能够实施ReDoS攻击的字符串。本文将所提出的叁阶段ReDoS检测方法实现为自动化检测工具RESCUE。在基准数据和实际开源项目实验结果表明RESCUE的ReDoS效果相比于先有的最好技术提升了49%。在实际开源项目中,RESCUE检出了10个前所未知的ReDoS问题,在将这些新检出的安全问题报告给开发者后,部分问题得到了修复。(本文来源于《南京大学》期刊2019-05-24)

林罡[10](2019)在《基于连续重复子串左联配的正则表达式识认算法》一文中研究指出形式语言的归纳学习致力于研究如何从语言的有限信息出发,通过归纳推断得到语言的定义。在形式语言体系中,正则语言是一类使用较为广泛的语言类。以正则表达式为目标的正则语言学习算法在基因序列识别、XML模式推断、图数据库查询学习、信息抽取中有广泛应用。因此,对正则表达式学习算法的研究不仅具有重要的理论意义,还具有较大的实际应用价值。语言极限识认模型是语言学习的经典模型,在该模型下进行学习算法研究,不仅能确保算法的良好特性,且学习语言类具有清晰明确的界定。本文基于语言极限识认模型,研究正则表达式学习算法,主要研究成果如下所述。(1)提出了基于连续重复子串左联配的正则表达式识认框架:首先,识别句子中的最长连续重复子串;其次,基于连续重复子串分块;然后,对分块进行左联配;最后,将联配结果泛化为正则表达式。在该框架内进行算法研究,可以识认一元正则运算符作用在多个连续字符上的正则表达式,克服了现有大多数算法只能识认运算符作用在单个字符上的局限性。(2)针对标准表达式和带数字出现的表达式,分别提出了两类不同的泛化策略,并实现了两种不同的识认算法。分析出可由算法识认的表达式子类,总结出表达式子类对应的特征样本的特性。为了验证理论分析结果,本文开发了一组工具用于表达式及其特征样本的生成并进行了相关的实验,实验结果验证了理论分析的正确性。对比了本文算法和已有算法,结果表明本文算法的识认结果在紧凑性、可读性方面均存在优势。(3)探讨了识认算法在图数据库查询学习中的应用,分析出图数据库可达性查询中有一类由正则表达式定义的路径约束与本文提出的带数字出现的表达式子类相吻合,因此可将本文算法应用于图数据库可达性查询学习。总结出可达性查询学习的一般步骤,并用实例考察了本文算法在可达性查询学习中的应用。(本文来源于《华侨大学》期刊2019-05-23)

正则表达式论文开题报告

(1)论文研究背景及目的

此处内容要求:

首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。

写法范例:

随着信息技术的高速发展,计算机面临着大量的数据处理业务。文本字符串处理是一种经常性的业务,正则表达式在复杂字符串处理方面有着得天独厚的优势。文章介绍了Java语言中的正则表达式处理方法,分析了复杂字符串的分割、查找、替换和提取特殊子串的方法,总结了构建正则表达式重要性。

(2)本文研究方法

调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。

观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。

实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。

文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。

实证研究法:依据现有的科学理论和实践的需要提出设计。

定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。

定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。

跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。

功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。

模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。

正则表达式论文参考文献

[1].高阳阳,徐烈伟,俞剑,许薇.一种新型动态可重构的正则表达式匹配引擎设计[J].复旦学报(自然科学版).2019

[2].罗恒洋,张林.Java中的正则表达式应用探讨[J].电脑知识与技术.2019

[3].徐帅,许海.正则表达式快速入门[J].电脑知识与技术.2019

[4].苻玲美.正则表达式在python爬虫中的应用[J].电脑知识与技术.2019

[5].更藏卓玛,安见才让.基于正则表达式的藏文虚词“???”类识别算法研究[J].数字通信世界.2019

[6].杨花雨,李银地.JavaScript技术利用正则表达式验证表单的探讨[J].电脑知识与技术.2019

[7].李晓欧,刘军.一种基于Prolog有限自动机的正则表达式算法研究[J].电脑编程技巧与维护.2019

[8].常征,吕勇.基于正则表达式的海量数据清洗系统[J].计算机应用.2019

[9].沈宇桔.正则表达式复杂度攻击自动化检测技术研究[D].南京大学.2019

[10].林罡.基于连续重复子串左联配的正则表达式识认算法[D].华侨大学.2019

论文知识图

单载荷作用的车桥系统WFEM模型一3刀日-文件结构示例一SPRAH数据源定制管理的界面一3训练文本采集的实施细节训练文本采集...(,v)平面与(,v)平面的关系正则表达式生成器流程图

标签:;  ;  ;  ;  ;  ;  ;  

正则表达式论文_高阳阳,徐烈伟,俞剑,许薇
下载Doc文档

猜你喜欢