计算机数据存储虚拟化技术优化研究
来源:用户上传
作者:徐冰
摘 要:文章主要对计算机数据存储虚拟化空间的稳定性进行优化,该优化方法基于预分块和滑动窗,以当前和历史数据的交界区域为依据完成存储空间稳定性优化阑值的获取,在完成数据变动及非变动区域划分的基础上实现其中冗余元素的提取以及重复数据存储率的计算,通过滑动窗口获取上限值同实际值间的差值,最后根据数据的交界区域获取稳定性优化阑值,从而完成对数据存儲虚拟空间的优化。
关键词:计算机数据存储空间;虚拟化技术;虚拟存储形式
传统固定分配资源模式存在利用率不高、数据迁移成本高且管理效率低等问题,随着虚拟化技术的发展和完善,在数据存储上运用存储虚拟化技术成为解决计算机数据存储的有效方法,为大数据时代海量信息存储提供了空间。本文提出了一种优化存储空间稳定性的方法,根据绝对偏移量获取稳定性优化阑值,据此完成存储空间稳定性的优化过程。
1 存储空间稳定性优化原理
本文主要以实验室中的虚拟计算机作为研究对象,在具体对数据存储空间稳定性进行优化时,先以内容为依据对实验室全部数据进行预分块处理完成变动区域和非变动区域的划分,在此基础上完成分块数据存储地址的计算,进而实现历史与目前数据交界区域以及所需存储数据关联副本的获取,据此对数据存储空间完成稳定性优化过程,具体的操作流程如下。
首先在进行预分块过程中,假设,连续数据由SSY表示,字节串由Si表示,一次性数据操作由Ti表示,经过Ti对Si进行操作后所获取的字节串由Si+1(Ti)表示,数据发生变化的后标志由Rem(Si,p)表示,针对数据类型的边界开销由HA(D,O)表示,系统中存在的介质数据由HA表示,数据的初始长度信息由(D,O)表示,数据压缩后最长相同前缀由HA(si)表示,则以内容为依据对实验室全部数据进行预分块处理的表达式如下:
假设,对重复数据进行自动搜索时的操作由μA(Si)表示,α表示重复文件的哈希值,字节的散列程度由βi表示,由λ*表示散列函数,相同数据块的原始存储位置由y(g)表示,则对所有实验室数据按照如下表达式进行划分:
各组备份集由E表示,数据分组长度由(r)表示,数据库中的元数据由A*表示,文件种类由f(x)表示,元数据间的关联性由ξ表示,则按照如下表达式完成分块数据存储地址的计算:
数据的管理权由B(o)表示,贡献因子由v表示,数据关联性由ι表示,存储介质由c(z)表示,数据的时间戳信息由(y)表示,访问数据文件的时间范围由P(ij)表示,则不同时期数据的交界区域按照如下表达式给出[3]:
字节级别由P(e)表示,μ°表示存储容量的需求程度,对于新数据由φ表示其存储区域的边界范围,报文分组的划分阑值由φ(l)表示,按照如下表达式完成所需存储数据关联副本的获取:
根据上式的计算结果,利用如下表达式最终完成存储空间稳定性的优化过程:
2 数据存储空间稳定性优化的实现
2.1 构建数据流映射空间
先融合于动态指针方法对数据存储空间稳定性进行优化,对于所有的实验室系统中的数据流,以时间信息为依据完成若干段的划分及数据流无穷序列的获取,在此基础上完成数据流老化计数值的计算及BF数据结构体(2个)的定义,以映射不同区间的数据流,具体操作及运算流程如下:
段内全部元素具有相同的到期时间,在不同段内对于所需维护的数据元素由N表示具体数量,时间戳由w表示,滑动窗口的数量及概率因子分别由α"及φ"表示,连续值的数量由c表示,当前窗口由bit表示,额外存储空间由m表示,数据单元素插入系统时由BF表示对应的时间复杂度,则将系统中所有的数据流按照如下表达式完成若干段的划分:
数据流元素的数量由K表示,最近元素在窗口中的保存数量由v(p)表示,Sk表示任意数据流(Sk=x1,x2,…,xk),针对已出现的x1,x1的重复元素即为出现于一定计数范围内的元素,true表示当前的计数标记符,则按照如下表达式完成数据流老化计数值的计算:
在对Sk历史元素进行保存时,整数组成的数组由F(Y)表示,最大散列函数由h'k表示,数据中所有冗余元素数量由P表示,由Ap表示数据流老化计数错误概率,由B表示其计数序号的结构体,计数映射由X表示(当前区域范围内),计算公式如下:
在数据流中由φ(x)表示各元素输出映射,特定因子由I(f)表示,散列函数的数量由ρ表示,映射情况(不同计数范围内)由or表示,对于当前数据及历史数据存储区域由decay和deeay表示对应的BF数据长度,对应指针计数器由I(d)表示,存储空间消耗(BF数据结构体)由(E)表示,则按照如下公式完成对不同区间数据流的映射过程[1]:
2.2 存储空间稳定性优化
本文基于数据存储阈值完成计算机数据存储空间稳定性的优化过程,在具体优化实现过程中根据上文所获取的数据流映射deeayBF和decayBF(对应不同区间),完成对重复数据消除率的定义及数据存储实际值同下限值间差值的获取,新旧数据通过使用绝对偏移量完成交界区域的划分及数据存储闽值的获取,最终完成稳定性优化过程,具体操作流程如下:
分块数据存储的地址由∫*表示,组成滑动窗口的数量由H(γ)表示,时间开销中由I(f)表示主要因素,字符的最长相同前缀由|DO|hs表示,γ表示分块预期大小,在数据流映射deeayBF及decayBF的基础上,按照如下公式完成重复数据消除率的定义:
在散列映射中由Δd表示冲突概率,对于前半计数区间由Eij表示对应的有效计数元素,被访问过的数据概率由Z(P)*表示,元数据开销由ι表示,消除过期元素的数量由(i)表示,更新范围限制(指每次插入新数据时)由ι(χ)表示,结构体的单元最大值由I(s)表示,则存储的下限值和实际值按照如下表达式获取二者间的差值[2]: 计数最大范围由φ(P)表示,过期数据元素导致的性能开销由(p)表示,标志性阑值由μ(Q)表示(用于区分历史和当前数据),则按照如下表达式完成新旧数据交界区域的划分(根据绝对偏移量):
对于当前有效的工作区间,由θ*j表示其所存储的数据元素数量,则按照如下表达式获取数据存储阑值:
根据上式的计算结果实现对计算机数据存储空间的优化过程,使其稳定性和安全性得到进一步提升,以有效满足不断增长的数据存储需求[3]。
3 结语
对于虚拟计算机数据存储空间稳定性的优化,传统方法大多普遍存在历史和当前数据,难以有效区分且数据存储安全度低等不足。为此本文根据现有优化方法提出了一种优化数据存储空间稳定性的方法,先融合于动态指针方法,以预分块和滑动窗口为依据,完成数据变动及非变动区域的有效划分,在获取实验室系统数据流无穷序列的基础上,完成數据流老化计数值的获取及冗余元素的去除,从而使对存储空间稳定性优化过程得以有效实现,在有效拓展了计算机存储空间的同时,提高了数据存储安全性和稳定性,具有较高的实际应用价值。
[参考文献]
[1]吴迎鸽.计算机硬盘存储结构及硬件故障数据恢复技术研究[J].自动化与仪器仪表,2018(11):47-49.
[2]葛微,罗圣美,周文辉,等.HiBase:一种基于分层式索引的高效HBase查询技术与系统[J].计算机学报,2016(1):140-153.
[3]吴章玲,金培权,岳丽华,等.基于PCM的大数据存储与管理研究综述[J].计算机研究与发展,2018(2):343-361.
Research on computer data storage virtualization technology optimization
Xu Bing
(Shenyang Polytechnic College, Shenyang 110045, China)
Abstract:This paper mainly optimizes the stability of computer data storage virtualization space, which is based on pre-blocking and sliding windows. Based on the junction area of current and historical data, the acquisition of storage space stability optimization value is completed, the extraction of redundant elements and the calculation of the duplicate data storage rate are realized on the basis of the completion of data change and non-variable division, and the difference between the upper value and the actual value is obtained by sliding window. Finally, according to the junction area of the data, the stability optimization value is obtained, so as to complete the optimization of the virtual space of data storage.
Key words:computer data storage space; virtualization technology; virtual storage form
转载注明来源:https://www.xzbu.com/8/view-15176896.htm