切换高可用性

高可用性  时间:2021-03-26  阅读:()
板坯连铸机动态轻压下过程控制系统的高可用性实现祭程!
,赵琦!
,朱苗勇!
,田建良",程乃良"(!
#东北大学材料与冶金学院,辽宁沈阳!
!
$$$%;"#上海宝钢集团梅山钢铁股份有限公司)[摘要]阐述了梅钢"&板坯连铸机动态轻压下过程控制系统的高可用性架构过程,提出了一种软件故障自主恢复与硬件热备冗余相结合的高可用性系统架构方案,并结合实际生产过程分析了备机切换过程中检查点数据的可用性,最后给出了系统故障测试结果.
实际表明,系统投产以后运行稳定,达到了预期目标.
[关键词]双机热备;高可用性;系统管理;板坯连铸;动态轻压下[中图分类号]'("%)*+;',"+-[文献标识码].
[文章编号]!
$$$/+$0)("$$+)$"/$$%0/$%012*/%3"4501),-264)"0/7,04-5540/),0'5*5)-310,5'%(40/)"/60654%5)"/#3%4$"/-1234567!
,89:;=@A/BA67!
,'2:C1=@6/D=@67",39EC(C@=/D=@67"(!
#FG4AADAH@I5J=@DKL5I@DDMJ7B,CAJI45@KI5J6>6=N5JK=IB,F456B@67!
!
$$$%,34=6@;"#5=K4@62JA6@6OFI55D3APIOAHF4@674@=.
@AKI55D(JAMQ)+(5),%4):'45HJ@R5S=I44=74@N@=D@T=D=IBHAJOB6@R=GKAHIJ5OMGI=A6QJAG5KKGA6IJADKBKI5RAHCA"KD@TGA6I=6MAMKG@KI=67R@G4=65=65=7@67=K=6IJAOMG5O#:9:KBKI5RHJ@R5KG45R5,GART=65OKAHIS@J5R@D/HM6GI=A6K5DH/J5GAN5J=67S=I44@JOS@J54AI/KI@6OTBJ5OM6O@6GB,S@KQJ5K56I5O#:N@=D@T=D=IBAHG45GUQA=6IO@I@=6KS=IG4AN5JQJAG5KKAHKI@6OTBGARQMI5JS@K@6@DBV5O=6N=5SAH@GIM@DQJAOMGI=A6#W=6@DDB,J5KMDIKAHKBKI5RTM7I5KI=67@J57=N56#,J@GI=G5K4ASKI4@IAQ5J@I=A6AHI45KBKI5R=KKI@TD5@6O5XQ5GI5O7A@D=KJ5@G45O#8-*90,25:4AI/KI@6OTB;4=74@N@=D@T=D=IB;KBKI5RR@6@75R56I;KD@TGA6I=6MAMKG@KI=67;OB6@R=GKAHIJ5/OMGI=A6连铸过程对连铸坯实施轻压下操作是消除中心偏析、提高连铸坯内部质量的有效手段.
在着力开发此技术的工艺控制核心模型的同时,控制系统的稳定性和安全性问题也显得尤为重要.
针对连铸生产过程的实时性和连续性,在上海宝钢集团梅山钢铁股份有限公司"&连铸机动态轻压下过程控制系统[!
]开发过程中,通过高可用性架构,将系统故障时间控制在!
4Y@内["].
在系统硬件架构方面采用两台服务器和磁盘阵列柜建立双机热备系统;软件架构方面利用系统管理模块,对系统进行监控和管理,增加了软件本身的自主恢复能力.
:系统的高可用性架构动态轻压下过程控制系统采用双节点群集模式架构[-Z%]:当系统工作时,工作节点对外提供服务,备用节点监控工作节点运行情况,不参与对外服务.
当工作节点出现异常时,备用节点主动接管工作机的工作,继续对外提供服务,从而保证系统的不间断运行.
原来的工作节点进行故障处理后,根据预先设定的配置命令以人工或自动的方[收稿日期][修改稿收到日期][作者简介]祭程(!
)\$/),男,山东济南人,助教,博士研究生,主要研究方向为冶金过程控制.
·0%·梅钢动态轻压下过程控制系统专栏冶金自动化;高可用性架构3)@A@'B(C'1BD(1E'**E1/F(1@*G*F'CB1(*@A*1BF('0HEF)1/无法解决时再转入热备机切换.
系统实现自主修复的关键为系统管理模块对其他模块的实时监控与重启功能.
系统管理模块具有看门狗功能,即在系统运行过程中,通过信号交互,实时检测模型计算、数据通信等其他模块的运行状态,如果被检测对象出现异常,则迅速将异常模块重启.
如果系统管理模块在一定时间无法使系统恢复正常,系统管理模块将自动关闭,群集管理器检测到后转入备机切换过程.
如图4所示.
具体恢复过程如下:(!
)数据管理模块以!
*的循环周期向磁盘阵列柜写入系统启动初始所需的检查点数据.
(4)模型计算模块、数据管理模块或数据通信模块中的线程存在未处理异常(I/>/0@'0'JE'DKF)1/[-])时,该模块中相应的进程将自动退出,不弹出错误描述对话框.
(+)系统管理模块通过调用L'F:(1E'**M'(*)1/函数以!
*的短周期实时检测其他模块的运行情况,如果检测到被监控模块中线程存在的未处理异常引起了程序的异常退出,立即调用N('F':(1KE'**函数启动被监控对象;利用I*'(+4O0@@中"*=H/('0)判断被监控模块是否响应,如没有响应则终止它.
(,)一旦系统管理模块监测到其他模块在设·-,·板坯连铸机动态轻压下过程控制系统的高可用性实现0%)12(%34&%+3.
!
55673!
万方数据图!
系统恢复过程流程图01+0(&20+/3+&(0.
.
定时间内连续$次没有响应或异常退出,则认为软件系统无法实现故障自恢复,系统管理模块自动关闭,转入备机切换过程.
(4)备机的过程控制系统启动过程中首先获取当前系统时间并与检查点数据时间比较,采用相应的算法在可接受的误差范围内校正检查点数据.
如果当前检查点数据不可用,继续读取前一时刻检查点,直到读取到完整的检查点数据为止.
结合检查点数据与当前流线状态,系统恢复生产服务.
(5)此外,当出现操作系统崩溃、硬件异常等系统管理模块无法恢复的故障时,直接转入备机切换.
备机的热切换功能基于6"78&'.
9020+$::;群集管理器实现.
"检查点数据可用性分析动态轻压下过程控制系统核心计算模型均基于跟踪单元方法架构[],即将数据通信模块读取的当前流线信息与检查点信息对比,选择距当前时刻最近且完整的检查点数据与当前通信信息一同输入工艺模型进行计算.
保证了温度场计算在时间和空间上的连续,同时降低了平均拉速的计算误差.
生产过程中,计算周期越短计算精度越高,对计算周期4.
和:.
两种情况进行仿真比较得出:稳态浇铸条件下,两种情况计算无偏差;在非稳态浇铸条件下,设定铸机在:.
内拉速从$@:1A1"7降至:,改变计算周期前后温度场计算偏差BC,水量设定值偏差C,且对新生成的跟踪单元无影·高可用性实现冶金自动化!
##$年第!
期万方数据响.
因此可以认为,当备机切换时间小于!
"#时,切换过程前后模型计算偏差小于$%,可以忽略.
!
系统功能测试与分析上线调试期间,对系统进行了故障测试,表!
给出了测试结果.
故障测试表明:(!
)过程控制系统本身的自主恢复功能,大大降低了双机热备切换次数,使软件引起的故障恢复时间控制在一个通信周期(&#)以表"系统测试结果01+#2345#6#+*7故障测试项目测试结果强行结束模型计算模块、数据通信模块或数据管理模块.
系统界面无影响,运行正常.
强行结束系统管理模块.
切换至备机,切换时间$#,切换后程序运行正常.
连续强行结束模型计算模块、数据通信模块或数据管理模块.
切换至备机,切换时间8#,切换后程序运行正常.
强行删除模型计算模块、数据通信模块或数据管理模块的关键文件,造成该模块无法正常启动,并关闭该模块.
切换至备机,切换时间8#,切换后程序运行正常.
强行结束操作系统关键进程造成系统崩溃.
切换至备机,切换时间$#,切换后程序运行正常.
工作机强行断电.
切换至备机,切换时间$#,切换后程序运行正常.
备用机强行断电.
群集管理器提示错误,程序运行正常.
拔掉心跳线.
群集管理器提示错误,程序运行正常.
拔掉工作机网线.
切换至备机,切换时间$#,切换后程序运行正常.
拔掉工作机与磁盘阵列的数据线.
切换至备机,切换时间$#,切换后程序运行正常.
内.
(9)系统管理模块的后台处理保证了系统界面的连续性,无异常反应.
(:)在操作系统崩溃、硬件异常、过程控制软件连续无响应、系统管理模块关闭四种情况下进行双机热备切换,系统恢复时间小于两个通信周期(!
"#),满足生产要求.
($)热备系统切换前后,过程控制系统数据计算连续,无异常跳跃.
#结论梅钢9;板坯连铸机动态轻压下过程控制系统采用软件与硬件相结合的方式实现系统的高可用性.
当控制程序内部模块出现运行错误时,首先进行系统自恢复,恢复时间小于一个通信周期,大大降低了双机热备切换机率.
当操作系统故障、硬件故障或系统管理模块无法完成自主恢复时,系统在两个通信周期内完成热备机切换.
结合工艺控制过程对检查点数据的可用性和系统恢复前后的数据连续性进行了分析,仿真结果表明备机切换引起的系统控制精度误差小于$%.
在线调试结果表明,系统故障最大恢复时间不超过!
"#.
系统投用至今运行稳定,产量已超过&"万+.
[参考文献][!
]祭程,朱苗勇,程乃良,:!
(!
):&!
&$,:!
(!
):&!
&$(8):!
&9$!
&>"(8):!
&9$!
&>"]祭程,张书岩,赵琦,等)[45S,V,*,ND\,0LB0(-,NF@Q0(-):编辑:夏宁]·X$·板坯连铸机动态轻压下过程控制系统的高可用性实现0)1&*23)&45'&,4/6778946万方数据板坯连铸机动态轻压下过程控制系统的高可用性实现作者:祭程,赵琦,朱苗勇,田建良,程乃良,JICheng,ZHAOQi,ZHUMiao-yong,TIANJian-liang,CHENGNai-liang作者单位:祭程,赵琦,朱苗勇,JICheng,ZHAOQi,ZHUMiao-yong(东北大学,材料与冶金学院,辽宁,沈阳,110004),田建良,程乃良,TIANJian-liang,CHENGNai-liang(上海宝钢集团梅山钢铁股份有限公司)刊名:冶金自动化英文刊名:METALLURGICALINDUSTRYAUTOMATION年,卷(期):2007,31(2)参考文献(8条)1.
祭程;朱苗勇;程乃良板坯连铸机动态轻压下过程控制系统研究与实现[期刊论文]-冶金自动化2007(01)2.
胡兵全基于Windows的双机热备系统的设计与实现[学位论文]20043.
于斌;刘宏伟;崔刚高可用双机容错服务器的研究与设计[期刊论文]-计算机工程与设计2006(09)4.
RajkumarBuyyaHighperformanceclustercomputingarchitectureandsystem20015.
PMChen;EKLee;GAGibsonRAID:high-performance,reliablesecondarystorage1994(02)6.
JeffreyRichter;王建华Windows核心编程20007.
祭程;张书岩;赵琦连铸板坯轻压下实时温度场计算及动态二冷控制模型的研究与开发[会议论文]20058.
沙丽杰;武秀川;韦鹓分布式系统检查点算法中程序卷回时文件系统的状态恢复[期刊论文]-计算机工程与应用2002(17)引用本文格式:祭程.
赵琦.
朱苗勇.
田建良.
程乃良.
JICheng.
ZHAOQi.
ZHUMiao-yong.
TIANJian-liang.
CHENGNai-liang板坯连铸机动态轻压下过程控制系统的高可用性实现[期刊论文]-冶金自动化2007(2)

RackNerd 2022春节促销提供三款年付套餐 低至年付10.88美元

RackNerd 商家我们应该是比较熟悉的商家,速度一般,但是人家便宜且可选机房也是比较多的,较多集中在美国机房。包括前面的新年元旦促销的时候有提供年付10美元左右的方案,实际上RackNerd商家的营销策略也是如此,每逢节日都有活动,配置简单变化,价格基本差不多,所以我们网友看到没有必要囤货,有需要就选择。RackNerd 商家这次2022农历新年也是有几款年付套餐。低至RackNerd VPS...

CloudCone月付$48,MC机房可小时付费

CloudCone商家在前面的文章中也有多次介绍,他们家的VPS主机还是蛮有特点的,和我们熟悉的DO、Linode、VuLTR商家很相似可以采用小时时间计费,如果我们不满意且不需要可以删除机器,这样就不扣费,如果希望用的时候再开通。唯独比较吐槽的就是他们家的产品太过于单一,一来是只有云服务器,而且是机房就唯一的MC机房。CloudCone 这次四周年促销活动期间,商家有新增独立服务器业务。同样的C...

美得云(20元)香港特价将军澳CTG+CN2云服务器

美得云成立于2021年,是一家云产品管理服务商(cloud)专业提供云计算服务、DDOS防护、网络安全服务、国内海外数据中心托管租用等业务、20000+用户的选择,43800+小时稳定运行香港特价将军澳CTG+CN2云服务器、采用高端CPU 优质CN2路线 SDD硬盘。香港CTG+CN22核2G3M20G数据盘25元点击购买香港CTG+CN2​2核2G5M30G数据盘39元点击购买香港CTG+CN...

高可用性为你推荐
安徽汽车网安徽汽车票查询杨紫别祝我生日快乐周杰伦的祝我生日快乐这首歌有什么寓意或者是在什么背景下写的access数据库ACCESS数据库有什么用罗伦佐娜罗拉芳娜 (西班牙小姐)谁可以简单的介绍以下www.119mm.comwww.993mm+com精品集!www.765.com哪里有免费的电影网站www.gegeshe.comSHE个人资料www.33xj.compro/engineer 在哪里下载,为什么找不到下载网站?www.zjs.com.cn中通快递投诉网站网址是什么?www.kaspersky.com.cn卡巴斯基中国总部设立在?
二级域名查询 老左 zpanel vpsio Dedicated 老左博客 服务器日志分析 华为4核 刀片服务器是什么 北京双线 万网主机管理 卡巴斯基官网下载 黑科云 密钥索引 沈阳idc shuangcheng 美国主机侦探 comodo cloudflare paypal兑换 更多