2020年左右
很久没管,搬家后关注,发现get-clusterresource结果是集群IP offline状态,经过将网络开启:专用网络后,数据同步正常
如下图,原来服务器名称A6-AlwaysOn 那里是 脱机状态,右键选择:联机,即可恢复集群IP地址状态到online。
2023-07-21:
无域alwayson高可用环境维护笔记:
事故经过:7月7日下午,研发人员发现应用日志提示连接不上数据库,登录数据库检查发现数据库服务停止,启动后手动切换主从,去忙别的。
7月17日,又故障自动转移,从库只读,研发说修改不了数据,上服务器检查,又是故障自动转移,手动切换后,又去忙别的
7月18 日,又自动故障转移,开始怀疑起来,排查起来;加上监控数据检查,发现7月7日到7月17日期间,E盘大小采集结果为0
确认E盘有问题。去服务器确认,E盘无法执行写入备份,备份一段时间以来一直失败,在进一步检查系统日志,确认:7月7日,又硬盘错误的系统日志
跟网络工程师确认后,决定:格式化E盘,并重启了服务器后,可以写入了。
但是因为在上述排查之前,手动操作了故障转移群集,改了属性啥的,加上副本无法连接到可用性组,反复研究,无解,还把从库给删了!
后来决定重新搭建,按步骤排查:确认配置方案里面,两个节点都需要:专用网络。检查发现:主库不知道什么时候网络被改为:公用网络?
百度找到方法:如何把防火墙上的公用网络改为专用网络:
步骤1. 按“Win + R”输入“secpol.msc”,然后点击“确定”打开本地安全策略。
步骤2. 单击“安全设置”,然后单击“网络列表管理器策略”,找到您的网络名称并双击它。如下图:选择:网络位置,专用 后应用,确定返回
在看防火墙,就是如下图:
然后再刷新可用性副本,辅助副本就显示正常状态
总结:
实际上副本连接不上的根本原因,就是防火墙上的网络方式不是【专用网络】的问题。不应该那么早删除备库!