编辑: Mckel0ve | 2019-09-29 |
发布时间:20120930 本手册适用于 3.0.1.x 系列版本 NewStart HA 双机高可用集群软件 用户手册 NewStart HA 双机高可用集群软件用户手册 -
1 - 目录 目录
1 前言
3 本书约定.3 正式版包装组件.3 第1章概述.4 第2章安装前准备.5 2.1. 安装流程快速预览.5 2.2. 相关概念.5 2.3. 硬件需求列表.6 2.4. 运行系统支持列表.7 2.5. 架构规划.7 2.6. 配置环境.9 2.7. 编写服务的双机脚本.13 第3章安装.14 3.1. 安装软件.14 3.2. 输入 SN 及产品注册.15 3.3. 产品卸载.16 第4章cli(命令行界面)17 4.1. HA 配置规划.17 4.2. 初始化配置.18 cluster-init
18 cluster-show
21 service-init.21 4.3. 修改配置.25 heartbeat-add.26 heartbeat-delete.26 cluster-modify.26 thirdpartyip-add.27 thirdpartyip-delete.27 service-add.27 service-show
28 service-modify.29 service-delete.29 lockdisk-adm
29 check-config
30 4.4. 集群管理.30 4.4.1. 节点的管理.30 4.4.2. 服务的管理.31 4.4.3. 资源的管理.34 4.5. 集群监控.36 NewStart HA 双机高可用集群软件用户手册 -
2 - cluster-stat.36 show-status
39 4.6. 日志收集和其他.39 第5章集群的验收测试.40 I.附录
41 附录 A-技术支持.41 附录 B-HA 应用脚本编写规范.41 HA 操作脚本的机制.41 自动调试脚本.42 手动调试脚本的快捷方法.43 脚本编写方案.44 附录 C-常见问题及解答.46 1. 目前有哪几种集群软件,HA 属于哪种?46 2. 双机热备(Active-Active)与主从备份(Active-Standby)方式区别 ...46 3. 问:运行 cli 后提示配置文件被损坏.46 4. 问:如何把试用版 HA 转成正式版 HA
46 5. 问:刚刚申请临时的 license 无效?47 6. 修改主机名是否影响 HA 配置?47 7. LVM 锁启用方法.47 附录 D-HA 配置策略表.47 NewStart HA 双机高可用集群软件用户手册 -
3 - 前言 本书约定 1. 组织和印刷约定 格式 意义 输入的命令 等宽粗体(新宋体小四) 命令输出 等宽字体(新宋体小四) 命令的注释 等宽粗斜体(新宋体小四) 2. 安全符号约定 在本手册中可能出现下列安全符号,它们所代表的含义如下: 安全符号 意义 危险 表示若忽视安全告诫, 就有可能发生损坏设备或导致人身 伤害的严重事故 警告 表示若忽视安全告诫, 就有可能发生损坏设备或导致人身 伤害的事故 注意 表示若忽视安全告诫, 就有可能导致设备损坏、 数据丢失、 设备性能降低以及其它不可预知的后果 提示 表示该内容是特别提示的信息 说明 表示该内容是正文的附加信息 正式版包装组件 组件 数量 HA安装光盘
1 产品简介
1 安装配置手册
1 许可协议卡
1 1.5M串口线
1 NewStart HA 双机高可用集群软件用户手册 -
4 - 第1章概述 本产品全称NewStart HA,简称NSHA,是广东新支点技术服务有限公司自主 研发的高可用集群产品,目前该产品只适用于双节点. 本手册是为新支点高可用集群系统的用户编写的,将引导您完成环境的搭 建,然后通过简单操作命令行界面,方便快捷地完成NSHA的配置和管理.所以本 手册将不对NSHA作太多的技术介绍,而是以图文相辅、通俗易懂的形式,详细地 介绍NSHA的安装使用过程. 光盘(或者 iso文件)内容 文件/目录 内容说明 doc/ 文档目录,包括用户手册和简易安装手册 scripts/ 集群和 web 的通用脚本函数 nsha/ HA 软件包所在目录 Web/ JDK,tomcat 和web 管理模块 install 安装脚本 uninstall 卸载脚本 version=xxxx 版本文件,字符 xxxxx 代表版本号 tools/ 一些工具脚本 由于软件修改后可能来不及更新到光盘中, 推荐用户上我司网站下载安装最 新版本 (iso文件),
网址: http://www.gd-linux.com/htdocs/product.php NewStart HA 双机高可用集群软件用户手册 -
5 - 第2章安装前准备 2.1. 安装流程快速预览 1. 熟悉 HA的概念和安装环境,确定架构和配置方案,详见2.2至2.5节说明. 2. 按照设计好的双机架构进行硬件配置,参考 第2.6节配置环境 . 3. 安装用户的业务软件(比如oracle数据库程序),确保两台服务器的业务软 件环境一致. 4. 安装HA,获取 License文件,详见 第3章安装 . 5. 配置集群参数cluster-init,配置服务参数service-init.上述操作在命令 行界面中完成请参考 第4章cli(命令行界面) . 6. 编写服务的双机脚本,通过在单机上调试,确保双机脚本能正常启动、停止 和检测服务,方法详见 第2.7节编写服务的双机脚本 . 7. 启动集群软件,查看双机集群的运行情况,进行服务的手动倒换和故障模拟 测试,确认服务能自动故障迁移,方法详见 第5章 . 2.2. 相关概念 ? 节点(node):指运行高可用集群软件的计算机. ? 主节点(也称主用节点):指运行服务的节点. ? 备份节点(也称备用节点):用于监控主节点状态,一旦主节点出现故障, 备份节点将接管主节点的服务,从而备份节点成为主节点,而原先的主节点 也将变为备份节点. ? 工作链路(work link):指集群向外提供服务的链路,从服务器到交换机 的链路.工作链路使用的网卡即为公共网卡(PubNIC). ? 心跳链路(heartbeat link):维持高可用集群软件内部互联,传送心跳信 息的链路. ? 镜像链路(mirror link):节点间链路,用于同步镜像分区数据. ? 服务(service):是与用户应用相关的一组资源的集合,一般包括:管理 用户进程资源的应用脚本(application),网络资源,存储资源;
譬如说用 户的一个 Oracle数据库,该服务包括管理Oracle的脚本(用于启动,关闭和 监控), IP地址和所需要 mount的磁盘;
服务可以是其中几种或全部资源的 组合. ? 互备方式(active-active):指两个节点上都有服务(两个节点上运行的服 NewStart HA 双机高可用集群软件用户手册 -
6 - 务不相同)在运行,这个时候每个节点既是主节点,同时也是备份节点,互 相备份. ? 优先节点(prefered node):指集群系统启动时,将优先考虑在该节点运 行. ? 服务故障迁移(服务倒换,failover):是指当服务在某节点上出现故障, 它将在运行节点停止服务(因为服务的其他资源可能未停止);
然后在集群 的另一个节点启动服务. ? 服务迁移的时间: 是指服务不可用的时间, 对于两个节点node1, node2来说, 如果服务在 node1上运行,目前出现故障的时刻为T1,那么当node2检测到 node1出现故障时,开始在 node2上启动该服务直到该服务可用的时刻为T2, 那么服务迁移的时间为(T2-T1).一般服务迁移的时间(近似等于)≈检测到 服务在node1上出现故障的时间+在node1上停止服务的时间+在node2上启动 服务的时间.服务停止和启动的时间由具体的应用来决定,而检测到服务出 现错误的时间可以通过对HA的配置来调整. ? 服务检测到错误的时间:(服务检测间隔+服务检测所需时间)*连续检测 到错误的次数.如果检测到服务出现错误,那么HA会继续进行检测,直到对 服务的检测错误次数达到指定的次数,HA认为服务确实出错,才开始进行服 务的迁移. ? 裂脑(Split-Brain):裂脑指的是两个节点彼此失去了联系,但集群软件都 正常运行,这样将导致资源的竞争,可能会损坏数据.为了降低裂脑现象发 生的可能性,我们建议用户至少配置两条心跳链路(两条网卡心跳,或者一 条网卡心跳和一条串口心跳),如果网卡数量足够,推荐三条心跳链路. ? 数据裂脑:两个节点的数据分区的数据不一致,每个节点都有对方节点没有 的数据. ? 看门狗(Watchdog):Linux看门狗是用于系统 挂死 (hanged up)或者崩 溃时使服务器自动重启的技术,Linux支持两种类型的看门狗:自带的 softdog模块(俗称 软狗 )和硬件看门狗(俗称 硬狗 ). ? 内核恐慌(Kernel panic)功能:Linux内核恐慌功能是HA重启服务器的一 种技术,用于HA异常或者服务停止失败时自动重启服务器. ? LVM锁:LVM是逻辑盘管理(LogicalVolumeManager)的简称,它是Linux环境 下对磁盘分区进行管理的一种机制,它是建立在硬盘和分区之上的一个逻辑 层,用来提高磁盘分区管理的灵活性,LVM锁可以确保LVM设备仅能在一个节 点上被激活和挂载. 2.3. 硬件需求列表 硬件需求列表(节点 A 和B以下硬件配置相同) 服务器节点A 数量 用途 硬盘 ≥1 安装 Linux 操作系统,/var 可用空 间预留不少于 1GB;
网卡 ≥3 两块 (至少有一块) 用于心跳链路 (百 兆以上网卡) , 一块用于工作链路 (千NewStart HA 双机高可用集群软件用户手册 -
7 - 兆以上网卡) 串口
1 用于集群心跳链路 交换机 ≥1 用于连接网卡 磁盘阵列
1 存放共享数据 2.4. 运行系统支持列表 HA产品已确认支持的操作系统列表: 操作系统 版本 内核 NewStart Carrier Grade Server Linux(简称CGSL) x86和x86_64 V3.x,V4.x 2.6.18 ~ 2.6.36 SUSE Linux Enterprise Server (简称SLES) x86和x86_64 SLES11.x 2.6.32.x Red Hat Enterprise Linux(简称 RHEL) x86和x86_64 RHEL5.x, RHEL6.x 2.6.18 ~ 2.6.32.x 如果需要其他Linux OS发行版的支持,请与我们联系. HA产品已确认支持的数据库系统列表: 数据库系统 版本 访问方式 Oracle 9i系列,10g系列,11g系列Linux版本 文件系统 Sybase ASE 12.x,15.x系列 文件系统 PostgreSQL 7.x,8.x,9.x系列 文件系统 HA产品已确认支持的其它软件列表: 中间件和网络服务器 版本 访问方式 Apache 2.0.x,2.2.x 文件系统 Tomcat 5.x,6.x,7.x 文件系统 Weblogic 8.x,9.x,10.x 文件系统 NFS 2,3,4 文件系统 HA作为第三方商业软件,不依赖特定厂商的产品,支持多种 Linux平台、数据库 系统和其他软件,以上信息供参考,未列出的软件版本也可能兼容HA. 2.5. 架构规划 提示:集群安装之前需要........