当前位置:首页 期刊杂志

SKYNET-X自动化系统EHCT装机经验总结及故障排查

时间:2024-08-31

黄明亮

摘要:SKYNET-X空管自动化系统包括多种类型的节点,每种类型节点所需的系统环境,网络配置,驱动等均有所差异,人工安装操作系统不仅工作量巨大且极易出错。我们通过EHCT工具可以轻松完成全系统节点操作系统安装工作。本文详细阐述了SKYNET-X自动化设备通过EHCT工具远程安装操作系统的原理和步骤,并结合系统安装过程中常见的故障进行分析,为全国SKYNET-X自动化系统用户提供了较好的THALIX 12操作系统装机经验参考。

关键词:SKYNET-X、EHCT、THALIX

正文:

SKYNET-X空管自动化系统采用基于Linux系统开发而成的THALIX 12操作系统。SKYNET-X空管自动化系统包括多种类型的节点,每种类型节点所需的系统环境,网络配置,驱动等均有所差异,人工安装操作系统不仅工作量巨大且极易出错,为了解决批量安装各节点操作系统的问题,THALIX厂家提供了一套强大的在线安装操作系统工具EHCT,通过EHCT工具,可以轻松完成全系统节点装机工作。

SKYNET-X自动化系统通常将DBM工作站配置为EHCT服务器,在该服务器中部署EHCT工具及相关脚本、系统RPM包、驱动等。通过以下几个步骤完成全系统节点自动装机工作:

一、在EHCTServer上开启DHCP、NFS和TFTP服务

系統装机前,需确保以下系统服务已经开启,开启这些服务需要root权限,并通过指令service dhcpd start 、service nsf start和 service xinetd restart开启对应系统服务。

(一)DHCP服务

动态主机设置协议(Dynamic Host Configuration Protocol,DHCP)是一个局域网的网络协议,使用UDP协议工作,主要有两个用途:给内部网络或网络服务供应商自动分配IP地址,给用户或者内部网络管理员作为对所有计算机作中央管理的手段。

(二)NFS服务

NFS(Network File System)即网络文件系统,它允许网络中的计算机之间共享资源。在NFS的应用中,本地NFS的客户端应用可以透明地读写位于远端NFS服务器上的文件。

(三)TFTP服务

TFTP(Trivial File Transfer Protocol,简单文件传输协议)是TCP/IP协议族中的一个用来在客户机与服务器之间进行简单文件传输的协议,提供不复杂、开销不大的文件传输服务。

二、在EHCTServer上进行相关参数配置

EHCT工具装机前需对以下两个文件夹中的文件参数进行详细配置,其中Database_HDMT目录下的文件定义了系统节点安装系统所需的各项配置;machine_types目录下文件定义了系统各种机器类型。

(一)Database_HDMT目录下关键配置文件解析

1.Configuration.hcs:定义系统需安装的节点名称。

2.Environment_linux.hcs:定义系统环境:系统名,版本,用户和登录密码以及用户对应的SHELL目录。

3.eurocat.hcs:定义系统各节点和系统分区的对应关系。

4.graphic.hcs:定义机器类型对应视频图像显示。

5.hardware_params.hcs:定义安装操作系统的硬盘分区,此处路径需与各节点机器/dev/disk/by-path/中定义保持一致。

6.hdmt_hosts.txt:存储具有关联IP地址的主机名的文本文件,所有节点/etc/hosts文件通过这个文件生成。

7.hdmt_networks.txt:是给计算机各网段起的一个名字,装机时所有节点的/etc/networks通过这个文件生成。

8.hosts_linux.hcs:定义节点名字,编号(编号为该节点ip地址最后一位),机器类型,ntp服务配置和分配网段。

9.interface.hcs:定义各节点网卡配置和网卡工作模式。

10.mac.hcs:节点S网的网卡mac地址,装机时EHCT服务器通过mac地址找到相应的节点,安装操作系统。

11.machine_types.hcs:定义不同机器类型装机所需安装组件

12.master_slave_standby.hcs:定义EHCTserver备份服务器

13.xxx.ntp:定义系统时钟同步。

(二)machine_types目录下关键配置文件解析

1.+_etc_X11_xorg.conf:定义系统显示输出,视频输出接口以及视频输出分辨率等

2.+__lib__kbd__keymaps__lk461.map:定义系统键盘映射

3.hardware_params.txt:定义该类型节点安装操作系统默认pci编号

完成以上文件配置后,通过指令build_platform.sh,执行平台编译脚本,结合以上配置的各项参数,生成kickstart文件,kickstart文件位于/EHCT_data/built/GL/12/kickstart文件夹内,每个节点均有对应的kickstart文件。kickstart文件为安装系统指引,文件内容包括装机过程中需要执行的脚本,命令以及需要从EHCTserver中获取的软件包,通过kickstar可以自动完成节点系统安装,网络设置,硬盘分区等操作。

三、客户机安装操作系统

(一)将客户机板载网卡在bios中禁用,设置USB启动为最高优先级,接上usb_key,启动机器进入U盘引导操作系统安装进程。

(二)客户机eth0网口接入与EHCT服务器S网同一网络后,客户机会在网络中广播DHCP Discover报文,报文中包含客户机eth0的mac地址。EHCT服务器收到客户机的报文后,并通过DHCP服务为节点分配IP地址。

(三)客户机通过NFS服务,从EHCT服务器中下载kickstart文件,自动完成操作系统的远程安装和系统配置。

四、常见故障排查

(一)装机过程提示WARNING:THE “—no-network” option is deprecated:nvidia-installed will ignore this option。

当节点显卡型号不一致时,系统装机过程中容易出现这个告警提示,原因是由于该节点从EHCT服务器上获取的显卡驱动与当前的显卡不适配造成,我们首先需要查看安装节点的显卡型号,并从厂家获取对应显卡THALES系统驱动包,将对应的显卡驱动放置在/EHCT_data/misc/EX_PACKAGE_T12/Drivers/目录下,重启机器后完成节点操作系统安装。

(二)装机过程提示warning:dracut-initqueue timeout – starting timeout scripts后,自動退出装机。

1.安装节点eth0网卡mac地址与服务器配置参数不一致

取下安装节点eth0所在网卡,记录下网卡mac地址。在EHCT服务器上,进入到/EHCT_data/database/GL/12/Database_HDMT目录下,编辑mac.hcs文件,将节点的eth0网卡的mac地址填写到对应的节点名后,重新执行build_platform.sh脚本,以更新kickstart文件,重启节点后完成操作系统安装。

2.安装节点eth0网卡所在pci设备地址与服务器默认配置不一致

该问题经常出现在机器型号与原安装节点机器型号不一致时,此时系统引导安装文件kickstart中pci设备地址和实际不一致,我们需要通过指令ls–al /dev/disk/by-path 查看并记录下sda1对应地址信息。在EHCT服务器上打开位于/EHCT_data/built/GL/12/kick start目录对应节点的kickstart文件,编辑并替换掉kickstart文件里两处pci地址信息,由于是直接编辑的kickstart文件,所以不需要执行脚本编译,可以直接重启节点完成操作系统安装。

五、结束语

本文从原理和配置出发,详细阐述了SKYNET-X自动化设备通过EHCT工具远程安装操作系统的原理和步骤,并结合操作系统安装过程中常见的故障进行分析,为全国SKYNET-X自动化系统用户提供了较好的THALIX 12操作系统装机经验参考。

参考文献:

[1]蒋增恒 THALIX操作系统网络安装服务原理分析,《空中交通》,2016

免责声明

我们致力于保护作者版权,注重分享,被刊用文章因无法核实真实出处,未能及时与作者取得联系,或有版权异议的,请联系管理员,我们会立即处理! 部分文章是来自各大过期杂志,内容仅供学习参考,不准确地方联系删除处理!