1、 日志清理
很多系统都会产生日志,时间长了影响运转(磁盘满、IO不稳定等)。我会检查操作系统、服务、应用产生的日志,将历史日志进行压缩转储。
2、 数据备份
每天系统、服务和业务会产生不少新的数据,以数据库为例,新增的用户、业务、产品信息很重要。为了确保数据安全,我会将新的数据备份到本地,传输到远程,实现异地备份。数据库可能是传统的Mysql、Oracle、SQLServer,也可能是NoSQL阵营的MongoDB、InfluxDB等。
3、 大数据分析
很多客户都有大数据分析需求,我严格按照人类伙伴设定的指令,对大数据相关的任务顺序执行。为了确保数据准确,各环节的执行有先后要求,有了我的参与,无论是离线分析还是实时统计,都可以做到井然有序。
4、 代码发布
客户的代码发布工作,以前通过人类伙伴操作,有时发错了机房,有时遗漏了配置。人们半夜操作也很辛苦,交给我之后,我会和各系统配合起来,实现自动构建、灰度发布、自动测试,检测到问题我会立即自动回滚。根据统计,我投入工作后,发布引起的故障率下降了90%以上。
04:00,在环卫师傅清洁街道之前,我开始清理客户业务运行的环境:
1、 系统标准化
人类伙伴有时在设备上操作,无意间会忘了恢复原有的配置(目录结构、权限等),可能影响发布、监控,严重的还会引发事故。无论是10台还是上万台,我会认真检查每个系统的环境,发现问题及时纠正、报告,保证环境的标准统一。
2、 清理垃圾
系统运行时间久了,会堆积一些垃圾,可能影响系统的安全稳定。我会按照操作系统(Linux、Unix、macOS、Windows)、服务(Tomcat、Redis、RabbitMQ等)的特点,排查垃圾,及时进行清理。这些垃圾包括桌面的、缓存的、浏览器的、内存镜像等。
3、 业务标准化
我的客户遍布各个行业,运行着不同业务软件。通过行业方案,我可以帮助客户快速建立业务运行的标准环境,包括运行程序的配置、目录、权限、相关用户等。我会认真检查每台业务设备,与标准化环境对比。发现问题我会及时修复,同时报告给管理者,尽可能消除隐患的影响。
8:00,我的人类伙伴们陆续到达岗位,随时检阅我的劳动成果:
1、 任务完成情况
我在夜间,执行了多少任务,成功率高低,有没有失败的任务,分别是什么原因等。
2、 工作流进度
我执行了多少流程,各个流程耗费了多久,成功率多少,是否需要重复执行等。
3、 自动纠偏报告
和标准环境相比,我自动改正了多少问题,还有哪几个需要人工排查。通过提示管理人员,将不标准的配置恢复正常,消除大部分事故隐患。
有的勤快的人类伙伴会到社区里逛逛,检查是否有较新的模板,确保系统紧跟潮流。
湖南科中智能科技有限公司专注于光伏清扫,光伏运维,运维机器人,太阳能清扫,光伏运维机器人,光伏清扫机器人等