简历准备阶段05_公司目标等
处理完成的Remedy的案件数【主要是mes系统相关联的软件故障而影响生产进度的案件】:
2019/11/1 - 2020/12/24 :129件
2020/12/24 - 2021/6/18 :271件
2019/11/1 - 2021/6/18 :400件
处理方式(因为remedy有不同的优先级,根据优先级的不同处理方式也不同):
-P1/P2: 尽快恢复生产。
-P3/P4:
·找出根本问题,调查根本原因并解决
·如果是未知问题,也就是以前没见过的,然后还找到了根本原因,这个时候就要进行小组内复盘,全员通过以后就可以写成固定参考式文档
·如果是一些系统缺陷问题,将会想办法修复缺陷,然后进行版本更新
·还有些时候是功能增强的请求,想好对策,执行完以后,进行版本更新
user有什么问题就会通过专用的系统(BMC Remedy,Service Now)提交Remedy,他们会在Remedy中写明什么Application/software所遇到的什么具体问题,详细到哪一天的几点几分(能多详细就有多详细),我们就会通过这个信息展开调查。但有些时候,如果遇到比较难查的remedy的话,我们也会实时与user进行沟通。
一般的调查方法:
·比较普遍的调查方法就是查看相关系统,相关app的日志文件
·或者看代码,研究逻辑
·或者是user操作的顺序是否正确
·然后负责版本更新的小组,每天都会有更新change,有时候也会是由于change引起的问题。
·除此之外,我们还会通过查看消息,看看有什么error的信息。【因为我们有专门管理不同command所传递的不同message的网页】
·我们也有在专门记录各个server之间传递的message,也就是消息,一般正确的情况都会有四个消息,比如A和Bserver之间,A发送,B接受,B反馈是成功/失败,A接收结果。如果有任何一个出现了什么问题,一般都会有error message。当然有些时候也没有,比如由于B server本身的一些问题,导致没有回消息,造成了超时的情况。
->如果是error,我们都有自己的资料库,可以通过这个具体的error的message去查一些过去问,也就是之前可能有前辈已经解决过,而且已经作为固定的解决方案存储起来了
一般遇到的问题/解决方式:
·由于某一台服务器故障出现Timeout的情况。
·一些app或者软件打不开,或者一些软件中的功能不能显示等等
配置文件的误删导致一些软件不能用
DBA那边可能哪个数据库在做event,failover等等,导致数据丢失
权限不足导致不能使用
网络链接出现问题,导致不能链接上网络
·由于用户的操作错误,导致哪个原材料停止运行,以引发警报
·因为这个mes系统[进行物料跟踪的系统]:可以引入做饭的例子进行解释说明,所以任何一个环节有问题就可能造成停产
·user在使用某一个功能的过程中,不能完成他想要的结果,比如本来像删除数据,但是却删不掉。
·一些增删改查类的问题。
·splunk警报等等,某个服务器内存不足,或者cpu使用率剧增等等
Mes系统:Manufacturing Execution System:该系统使用计算机来管理和分析在生产线上流动的每个产品的所有过程,设备,条件和工作数据,从而提高质量,提高产量,并执行和支持更有效的生产,例如减少人为工作错误。
MES是制造执行系统(Manufacturing Execution System )的缩写,它是一个信息系统,可以掌握和管理制造过程/工程的状态,并为制造业生产现场的工人提供指导和支持。
Lot:1Lot是由最多25个晶圆片(wafer)组成
有很多软件:
有数据分析的,有设备/装置管理的,有质量分析并提供自动修复的【类似于迭代】等等
半导体制作流程,大概介绍:
mes系统: