DSOX2000系列示波器维修
今天收到一台安捷伦公司的DSOX2014示波器,用户报修故障为无法开机,收到机器后按下电源开关,
如图所示,只有Math和Ref两个灯亮,机器一直停留在这个状态。经过上网查找资料,发现有一个时期的安捷伦DSOX2000和DSOX3000系列都会出现这个不启动的故障,应该是NAND FLASH故障,启动时CPU无法从FLASH中加载应用程序,而导致无法完成启动,是软件问题,而不是硬件故障。可以更换NAND FLASH维修,也可以通过软件方法解决问题。通过查找资料,对该故障的维修可以通过计算机与示波器连接,中止示波器的启动过程,通过U盘启动示波器,然后再更新固件即可修复该故障。
修电路板难吗?仅4步定位故障,第4步工程师不愿意用到
1. 背景
白蔡新设计的电路板焊接完成,首样总共有5块板卡,领导也是大胆,设计图上有几个器件全公司都没用过,设计时白蔡经常拿着器件数据手册请教前辈,没来几个月已经和大半个部门混得通熟,着看得出他很认真,祈祷一版设计成功。
上电后预想的处理器执行状态灯闪烁的场景没发生,很明显处理器没执行。再正常不过了,第一次吃螃蟹哪能轻而易举。
这一次白蔡来到浅鉴办公桌后寻求协助。
浅鉴转过椅子:“说说你的排查思路。”
白蔡一脸茫然:“没有办法。”
浅鉴白他一眼:“没有经过独立思考的伸手党,等同于谋杀“,白蔡眉毛稍稍上扬,没等他揣摩字面的意思,浅鉴补充道,“悄无声息的谋杀被询问方几分钟的阳寿。”
”给你一个排查故障万能公式,一般故障定位思路靠它挺奏效,以后请教前把自己的尝试结果先汇报,这是礼仪,我把它叫做 ‘三查一返’ ”。
2. “三查一返”
起身走向实验室,走廊上浅鉴解释:“三查一改指的是查输入状态、查内部逻辑、查输出状态、返原理。”
三查一改
“‘三查类’类似于产业链的客户、责任人、供方三层角色,要求三层角色的输入、输出、实施过程可量化度量。只有可量化才能保证出来的产品质量可控。”
白蔡:“那么‘返原理’怎么解释。”
浅鉴右手戴上与维修台连接的防静电手环,左手拇指和无名指卡在板卡边沿,托起板卡与嘴唇水平的位置,右手打开手机电筒靠在右脸颊,左手腕向三个轴小角度转动板卡,注视着手电打亮的位置,试图找到外观肉眼可见的工艺质量缺陷。
浅鉴继续检查板子另一面:“先尝试‘三查’排查一遍,至于‘返原理’,你不愿用到的”。
3. 查输入状态
3.1. 电源
浅鉴放下板子:“你说我们成为打工人的最基本目的是什么?”
白蔡眼球看向左上方:“吃饭!”,接着眼球转到右上方,左手拇指在下巴来回滑动,笑盈盈地,“升职加薪、出任CEO、迎娶白富美、发家致富……”越说越来劲。
浅鉴随手抽出鼠标垫往白蔡头上拍去:“还发家致富呢~打工人升职加薪没问题,发家致富请找别处”,白蔡闭上一只眼,“公司克扣你的工资怎么办”
白蔡瞪着大眼睛:“蛤?公司是想失去我吗?不过我保证,以后我去哪都叫你师傅”。
放下的鼠标垫再被浅鉴卷起往白蔡头上拍打三下,一次比一次使劲,每拍一次吐出几个字,“又白”、“又菜”,“我没教过你任何东西”。
浅鉴:“是否扣工资你也得下个月才知道,这个月的活一样也不会少”,指着电路板上几个古铜色没被绿油包裹的金属标记点,“不过你要是没给处理器供电、供时钟、电压缺斤少两,它立马罢工” 。
设计电路板时留下2mm直径的圆形区域,裸露紫铜色铜箔未被绿油覆盖, 旁边白色字母标注该铜箔的意义,它们是电路板上的测试点 。
每路电源都应有一个测试点,旁边白色字母+5V、-5V、REF+2.5v简洁地告知它们的正常电压范围。 电路板通电后应测试各电源是否符合要求,除了电压与标注一致外还需检查电源浮动, +5V直流电压不得噪声不得超过50mV,即小于电压有效值1%。
电路板测试点
电源浮动源于纹波 和噪声 。
纹波包括两个交流成分,一个是频率为两倍工频输入电压的正弦纹波,中国电网工频50Hz,这是由整流电路引起的;另外一个是由开关电源导通和关断引起的锯齿状纹波,其频率等于开关电源的工作频率。
噪音的频率都会高于开关电源的频率。它出现在开关电源工作状态的转换时期,噪声极大值一般都会叠加于波形的峰值或谷值附近。
纹波
示波器抓取板卡的电源纹波呈现出三角形态,白蔡:“幅度在40mV内,虽不优秀也差不到哪去。”
浅鉴说:“那再检查一下时钟。”
3.2. 时钟
白蔡拿着万用表黑表笔接地、红表笔接晶振输出时钟触点:“有捏,300mv”。
“万用表测试时钟信号虽然也行,不过测试结果比较粗糙,万用表显示的是正弦时钟幅度的平均值 , 更建议用示波器,准确地观察到时钟的输出高、低电平范围”, 浅鉴手上示波器点在万用表红表刚才接触的位置,移动示波器两根水平Y轴标杆卡在时钟最高、最低位置。
测试结果对照着原理图没看出什么问题,浅鉴:“时钟25MHz、波谷0V、波峰655mV。”
白蔡:“嘿嘿,怎么样,有思路吗。”,回了浅鉴问他的那句“说说你的排查思路”。
浅鉴神情自若:“仅完成‘查输入状态’而已,还有‘查内部逻辑’,掏出你的手机帮我录像。”
时钟
4. 查内部逻辑
4.1. 电流
浅鉴给示波器换上电流探头,电流探头是个手掌大小的夹子,中间有个1cm的孔隙,电源线从孔隙穿过。
电流探头
浅鉴随手在纸上画台阶图、坐标横轴表示时间、纵轴表示电流:“上电后理想状态下,随着越来越多器件得到供电,电流变化趋势应该是阶梯状递增, 依次是电源、不受CPU控制的外设(内存、FLASH)、CPU、其他外设, 待CPU执行控制代码后,部分外设可能处于低功耗模式,电流随之降低到稳定值”。
理想上电电流变化趋势
板卡接上电源,浅鉴不急着按开机键,静静看着示波器的电流是否停留在0mA处,自言自语到:“电流是0mA, 至少没在电源模块供电前漏电 ,可以开机了。”
开机前浅鉴提醒白蔡: “待会录像记录上电过程电路板状态, 你务必把板卡上的LED灯状态和示波器图像同时拍进去,便于定位各功能模块对应的电流上升位置。”
果然,屏幕上的电流轨迹呈现出纸上的台阶趋势,2秒后不再明显浮动,浅鉴扭动旋钮放大电流垂直刻度单位: “电流没抖动是好消息,电流不大可推断CPU之后的外设都没运行,启动过程卡在CPU上。”说完再万用表检查外设工作状态。
白蔡:“电流什么情况下会抖动?”
“没抖动则证明不存在某负载反复上电情况。什么是反复上电?若某特别耗电的负载X上电瞬间超过 负载X供电模块的额定负荷 , 供电模块不堪重负而拉低负载X供电压,直至低于负载X最低工作电压门限,供电模块负载恢复正常、电压升高、电流降低,” 浅鉴在纸上画出上下抖动信号, “负载X再次导通,反复循环 。电路板表现出LED闪烁、蜂鸣器或继电器滴答作响。”
4.2. 时序
两人握着3支示波器探头分别接在处理器时钟、供电、复位信号,按下按键瞬间3路 信号都出现高频杂波,时钟和供电几乎同一时刻达到额定有效值,5ms后复位信号干净利落地下拉到0V,保持约5ms再升高至3.3V。
实际上电时序
浅鉴放大时钟信号刚开始输出震荡波形的位置,晶振供电后电压立即从0V过冲到1V附近,再恢复到455mv位置保持0.5ms的直流信号,接着2ms的时段里晶振震动幅度逐渐增大,直至波峰655mV、波谷0V的正弦时钟,浅鉴说:“理想状态下,时钟应该在处理器供电前处于稳定状态 ,电路板上的纽扣电池除了防止BIOS配置丢失、确保关机不丢时间外,还保证处理器供电前时钟已经处于平稳状态。”
时钟启震不稳定区
浅鉴赞扬:“你设计的板卡时钟和供电同时提供,时钟稳定后给予1个足够长的的复位信号,避开这段不可靠时段,避免处理器执行出错,你做得很好。”
理想上电时序
“刚毕业的小屁孩设计的复位电路千篇一律,或者说根本没设计过,为什么呢!教材就那么教的——佛系复位,上电复位单纯依靠RC缓慢充电时间,电容在不同温度条件下可靠性难以保证不失效,那套RC复位电路只为手动复位而设计。”
白蔡:“那么,这时序就是有效的咯,为什么没跑起来呢?”
浅鉴有给出新的排查方向:“的确,时序看上去是有效的,为什么跑步起来要问问处理器!第三查,‘查输出状态’ 。”
5. 查输出状态
浅鉴竖起食指落在处理器旁边的存储芯片上:“处理器Boot载入软件的过程会在硬件留下痕迹 ,它是 ‘查输出状态’ 的对象。你说说怎么找到痕迹?”
计算机启动分为软启动和硬启动,软启动是保持处理器供电的情况下清除内存的数据,重新初始化硬件,重启计算机叫reboot。 硬启动是重新给处理器供电,刚上电时候计算机内存里并没有软件,处理器必须从硬件载入引导软件,这个过程叫做Boot,Boot全称是Bootstrap load(引导装载程序)。
白蔡思索着:“痕迹?处理器和存储芯片有几根通信信号线,示波器测量信号线变化可推断处理器是否已经执行Boot过程。”
白蔡有些为难:“不过,处理器和存储芯片都是BGA封装,焊盘在芯片底下,示波器探针够不到。”
BGA封装和钢网
BGA封装(球栅阵列封装)特点是所有引脚阵列排布在处理器底部,焊接前需在芯片底部焊盘“植球”,与芯片同规格的钢网压在芯片上,铜箔从网孔对应位置裸露,刷上焊锡膏,焊锡膏受热后凝结成球固化在芯片底部。
“怎么测试呢?刮掉电路板绿油露出走线铜箔?”白蔡说着正准备从收纳盒里找刀片,“虽说线宽不到0.2mm有刮断的风险,也不是没有操作性。”
浅鉴伸手盖上收纳盒子,“哎~通用电脑的硬启动是从BIOS存储芯片载入引导软件,嵌入式产品的存储介质就丰富许多,EEPROM、NOR Flash、Nand Flash、SATA、SD卡、USB都可能作为存储介质。”
白蔡:“那处理器究竟怎么知道要从哪个存储介质载入呢?”
浅鉴翻阅文件夹寻找处理器手册:“ 通常处理器都有几名称为BOOTx的管脚,电路上拉高、拉低BOOTx管脚告知处理器从哪个存储介质载入,咱们先看看这款处理器支持什么方式BOOT 。”
浅鉴打开处理器PDF参考手册,搜索输入“Boot”查询,反复按“下一个”,眼睛还没来得及看清内容,直到停留在表格名为“Boot Modes”的页面: “SD卡启动方式也属于本处理器Boot模式之一,电路板也有SD卡外设, 接下来的排场方案:你重新焊接电阻配置BOOTx管脚,Boot选择SD卡模式,示波器测试复位信号后SD卡上是否有时钟信号,若有就好办了。”
怀揣希望地重新配置BOOTx、上电、SD卡数据线电平状态——死寂,再尝试测量时钟线,同样没有反应。
浅鉴关掉电源两手摊开:“没办法,重读芯片手册吧。‘返原理’——重新审查原理设计错误 。”
6. 返原理
白蔡还抱着侥幸小声问:“什么!原理就错了?”
浅鉴翘起一边眉毛开导他:“要不你以为呢!首批研发样品第1块电路板故障,可以安慰自己手气背,抽中焊接有瑕疵的板卡,放下、暂不考虑维修; 又拿起一块电路板还是不能运行,要不再阿Q精神一下!同样的故障发生在第3块。”
浅鉴竖起4根手指:“我敢说再拿起第4块板卡可运行的概率不超过25%,生产电子垃圾质量达‘三西格玛’指日可待。”
白蔡:“什么西格玛?”
“嗨~题外话,以后再教你。“浅鉴挥手,“‘三查’只能算是维修步骤,针对单一样品修复质量缺陷。 ‘返原理’是面向产品研发、试产阶段,针对大规模暴露某一类故障现象的追根溯源定位。”
“刚刚我们测试的电压、电流、时钟参数和原理图设计都一致,会不会是原理图参数就标记错了呢? 设计师在盖房子的施工图写着 “钢筋加口香糖浇灌” ,施工方严格灌入口香糖,最后房子倒了, 责任人是设计师还是施工方?”
白蔡:“明白了,我画的原理图哪些位置可能犯‘水泥换口香糖’的错误呢?”
浅鉴:“历史教训告诉我们,重点检查手册上的所有参数表格底部有 ‘Note’ 的文字,重点关注电气特性表格里 最大值、最小值、典型值、适用范围、阻容精度要求 ,对比设计图是否有出入。”
时钟电气特性的“备注”栏有个 “note 1”,拉到本页面末尾特别注明:
本芯片有两个时钟输入管脚CLK25、CLK125,可自适应25MHz、125MHz两种时钟,使用125MHz时钟源峰值在500800mV之间,使用25MHz时钟源峰值在3.13.4V之间,典型值3.3V。
两人对望片刻,拿起板卡仔细看上面标注的时钟频率规格,校对原理图选择的时钟源也是25MHz,再重复之前测量时钟的步骤,确认频率25MHz、峰值655mV。
浅鉴微微翘起的嘴角挂满喜悦:“好家伙、我预感找到了!呵——忙活一下午,就这?”
白蔡麻利的焊接根条线、峰值升高到3.3V。嘿~SD卡时钟信号线抓取到处理器执行Boot过程的痕迹,白蔡撑大双的眼变得明亮,笑盈盈地:“来来来,另外几块也改了。”
7. 闭环
浅鉴收拾桌面:“别弄了,还有10分钟下班。”
白蔡:“师傅,你要是当老板我都不好意思带薪摸鱼。”
浅鉴关掉白蔡手中烙铁电源:“我更看中手下工作质量,眼下无非弄错1张原理图、5块电路板、两人3小时日薪。你有更重要的事情——‘闭环’。原理图上的错误必须下班前改掉,项目档案记录故障现象、处理方法,杜绝再犯 。”
浅鉴坏笑:“明早上内卷一下,提前半小时来公司把剩下几块电路板修复。” 晚上8点,浅鉴手机收到一封公司内网论坛博文推送,文章标题《“三查一返”在故障排查的应用》,作者:白蔡。
往期文章:
本地DVD做deb源,apt-get快得飞起
免费下载“知网”等数据库论文,视频文字版
一文读懂,网卡由哪些部分组成
initramfs编译到内核似乎没运行,都怪自己没看官方教程
揪出元凶:linux定时任务crontab居然没执行
相关问答
为什么 flash 修复工具修复不了?那是Flash,维修工具只能维修系统故障,硬件故障无法求那是Flash,维修工具只能维修系统故障,硬件故障无法求
怎么处理啊,miflash刷机出现错误-ZOL问答可以尝试以下方法解决该问题:1、如果没有更新分区则通常会出现此错误,因此只要使用miflash软件重新更新小米3手机的分区点即可。2、更新分区是,不要手动清除数...
PS常见问题和解决的 方法 你知道吗?1.问:有些插件显示在屏幕以外,怎么办?答:在Photoshop中一次装载了过多的插件之后,PS中的滤镜那个菜单可能会超过窗口的高度,对此,有一个方法,虽然麻烦...答:用...
TTL开不开机了怎么办?...然后,检查TTL的电源开关是否打开。如果问题仍然存在,尝试使用不同的电源适配器或电源线进行测试。如果TTL仍然无法开机,可能是硬件故障导致的,建议联系售...
电脑开不了机,显示gigabyte insist on ultra durable是为什...软件需要更新,(360管家,软件升级,下载,覆盖安装,winrar可以不升)6。系统有新的漏洞等待安装,(修补高危和重要的,其它设置为:忽略)7。显卡或内存cpu,或风扇的接...
等离子电视机 维修方法 谁了解?_土巴兔装修问答等离子电视机维修方法:先查下电源部分有没有问题,主要是检查一下开关电源部分,先看一下保险丝有没有烧坏,如果保险丝烧坏了就很有可能开关管也烧坏...
U盘主控不认 Flash 老是提示请插入磁盘怎么办[最佳回答]前两天我公司一个同事的u盘也是这个问题,经过一个下午的奋战,对这方面也有些了解,这些是我收集回来的一些资料,你慢慢分析,希望你也能成功。U盘量产...
夏普液晶电视电源板 维修方法 有哪些?- 一起装修网[回答]夏普液晶电视机开关电源电路大都采用并联式开关电源,分为外置式开关电源与内置式开关电源两大类。外置式开关电源。这种形式的开关电源通常称为电源...
安装win10之后 flash 就不可用了-ZOL问答在win8中IE自带flash,它的更新需要在Windowsupdate中更新,下载flashplayerforIE是无法安装的。另外你查一下edge的设置中有没有开启flash1、使...
u盘烧坏了怎么自己修?当U盘出现问题或疑似损坏时,您可以尝试以下方法进行修复:1.**使用Windows命令提示符**:插入疑似损坏的U盘到电脑,同时按下“win+R”快捷键。在弹出的运行窗...