嵌入式究竟難在什么地方?學(xué)會(huì)調(diào)試手段是關(guān)鍵
為什么很多人說嵌入式開發(fā)很難?
其實(shí),嵌入式開發(fā)的難度相對(duì)來說不算大,只是嵌入式開發(fā)會(huì)遇到各種各樣奇奇怪怪的問題,問題多了,很多人就覺得難。
如果把這些問題一個(gè)一個(gè)拆解開來看,其實(shí)都是小問題。今天就來說說嵌入式開發(fā)常見問題解決方法。一、問題復(fù)現(xiàn)
穩(wěn)定復(fù)現(xiàn)問題才能正確的對(duì)問題進(jìn)行定位、解決以及驗(yàn)證。一般來說,越容易復(fù)現(xiàn)的問題越容易解決。
縮小排查范圍,確認(rèn)引入問題的任務(wù)、函數(shù)、語句。
我們可以在陷入異常中斷時(shí)將棧上的內(nèi)核寄存器值寫入RAM的一段復(fù)位后保留默認(rèn)值的區(qū)域內(nèi),執(zhí)行復(fù)位操作后再從RAM將該信息讀出并分析,通過PC、LR確認(rèn)當(dāng)時(shí)執(zhí)行的函數(shù),通過R0-R3分析當(dāng)時(shí)處理的變量是否異常,通過SP分析是否可能出現(xiàn)棧溢出等。結(jié)合問題現(xiàn)象以及定位的問題代碼位置分析造成問題的原因。
此類問題通常需要結(jié)合map文件進(jìn)行分析,通過map文件觀察被篡改變量地址附近的數(shù)組,查看對(duì)該數(shù)組的寫入操作是否存在如上圖所示不安全的代碼,將其修改為安全的代碼。2、棧溢出0x20001ff8g_val| 0x20002000 | 棧底 |
| ………… | 棧空間 |
| 0x20002200 | 棧頂 |
- 在設(shè)計(jì)階段應(yīng)該合理分配內(nèi)存資源,為棧設(shè)置合適的大小;
- 將函數(shù)內(nèi)較大的臨時(shí)變量加”static”關(guān)鍵字轉(zhuǎn)化為靜態(tài)變量,或者使用malloc()動(dòng)態(tài)分配,將其放到堆上;
- 改變函數(shù)調(diào)用方式,降低調(diào)用層數(shù)。
判斷語句的條件容易把相等運(yùn)算符“==”寫成賦值運(yùn)算符“=”導(dǎo)致被判斷的變量值被更改,該類錯(cuò)誤編譯期不會(huì)報(bào)錯(cuò)且總是返回真。建議將要判斷的變量寫到運(yùn)算符的右邊,這樣錯(cuò)寫為賦值運(yùn)算符時(shí)會(huì)在編譯期報(bào)錯(cuò)。還可以使用一些靜態(tài)代碼檢查工具來發(fā)現(xiàn)此類問題。4、同步問題例如操作隊(duì)列時(shí),出隊(duì)操作執(zhí)行的過程中發(fā)生中斷(任務(wù)切換),并且在中斷(切換后的任務(wù))中執(zhí)行入隊(duì)操作則可能破壞隊(duì)列結(jié)構(gòu),對(duì)于這類情況應(yīng)該操作時(shí)關(guān)中斷(使用互斥鎖同步)。5、優(yōu)化問題
如上圖程序,本意是等待irq中斷之后不再執(zhí)行foo()函數(shù),但被編譯器優(yōu)化之后,實(shí)際運(yùn)行過程中flg可能被裝入寄存器并且每次都判斷寄存器內(nèi)的值而不重新從ram里讀取flg的值,導(dǎo)致即使irq中斷發(fā)生foo()也一直運(yùn)行,此處需要在flg的申明前加“volatile”關(guān)鍵字,強(qiáng)制每次都從ram里獲取flg的值。3.1.1.2 硬件問題1、芯片BUG芯片本身存在BUG,在某些特定情況下給單片機(jī)返回一個(gè)錯(cuò)誤的值,需要程序?qū)ψx回的值進(jìn)行判斷,過濾異常值。2、通信時(shí)序錯(cuò)誤
例如電源管理芯片Isl78600,假設(shè)現(xiàn)在兩片級(jí)聯(lián),當(dāng)同時(shí)讀取兩片的電壓采樣數(shù)據(jù)時(shí),高端芯片會(huì)以固定周期通過菊花鏈將數(shù)據(jù)傳送到低端芯片,而低端芯片上只有一個(gè)緩存區(qū).如果單片機(jī)不在規(guī)定時(shí)間內(nèi)將低端芯片上的數(shù)據(jù)讀走那么新的數(shù)據(jù)到來時(shí)將會(huì)覆蓋當(dāng)前數(shù)據(jù),導(dǎo)致數(shù)據(jù)丟失。此類問題需要仔細(xì)分析芯片的數(shù)據(jù)手冊(cè),嚴(yán)格滿足芯片通信的時(shí)序要求。3.1.2 動(dòng)作異常3.1.2.1 軟件問題1、設(shè)計(jì)問題設(shè)計(jì)中存在錯(cuò)誤或者疏漏,需要重新評(píng)審設(shè)計(jì)文檔。2、實(shí)現(xiàn)與設(shè)計(jì)不符代碼的實(shí)現(xiàn)與設(shè)計(jì)文檔不相符需要增加單元測(cè)試覆蓋所有條件分支,進(jìn)行代碼交叉review。3、狀態(tài)變量異常例如記錄狀態(tài)機(jī)當(dāng)前狀態(tài)的變量被篡改,分析該類問題的方法同前文數(shù)值異常部分。3.1.2.2 硬件問題1、硬件失效目標(biāo)IC失效,接收控制指令后不動(dòng)作,需要排查硬件。2、通信異常與目標(biāo)IC通信錯(cuò)誤,無法正確執(zhí)行控制命令,需要使用示波器或邏輯分析儀去觀察通信時(shí)序,分析是否發(fā)出的信號(hào)不對(duì)或者受到外部干擾。3.2 程序崩潰3.2.1 停止運(yùn)行3.2.1.1 軟件問題- 在外設(shè)時(shí)鐘門未使能的情況下操作該外設(shè)的寄存器;
- 跳轉(zhuǎn)函數(shù)地址越界,通常發(fā)生在函數(shù)指針被篡改,排查方法同數(shù)值異常;
- 解引用指針時(shí)出現(xiàn)對(duì)齊問題:
地址0x000000000x000000010x000000020x00000003| 變量名 | Val0 | Val1_low | Val1_high | Val2 |
| 值 | 0x12 | 0x56 | 0x34 | 0x78 |
1、看門狗復(fù)位
1、供電電壓不穩(wěn)
2、電源帶載能力不足
四、回歸測(cè)試問題解決后需要進(jìn)行回歸測(cè)試,一方面確認(rèn)問題是否不再復(fù)現(xiàn),另一方面要確認(rèn)修改不會(huì)引入其他問題。
總結(jié)本次問題產(chǎn)生的原因及解決問題的方法,思考類似問題今后如何防范,對(duì)相同平臺(tái)產(chǎn)品是否值得借鑒,做到舉一反三,從失敗中吸取經(jīng)驗(yàn)。
*博客內(nèi)容為網(wǎng)友個(gè)人發(fā)布,僅代表博主個(gè)人觀點(diǎn),如有侵權(quán)請(qǐng)聯(lián)系工作人員刪除。







