欧美91在线,三级片视频网站,麻豆传媒网站

C++代碼質量掃描主流工具深度比較

轉帖|對比評測|編輯：龔雪|2016-06-02 14:39:12.000|閱讀 1853 次

概述：統計證明，在整個軟件開發生命周期中，30%至70%的代碼邏輯設計和編碼缺陷是可以通過靜態代碼分析來發現和修復的。本文中，將對C++代碼質量掃描主流工具進行深度對比。

相關鏈接：

一、引言

靜態代碼分析是指無需運行被測代碼，通過詞法分析、語法分析、控制流、數據流分析等技術對程序代碼進行掃描，找出代碼隱藏的錯誤和缺陷，如參數不匹配，有歧義的嵌套語句，錯誤的遞歸，非法計算，可能出現的空指針引用等等。統計證明，在整個軟件開發生命周期中，30%至70%的代碼邏輯設計和編碼缺陷是可以通過靜態代碼分析來發現和修復的。

在C++項目開發過程中，因為其為編譯執行語言，語言規則要求較高，開發團隊往往要花費大量的時間和精力發現并修改代碼缺陷。所以C++靜態代碼分析工具能夠幫助開發人員快速、有效的定位代碼缺陷并及時糾正這些問題，從而極大地提高軟件可靠性并節省開發成本。

C/C++代碼審查工具Parasoft C/C++test

資源下載

靜態代碼分析工具的優勢：

自動執行靜態代碼分析，快速定位代碼隱藏錯誤和缺陷。
幫助代碼設計人員更專注于分析和解決代碼設計缺陷。
減少在代碼人工檢查上花費的時間，提高軟件可靠性并節省開發成本。

二、業界主流靜態代碼掃描工具概況

目前市場上的C++靜態代碼分析工具種類繁多且各有千秋，本文將分別介紹TSC團隊自主研發的tscancode工具和當前4種主流C++靜態代碼分析工具(cppcheck、coverity、clang、pclint)，并從功能、效率、易用性等方面對它們進行分析和比較，以期幫助C++開發人員更清晰靜態代碼分析工具的工作效果、適用場景和擴展空間，同時在其對應項目特征中選擇合適的工具應用到項目開發環節中。

以下為工具在付費價格、規則數量、準確率、掃描效率、編譯依賴、IDE支持、跨平臺支持、可擴展開發方面的對比數據。注：本次競品分析的選擇了3款游戲項目（約500萬行代碼）。

在可擴展性上，TSC有專人維護，定期根據用戶需求擴展規則或新增功能特性，cppcheck和clang是開源工具，工具更新較慢，但如果用戶有特殊需求可以自己擴展開發，pclint和coverity是商業軟件，難以進行功能擴展。

同時，TSC有完整代碼質量管理閉環平臺QOC支持；coverity和clang可用web端的結果展示，但無法自行管理問題流，需要進行二次開發；cppcheck和pclint缺少web端結果展示。

以下重點比較具體檢查規則和有效問題報錯率。

三、檢查規則大比拼

1.規則大類

針對業內大量掃描工具在實際項目中掃描結果的影響比較，我們將代碼質量問題分為以下幾大類：

致命類：可能導致程序宕機、無響應等影響范圍極大的錯誤；
邏輯類：可能造成程序不能達到預期邏輯結果的錯誤；
編碼規范及其他類：可能造成程序的可讀性、可維護性較差的錯誤（不可達代碼，無效的變量聲明等）；

2.規則大類分布

根據3大影響分類，其嚴重程度分別為高、中、低，各類型規則數量分布為：

從規則分類占比來看：

TSC針對互聯網產品高效開發修復原則，工具定位為針對致命和邏輯類問題，相對傳統、軍事、安全領域，并不關注編碼規范及編譯錯誤；
coverity作為商業化軟件，在付費后添加規則上，達到覆蓋率最全面，除致命和邏輯類規則外，還有大量編碼規范、安全和針對其他語言（如java，C#）的規則；
cppcheck作為開源工具，應用范圍廣泛，根據開源社區場景搜集，在各方面都有規則添加，但場景較為粗獷，場景雖多，但有效率不高。例如：cppcheck在初始化檢查上有5個子規則，樣本代碼共掃描出312個問題，其中有效問題僅8個，有效率僅為3%。
pclint作為商業化軟件，在付費后添加規則上，達到覆蓋率最全面，除致命和邏輯類規則外，還有大量編碼規范、安全的規則；
clang作為開源軟件，規則較少，但規則類型分布較為均勻，在致命、邏輯類，還有編碼規范、安全類都有規則添加。

3.規則報錯數量

整體規則數量上：pclint[915]>coverity[515]>cppcheck[245]>clang[74]>TSC[67]

可以看出pclint和coverity規則最多，TSC和clang規則最少，原因有如下3點：

pclint和coverity作為商業化軟件，需求來源于傳統軟件、軍事、安全各個領域，其規則總數最多，其編碼規范類規則數量分別高達646條和382條；排除掉低價值的編碼規范類規則，規則數量排序為：
pclint[269]>cppcheck[151]>coverity[133]>TSC[67]>clang[44]
在規則實際報錯數量上，以3款游戲500萬行代碼的結果覆蓋度來看；

注：規則總數指工具所有的規則總數，報錯規則數指開啟工具所有規則情況下，掃描樣本代碼所覆蓋的規則數量。

從實際項目掃描結果來看：

掃描出問題的規則數/規則總數：

TSC[60%]>cppcheck[27%]>clang[19%]>coverity[10%]>pclint[9%]

pclint、coverity、cppcheck雖然規則數量很多，但因為其定制加入的大部分規則普遍適用度不高，大量規則可能在多個項目中都無法掃描出問題。有些規則卻在多個項目中掃描出大量非核心的問題，如：函數沒有被調用、未使用的變量、存在多余的頭文件等。
規則數量多來源于兩個方面，一方面是規則覆蓋更全面，另一方面是規則粒度劃分得更細；

通過對具體規則進行分析，發現在規則劃分粒度由細到出排序為[pclint，coverity，cppcheck，clang，TSC]

pclint和coverity劃分粒度最細，cppcheck，clang次之，TSC最粗。

例如：coverity的除0報錯分為整型除0，浮點數除0，取模除0；數組下標越界也細分為訪問越界、讀越界、寫越界。Pclint和cppcheck初始化分為變量未初始化、結構體成員未初始化、類成員未初始化、string未初始化、data未初始化、union未初始化、全局靜態變量未初始化等；而TSC則合并了一些過細的規則，未初始化上只分為變量未初始化和成員未初始化。

粒度劃分越細既有優點也有缺點：

優點：可以針對細分規則靈活配置開關，關掉準確率低的規則

缺點：規則數量太多，用戶配置相當麻煩，新用戶很難理解多個相似的規則之前的區別。

TSC為降低用戶配置難度，在規則粒度劃分上相對粗獷，但會從中提取出其中準確率低的場景，作為單獨規則，從而達到可以關掉低準確率規則的目的。

四、同類規則效果對比分析

本文針對每個工具在關鍵報錯項，如：空指針、越界、變量未初始化、內存泄露、邏輯上的報錯結果進行分析。

樣本代碼——3款游戲項目（約500萬行代碼）代碼

測試對象——tscancode2.0、coverity7.5、cppcheck1.68、pclint9.0、clang3.4

有效報錯數——某類規則在3款游戲項目的有效報錯數總和

準確率——某類規則在3款游戲項目的平均準確率，準確率=有效報錯數/報錯總數*100%

綜合評分——綜合有效報錯數和準確率的評分，有效報錯數和準確率的權值暫定為45：55，綜合評分=有效報錯/最大有效報錯數*100*45%+準確率*100*55%

1.空指針規則

空指針檢查規則主要檢查是否存在對賦值為空的指針解引用的情況，空指針是c/c++中最大的問題，經常造成程序崩潰的致命錯誤。因此，C++靜態代碼分析工具對空指針的檢查能力顯得尤為重要。

圖為五個工具對樣本代碼掃描結果：

有效報錯數：TSC [401] >;coverity[219]>>clang[57] >cppcheck[20]>pclint[14]

準確率：coverity[95%]≈TSC[92%] ≈clang[90%]>>cppcheck[28%]>pclint[14%]

綜合評分：TSC[96分] >coverity[77分] >clang[56分]>cppcheck[18分]>pclint[8分]

從準確率來看，在空指針檢查方面，不考慮掃描效率和掃描環境搭建復雜度，TSC、coverity和clang都很優秀，三者準確率都很高。cppcheck， pclint在結果準確率上和數量上都較差，不推薦使用。
從空指針規則細分程度來看，TSC和coverity相當，細分場景挖掘更多，cppcheck規則并未細分空指針規則，從實際項目結果來看，只能檢查出dereferenceBeforeCheck場景的錯誤。Clang和pclint在空指針細分上維度跟TSC和coverity不同，比如：它們區分是參數指針解引用還是局部變量解引用，細分粒度不夠且覆蓋場景較少，其覆蓋場景基本都被TSC和coverity包含。

cppcheck掃描出來的問題存在大量誤報，誤報主要是冗余的判空，并不會引起實際問題，具體誤報場景如下：
從有效報錯數量上，TSC有效報錯數量更多，細分場景挖掘更多，無疑是掃描空指針最佳選擇；clang覆蓋的場景較少，其有效報錯基本都能被coverity和TSC覆蓋，不過由于其準確率較高且免費，與TSC搭配使用也是不錯的選擇；而coverity雖然覆蓋場景多但因為只會報完全可信的問題，因此會漏掉部分有效報錯，例如：指針變量來源于函數返回值，而函數返回值是否為NULL依賴于用戶輸入，在靜態分析中 coverity無法判斷其是否會為NULL，為保證準確率會漏掉該指針報錯。若項目對空指針漏報容忍度較高，且有足夠預算采購商業軟件，可以選擇coverity；而cppcheck和 pclint檢查出的有效問題極少并伴隨大量誤報，同上結論，不宜使用。
在易用性上，coverity和clang編譯環境構建復雜，編譯時長增加較多；TSC在易用性上也有一個缺點，即為提高準確率，在個別項目存在一次性配置工作。原因是個別項目存在自定義判空宏，但由于不依賴編譯，TSC掃描的代碼可能并不完整，導致個別自定義判空宏找不到，需要在cfg.ini中配置自定義判空宏。當然，如果掃描的代碼完整度同編譯環境，則無此問題。

2.越界規則

越界一般來講是指數組下標越界，或者緩沖區讀寫越界。這類錯誤會導致非法內存的訪問，引發程序崩潰或者錯誤。

下圖是五個工具對樣本代碼掃描結果：

注：越界對誤報判定的規則比較嚴格，即使場景識別本身無誤，但是通過代碼邏輯可以推斷該場景不會越界的也判定為誤報。

例如：

這里由found變量間接推斷出data[region_index]不會越界，將其判定為誤報。

從報錯數量和準確率來看：

有效報錯數：coverity[98]>>TSC [18]>pclint[16] >cppcheck[6]> clang[4]

準確率：clang[100%] >coverity[80%]>TSC[70%] >cppcheck[67%]>>pclint[2%]

綜合評分：coverity[90分] >TSC[54分]≈clang[55分]>cppcheck[40分]>pclint[1分]

在報錯數量上，coverity在越界檢查上有較大的優勢，因為coverity有較強的符號查找和場景識別能力，能識別相對復雜的越界場景。其他四個工具同coverity相比還有差距，其中pclint存在大量誤報，表現最差。如：TSC和cppcheck只能識別數組變量本身越界，但如果是一個指針p指向數組的第一個元素，通過p[i]訪問時的越界，TSC 和cppcheck都無法檢查，而coverity能找到p所指向的數組定義，得到數組大小，從而判斷p[i]是否越界。
clang越界這塊的準確率雖然最高為100%，但其覆蓋的場景單一（strncpy使用越界報了4條），其報錯都被TSC和coverity覆蓋，數量上和其他工具有較大差距。TSC越界檢查結果要略好于cppcheck，clang和pclint，TSC增加了對變量取值范圍的推斷，檢測出是否存在越界的風險。比如：

（TSC越界有效報錯場景）

對于數組下標iCountry的判定存在風險，代碼執行到當前上下文時，iCountry可能取值為MAX_QT_COUNTRY_JIFEN_ITEM_CNT，而這正是數組m_astDataInDB的長度，也就是說在這種邊界情況下會造成了數組訪問越界。對于如上場景，應該將代碼修改為iCountry>= MAX_QT_COUNTRY_JIFEN_ITEM_CNT。

3.變量未初始化規則

變量未初始化顧名思義：變量聲明后沒有賦初值，其分配的內存值是隨機的。這也是代碼中容易出現的問題，會導致不確定的程序行為，造成嚴重的后果。

下圖是五個工具對樣本代碼掃描結果：

注：結果排除了3個工具都有的檢查項——構造函數中是否存在未初始化成員變量。在實際項目中發現，C++類構造函數中對成員變量不做初始化的情況是普遍的，很多代碼會采用“延遲初始化”，即在實際用到該對象的時候調用類似Initialize的方法進行初始化。因此在此次對比中并沒有把這條規則納入進來。

從報錯數量和準確率來看：

有效報錯數：coverity[75]>>pclint[25] >TSC [9]>cppcheck[8]> clang[1]

準確率：TSC[75%] >coverity[68%]>pclint[26%] > clang[17%] >cppcheck[3%]

綜合評分：coverity[82分] > TSC[47分] >pclint[30分] > clang[10分] >cppcheck[6分]

在報錯數量上，coverity初始化檢查場景覆蓋比其他四個工具要全，TSC為保持準確率，規則覆蓋上比較保守，而cppcheck存在比較嚴重的誤報問題，準確率僅為 3%。pclint的誤報也相對很高，clang在初始化這塊顯得無能為力。從上圖可以很容易發現cppcheck的誤報數量相當得高，cppcheck會將如下的場景判定為未初始化：
（cppcheck誤報場景）
SMD_POS是一個簡單的結構體，它包含了一個空的構造函數，cppcheck依據這點判定這是一個未初始化的錯誤。但這樣的場景不會有什么問題，算是一個誤報。這導致了cppcheck在未初始化規則的結果可信度大大降低。
coverity在未初始化這塊的場景覆蓋比較全，特別是對結構體對象的字段的初始化情況的檢測，因為其基于編譯可對變量做路徑跟蹤，例如：構造函數里面調用了init() 函數，coverity會繼續跟蹤init()函數中是否有對變量的賦值，所以掃描覆蓋場景最全。 coverity的誤報主要分為兩類：一類是對幾種未初始化場景的識別上存在問題，如：，變量在某個分支的確沒有初始化，但用了一個狀態標識其未初始化，當使用這個變量前會使用狀態標記來判斷其是否沒有初始化，保證使用的變量都是初始化過了的。另一類就是上面提到的“低價值報錯”，即通過代碼邏輯或者做了代碼保護，保證變量不會因為沒有初始化而產生實際的問題。如：一個表示時間的結構體，里面字段有year， month，day，hour，min，day這個字段沒有初始化，但實際代碼中也沒有用到這個字段，因此并不會產生任何問題。
TSC在未初始化變量的檢查因不具備路徑分析能力，而以分支作用域檢查特定變量在各個代碼分支的初始化情況，誤報率保持在相對低的一個水平。但場景覆蓋較少，沒有針對結構體字段的初始化場景做覆蓋。因為對結構字段的初始化方式相對比較多樣：逐個字段初始化，函數調用初始化，構造函數初始化等。

4.內存/資源泄露規則

內存泄漏指由于疏忽或錯誤造成程序未能釋放已經不再使用的內存，從而造成了內存浪費的情況。內存泄漏是靜態下很難檢測的一種錯誤，一般需要動態分析工具進行檢測，如valgrind工具會捕獲malloc()/free()/new/delete的調用，監控內存分配和釋放，從動態上檢測程序是否存在內存泄漏。因此，靜態代碼分析能檢查的內存泄漏就非常有限了，當前各工具主要是從代碼寫法上檢查內存分配和釋放是否配對使用。比如：fopen 打開文件后在退出函數前是否有執行fclose，new[]和delete[]是否配對使用等。

下圖是五個工具對樣本代碼掃描結果：

注：以上數據排除了cppcheck35個低價值報錯，這里排除的cppcheck35個報錯都是基本數據類型的new和delete不匹配（如char* p=new char[100];delete p;）雖然這種寫法不規范，但由于實際上不會造成內存泄漏，很多項目不會對此進行修復。

從報錯數量和準確率來看：

有效報錯數：pclint[55] >TSC[40]>coverity [29]>cppcheck[28]> clang[0]

準確率：coverity[100%]=cppcheck[100%] >TSC[73%]>pclint[23%] > clang[N/A]

綜合評分：coverity[79分] ≈ TSC [73分]≈cppcheck[77分]>pclint[57分]>clang[0分]

從報錯數量上看出，在內存泄漏檢查方面，pclint雖然發現有效問題最多，但誤報很高，不推薦使用。TSC的有效錯誤數比coverity和cppcheck多，但誤報也相對較高。clang則不具備泄露類場景的檢測能力。

注：由于靜態掃描能檢查的內存泄露場景都非常明確，因此一般都不會出現問題，TSC的15個誤報也非場景識別有誤而是工具底層bug導致，后續會對底層bug進行修復。如：#ifdef 和#else分支中各有一個fopen，實際編譯時只會走其中1個分支識別1次fopen，但由于底層bug識別了2次fopen，導致誤報。

5.邏輯錯誤規則

邏輯錯誤:指可能存在的邏輯問題，如if不同分支內容相同，在switch內缺少break等，對指針使用sizeof進行空間分配等問題。

下圖是五個工具對樣本代碼掃描結果：

注：這些報錯中剔除了一些無修改意義且結果數量很多規則:如:coverity掃描存在7484條Logically dead code(邏輯代碼不可達)報錯。cppcheck存在2246條unusedFunction(函數未被使用)報錯。

從報錯數量和準確率來看：

有效數量：TSC[293]>coverity[164]>clang[142] >cppcheck [120]>pclint[116]

準確率：clang[97%] >TSC[93%]>coverity(88%)>pclint[72%] >cppcheck[55%]

綜合評分：coverity[94分] > TSC[86分] > clang[80分] >cppcheck[63分] >pclint[27分]

從報錯數量和準確率上可以看出TSC可以更有效的發現邏輯類問題。但各工具邏輯類場景各有特色，互為互補，可以一同選擇掃描，但cppcheck和pclint準確率較低，可以較少選擇。clang的準確率最高，但clang掃描出來的邏輯錯誤中有一大半為低價值的邏輯錯誤，比如clang掃描出來的142條邏輯錯誤中就有140條“變量賦值但沒有使用”錯誤。

①TSC，coverity具備較強宏展開能力

以DuplicateExpression規則為例，TSC發現DuplicateExpression規則報錯32條，cppcheck發現DuplicateExpression規則報錯12條。因為TSC可以對宏進行更有效展開，例如：

這種報錯TSC可以準確的識別出來，宏MAX_TASK_TAB_SIZE和MAX_TASK_RES_NUM為相同的數值，而cppcheck無法區分發現這類問題，只能進行簡單的文本匹配。coverity在推斷能力上也不差，在這點也明顯優于cppcheck。

②TSC規則類型更有效

經過篩選，TSC只保留價值更高的推斷和有效規則；

Ø增加一些函數檢查規則，如：MemsetZeroBytes，這種錯誤的Memset寫法：memset(ctYear， sizeof(ctYear)，0)；可疑的數組下標使用等這些規則在coverity邏輯類檢查中并沒有體現，而coverity只會報出非常準確的報錯如：if分支完全相同等檢查項。

Ø剔除價值低的無效規則，如coverity規則Logically dead code，指一些邏輯上不可達的廢棄代碼；cppcheck規則memsetClassFloatc指對存在Float類型成員變量的Class
使用Memset，當時代碼中發現基本都是Memset為0，并不會有數據丟失等問題。故這類規則發現有效問題很低，在數量較大的情況下，需要耗費大量的人力來確認，性價比不高，TSC已經將這種規則剔除。

總的來說，TSC在發現問題和準確率方面表現都不錯，可以節省大量的人力在鎖定邏輯類型錯誤。

TSC在某些細小規則的推斷能力上比coverity要稍微弱一些，如規則Missing break in switch：coverity發現全部準確的報錯，TSC存在一定的誤報，這些復雜場景需要較強的動態計算如：

五、常見誤報場景

1.空指針常見誤報場景

誤報場景一（cppcheck）

以上538行代碼報quiz_set_ptt存在空指針訪問。

誤報原因：538行只是指針的比較，并沒有解引用，這是一個比較低級的誤報。

誤報場景二（coverity）

以上119行代碼報actor存在空指針訪問，判定邏輯如下：112行對actor進行了判空，說明actor在當前上下文可能為空。所以119行actor可能為空。

誤報原因：xy_assert_retval是個宏，展開后包含有return語句，即如果actor為空115行就返回了，119行actor不會為空。

2.越界常見誤報場景

誤報場景一（TSC）

以上83行代碼報第數組訪問可能越界，判定邏輯如下：第61行的if語句對req_list.num的取值范圍作了限制，req_list.num在當前上下文的最大值可以是
MAX_RECRUIT_REQ_LIST_SIZE(4)；83行req_list._數組對象用req_list.num作為其數組訪問的下標，當req_list.num取值為MAX_RECRUIT_REQ_LIST_SIZE時發生越界（req_list._數組的長度為MAX_RECRUIT_REQ_LIST_SIZE(4)）。

誤報原因：第79行的if條件保證了之后的代碼req_list.num的值不會等于MAX_RECRUIT_REQ_LIST_SIZE，所以這是一個誤報。

誤報場景二（cppcheck）