轉帖|行業資訊|編輯:陳俊吉|2016-04-08 10:24:06.000|閱讀 324 次
概述:當今世界最受人們重視的十大經典算法
# 界面/圖表報表/文檔/IDE等千款熱門軟控件火熱銷售中 >>
當今世界,已經被發現或創造的經典算法數不勝數。如果,一定要你投票選出你最看重的十大算法,你會作何選擇?2011年,有人在Stack Exchange上發起了提問,向網友們征集當今世界最為經典的十大算法。眾人在一大堆入圍算法中進行投票,最終得出了呼聲最高的以下十個算法。鑒于其中多數算法前面已在不同的地方分別介紹過,這里從略。不過希望網友明白一點,以下票選出來的十大算法,受票選領域所限,不等同于、也絕非就是當今世界最為經典的十大算法,如許多常用的數值型經典算法并不在列等。
這里總結出的《程序員應知道的10大基礎算法》,包含排序、查找、搜索和分類等幾類算法,當然是程序員應當知道的一些基礎算法,但是不是“程序員應知道的10大基礎算法”,可能是仁者見仁、智者見智,不同看法一定很多。因其數量極其有限,既不可能全面,更不可能完善,只能是僅供參考而已。
快速排序是由東尼·霍爾所發展的一種排序算法。在平均狀況下,排序 n 個項目要Ο(nlogn)次比較。在最壞狀況下則需要Ο(n 2 )次比較,但這種狀況并不常見。事實上,快速排序通常明顯比其他Ο(n log n) 算法更快,因為它的內部循環可以在大部分的架構上很有效率地被實現出來。快速排序使用分治法策略來把一個串行分為兩個子串行,再分別進行排序。
算法步驟:
1 從數列中挑出一個元素,稱為 “基準”。
2 重新排序數列,所有元素比基準值小的擺放在基準前面,所有元素比基準值大的擺在基準的后面。在這個分區退出之后,該基準就處于數列的中間位置,稱為分區操作。
3 遞歸地把小于基準值元素的子數列和大于基準值元素的子數列排序。
遞歸的最底部情形,是數列的大小是零或一,也就是都已經被排序好了。雖然一直遞歸下去,但是這個算法總會退出,因為在每次的迭代中,它至少會把一個元素擺到它最后的位置上去。
堆排序(Heap sort)是指利用堆這種數據結構所設計的一種排序算法。堆積是一個近似完全二叉樹的結構,并同時滿足堆積的性質:即子結點的鍵值或索引總是小于(或者大于)它的父節點。
堆排序的平均時間復雜度為Ο(nlogn) 。
歸并排序(Merge sort)是建立在歸并操作上的一種有效的排序算法。該算法是分治法的一個非常典型的應用。
算法步驟:
1. 申請空間,使其大小為兩個已經排序序列之和,該空間用來存放合并后的序列;
2. 設定兩個指針,最初位置分別為兩個已經排序序列的起始位置;
3. 比較兩個指針所指向的元素,選擇相對小的元素放入到合并空間,并移動指針到下一位置;
4. 重復步驟3直到某一指針達到序列尾;
5. 將另一序列剩下的所有元素直接復制到合并序列尾。
二分查找算法是一種在有序數組中查找某一特定元素的搜索算法。搜索過程從數組的中間元素開始,如果中間元素正好是要查找的元素,則搜索過程結束;如果某一特定元素大于或者小于中間元素,則在數組大于或小于中間元素的那一半中查找,而且跟開始一樣從中間元素開始比較。如果在某一步驟數組為空,則代表找不到。這種搜索算法每一次比較都使搜索范圍縮小一半。折半搜索每次把搜索區域減少一半,時間復雜度為Ο(nlogn) 。
BFPRT算法解決的問題十分經典,即從某n個元素的序列中選出第k大(或第k小)的元素,通過巧妙的分析,BFPRT可以保證在最壞情況下仍為線性時間復雜度。該算法的思想與快速排序思想相似,當然,為使得算法在最壞情況下,依然能達到o(n)的時間復雜度,算法作者對此做了精妙的處理。
深度優先搜索算法(Depth First Search),是搜索算法的一種。它沿著樹的深度遍歷樹的節點,盡可能深的搜索樹的分支。當節點v的所有邊都己被探尋過,搜索將回溯到發現節點v的那條邊的起始節點。這一過程一直進行到已發現從源節點可達的所有節點為止。如果還存在未被發現的節點,則選擇其中一個作為源節點并重復以上過程,整個進程反復進行直到所有節點都被訪問為止。DFS屬于盲目搜索。
深度優先搜索是圖論中的經典算法,利用深度優先搜索算法可以產生目標圖的相應拓撲排序表,利用拓撲排序表可以方便的解決很多相關的圖論問題,如最大路徑問題等等。一般用堆數據結構來輔助實現DFS算法。
深度優先遍歷圖算法步驟:
1. 訪問頂點v;
2. 依次從v的未被訪問的鄰接點出發,對圖進行深度優先遍歷;直至圖中和v有路徑相通的頂點都被訪問;
3. 若此時圖中尚有頂點未被訪問,則從一個未被訪問的頂點出發,重新進行深度優先遍歷,直到圖中所有頂點均被訪問過為止。
廣度優先搜索算法(Breadth First Search),是一種圖形搜索算法。簡單的說,BFS是從根節點開始,沿著樹(圖)的寬度遍歷樹(圖)的節點。如果所有節點均被訪問,則算法中止。BFS同樣屬于盲目搜索。一般用隊列數據結構來輔助實現BFS算法。
算法步驟:
1. 首先將根節點放入隊列中;
2. 從隊列中取出第一個節點,并檢驗它是否為目標。如果找到目標,則結束搜尋并回傳結果,否則將它所有尚未檢驗過的直接子節點加入隊列中;
3. 若隊列為空,表示整張圖都檢查過了——亦即圖中沒有欲搜尋的目標。結束搜尋并回傳“找不到目標”;
4. 重復步驟2。
戴克斯特拉算法(Dijkstra’s algorithm)是由荷蘭計算機科學家艾茲赫爾·戴克斯特拉提出。迪科斯徹算法使用了廣度優先搜索解決非負權有向圖的單源最短路徑問題,算法最終得到一個最短路徑樹。該算法常用于路由算法或者作為其他圖算法的一個子模塊。
動態規劃(Dynamic programming)是一種在數學、計算機科學和經濟學中使用的算法,通過把原問題分解為相對簡單的子問題的方式求解一些復雜的問題。 動態規劃常常適用于有重疊子問題和最優子結構性質的問題,動態規劃方法所耗時間往往遠少于樸素解法。
動態規劃背后的基本思想非常簡單。大致上,若要解一個給定問題,我們需要解其不同部分(即子問題),再合并子問題的解以得出原問題的解。 通常許多子問題非常相似,為此動態規劃法試圖僅僅解決每個子問題一次,從而減少計算量:一旦某個給定子問題的解已經算出,則將其記憶化為存儲,以便下次需要同一個子問題解之時直接查表。 這種做法在重復子問題的數目關于輸入的規模呈指數增長時特別有用。動態規劃最經典的問題當屬背包問題。
算法步驟:
1. 最優子結構性質。如果問題的最優解所包含的子問題的解也是最優的,我們就稱該問題具有最優子結構性質(即滿足最優化原理)。最優子結構性質為動態規劃算法解決問題提供了重要線索。
2. 子問題重疊性質。子問題重疊性質是指在用遞歸算法自頂向下對問題進行求解時,每次產生的子問題并不總是新問題,有些子問題會被重復計算多次。動態規劃算法正是利用了這種子問題的重疊性質,對每一個子問題只計算一次,然后將其計算結果保存在一個表格中,當再次需要計算已經計算過的子問題時,只是在表格中簡單地查看一下結果,從而獲得較高的效率。
分類是將一個未知樣本分到幾個預先已知類別的過程。在眾多的分類模型中,應用最為廣泛的兩種分類模型是決策樹模型(Decision Tree Model)和樸素貝葉斯模型(Naïve Bayesian Model,NBC)。決策樹模型通過構造樹來解決分類問題。首先利用訓練數據集來構造一棵決策樹,一旦樹建立起來,它就可為未知樣本產生一個分類。在分類問題中使用決策樹模型有很多的優點,決策樹便于使用,而且高效;根據決策樹可以很容易地構造出規則,而規則通常易于解釋和理解;決策樹可很好地擴展到大型數據庫中,同時它的大小獨立于數據庫的大小;決策樹模型的另外一大優點就是可以對有許多屬性的數據集構造決策樹。決策樹模型也有一些缺點,比如處理缺失數據時的困難,過度擬合問題的出現,以及忽略數據集中屬性之間的相關性等。
樸素貝葉斯分類算法是一種基于貝葉斯定理的簡單概率分類算法。貝葉斯分類的基礎是概率推理,就是在各種條件的存在不確定、僅知其出現概率的情況下,如何完成推理和決策任務。概率推理是與確定性推理相對應的。而樸素貝葉斯分類器是基于獨立假設的,即假設樣本每個特征與其他特征都不相關。
樸素貝葉斯分類器依靠精確的自然概率模型,在有監督學習的樣本集中能獲取得非常好的分類效果。在許多實際應用中,樸素貝葉斯模型參數估計使用最大似然估計方法,換言之樸素貝葉斯模型能工作并沒有用到貝葉斯概率或者任何貝葉斯模型。盡管是帶著這些樸素思想和過于簡單化的假設,但樸素貝葉斯分類器在很多復雜的現實情形中仍能夠取得相當好的效果。
攜手IBM|慧都科技最新版大數據解決方案上線,幫助企業充分釋放數據價值!
本站文章除注明轉載外,均為本站原創或翻譯。歡迎任何形式的轉載,但請務必注明出處、不得修改原文相關鏈接,如果存在內容上的異議請郵件反饋至chenjj@fc6vip.cn