在這篇博文中,我們將比較最近個人項(xiàng)目中使用的三種不同算法的性能:ILP(整數(shù)線性規(guī)劃) 算法、使用 A* 算法的本地算法,以及使用 Branch and Bound 算法的優(yōu)化解決方案。所有算法都使用相同的數(shù)據(jù)集進(jìn)行測試,ILP 和分支定界實(shí)現(xiàn)共享相同的工作負(fù)載,而 A* 實(shí)現(xiàn)由于性能限制而受到限制。
免責(zé)聲明:雖然我不會深入研究該項(xiàng)目的具體代碼細(xì)節(jié),但我會從中分享一些見解。該代碼庫不打算公開披露,這是尊重其機(jī)密性的免責(zé)聲明。
基準(zhǔn)測試結(jié)果
以下是所有三種算法的基準(zhǔn)測試結(jié)果:
goos: linux goarch: amd64 pkg: github.com/sosalejandro/<my-project>/<my-package>/pkg cpu: 13th Gen Intel(R) Core(TM) i7-13700HX BenchmarkGenerateReportILP-24 724 1694029 ns/op 30332 B/op 181 allocs/op BenchmarkGenerateReportILPParallel-24 6512 187871 ns/op 34545 B/op 184 allocs/op BenchmarkGenerateReportLocal-24 2 851314106 ns/op 559466456 B/op 7379756 allocs/op BenchmarkBranchGenerateReportLocal-24 101449 12106 ns/op 29932 B/op 165 allocs/op BenchmarkGenerateReportLocalParallel-24 3 349605952 ns/op 559422440 B/op 7379837 allocs/op BenchmarkBranchGenerateReportLocalParallel-24 120543 10755 ns/op 29933 B/op 165 allocs/op PASS coverage: 81.4% of statements ok github.com/sosalejandro/<my-project>/<my-package>/pkg 11.121s
工作負(fù)載配置
所有算法均使用同一組數(shù)據(jù)進(jìn)行測試,但實(shí)現(xiàn)之間的工作負(fù)載(即處理每個項(xiàng)目的次數(shù))不同。
ILP 和分支定界實(shí)施工作量:
plan := []Plan{ {ID: "1", Times: 100}, {ID: "2", Times: 150}, {ID: "3", Times: 200}, {ID: "8", Times: 50}, {ID: "9", Times: 75}, {ID: "10", Times: 80}, {ID: "11", Times: 90}, {ID: "12", Times: 85}, {ID: "13", Times: 60}, {ID: "14", Times: 110}, }
A* 實(shí)施工作量:
plan := []Plan{ {ID: "1", Times: 1}, {ID: "2", Times: 1}, {ID: "3", Times: 5}, {ID: "8", Times: 5}, {ID: "9", Times: 5}, {ID: "10", Times: 5}, {ID: "11", Times: 9}, {ID: "12", Times: 5}, {ID: "13", Times: 5}, {ID: "14", Times: 5}, }
工作量分析
為了了解這些工作負(fù)載對基準(zhǔn)測試結(jié)果的影響,我們來計(jì)算每個實(shí)現(xiàn)的迭代總數(shù)(即 Times 值的總和)。
總迭代次數(shù):
- ILP 和分支定界實(shí)現(xiàn):
100 + 150 + 200 + 50 + 75 + 80 + 90 + 85 + 60 + 110 = 1000
- A* 實(shí)施:
1 + 1 + 5 + 5 + 5 + 5 + 9 + 5 + 5 + 5 = 46
工作負(fù)載比例:
ILP Iterations / A* Iterations = 1000 / 46 ≈ 21.74
這意味著與 A* 實(shí)現(xiàn)相比,ILP 和分支定界實(shí)現(xiàn)處理的迭代次數(shù)大約多21.74 倍。
性能比較
讓我們根據(jù)工作負(fù)載差異來分解基準(zhǔn)測試結(jié)果。
Benchmark | Runs | ns/op | B/op | allocs/op | Total Time (ns) |
---|---|---|---|---|---|
BenchmarkGenerateReportILP-24 | 724 | 1,694,029 | 30,332 | 181 | ≈ 1,225,836,996 |
BenchmarkGenerateReportILPParallel-24 | 6,512 | 187,871 | 34,545 | 184 | ≈ 1,223,607,552 |
BenchmarkBranchGenerateReportLocal-24 | 101,449 | 12,106 | 29,932 | 165 | ≈ 1,224,505,394 |
BenchmarkGenerateReportLocal-24 | 2 | 851,314,106 | 559,466,456 | 7,379,756 | ≈ 1,702,628,212 |
BenchmarkGenerateReportLocalParallel-24 | 3 | 349,605,952 | 559,422,440 | 7,379,837 | ≈ 1,048,817,856 |
BenchmarkBranchGenerateReportLocalParallel-24 | 120,543 | 10,755 | 29,933 | 165 | ≈ 1,295,219,065 |
觀察結(jié)果
-
每個操作的執(zhí)行時間:
-
BenchmarkGenerateReportILP-24 與 BenchmarkBranchGenerateReportLocal-24:
- 分支和綁定 比 ILP 快 99.29%,將執(zhí)行時間從 1,694,029 ns/op 減少到 12,106 ns/op .
-
BenchmarkGenerateReportILP-24 與 BenchmarkBranchGenerateReportLocal-24:
-
BenchmarkGenerateReportILP-24 與 BenchmarkGenerateReportLocal-24:
- ILP 比 本地 快 99.80%,將執(zhí)行時間從 851,314,106 ns/op 減少到 1,694,029 ns/op.
-
BenchmarkGenerateReportILPParallel-24 與 BenchmarkBranchGenerateReportLocalParallel-24:
- 分支和綁定并行比ILP并行快94.28%,將執(zhí)行時間從187,871 ns/op減少到10,755 ns /op.
-
BenchmarkGenerateReportILPParallel-24 與 BenchmarkGenerateReportLocalParallel-24:
- ILP 并行 比 本地并行 快 99.95%,將執(zhí)行時間從 349,605,952 ns/op 減少到 187,871 ns/op .
-
內(nèi)存分配:
- ILP 實(shí)現(xiàn): 并行運(yùn)行時內(nèi)存使用和分配略有增加。
- 分支和綁定實(shí)現(xiàn):與 A* 實(shí)現(xiàn)相比,內(nèi)存使用量和分配更低。
- A* 實(shí)現(xiàn): 極高的內(nèi)存分配,導(dǎo)致資源利用率低下。
-
吞吐量:
- ILP 并行 和 分支定界并行 由于工作負(fù)載較高,可以處理 大約 21.74 倍的迭代。
- A* 實(shí)現(xiàn) 吞吐量困難不是因?yàn)榈螖?shù)顯著減少,而是因?yàn)閮?nèi)存使用和實(shí)現(xiàn)效率低下。
不同工作負(fù)載對性能的影響
鑒于 ILP 和 Branch 算法每次測試迭代處理 21.74 倍 的吞吐量,這種工作負(fù)載差異會影響每個算法的性能和效率:
ILP 和分支算法:由于這些算法可處理更大的吞吐量,因此它們針對更高的工作負(fù)載進(jìn)行了優(yōu)化。盡管處理更多操作,但它們?nèi)员3指斓膱?zhí)行時間。這表明它們不僅計(jì)算效率高,而且非常適合高吞吐量場景。
本地算法:吞吐量較小,執(zhí)行時間較長,該算法在處理增加的工作負(fù)載時效率較低。如果擴(kuò)展到與 ILP 或 Branch 相同的吞吐量,其執(zhí)行時間將顯著增加,這表明它對于高吞吐量情況并不理想。
在工作負(fù)載增加的情況下,ILP 和 Branch 將優(yōu)于 Local,因?yàn)樗鼈兡軌蛴行Ч芾砀叩耐掏铝俊O喾?,如果工作量減少,Local 算法的性能可能更接近 ILP 和 Branch,但由于算法效率的根本差異,仍然可能落后。
算法概述
為了更清楚地了解每種算法如何解決問題,這里對其機(jī)制和方法進(jìn)行了總體概述。
整數(shù)線性規(guī)劃 (ILP)
目的:
ILP 是一種優(yōu)化技術(shù),用于在數(shù)學(xué)模型中找到最佳結(jié)果(例如最大利潤或最低成本),其要求由線性關(guān)系表示。它對于可以用線性約束和線性目標(biāo)函數(shù)表示的問題特別有效。
一般工作流程:
定義變量:
確定代表要做出的選擇的決策變量。目標(biāo)函數(shù):
制定需要最大化或最小化的線性方程。約束:
建立解必須滿足的線性不等式或等式。解決:
利用 ILP 求解器找到?jīng)Q策變量的最優(yōu)值,在滿足所有約束的同時最大化或最小化目標(biāo)函數(shù)。
偽代碼:
goos: linux goarch: amd64 pkg: github.com/sosalejandro/<my-project>/<my-package>/pkg cpu: 13th Gen Intel(R) Core(TM) i7-13700HX BenchmarkGenerateReportILP-24 724 1694029 ns/op 30332 B/op 181 allocs/op BenchmarkGenerateReportILPParallel-24 6512 187871 ns/op 34545 B/op 184 allocs/op BenchmarkGenerateReportLocal-24 2 851314106 ns/op 559466456 B/op 7379756 allocs/op BenchmarkBranchGenerateReportLocal-24 101449 12106 ns/op 29932 B/op 165 allocs/op BenchmarkGenerateReportLocalParallel-24 3 349605952 ns/op 559422440 B/op 7379837 allocs/op BenchmarkBranchGenerateReportLocalParallel-24 120543 10755 ns/op 29933 B/op 165 allocs/op PASS coverage: 81.4% of statements ok github.com/sosalejandro/<my-project>/<my-package>/pkg 11.121s
A*算法(本地實(shí)現(xiàn))
目的:
A* 是一種尋路和圖遍歷算法,以其性能和準(zhǔn)確性而聞名。它通過結(jié)合統(tǒng)一成本搜索和純啟發(fā)式搜索的特征,有效地找到節(jié)點(diǎn)之間的最短路徑。
一般工作流程:
初始化:
從初始節(jié)點(diǎn)開始并將其添加到優(yōu)先級隊(duì)列中。-
循環(huán):
- 從優(yōu)先級隊(duì)列中刪除成本估計(jì)最低的節(jié)點(diǎn)。
- 如果是目標(biāo)節(jié)點(diǎn),則終止。
- 否則,通過探索其鄰居來擴(kuò)展節(jié)點(diǎn)。
- 對于每個鄰居,計(jì)算新的成本并相應(yīng)地更新優(yōu)先級隊(duì)列。
終止:
當(dāng)?shù)竭_(dá)目標(biāo)節(jié)點(diǎn)或優(yōu)先級隊(duì)列為空(表示不存在路徑)時,算法結(jié)束。
偽代碼:
goos: linux goarch: amd64 pkg: github.com/sosalejandro/<my-project>/<my-package>/pkg cpu: 13th Gen Intel(R) Core(TM) i7-13700HX BenchmarkGenerateReportILP-24 724 1694029 ns/op 30332 B/op 181 allocs/op BenchmarkGenerateReportILPParallel-24 6512 187871 ns/op 34545 B/op 184 allocs/op BenchmarkGenerateReportLocal-24 2 851314106 ns/op 559466456 B/op 7379756 allocs/op BenchmarkBranchGenerateReportLocal-24 101449 12106 ns/op 29932 B/op 165 allocs/op BenchmarkGenerateReportLocalParallel-24 3 349605952 ns/op 559422440 B/op 7379837 allocs/op BenchmarkBranchGenerateReportLocalParallel-24 120543 10755 ns/op 29933 B/op 165 allocs/op PASS coverage: 81.4% of statements ok github.com/sosalejandro/<my-project>/<my-package>/pkg 11.121s
分支定界算法
目的:
分支定界是一種系統(tǒng)地探索解空間的優(yōu)化算法。它將問題劃分為更小的子問題(分支),并使用邊界來消除無法產(chǎn)生比當(dāng)前最佳解決方案更好的解決方案(邊界)的子問題。
一般工作流程:
初始化:
從初始解決方案開始,然后設(shè)置最知名的解決方案。分支:
在每個節(jié)點(diǎn),將問題分成更小的子問題。邊界:
計(jì)算每個分支中最佳可能解決方案的樂觀估計(jì)(上限)。修剪:
丟棄上限比已知解決方案更差的分支。搜索:
使用深度優(yōu)先或最佳優(yōu)先搜索遞歸地探索剩余分支。終止:
當(dāng)所有分支都被修剪或探索后,最知名的解決方案就是最優(yōu)的。
偽代碼:
goos: linux goarch: amd64 pkg: github.com/sosalejandro/<my-project>/<my-package>/pkg cpu: 13th Gen Intel(R) Core(TM) i7-13700HX BenchmarkGenerateReportILP-24 724 1694029 ns/op 30332 B/op 181 allocs/op BenchmarkGenerateReportILPParallel-24 6512 187871 ns/op 34545 B/op 184 allocs/op BenchmarkGenerateReportLocal-24 2 851314106 ns/op 559466456 B/op 7379756 allocs/op BenchmarkBranchGenerateReportLocal-24 101449 12106 ns/op 29932 B/op 165 allocs/op BenchmarkGenerateReportLocalParallel-24 3 349605952 ns/op 559422440 B/op 7379837 allocs/op BenchmarkBranchGenerateReportLocalParallel-24 120543 10755 ns/op 29933 B/op 165 allocs/op PASS coverage: 81.4% of statements ok github.com/sosalejandro/<my-project>/<my-package>/pkg 11.121s
對比分析
Feature | ILP Implementation | Local (A*) Implementation | Branch and Bound Implementation |
---|---|---|---|
Optimization Approach | Formulates the problem as a set of linear equations and inequalities to find the optimal solution. | Searches through possible states using heuristics to find the most promising path to the goal. | Systematically explores and prunes the solution space to find optimal solutions efficiently. |
Scalability | Handles large-scale problems efficiently by leveraging optimized solvers. | Performance can degrade with increasing problem size due to the exhaustive nature of state exploration. | Efficient for combinatorial problems, with pruning reducing the search space significantly. |
Development Time | Faster implementation as it relies on existing ILP solvers and libraries. | Requires more time to implement, especially when dealing with complex state management and heuristics. | Moderate development time, balancing complexity and optimization benefits. |
Flexibility | Highly adaptable to various linear optimization problems with clear constraints and objectives. | Best suited for problems where pathfinding to a goal is essential, with heuristic guidance. | Effective for a wide range of optimization problems, especially combinatorial ones. |
Performance | Demonstrates superior performance in handling a higher number of iterations with optimized memory usage. | While effective for certain scenarios, struggles with high memory allocations and longer execution times under heavy workloads. | Shows significant performance improvements over ILP and A* with optimized memory usage and faster execution times. |
Developer Experience | Improves developer experience by reducing the need for extensive coding and optimization efforts. | May require significant debugging and optimization to achieve comparable performance levels. | Balances performance with manageable development effort, leveraging existing strategies for optimization. |
Integration | Currently integrates a C ILP module with Golang, facilitating efficient computation despite cross-language usage. | Fully implemented within Golang, but may face limitations in performance and scalability without optimizations. | Implemented in Golang, avoiding cross-language integration complexities and enhancing performance. |
對服務(wù)器性能的影響
-
可擴(kuò)展性:
- 分支和綁定實(shí)現(xiàn)展示了出色的可擴(kuò)展性,可以有效處理大量并發(fā)請求并減少延遲。
- ILP Parallel 實(shí)現(xiàn)還表現(xiàn)出出色的可擴(kuò)展性,能夠有效處理大量并發(fā)請求并減少延遲。
- 由于性能限制,A* 實(shí)現(xiàn)不適合高負(fù)載環(huán)境。
-
資源利用率:
- 分支和限界實(shí)現(xiàn)高效利用資源,內(nèi)存消耗低,執(zhí)行時間快。
- ILP Parallel 有效利用多核 CPU,提供高吞吐量和可管理的內(nèi)存消耗。
- A* 實(shí)現(xiàn) 消耗過多內(nèi)存,可能導(dǎo)致資源耗盡。
工作負(fù)載對性能的影響
工作負(fù)載差異影響算法的性能:
分支限界實(shí)現(xiàn)可以有效地處理與 ILP 實(shí)現(xiàn)相同的工作負(fù)載,提供快速的執(zhí)行時間和較低的內(nèi)存使用量,使其適合擴(kuò)展。
ILP 實(shí)施 由于優(yōu)化的求解器,可以有效地處理更大的工作負(fù)載。
A* 實(shí)現(xiàn) 由于高執(zhí)行時間和內(nèi)存使用而導(dǎo)致性能不佳。
結(jié)論
使用優(yōu)化解決方案與分支定界算法進(jìn)行了額外的比較,這表明它在性能和資源利用率方面比 ILP 和 A* 算法有顯著改進(jìn)。分支定界算法使用的工作負(fù)載與 ILP 算法相同。
基于分支和界限的BenchmarkBranchGenerateReportLocalParallel功能展示了卓越的性能改進(jìn),使其非常適合需要高并發(fā)和高效資源管理的服務(wù)器環(huán)境。
通過專注于利用分支定界方法的優(yōu)勢并針對特定問題對其進(jìn)行優(yōu)化,我們可以確保項(xiàng)目保持高性能和可擴(kuò)展性,能夠輕松處理不斷增長的需求。
最后的想法
平衡性能、可擴(kuò)展性和開發(fā)人員體驗(yàn)對于構(gòu)建強(qiáng)大的應(yīng)用程序至關(guān)重要。 分支定界 方法已被證明是當(dāng)前設(shè)置中最有效的方法,通過合理的開發(fā)工作可帶來顯著的性能提升。
通過不斷分析、優(yōu)化和利用每種算法方法的優(yōu)勢,我們可以維護(hù)一個高性能、可擴(kuò)展且對開發(fā)人員友好的系統(tǒng)。
以上是比較基準(zhǔn)測試:高吞吐量場景中的 ILP、A* 和分支定界算法的詳細(xì)內(nèi)容。更多信息請關(guān)注PHP中文網(wǎng)其他相關(guān)文章!

熱AI工具

Undress AI Tool
免費(fèi)脫衣服圖片

Undresser.AI Undress
人工智能驅(qū)動的應(yīng)用程序,用于創(chuàng)建逼真的裸體照片

AI Clothes Remover
用于從照片中去除衣服的在線人工智能工具。

Clothoff.io
AI脫衣機(jī)

Video Face Swap
使用我們完全免費(fèi)的人工智能換臉工具輕松在任何視頻中換臉!

熱門文章

熱工具

記事本++7.3.1
好用且免費(fèi)的代碼編輯器

SublimeText3漢化版
中文版,非常好用

禪工作室 13.0.1
功能強(qiáng)大的PHP集成開發(fā)環(huán)境

Dreamweaver CS6
視覺化網(wǎng)頁開發(fā)工具

SublimeText3 Mac版
神級代碼編輯軟件(SublimeText3)

Golang主要用于后端開發(fā),但也能在前端領(lǐng)域間接發(fā)揮作用。其設(shè)計(jì)目標(biāo)聚焦高性能、并發(fā)處理和系統(tǒng)級編程,適合構(gòu)建API服務(wù)器、微服務(wù)、分布式系統(tǒng)、數(shù)據(jù)庫操作及CLI工具等后端應(yīng)用。雖然Golang不是網(wǎng)頁前端的主流語言,但可通過GopherJS編譯成JavaScript、通過TinyGo運(yùn)行于WebAssembly,或搭配模板引擎生成HTML頁面來參與前端開發(fā)。然而,現(xiàn)代前端開發(fā)仍需依賴JavaScript/TypeScript及其生態(tài)。因此,Golang更適合以高性能后端為核心的技術(shù)棧選擇。

要構(gòu)建一個GraphQLAPI在Go語言中,推薦使用gqlgen庫以提高開發(fā)效率。1.首先選擇合適的庫,如gqlgen,它支持根據(jù)schema自動生成代碼;2.接著定義GraphQLschema,描述API的結(jié)構(gòu)和查詢?nèi)肟?,如定義Post類型和查詢方法;3.然后初始化項(xiàng)目并生成基礎(chǔ)代碼,實(shí)現(xiàn)resolver中的業(yè)務(wù)邏輯;4.最后將GraphQLhandler接入HTTPserver,通過內(nèi)置Playground測試API。注意事項(xiàng)包括字段命名規(guī)范、錯誤處理、性能優(yōu)化及安全設(shè)置等,確保項(xiàng)目可維護(hù)性

安裝Go的關(guān)鍵在于選擇正確版本、配置環(huán)境變量并驗(yàn)證安裝。1.前往官網(wǎng)下載對應(yīng)系統(tǒng)的安裝包,Windows使用.msi文件,macOS使用.pkg文件,Linux使用.tar.gz文件并解壓至/usr/local目錄;2.配置環(huán)境變量,在Linux/macOS中編輯~/.bashrc或~/.zshrc添加PATH和GOPATH,Windows則在系統(tǒng)屬性中設(shè)置PATH為Go的安裝路徑;3.使用goversion命令驗(yàn)證安裝,并運(yùn)行測試程序hello.go確認(rèn)編譯執(zhí)行正常。整個流程中PATH設(shè)置和環(huán)

sync.WaitGroup用于等待一組goroutine完成任務(wù),其核心是通過Add、Done、Wait三個方法協(xié)同工作。1.Add(n)設(shè)置需等待的goroutine數(shù)量;2.Done()在每個goroutine結(jié)束時調(diào)用,計(jì)數(shù)減一;3.Wait()阻塞主協(xié)程直到所有任務(wù)完成。使用時需注意:Add應(yīng)在goroutine外調(diào)用、避免重復(fù)Wait、務(wù)必確保Done被調(diào)用,推薦配合defer使用。常見于并發(fā)抓取網(wǎng)頁、批量數(shù)據(jù)處理等場景,能有效控制并發(fā)流程。

使用Go的embed包可以方便地將靜態(tài)資源嵌入二進(jìn)制,適合Web服務(wù)打包HTML、CSS、圖片等文件。1.聲明嵌入資源需在變量前加//go:embed注釋,如嵌入單個文件hello.txt;2.可嵌入整個目錄如static/*,通過embed.FS實(shí)現(xiàn)多文件打包;3.開發(fā)時建議通過buildtag或環(huán)境變量切換磁盤加載模式以提高效率;4.注意路徑正確性、文件大小限制及嵌入資源的只讀特性。合理使用embed能簡化部署并優(yōu)化項(xiàng)目結(jié)構(gòu)。

音視頻處理的核心在于理解基本流程與優(yōu)化方法。1.其基本流程包括采集、編碼、傳輸、解碼和播放,每個環(huán)節(jié)均有技術(shù)難點(diǎn);2.常見問題如音畫不同步、卡頓延遲、聲音噪音、畫面模糊等,可通過同步調(diào)整、編碼優(yōu)化、降噪模塊、參數(shù)調(diào)節(jié)等方式解決;3.推薦使用FFmpeg、OpenCV、WebRTC、GStreamer等工具實(shí)現(xiàn)功能;4.性能管理方面應(yīng)注重硬件加速、合理設(shè)置分辨率幀率、控制并發(fā)及內(nèi)存泄漏問題。掌握這些關(guān)鍵點(diǎn)有助于提升開發(fā)效率和用戶體驗(yàn)。

搭建一個用Go編寫的Web服務(wù)器并不難,核心在于利用net/http包實(shí)現(xiàn)基礎(chǔ)服務(wù)。1.使用net/http啟動最簡服務(wù)器:通過幾行代碼注冊處理函數(shù)并監(jiān)聽端口;2.路由管理:使用ServeMux組織多個接口路徑,便于結(jié)構(gòu)化管理;3.常見做法:按功能模塊分組路由,并可用第三方庫支持復(fù)雜匹配;4.靜態(tài)文件服務(wù):通過http.FileServer提供HTML、CSS和JS文件;5.性能與安全:啟用HTTPS、限制請求體大小、設(shè)置超時時間以提升安全性與性能。掌握這些要點(diǎn)后,擴(kuò)展功能將更加容易。

select加default的作用是讓select在沒有其他分支就緒時執(zhí)行默認(rèn)行為,避免程序阻塞。1.非阻塞地從channel接收數(shù)據(jù)時,若channel為空,會直接進(jìn)入default分支;2.結(jié)合time.After或ticker定時嘗試發(fā)送數(shù)據(jù),若channel滿則不阻塞而跳過;3.防止死鎖,在不確定channel是否被關(guān)閉時避免程序卡?。皇褂脮r需注意default分支會立即執(zhí)行,不能濫用,且default與case互斥,不會同時執(zhí)行。
