亚洲国产日韩欧美一区二区三区,精品亚洲国产成人av在线,国产99视频精品免视看7,99国产精品久久久久久久成人热,欧美日韩亚洲国产综合乱

目錄
K-均值聚類:快速而簡單
DBSCAN:非常適合任意形狀
分層聚類:視覺和可解釋
minibatch k均值:更快的K均值替代品
首頁 後端開發(fā) Python教學 用Python Scikit-Learn聚類算法

用Python Scikit-Learn聚類算法

Jul 23, 2025 am 03:05 AM

Scikit-Learn中的聚類涉及使用K-均值,DBSCAN,分層和Minibatch K-均值方法。 1。 k均值很快,需要指定簇,並使用肘方法進行選擇; 2。 dbscan使用EPS和Min_Samples處理噪聲和任意形狀; 3。分層聚類通過樹狀圖可視化關(guān)係,但與大數(shù)據(jù)鬥爭。 4. Minibatch K-均值以略有準確的權(quán)衡提高了大型數(shù)據(jù)集的速度。每種方法都適合不同的數(shù)據(jù)和目標,從快速分組到噪聲處理和解釋。

用Python Scikit-Learn聚類算法

聚類是一種用於將相似數(shù)據(jù)點分組在一起的一種無監(jiān)督的學習。借助Python的Scikit-Learn庫,您可以訪問幾種易於實現(xiàn)和自定義的功能強大的聚類算法。

用Python Scikit-Learn聚類算法

這是使用Scikit-Learn使用一些最常用的聚類方法的方法。


K-均值聚類:快速而簡單

K-均值是由於其簡單性和效率,是使用最廣泛使用的聚類算法之一。它根據(jù)距離將數(shù)據(jù)分配到K簇中。

用Python Scikit-Learn聚類算法

使用它:

  • 確定群集的數(shù)量n_clusters
  • 初始化模型: KMeans(n_clusters=3)
  • 適合和預測: .fit(X).fit_predict(X)

人們遇到的一個常見問題是選擇正確的群集。一種實用的方法是肘部方法,它涉及繪製k的不同值的慣性(平方距離之和)。 “肘”點為K提供了合理的選擇。

用Python Scikit-Learn聚類算法
來自Sklearn.Cluster Import Kmeans
導入matplotlib.pyplot作為PLT

惰性= []
對於我的範圍(1,11):
    kmeans = kmeans(n_clusters = i,andural_state = 0)
    kmeans.fit(x)
    interias.append(kmeans.inertia_)

plt.plot(範圍(1,11),慣性)
plt.xlabel(“群集數(shù)”)
plt.ylabel(“慣性”)
plt.show()

請記住,K均值假設(shè)簇是凸和各向同性的 - 因此在非球形或不規(guī)則形狀的數(shù)據(jù)上可能表現(xiàn)不佳。


DBSCAN:非常適合任意形狀

如果您的數(shù)據(jù)具有復雜的形狀或包含噪聲,則DBSCAN (基於密度的空間群集使用噪聲)比K-均值更好。

它通過將密切包裝的點組合在一起,並將隔離點標記為噪聲來起作用。

關(guān)鍵參數(shù):

  • eps :兩個樣本之間的最大距離,它們被視為鄰居
  • min_samples :附近的最小樣本數(shù)量,以將其視為核心點
來自Sklearn.Cluster Import DBSCAN
dbscan = dbscan(eps = 3,min_samples = 5)
標籤= dbscan.fit_predict(x)

DBSCAN的一個棘手部分是選擇合適的eps 。一個好方法是查看k-distance圖並選擇一個急劇增加(例如肘部)的值。

此方法不需要自然地指定前期簇的數(shù)量並處理離群值。


分層聚類:視覺和可解釋

層次聚類構(gòu)建了簇的樹狀結(jié)構(gòu),從而使通過樹狀圖可視化關(guān)係變得更加容易。

有兩種主要方法:

  • 集聚:從每個點開始,作為其自身的群集並將其合併
  • 分裂:從一個集群中的所有點開始,然後遞歸分裂

在scikit-learn中使用AgglomerativeClustering

從sklearn.cluster導入AgrogomerativeClustering
cluster = grogmerativeclustering(n_clusters = 3)
標籤= cluster.fit_predict(x)

您還可以在特定的距離閾值下切割樹狀圖以獲取集群:

來自scipy.cluster.hierarchy導入樹狀圖,鏈接
鏈接=鏈接(X,'Ward')
樹狀圖(鏈接)
plt.show()

雖然此方法可以更深入地了解群集層次結(jié)構(gòu),但與大型數(shù)據(jù)集相比,它的擴展不佳。


minibatch k均值:更快的K均值替代品

使用大型數(shù)據(jù)集時, Minibatch K-均值是K-均值的更快版本,它使用每次迭代中數(shù)據(jù)的隨機示例。

這樣使用:

來自Sklearn.Cluster Import Minibatchkmeans
mbk = minibatchkmeans(n_clusters = 3,batch_size = 100)
mbk.fit(x)

權(quán)衡的精度略低,但是提高速度可能很大。當您處理數(shù)千或數(shù)百萬個數(shù)據(jù)點並需要快速結(jié)果時,這使其成為一個可靠的選擇。


這是如何使用Scikit-Learn應用流行聚類算法的基本分解。每個人都有其優(yōu)勢和最佳用途的場景 - 從與K-均值的快速分組,用DBSCAN處理噪聲,通過層次方法解釋關(guān)係到與Minibatch K-均值擴展。

根據(jù)您的數(shù)據(jù)形狀,大小和目標,其中之一應該可以恰當。

以上是用Python Scikit-Learn聚類算法的詳細內(nèi)容。更多資訊請關(guān)注PHP中文網(wǎng)其他相關(guān)文章!

本網(wǎng)站聲明
本文內(nèi)容由網(wǎng)友自願投稿,版權(quán)歸原作者所有。本站不承擔相應的法律責任。如發(fā)現(xiàn)涉嫌抄襲或侵權(quán)的內(nèi)容,請聯(lián)絡(luò)admin@php.cn

熱AI工具

Undress AI Tool

Undress AI Tool

免費脫衣圖片

Undresser.AI Undress

Undresser.AI Undress

人工智慧驅(qū)動的應用程序,用於創(chuàng)建逼真的裸體照片

AI Clothes Remover

AI Clothes Remover

用於從照片中去除衣服的線上人工智慧工具。

Clothoff.io

Clothoff.io

AI脫衣器

Video Face Swap

Video Face Swap

使用我們完全免費的人工智慧換臉工具,輕鬆在任何影片中換臉!

熱工具

記事本++7.3.1

記事本++7.3.1

好用且免費的程式碼編輯器

SublimeText3漢化版

SublimeText3漢化版

中文版,非常好用

禪工作室 13.0.1

禪工作室 13.0.1

強大的PHP整合開發(fā)環(huán)境

Dreamweaver CS6

Dreamweaver CS6

視覺化網(wǎng)頁開發(fā)工具

SublimeText3 Mac版

SublimeText3 Mac版

神級程式碼編輯軟體(SublimeText3)

熱門話題

Laravel 教程
1597
29
PHP教程
1488
72
Python類中的多態(tài)性 Python類中的多態(tài)性 Jul 05, 2025 am 02:58 AM

多態(tài)是Python面向?qū)ο缶幊讨械暮诵母拍睿浮耙环N接口,多種實現(xiàn)”,允許統(tǒng)一處理不同類型的對象。 1.多態(tài)通過方法重寫實現(xiàn),子類可重新定義父類方法,如Animal類的speak()方法在Dog和Cat子類中有不同實現(xiàn)。 2.多態(tài)的實際用途包括簡化代碼結(jié)構(gòu)、增強可擴展性,例如圖形繪製程序中統(tǒng)一調(diào)用draw()方法,或遊戲開發(fā)中處理不同角色的共同行為。 3.Python實現(xiàn)多態(tài)需滿足:父類定義方法,子類重寫該方法,但不要求繼承同一父類,只要對象實現(xiàn)相同方法即可,這稱為“鴨子類型”。 4.注意事項包括保持方

解釋Python發(fā)電機和迭代器。 解釋Python發(fā)電機和迭代器。 Jul 05, 2025 am 02:55 AM

迭代器是實現(xiàn)__iter__()和__next__()方法的對象,生成器是簡化版的迭代器,通過yield關(guān)鍵字自動實現(xiàn)這些方法。 1.迭代器每次調(diào)用next()返回一個元素,無更多元素時拋出StopIteration異常。 2.生成器通過函數(shù)定義,使用yield按需生成數(shù)據(jù),節(jié)省內(nèi)存且支持無限序列。 3.處理已有集合時用迭代器,動態(tài)生成大數(shù)據(jù)或需惰性求值時用生成器,如讀取大文件時逐行加載。注意:列表等可迭代對像不是迭代器,迭代器到盡頭後需重新創(chuàng)建,生成器只能遍歷一次。

如何處理Python中的API身份驗證 如何處理Python中的API身份驗證 Jul 13, 2025 am 02:22 AM

處理API認證的關(guān)鍵在於理解並正確使用認證方式。 1.APIKey是最簡單的認證方式,通常放在請求頭或URL參數(shù)中;2.BasicAuth使用用戶名和密碼進行Base64編碼傳輸,適合內(nèi)部系統(tǒng);3.OAuth2需先通過client_id和client_secret獲取Token,再在請求頭中帶上BearerToken;4.為應對Token過期,可封裝Token管理類自動刷新Token;總之,根據(jù)文檔選擇合適方式,並安全存儲密鑰信息是關(guān)鍵。

解釋Python斷言。 解釋Python斷言。 Jul 07, 2025 am 12:14 AM

Assert是Python用於調(diào)試的斷言工具,當條件不滿足時拋出AssertionError。其語法為assert條件加可選錯誤信息,適用於內(nèi)部邏輯驗證如參數(shù)檢查、狀態(tài)確認等,但不能用於安全或用戶輸入檢查,且應配合清晰提示信息使用,僅限開發(fā)階段輔助調(diào)試而非替代異常處理。

什麼是Python型提示? 什麼是Python型提示? Jul 07, 2025 am 02:55 AM

typeHintsInpyThonsolverbromblemboyofambiguityandPotentialBugSindyNamalytyCodeByallowingDevelopsosteSpecefectifyExpectedTypes.theyenhancereadability,enablellybugdetection,andimprovetool.typehintsupport.typehintsareadsareadsareadsareadsareadsareadsareadsareadsareaddedusidocolon(

如何一次迭代兩個列表 如何一次迭代兩個列表 Jul 09, 2025 am 01:13 AM

在Python中同時遍歷兩個列表的常用方法是使用zip()函數(shù),它會按順序配對多個列表並以最短為準;若列表長度不一致,可使用itertools.zip_longest()以最長為準並填充缺失值;結(jié)合enumerate()可同時獲取索引。 1.zip()簡潔實用,適合成對數(shù)據(jù)迭代;2.zip_longest()處理不一致長度時可填充默認值;3.enumerate(zip())可在遍歷時獲取索引,滿足多種複雜場景需求。

什麼是Python迭代器? 什麼是Python迭代器? Jul 08, 2025 am 02:56 AM

Inpython,IteratorSareObjectSthallowloopingThroughCollectionsByImplementing_iter __()和__next __()。 1)iteratorsWiaTheIteratorProtocol,使用__ITER __()toreTurnterateratoratoranteratoratoranteratoratorAnterAnteratoratorant antheittheext__()

Python Fastapi教程 Python Fastapi教程 Jul 12, 2025 am 02:42 AM

要使用Python創(chuàng)建現(xiàn)代高效的API,推薦使用FastAPI;其基於標準Python類型提示,可自動生成文檔,性能優(yōu)越。安裝FastAPI和ASGI服務(wù)器uvicorn後,即可編寫接口代碼。通過定義路由、編寫處理函數(shù)並返回數(shù)據(jù),可以快速構(gòu)建API。 FastAPI支持多種HTTP方法,並提供自動生成的SwaggerUI和ReDoc文檔系統(tǒng)。 URL參數(shù)可通過路徑定義捕獲,查詢參數(shù)則通過函數(shù)參數(shù)設(shè)置默認值實現(xiàn)。合理使用Pydantic模型有助於提升開發(fā)效率和準確性。

See all articles