亚洲国产日韩欧美一区二区三区,精品亚洲国产成人av在线,国产99视频精品免视看7,99国产精品久久久久久久成人热,欧美日韩亚洲国产综合乱

目錄
目錄
什麼是機(jī)器學(xué)習(xí)?
簡(jiǎn)單的例子:教室裡的學(xué)生
什麼是監(jiān)督的機(jī)器學(xué)習(xí)?
1。分類
2?;貧w
監(jiān)督學(xué)習(xí)工作流程
普通監(jiān)督的機(jī)器學(xué)習(xí)算法
1。線性回歸
2。邏輯回歸
3。決策樹
4。隨機(jī)森林
5。支持向量機(jī)(SVM)
6。 k-nearest鄰居(KNN)
7。天真的貝葉斯
8。梯度提升(XGBoost,LightGBM)
現(xiàn)實(shí)世界應(yīng)用
關(guān)鍵的挑戰(zhàn)和緩解
挑戰(zhàn)1:過度擬合與不合適的
挑戰(zhàn)2:數(shù)據(jù)質(zhì)量和偏見
挑戰(zhàn)3:“維度的詛咒”
結(jié)論
首頁 科技週邊 人工智慧 初學(xué)者的監(jiān)督機(jī)器學(xué)習(xí)指南

初學(xué)者的監(jiān)督機(jī)器學(xué)習(xí)指南

Jun 28, 2025 am 09:16 AM

機(jī)器學(xué)習(xí)(ML)允許計(jì)算機(jī)從數(shù)據(jù)中學(xué)習(xí)模式並自行做出決策。將其視為教學(xué)機(jī)器如何“從經(jīng)驗(yàn)中學(xué)習(xí)”。我們?cè)试S機(jī)器從示例中學(xué)習(xí)規(guī)則,而不是對(duì)每個(gè)規(guī)則進(jìn)行硬編碼。這是AI革命中心的概念。在本文中,我們將介紹哪些監(jiān)督學(xué)習(xí),其不同的類型以及屬於監(jiān)督的學(xué)習(xí)傘下的一些常見算法。

目錄

  • 什麼是機(jī)器學(xué)習(xí)?
  • 什麼是監(jiān)督的機(jī)器學(xué)習(xí)?
  • 監(jiān)督學(xué)習(xí)工作流程
  • 普通監(jiān)督的機(jī)器學(xué)習(xí)算法
  • 關(guān)鍵的挑戰(zhàn)和緩解
  • 結(jié)論

什麼是機(jī)器學(xué)習(xí)?

從根本上講,機(jī)器學(xué)習(xí)是識(shí)別數(shù)據(jù)中模式的過程。主要概念是創(chuàng)建當(dāng)應(yīng)用於新鮮,未經(jīng)測(cè)試的數(shù)據(jù)時(shí)性能良好的模型。 ML可以大致分為三個(gè)領(lǐng)域:

  1. 監(jiān)督學(xué)習(xí)
  2. 無監(jiān)督的學(xué)習(xí)
  3. 強(qiáng)化學(xué)習(xí)

簡(jiǎn)單的例子:教室裡的學(xué)生

  • 監(jiān)督的學(xué)習(xí)中,老師會(huì)給學(xué)生問題和答案(例如,“ 2 2 = 4”),然後稍後問他們是否記住模式。
  • 無監(jiān)督的學(xué)習(xí)中,學(xué)生會(huì)收到大量的數(shù)據(jù)或文章,並按主題進(jìn)行分組;他們通過識(shí)別相似性而在沒有標(biāo)籤的情況下學(xué)習(xí)。

現(xiàn)在,讓我們嘗試從技術(shù)上了解監(jiān)督的機(jī)器學(xué)習(xí)。

什麼是監(jiān)督的機(jī)器學(xué)習(xí)?

在監(jiān)督的學(xué)習(xí)中,該模型通過使用數(shù)據(jù)集中的輸入輸出對(duì)從標(biāo)記的數(shù)據(jù)中學(xué)習(xí)。模型學(xué)會(huì)了輸入(也稱為特徵或自變量)和輸出(也稱為標(biāo)籤或因變量)之間的映射。使用這種學(xué)習(xí)的關(guān)係對(duì)未知數(shù)據(jù)進(jìn)行預(yù)測(cè)是目標(biāo)。目的是根據(jù)這種學(xué)習(xí)的關(guān)係對(duì)看不見的數(shù)據(jù)進(jìn)行預(yù)測(cè)。監(jiān)督的學(xué)習(xí)任務(wù)分為兩個(gè)主要類別:

1。分類

分類中的輸出變量是分類的,這意味著它屬於特定的類。

示例:

  • 電子郵件垃圾郵件檢測(cè)
    • 輸入:電子郵件文字
    • 輸出:垃圾郵件或不垃圾郵件
  • 手寫數(shù)字識(shí)別(MNIST)
    • 輸入:數(shù)字的圖像
    • 輸出:數(shù)字從0到9

2?;貧w

回歸中的輸出變量是連續(xù)的,這意味著它可以具有任何數(shù)量的值落在特定範(fàn)圍內(nèi)。

示例:

  • 房?jī)r(jià)預(yù)測(cè)
    • 輸入:大小,位置,房間數(shù)量
    • 輸出:房?jī)r(jià)(以美元為單位)
  • 股價(jià)預(yù)測(cè)
    • 輸入:以前的價(jià)格,交易量
    • 輸出:第二天的收盤價(jià)

監(jiān)督學(xué)習(xí)工作流程

初學(xué)者的監(jiān)督機(jī)器學(xué)習(xí)指南

典型的監(jiān)督機(jī)學(xué)習(xí)算法遵循以下工作流程:

  1. 數(shù)據(jù)收集:收集標(biāo)記的數(shù)據(jù)是第一步,它需要同時(shí)收集正確的輸出(標(biāo)籤)和輸入(自變量或功能)。
  2. 數(shù)據(jù)預(yù)處理:在培訓(xùn)之前,必須清理和準(zhǔn)備數(shù)據(jù),因?yàn)楝F(xiàn)實(shí)世界中的數(shù)據(jù)通常會(huì)混亂和無組織。這需要處理缺失的值,標(biāo)準(zhǔn)化量表,將文本編碼為數(shù)字以及適當(dāng)格式化數(shù)據(jù)。
  3. 火車測(cè)試拆分:要測(cè)試您的模型對(duì)新數(shù)據(jù)的推廣程度,您需要將數(shù)據(jù)集分為兩個(gè)部分:一個(gè)用於訓(xùn)練模型,另一個(gè)用於測(cè)試。通常,數(shù)據(jù)科學(xué)家將大約70-80%的數(shù)據(jù)用於培訓(xùn),並保留其餘數(shù)據(jù)進(jìn)行測(cè)試或驗(yàn)證。大多數(shù)人使用80-20或70-30拆分。
  4. 模型選擇:根據(jù)問題的類型(分類或回歸)和數(shù)據(jù)的性質(zhì),您選擇了適當(dāng)?shù)臋C(jī)器學(xué)習(xí)算法,例如用於預(yù)測(cè)數(shù)字的線性回歸或用於分類任務(wù)的決策樹。
  5. 培訓(xùn):然後使用培訓(xùn)數(shù)據(jù)來培訓(xùn)所選模型。該模型在此步驟中獲得了對(duì)輸入特徵和輸出標(biāo)籤之間的基本趨勢(shì)和連接的了解。
  6. 評(píng)估:未見測(cè)試數(shù)據(jù)用於在訓(xùn)練模型後評(píng)估模型。根據(jù)它是分類或回歸任務(wù),您可以使用準(zhǔn)確性,精度,召回,RMSE或F1得分等指標(biāo)評(píng)估其性能。
  7. 預(yù)測(cè):最後,訓(xùn)練有素的模型預(yù)測(cè)了新的現(xiàn)實(shí)世界數(shù)據(jù)的輸出,結(jié)果未知。如果表現(xiàn)良好,則團(tuán)隊(duì)可以將其用於價(jià)格預(yù)測(cè),欺詐檢測(cè)和推薦系統(tǒng)等應(yīng)用程序。

普通監(jiān)督的機(jī)器學(xué)習(xí)算法

現(xiàn)在讓我們看一些最常用的監(jiān)督ML算法。在這裡,我們將保持簡(jiǎn)單,並概述每種算法的作用。

1。線性回歸

從根本上講,線性回歸決定了連續(xù)目標(biāo)(y)和輸入特徵(x)之間的最佳直線關(guān)係(y = ax b)。通過最小化預(yù)期和實(shí)際值之間的平方誤差之和,它決定了最佳係數(shù)(a,b)。由於這種封閉形式的數(shù)學(xué)解決方案,它可以為線性趨勢(shì)建模而在計(jì)算上有效,例如基於位置或平方英尺的預(yù)測(cè)房?jī)r(jià)。當(dāng)關(guān)係大致線性並且解釋性很重要時(shí),它們的簡(jiǎn)單性就會(huì)閃耀。

初學(xué)者的監(jiān)督機(jī)器學(xué)習(xí)指南

2。邏輯回歸

儘管有名稱,logistic回歸將線性輸出轉(zhuǎn)換為解決二進(jìn)制分類的概率。它使用sigmoid函數(shù)(1 /(1e??))(例如,“癌癥風(fēng)險(xiǎn):87%”),它擠壓了0到1之間的值,代表了類的可能性。在概率閾值(通常為0.5)下,會(huì)出現(xiàn)決策邊界。由於其概率基礎(chǔ),它非常適合醫(yī)學(xué)診斷,而對(duì)不確定性的理解與做出??準(zhǔn)確的預(yù)測(cè)同樣重要。

初學(xué)者的監(jiān)督機(jī)器學(xué)習(xí)指南

3。決策樹

決策樹是一種簡(jiǎn)單的機(jī)器學(xué)習(xí)工具,用於分類和回歸任務(wù)。這些用戶友好的“ if-else”流程圖使用特徵閾值(例如“收入> $ 50K?”)來分層數(shù)據(jù)。諸如CART之類的算法優(yōu)化信息增益(降低熵/方差),以區(qū)分類別或預(yù)測(cè)值。最終預(yù)測(cè)是由末端葉產(chǎn)生的。儘管他們承擔(dān)過度擬合嘈雜數(shù)據(jù)的風(fēng)險(xiǎn),但他們的白盒自然可以幫助銀行家解釋拒絕貸款(“由於信用評(píng)分 40%,拒絕了”)。

初學(xué)者的監(jiān)督機(jī)器學(xué)習(xí)指南

4。隨機(jī)森林

使用隨機(jī)特徵樣本和數(shù)據(jù)子集來構(gòu)建多個(gè)反相關(guān)的決策樹的合奏方法。它使用多數(shù)投票來匯總分類和回歸平均值的預(yù)測(cè)。對(duì)於信用風(fēng)險(xiǎn)建模,單一樹木可能會(huì)使噪音混淆模式,這是可靠的,因?yàn)樗ㄟ^結(jié)合各種“弱學(xué)習(xí)者”來減少差異和過度擬合。

初學(xué)者的監(jiān)督機(jī)器學(xué)習(xí)指南

5。支持向量機(jī)(SVM)

在高維空間中,SVM確定最大分裂類別的最佳超平面。為了處理非線性邊界,它們使用內(nèi)核技巧(例如RBF)隱式將數(shù)據(jù)隱式映射到更高的維度。在文本/基因組數(shù)據(jù)(僅由關(guān)鍵特徵定義的分類)中,強(qiáng)調(diào)“支持向量”(關(guān)鍵邊界案例)提供了效率。

初學(xué)者的監(jiān)督機(jī)器學(xué)習(xí)指南

6。 k-nearest鄰居(KNN)

一種懶惰的,基於實(shí)例的算法,它使用其在功能空間內(nèi)最接近的鄰居的多數(shù)投票來對(duì)點(diǎn)進(jìn)行分類。相似性通過距離指標(biāo)(Euclidean/Manhattan)來衡量,並通過k控制平滑。它沒有培訓(xùn)階段,可以立即適應(yīng)新數(shù)據(jù),非常適合推薦系統(tǒng),這些系統(tǒng)根據(jù)類似的用戶喜好進(jìn)行電影建議。

初學(xué)者的監(jiān)督機(jī)器學(xué)習(xí)指南

7。天真的貝葉斯

這種概率分類器使大膽的假設(shè)是特徵在有條件地獨(dú)立的,鑑於該類應(yīng)用了貝葉斯定理。儘管這種“天真”,它使用頻率計(jì)數(shù)來快速計(jì)算後驗(yàn)概率。由於O(n)的複雜性和稀疏數(shù)據(jù)耐受性,因此通過實(shí)時(shí)垃圾郵件過濾器掃描了數(shù)百萬封電子郵件。

初學(xué)者的監(jiān)督機(jī)器學(xué)習(xí)指南

8。梯度提升(XGBoost,LightGBM)

一個(gè)順序的合奏,每個(gè)新的弱學(xué)習(xí)者(Tree)都可以修復(fù)其前身的錯(cuò)誤。通過使用梯度下降來優(yōu)化損失功能(例如平方誤差),它適合殘差。通過添加正則化和並行處理,高級(jí)實(shí)現(xiàn)(例如Xgboost)通過在表格數(shù)據(jù)上獲得具有復(fù)雜相互作用的表格數(shù)據(jù)來占主導(dǎo)地位的Kaggle競(jìng)爭(zhēng)。

初學(xué)者的監(jiān)督機(jī)器學(xué)習(xí)指南

現(xiàn)實(shí)世界應(yīng)用

監(jiān)督學(xué)習(xí)的某些應(yīng)用是:

  • 醫(yī)療保健:監(jiān)督學(xué)習(xí)革命性診斷。卷積神經(jīng)網(wǎng)絡(luò)(CNN)在MRI掃描中對(duì)腫瘤進(jìn)行了分類,其精度超過95%,而回歸模型可以預(yù)測(cè)患者的壽命或藥物功效。例如,Google的Lyna檢測(cè)到比人類病理學(xué)家快的乳腺癌轉(zhuǎn)移速度,從而實(shí)現(xiàn)了早期的干預(yù)措施。
  • 財(cái)務(wù):銀行使用分類器來進(jìn)行信用評(píng)分和欺詐檢測(cè),分析交易模式以識(shí)別不規(guī)則性。回歸模型使用歷史市場(chǎng)數(shù)據(jù)來預(yù)測(cè)貸款違約或股票趨勢(shì)。通過自動(dòng)化文檔分析,摩根大通的硬幣平臺(tái)每年節(jié)省360,000個(gè)勞動(dòng)力小時(shí)。
  • 零售與市場(chǎng)營銷:亞馬遜推薦引擎使用了一種稱為協(xié)作過濾的技術(shù)的組合來提出產(chǎn)品建議,將銷售額提高了35%。回歸預(yù)測(cè)需要庫存優(yōu)化的峰值,而分類器則使用購買歷史記錄來預(yù)測(cè)客戶的損失。
  • 自主系統(tǒng):自動(dòng)駕駛汽車依靠Yolo(“您只看一次”)等實(shí)時(shí)對(duì)象分類器來識(shí)別行人和交通標(biāo)誌?;貧w模型計(jì)算碰撞風(fēng)險(xiǎn)和轉(zhuǎn)向角度,從而在動(dòng)態(tài)環(huán)境中實(shí)現(xiàn)安全導(dǎo)航。

關(guān)鍵的挑戰(zhàn)和緩解

挑戰(zhàn)1:過度擬合與不合適的

當(dāng)模型記住訓(xùn)練噪聲,而在新數(shù)據(jù)上失敗時(shí),就會(huì)發(fā)生過度擬合。解決方案包括正則化(懲罰複雜性),交叉驗(yàn)證和集成方法。過於簡(jiǎn)單化的不足;修復(fù)涉及功能工程或高級(jí)算法。平衡兩者都優(yōu)化了概括。

挑戰(zhàn)2:數(shù)據(jù)質(zhì)量和偏見

有偏見的數(shù)據(jù)會(huì)產(chǎn)生歧視性模型,尤其是在抽樣過程中(例如,性別偏見的招聘工具)。緩解包括合成數(shù)據(jù)生成(SMOTE),公平意識(shí)算法和多種數(shù)據(jù)採購。嚴(yán)格的審核和記錄限制的“模型卡”可以提高透明度和問責(zé)制。

挑戰(zhàn)3:“維度的詛咒”

高維數(shù)據(jù)(10K特徵)需要呈指數(shù)級(jí)的樣本,以避免稀疏性。降低降低技術(shù)(例如PCA(主要組件分析),LDA(線性判別分析))採用這些稀疏特徵並減少它們的同時(shí)保留信息信息,從而使分析師能夠根據(jù)較小的組做出更好的驅(qū)逐決策,從而提高效率和準(zhǔn)確性。

結(jié)論

監(jiān)督的機(jī)器學(xué)習(xí)(SML)彌合了原始數(shù)據(jù)和智能動(dòng)作之間的差距。通過從標(biāo)記的示例中學(xué)習(xí),可以使系統(tǒng)能夠做出準(zhǔn)確的預(yù)測(cè)和知情決策,從過濾垃圾郵件和檢測(cè)欺詐到預(yù)測(cè)市場(chǎng)和幫助醫(yī)療保健。在本指南中,我們介紹了基礎(chǔ)工作流程,關(guān)鍵類型(分類和回歸)以及為真實(shí)世界應(yīng)用程序提供動(dòng)力的基本算法。 SML繼續(xù)塑造我們每天依賴的許多技術(shù)的骨幹,通常甚至沒有意識(shí)到這一點(diǎn)。

以上是初學(xué)者的監(jiān)督機(jī)器學(xué)習(xí)指南的詳細(xì)內(nèi)容。更多資訊請(qǐng)關(guān)注PHP中文網(wǎng)其他相關(guān)文章!

本網(wǎng)站聲明
本文內(nèi)容由網(wǎng)友自願(yuàn)投稿,版權(quán)歸原作者所有。本站不承擔(dān)相應(yīng)的法律責(zé)任。如發(fā)現(xiàn)涉嫌抄襲或侵權(quán)的內(nèi)容,請(qǐng)聯(lián)絡(luò)admin@php.cn

熱AI工具

Undress AI Tool

Undress AI Tool

免費(fèi)脫衣圖片

Undresser.AI Undress

Undresser.AI Undress

人工智慧驅(qū)動(dòng)的應(yīng)用程序,用於創(chuàng)建逼真的裸體照片

AI Clothes Remover

AI Clothes Remover

用於從照片中去除衣服的線上人工智慧工具。

Clothoff.io

Clothoff.io

AI脫衣器

Video Face Swap

Video Face Swap

使用我們完全免費(fèi)的人工智慧換臉工具,輕鬆在任何影片中換臉!

熱工具

記事本++7.3.1

記事本++7.3.1

好用且免費(fèi)的程式碼編輯器

SublimeText3漢化版

SublimeText3漢化版

中文版,非常好用

禪工作室 13.0.1

禪工作室 13.0.1

強(qiáng)大的PHP整合開發(fā)環(huán)境

Dreamweaver CS6

Dreamweaver CS6

視覺化網(wǎng)頁開發(fā)工具

SublimeText3 Mac版

SublimeText3 Mac版

神級(jí)程式碼編輯軟體(SublimeText3)

熱門話題

Laravel 教程
1597
29
PHP教程
1488
72
Kimi K2:最強(qiáng)大的開源代理模型 Kimi K2:最強(qiáng)大的開源代理模型 Jul 12, 2025 am 09:16 AM

還記得今年早些時(shí)候破壞了Genai行業(yè)的大量開源中國模型嗎??jī)嵐蹹eepSeek佔(zhàn)據(jù)了大多數(shù)頭條新聞,但Kimi K1.5是列表中的重要名字之一。模型很酷。

Grok 4 vs Claude 4:哪個(gè)更好? Grok 4 vs Claude 4:哪個(gè)更好? Jul 12, 2025 am 09:37 AM

到2025年中期,AI“軍備競(jìng)賽”正在加熱,XAI和Anthropic都發(fā)布了他們的旗艦車型Grok 4和Claude 4。這兩種模型處於設(shè)計(jì)理念和部署平臺(tái)的相反端,但他們卻在

今天已經(jīng)在我們中間走了10個(gè)驚人的人形機(jī)器人 今天已經(jīng)在我們中間走了10個(gè)驚人的人形機(jī)器人 Jul 16, 2025 am 11:12 AM

但是我們可能甚至不必等10年就可以看到一個(gè)。實(shí)際上,可以被認(rèn)為是真正有用的,類人類機(jī)器的第一波。 近年來,有許多原型和生產(chǎn)模型從T中走出來

上下文工程是' new'及時(shí)的工程 上下文工程是' new'及時(shí)的工程 Jul 12, 2025 am 09:33 AM

直到上一年,迅速的工程被認(rèn)為是與大語言模型(LLM)互動(dòng)的關(guān)鍵技能。然而,最近,LLM在推理和理解能力方面已經(jīng)顯著提高。自然,我們的期望

6個(gè)任務(wù)Manus AI可以在幾分鐘內(nèi)完成 6個(gè)任務(wù)Manus AI可以在幾分鐘內(nèi)完成 Jul 06, 2025 am 09:29 AM

我相信您必須了解通用的AI代理Manus。它是幾個(gè)月前推出的,在過去的幾個(gè)月中,他們?yōu)橄到y(tǒng)添加了幾個(gè)新功能?,F(xiàn)在,您可以生成視頻,創(chuàng)建網(wǎng)站並做很多MO

Leia的浸入式移動(dòng)應(yīng)用將3D深度帶入日常照片 Leia的浸入式移動(dòng)應(yīng)用將3D深度帶入日常照片 Jul 09, 2025 am 11:17 AM

基於Leia專有的神經(jīng)深度引擎,應(yīng)用程序流程靜止圖像,並添加了自然深度以及模擬運(yùn)動(dòng)(例如Pans,Zooms和Alallax Effects),以創(chuàng)建簡(jiǎn)短的視頻捲軸,從而給人以踏入SCE的印象

這些AI模型沒有學(xué)習(xí)語言,他們學(xué)習(xí)了策略 這些AI模型沒有學(xué)習(xí)語言,他們學(xué)習(xí)了策略 Jul 09, 2025 am 11:16 AM

倫敦國王學(xué)院和牛津大學(xué)的研究人員的一項(xiàng)新研究分享了Openai,Google和Anthropic在基於迭代囚犯的困境基於的cutthroat競(jìng)爭(zhēng)中一起投擲的結(jié)果。這是沒有的

7種AI代理的7種類型是什麼? 7種AI代理的7種類型是什麼? Jul 11, 2025 am 11:08 AM

想像一些複雜的東西,例如AI引擎準(zhǔn)備提供有關(guān)米蘭新服裝系列的詳細(xì)反饋,或者自動(dòng)市場(chǎng)分析用於全球運(yùn)營的企業(yè),或者智能係統(tǒng)管理大型車隊(duì)。

See all articles