狹義定義
特指ChatGPT等大語言模型(LLM),通過千億級參數(shù)訓(xùn)練,具備文本生成、邏輯推理等通用能力。
廣義定義
涵蓋CV/語音等領(lǐng)域的通用模型范式,演進(jìn)路徑:專用小模型 → 預(yù)訓(xùn)練+微調(diào) → 大模型+人類對齊
核心價值
傳統(tǒng)AI需為每個任務(wù)單獨訓(xùn)練模型(如翻譯模型、摘要模型),而大模型如同「瑞士軍刀」,單模型應(yīng)對多任務(wù)。
關(guān)鍵差異對比:
技術(shù)層級 | 數(shù)據(jù)需求 | 特征提取 | 典型應(yīng)用 |
---|---|---|---|
機器學(xué)習(xí) | 標(biāo)注數(shù)據(jù) | 人工設(shè)計 | 垃圾郵件分類 |
深度學(xué)習(xí) | 部分標(biāo)注 | 半自動提取 | 人臉識別 |
大模型 | 無標(biāo)注海量文本 | 完全自主提取 | 多輪對話系統(tǒng) |
基于詞頻預(yù)測,如同查字典寫作文
RNN/LSTM網(wǎng)絡(luò),實現(xiàn)上下文記憶
BERT/GPT-1開啟「預(yù)訓(xùn)練+微調(diào)」范式
GPT-3展現(xiàn)零樣本學(xué)習(xí)能力
ChatGPT通過RLHF技術(shù)理解人類意圖
技術(shù)拐點:2017年Transformer架構(gòu)問世,突破長文本處理瓶頸。
生成式AI vs 決策式AI
AIGC三大特征:
中國大模型「三梯隊」格局:
通用底座
垂直領(lǐng)域
大模型不是替代人類的「對手」,而是放大能力的「杠桿」
微信掃碼
關(guān)注PHP中文網(wǎng)服務(wù)號
QQ掃碼
加入技術(shù)交流群
Copyright 2014-2025 http://ipnx.cn/ All Rights Reserved | php.cn | 湘ICP備2023035733號