狹義定義
特指ChatGPT等大語言模型(LLM),通過千億級參數(shù)訓練,具備文本生成、邏輯推理等通用能力。
廣義定義
涵蓋CV/語音等領域的通用模型范式,演進路徑:專用小模型 → 預訓練+微調(diào) → 大模型+人類對齊
核心價值
傳統(tǒng)AI需為每個任務單獨訓練模型(如翻譯模型、摘要模型),而大模型如同「瑞士軍刀」,單模型應對多任務。
關鍵差異對比:
技術層級 | 數(shù)據(jù)需求 | 特征提取 | 典型應用 |
---|---|---|---|
機器學習 | 標注數(shù)據(jù) | 人工設計 | 垃圾郵件分類 |
深度學習 | 部分標注 | 半自動提取 | 人臉識別 |
大模型 | 無標注海量文本 | 完全自主提取 | 多輪對話系統(tǒng) |
基于詞頻預測,如同查字典寫作文
RNN/LSTM網(wǎng)絡,實現(xiàn)上下文記憶
BERT/GPT-1開啟「預訓練+微調(diào)」范式
GPT-3展現(xiàn)零樣本學習能力
ChatGPT通過RLHF技術理解人類意圖
技術拐點:2017年Transformer架構問世,突破長文本處理瓶頸。
生成式AI vs 決策式AI
AIGC三大特征:
中國大模型「三梯隊」格局:
通用底座
垂直領域
大模型不是替代人類的「對手」,而是放大能力的「杠桿」
Copyright 2014-2025 http://ipnx.cn/ All Rights Reserved | php.cn | 湘ICP備2023035733號