一、大模型基本概念1.1 定義與核心特征 大模型是指通過海量數(shù)據(jù)和巨大參數(shù)量(通常10億以上)訓(xùn)練而成的深度學(xué)習(xí)模型,具有以下特征: 規(guī)模效應(yīng)?:參數(shù)量達百億至萬億級通用能力?:無需特定訓(xùn)練即可完成多種任務(wù)涌現(xiàn)特性?:規(guī)模突破閾值后出現(xiàn)意外能...
一、凌晨3點的警報:工程師的噩夢從何而來?“連續(xù)三周,每天凌晨3:15準時崩潰!”某電商平臺測試負責(zé)人發(fā)現(xiàn),AI生成的支付系統(tǒng)測試腳本總在深夜罷工,導(dǎo)致次日緊急修復(fù)耗時超8小時。而這種現(xiàn)象絕非個例——騰訊安全團隊2025年數(shù)據(jù)顯示,68%的AI腳本故...
一、什么是AI Agent?AI Agent(人工智能代理)是基于大語言模型(LLMs)的智能系統(tǒng),能夠通過工具調(diào)用、自主決策和持續(xù)學(xué)習(xí)完成特定任務(wù)。在軟件測試開發(fā)中,它被設(shè)計為測試領(lǐng)域的智能協(xié)作者,例如: 自動化測試:理解測試需求,生成并維護...
一、大模型定義狹義定義 特指ChatGPT等大語言模型(LLM),通過千億級參數(shù)訓(xùn)練,具備文本生成、邏輯推理等通用能力。 廣義定義 涵蓋CV/語音等領(lǐng)域的通用模型范式,演進路徑:專用小模型 → 預(yù)訓(xùn)練+微調(diào) → 大模型+人類對齊 核心價值 ...
2025年4月13日,人形機器人半程馬拉松賽在北京經(jīng)濟技術(shù)開發(fā)區(qū)(北京經(jīng)開區(qū))與北京亦莊半程馬拉松賽同期舉行。本次賽事共有20支隊伍參賽,包括全球范圍內(nèi)的機器人企業(yè)、科研院所、機器人俱樂部、高校等創(chuàng)新主體的人形機器人。最終,天工隊以36分54秒率先沖...
在電商系統(tǒng)的測試中,你是否經(jīng)常遇到這些問題? ?? 場景遺漏?:測試用例覆蓋不全,上線后才發(fā)現(xiàn)關(guān)鍵路徑未測試 ?? 重復(fù)勞動?:不同模塊的測試用例存在大量冗余 ?? 維護困難?:業(yè)務(wù)規(guī)則變更后,需要手動更新數(shù)十個關(guān)聯(lián)用例 ?? 效率低下?:人...
一、企業(yè)引入AI測試工具的三大初衷1. 降本增效的必然選擇?某銀行信用卡系統(tǒng)接入AI后: 識別速度提升?:單筆交易風(fēng)險檢測從3秒→80毫秒人力節(jié)省?:反欺詐團隊從20人縮減至8人 ?數(shù)據(jù): 指標 人工檢測 AI檢測 提升率...
探索性測試是一種強調(diào)測試人員自主性、學(xué)習(xí)性和實時設(shè)計執(zhí)行的測試方法。測試人員通過動態(tài)探索軟件功能,同時設(shè)計測試用例、執(zhí)行測試并即時分析結(jié)果,依賴經(jīng)驗、直覺和創(chuàng)造力發(fā)現(xiàn)潛在缺陷。 什么時候進行探索性測試? 早期開發(fā)階段 需求不明確或文檔不全時...
月之暗面公司推出Kimi-VL,一個高效的開源Mixture-of-Experts(MOE)視覺語言模型(VLM),它提供了先進的多模態(tài)推理、長語境理解和強大的代理能力—同時僅在其語言解碼器(Kimi-VL-A3B)中激活2.8B個參數(shù)。 Kimi...
“手工測試”在軟件測試領(lǐng)域始終具有不可替代的價值,尤其是在移動應(yīng)用(App)測試中。盡管自動化測試(如AppAgentX等工具)能提升效率,但手工測試的靈活性和人類直覺仍是發(fā)現(xiàn)復(fù)雜問題的關(guān)鍵。 手工測試的價值:為什么機器取代不了人手工測試就像老匠人...
“未來我會被AI取代嗎?”這個問題,問出了很多人的好奇和擔(dān)憂。在今年閉幕的全國兩會上,從會場到駐地,代表委員們也議論風(fēng)生。 我向DeepSeek求證——“你被問最多的關(guān)于人工智能的問題是什么?”“AI會取代人類的工作嗎?”位列榜首。 “聽說AI能...
Dify 和 FastGPT 都是基于大語言模型的 開源開發(fā)平臺,旨在幫助開發(fā)者快速構(gòu)建和部署 AI 應(yīng)用,但它們的設(shè)計目標、功能特性和適用場景有所不同。 核心定位對比 維度 Dify FastGPT 核心目標 企...
2025年4月14日,中國信息通信研究院(以下簡稱“中國信通院”)在南京舉辦的“人工智能賦能新型工業(yè)化深度行”活動中宣布,正式啟動“可信AI智能體測試床”建設(shè)工作。 該項目聯(lián)合華為、百度、金蝶軟件、聯(lián)通數(shù)科、中國移動研究院、VIVO、吉利汽車、華晨...
RAG的基本流程,也就是檢索增強生成??雌饋砗唵?,但實際優(yōu)化起來可能有很多細節(jié)需要注意。提升RAG效果需要像拼積木一樣,把每個環(huán)節(jié)拆開針對性優(yōu)化。下面分享一些實戰(zhàn)中驗證過的策略: 數(shù)據(jù)預(yù)處理是基本功,但多數(shù)人沒做透 文檔切割別一刀切:根據(jù)內(nèi)容類型...
“手工測試”在軟件測試領(lǐng)域始終具有不可替代的價值,尤其是在移動應(yīng)用(App)測試中。盡管自動化測試(如AppAgentX等工具)能提升效率,但手工測試的靈活性和人類直覺仍是發(fā)現(xiàn)復(fù)雜問題的關(guān)鍵。以下是手工測試的核心價值及其與自動化測試(如AppAgen...