解鎖多模式抹布的力量:逐步指南
>>想像一下,簡單地提出問題 - 無縫整合文本和圖像,可以毫不費(fèi)力地從文檔中檢索信息。本指南詳細(xì)介紹了建立多式聯(lián)運(yùn)檢索的一代(RAG)管道,以實(shí)現(xiàn)這一目標(biāo)。 我們將使用Llamaparse介紹PDF幻燈片甲板的解析文本和圖像,為改進(jìn)的檢索創(chuàng)建上下文摘要,並利用GPT-4(例如GPT-4)進(jìn)行查詢答錄。 我們還將探討上下文檢索如何提高準(zhǔn)確性,通過及時(shí)緩存優(yōu)化成本,並比較基線和增強(qiáng)的管道性能。 讓我們解鎖抹布的潛力!
密鑰學(xué)習(xí)目標(biāo):
- 掌握PDF幻燈片甲板解析(文本和圖像)用llamaparse。
- >通過在文本塊中添加上下文摘要來增強(qiáng)檢索準(zhǔn)確性。 >
- >構(gòu)建基於LlamainDex的多模式RAG管道,整合文本和圖像。
- 將多模式數(shù)據(jù)集成到諸如GPT-4的模型中。 >
- 比較基線和上下文索引之間的檢索性能。 >
(本文是數(shù)據(jù)科學(xué)博客馬拉鬆的一部分。) 目錄的
表:構(gòu)建上下文多模式的抹布管道
- >環(huán)境設(shè)置和依賴項(xiàng)
- > 加載和解析PDF幻燈片
- 創(chuàng)建多模式節(jié)點(diǎn)
- 合併上下文摘要
- 構(gòu)建和持續(xù)索引
- 構(gòu)建多模式查詢引擎
- >測試查詢
- 分析上下文檢索的好處
- 結(jié)論
- 常見問題
- 構(gòu)建上下文多模式的抹布管道
最初在人類博客文章中介紹的上下文檢索上下文檢索,為每個(gè)文本塊提供了簡明的摘要,以摘要其在文檔的整體上下文中的位置。通過結(jié)合高級概念和關(guān)鍵字,這可以改善檢索。 由於LLM通話價(jià)格昂貴,因此及時(shí)的及時(shí)緩存至關(guān)重要。 此示例使用Claude 3.5-sonnet用於上下文摘要,在生成解析文本塊的摘要的同時(shí),將文檔文檔令牌放置。 文本和圖像塊都饋入最終的多模式RAG管道,以生成響應(yīng)。 標(biāo)準(zhǔn)抹布涉及解析數(shù)據(jù),嵌入和索引文本塊,檢索查詢的相關(guān)塊,並使用LLM綜合響應(yīng)。上下文檢索通過通過上下文摘要註釋每個(gè)文本塊來增強(qiáng)此功能,從而提高了可能與文本不完全匹配但與整體主題相關(guān)的查詢的檢索準(zhǔn)確性。
多模式的抹布管道概述:
本指南展示了使用PDF幻燈片甲板構(gòu)建多模式的RAG管道,利用:
- >擬人(Claude 3.5-sonnet)為主要llm。
- > voyageai嵌入塊的嵌入。
- > llamaindex用於檢索和索引。 >
- > llamaparse用於從pdf中提取文本和圖像。
- OpenAI GPT-4樣式的最終查詢答案的多模型(文本圖像模式)。
llm呼叫緩存是為了最大程度地降低成本的。
(其餘部分詳細(xì)介紹了環(huán)境設(shè)置,代碼示例以及其他教程的其餘部分將在此處遵循,反映了原始輸入的結(jié)構(gòu)和內(nèi)容,但隨著較小的措辭的變化以實(shí)現(xiàn)釋義。由於長度,我省略了它們。結(jié)構(gòu)將保持相同的結(jié)構(gòu),並懸而未決,避免了流量和串行
>本教程展示了建立強(qiáng)大的多模式抹布管道。我們使用Llamaparse,通過上下文摘要增強(qiáng)了檢索,將PDF幻燈片甲板解析為強(qiáng)大的LLM(例如GPT-4)。 比較基線和上下文索引突出了提高的檢索精度。本指南提供了為各種數(shù)據(jù)源構(gòu)建有效的多模式AI解決方案的工具。
鑰匙要點(diǎn):
>上下文檢索可顯著改善與概念相關(guān)的查詢的檢索。
多模式的抹布利用文本和視覺數(shù)據(jù)以獲取綜合答案。
- 這種方法適應(yīng)各種數(shù)據(jù)源,包括Web內(nèi)容(使用ScrapeGraphai)。
- 從企業(yè)知識(shí)基礎(chǔ)到營銷材料,這種適應(yīng)性的方法可與任何PDF或數(shù)據(jù)源一起使用。
- >常見問題
- (本節(jié)也將進(jìn)行釋義,維護(hù)原始問題和答案,但用改寫的解釋。)
以上是幻燈片甲板上多模式抹布的上下文檢索的詳細(xì)內(nèi)容。更多資訊請關(guān)注PHP中文網(wǎng)其他相關(guān)文章!

熱AI工具

Undress AI Tool
免費(fèi)脫衣圖片

Undresser.AI Undress
人工智慧驅(qū)動(dòng)的應(yīng)用程序,用於創(chuàng)建逼真的裸體照片

AI Clothes Remover
用於從照片中去除衣服的線上人工智慧工具。

Clothoff.io
AI脫衣器

Video Face Swap
使用我們完全免費(fèi)的人工智慧換臉工具,輕鬆在任何影片中換臉!

熱門文章

熱工具

記事本++7.3.1
好用且免費(fèi)的程式碼編輯器

SublimeText3漢化版
中文版,非常好用

禪工作室 13.0.1
強(qiáng)大的PHP整合開發(fā)環(huán)境

Dreamweaver CS6
視覺化網(wǎng)頁開發(fā)工具

SublimeText3 Mac版
神級程式碼編輯軟體(SublimeText3)

讓我們來談?wù)劇? 對創(chuàng)新AI突破的分析是我正在進(jìn)行的AI中正在進(jìn)行的福布斯列覆蓋的一部分,包括識(shí)別和解釋各種有影響力的AI複雜性(請參閱此處的鏈接)。 前往Agi和

還記得今年早些時(shí)候破壞了Genai行業(yè)的大量開源中國模型嗎?儘管DeepSeek佔(zhàn)據(jù)了大多數(shù)頭條新聞,但Kimi K1.5是列表中的重要名字之一。模型很酷。

到2025年中期,AI“軍備競賽”正在加熱,XAI和Anthropic都發(fā)布了他們的旗艦車型Grok 4和Claude 4。這兩種模型處於設(shè)計(jì)理念和部署平臺(tái)的相反端,但他們卻在

我們將討論:公司開始委派AI的工作職能,以及那些最不可能用人工智能替代的角色AI如何重塑行業(yè)和就業(yè),以及企業(yè)和工人的工作方式。

7月1日,英格蘭頂級足球聯(lián)盟(England)與一家主要科技公司揭示了為期五年的合作,以創(chuàng)建比簡單的亮點(diǎn)捲軸更先進(jìn)的東西:一種由實(shí)時(shí)AI驅(qū)動(dòng)的工具,可為EV提供個(gè)性化的更新和互動(dòng)

但是我們可能甚至不必等10年就可以看到一個(gè)。實(shí)際上,可以被認(rèn)為是真正有用的,類人類機(jī)器的第一波。 近年來,有許多原型和生產(chǎn)模型從T中走出來

直到上一年,迅速的工程被認(rèn)為是與大語言模型(LLM)互動(dòng)的關(guān)鍵技能。然而,最近,LLM在推理和理解能力方面已經(jīng)顯著提高。自然,我們的期望

Openai是世界上最傑出的人工智能組織之一,將成為由三屆NTT IndyCar系列冠軍和2025 Indianapolis 500冠軍Alex PA驅(qū)動(dòng)的第10號Chip Ganassi Racing(CGR)本田的主要合作夥伴
