亚洲国产日韩欧美一区二区三区,精品亚洲国产成人av在线,国产99视频精品免视看7,99国产精品久久久久久久成人热,欧美日韩亚洲国产综合乱

首頁(yè) 科技週邊 人工智慧 如何用蘭班計(jì)算和存儲(chǔ)矢量嵌入?

如何用蘭班計(jì)算和存儲(chǔ)矢量嵌入?

Apr 17, 2025 am 10:37 AM

利用Langchain和向量嵌入以增強(qiáng)內(nèi)容檢索

先前的文章涵蓋了與查詢(xún)相關(guān)內(nèi)容提取的數(shù)據(jù)加載和分裂技術(shù)。本文使用帶有Langchain的矢量嵌入來(lái)深入研究高級(jí)數(shù)據(jù)檢索,從而更快,更精確和直觀(guān)的搜索。

如何用蘭班計(jì)算和存儲(chǔ)矢量嵌入?

關(guān)鍵概念:

  • 文本嵌入:了解單詞和句子如何表示為數(shù)值向量以捕獲語(yǔ)義含義。
  • Langchain&Hugging Face:實(shí)際應(yīng)用Langchain和擁抱面部嵌入模型,用於計(jì)算和比較句子嵌入。
  • 向量數(shù)據(jù)庫(kù)和ANN:使用矢量數(shù)據(jù)庫(kù)和近似最近的鄰居算法的文檔有效存儲(chǔ)和檢索。
  • Langchain索引:掌握Langchain的索引模式,用於管理Vector數(shù)據(jù)庫(kù)中的文檔更新和刪除。

目錄:

  • 句子嵌入
  • 建造蘭鏈文件
  • 帶有蘭鏈的嵌入
  • 利用矢量商店
  • 索引技術(shù)
  • 常見(jiàn)問(wèn)題

句子嵌入:快速評(píng)論

要在計(jì)算上處理文本,必須將其轉(zhuǎn)換為數(shù)值格式。單詞嵌入表示單詞為矢量,捕獲語(yǔ)義關(guān)係(更緊密的同義詞,距離較遠(yuǎn))。使用句子模型(暹羅網(wǎng)絡(luò))計(jì)算的句子嵌入將其擴(kuò)展到句子。

創(chuàng)建Langchain文檔

先決條件:安裝langchain_openailangchain-huggingface , langchain-chroma , langchainlangchain_community 。配置您的OpenAI API密鑰。

 PIP安裝langchain_openai langchain-Huggingface langchain-chroma langchain langchain_community

例子:

我們將使用示例句子和類(lèi)別來(lái)說(shuō)明Langchain文檔創(chuàng)建。

來(lái)自langchain_core.documents導(dǎo)入文檔
#...(其餘代碼保持不變) 

如何用蘭班計(jì)算和存儲(chǔ)矢量嵌入?

在蘭鏈中使用嵌入

讓我們初始化一個(gè)嵌入模型並生成嵌入。

導(dǎo)入操作系統(tǒng)
來(lái)自dotenv import load_dotenv
#...(其餘代碼保持不變)

餘弦相似性熱圖可視化句子關(guān)係。

導(dǎo)入numpy作為NP
進(jìn)口海洋作為SNS
#...(其餘代碼保持不變) 

如何用蘭班計(jì)算和存儲(chǔ)矢量嵌入?

句子和查詢(xún)之間的餘弦相似性標(biāo)識(shí)了最相關(guān)的句子。也可以使用擁抱面的開(kāi)源模型。

利用矢量商店進(jìn)行有效檢索

對(duì)於大型數(shù)據(jù)集,將查詢(xún)嵌入與每個(gè)文檔嵌入進(jìn)行比較效率低下。向量數(shù)據(jù)庫(kù)中的大約最近的鄰居(ANN)算法提供了解決方案。

來(lái)自langchain_chroma進(jìn)口色度
#...(其餘代碼保持不變)

該代碼演示了從矢量商店添加,檢索和刪除文檔。還顯示了直接使用chromadb 。

掌握索引技術(shù)

Langchain的索引使用記錄管理器跟蹤數(shù)據(jù)庫(kù)條目,防止重複條目並啟用有效的更新和刪除。存在三種模式: NoneIncrementalFull 。

來(lái)自langchain.indexes導(dǎo)入sqlrecordmanager,索引
#...(其餘代碼保持不變)

示例說(shuō)明瞭如何使用不同的索引模式添加,更新和刪除文檔。

結(jié)論

本文展示了使用Langchain和向量嵌入的有效內(nèi)容檢索。嵌入模型和矢量數(shù)據(jù)庫(kù)的組合可實(shí)現(xiàn)準(zhǔn)確且可擴(kuò)展的內(nèi)容檢索。 Langchain的索引功能優(yōu)化數(shù)據(jù)庫(kù)管理。未來(lái)的文章將探討LLM的內(nèi)容檢索方法。

常見(jiàn)問(wèn)題

Q1:什麼是文本嵌入及其重要性?

A1:文本嵌入是捕獲語(yǔ)義含義的數(shù)值表示,從而實(shí)現(xiàn)了計(jì)算文本處理和相似性比較。

Q2: Langchain如何幫助嵌入創(chuàng)建和使用?

A2: Langchain簡(jiǎn)化了嵌入模型初始化,計(jì)算和相似性比較,以進(jìn)行有效內(nèi)容檢索。

Q3:矢量數(shù)據(jù)庫(kù)在內(nèi)容檢索中的作用是什麼?

A3:矢量數(shù)據(jù)庫(kù)存儲(chǔ)並使用ANN算法快速檢索相關(guān)文檔,從而提高可擴(kuò)展性。

Q4: Langchain索引如何增強(qiáng)數(shù)據(jù)庫(kù)管理?

A4: Langchain索引使用記錄管理器,有效地處理文檔更新和刪除,以確保數(shù)據(jù)庫(kù)的準(zhǔn)確性和性能。

以上是如何用蘭班計(jì)算和存儲(chǔ)矢量嵌入?的詳細(xì)內(nèi)容。更多資訊請(qǐng)關(guān)注PHP中文網(wǎng)其他相關(guān)文章!

本網(wǎng)站聲明
本文內(nèi)容由網(wǎng)友自願(yuàn)投稿,版權(quán)歸原作者所有。本站不承擔(dān)相應(yīng)的法律責(zé)任。如發(fā)現(xiàn)涉嫌抄襲或侵權(quán)的內(nèi)容,請(qǐng)聯(lián)絡(luò)admin@php.cn

熱AI工具

Undress AI Tool

Undress AI Tool

免費(fèi)脫衣圖片

Undresser.AI Undress

Undresser.AI Undress

人工智慧驅(qū)動(dòng)的應(yīng)用程序,用於創(chuàng)建逼真的裸體照片

AI Clothes Remover

AI Clothes Remover

用於從照片中去除衣服的線(xiàn)上人工智慧工具。

Clothoff.io

Clothoff.io

AI脫衣器

Video Face Swap

Video Face Swap

使用我們完全免費(fèi)的人工智慧換臉工具,輕鬆在任何影片中換臉!

熱工具

記事本++7.3.1

記事本++7.3.1

好用且免費(fèi)的程式碼編輯器

SublimeText3漢化版

SublimeText3漢化版

中文版,非常好用

禪工作室 13.0.1

禪工作室 13.0.1

強(qiáng)大的PHP整合開(kāi)發(fā)環(huán)境

Dreamweaver CS6

Dreamweaver CS6

視覺(jué)化網(wǎng)頁(yè)開(kāi)發(fā)工具

SublimeText3 Mac版

SublimeText3 Mac版

神級(jí)程式碼編輯軟體(SublimeText3)

熱門(mén)話(huà)題

AGI和AI超級(jí)智能將嚴(yán)重?fù)糁腥祟?lèi)天花板的假設(shè)障礙 AGI和AI超級(jí)智能將嚴(yán)重?fù)糁腥祟?lèi)天花板的假設(shè)障礙 Jul 04, 2025 am 11:10 AM

讓我們來(lái)談?wù)劇? 對(duì)創(chuàng)新AI突破的分析是我正在進(jìn)行的AI中正在進(jìn)行的福布斯列覆蓋的一部分,包括識(shí)別和解釋各種有影響力的AI複雜性(請(qǐng)參閱此處的鏈接)。 前往Agi和

Kimi K2:最強(qiáng)大的開(kāi)源代理模型 Kimi K2:最強(qiáng)大的開(kāi)源代理模型 Jul 12, 2025 am 09:16 AM

還記得今年早些時(shí)候破壞了Genai行業(yè)的大量開(kāi)源中國(guó)模型嗎??jī)嵐蹹eepSeek佔(zhàn)據(jù)了大多數(shù)頭條新聞,但Kimi K1.5是列表中的重要名字之一。模型很酷。

Grok 4 vs Claude 4:哪個(gè)更好? Grok 4 vs Claude 4:哪個(gè)更好? Jul 12, 2025 am 09:37 AM

到2025年中期,AI“軍備競(jìng)賽”正在加熱,XAI和Anthropic都發(fā)布了他們的旗艦車(chē)型Grok 4和Claude 4。這兩種模型處?kù)对O(shè)計(jì)理念和部署平臺(tái)的相反端,但他們卻在

深入探討人工智能如何幫助和危害各行各業(yè) 深入探討人工智能如何幫助和危害各行各業(yè) Jul 04, 2025 am 11:11 AM

我們將討論:公司開(kāi)始委派AI的工作職能,以及那些最不可能用人工智能替代的角色AI如何重塑行業(yè)和就業(yè),以及企業(yè)和工人的工作方式。

英超聯(lián)賽發(fā)揮了AI播放來(lái)增強(qiáng)球迷的體驗(yàn) 英超聯(lián)賽發(fā)揮了AI播放來(lái)增強(qiáng)球迷的體驗(yàn) Jul 03, 2025 am 11:16 AM

7月1日,英格蘭頂級(jí)足球聯(lián)盟(England)與一家主要科技公司揭示了為期五年的合作,以創(chuàng)建比簡(jiǎn)單的亮點(diǎn)捲軸更先進(jìn)的東西:一種由實(shí)時(shí)AI驅(qū)動(dòng)的工具,可為EV提供個(gè)性化的更新和互動(dòng)

今天已經(jīng)在我們中間走了10個(gè)驚人的人形機(jī)器人 今天已經(jīng)在我們中間走了10個(gè)驚人的人形機(jī)器人 Jul 16, 2025 am 11:12 AM

但是我們可能甚至不必等10年就可以看到一個(gè)。實(shí)際上,可以被認(rèn)為是真正有用的,類(lèi)人類(lèi)機(jī)器的第一波。 近年來(lái),有許多原型和生產(chǎn)模型從T中走出來(lái)

上下文工程是' new'及時(shí)的工程 上下文工程是' new'及時(shí)的工程 Jul 12, 2025 am 09:33 AM

直到上一年,迅速的工程被認(rèn)為是與大語(yǔ)言模型(LLM)互動(dòng)的關(guān)鍵技能。然而,最近,LLM在推理和理解能力方面已經(jīng)顯著提高。自然,我們的期望

Chip Ganassi Racing宣布Openai為中俄亥俄州IndyCar贊助商 Chip Ganassi Racing宣布Openai為中俄亥俄州IndyCar贊助商 Jul 03, 2025 am 11:17 AM

Openai是世界上最傑出的人工智能組織之一,將成為由三屆NTT IndyCar系列冠軍和2025 Indianapolis 500冠軍Alex PA驅(qū)動(dòng)的第10號(hào)Chip Ganassi Racing(CGR)本田的主要合作夥伴

See all articles