亚洲国产日韩欧美一区二区三区,精品亚洲国产成人av在线,国产99视频精品免视看7,99国产精品久久久久久久成人热,欧美日韩亚洲国产综合乱

目錄
準(zhǔn)備工作
步驟1:獲取最新A輪融資初創(chuàng)公司的列表
步驟2:查找職業(yè)頁面
步驟3:抓取開放職位
首頁 後端開發(fā) Python教學(xué) 使用Python和LLM搜索啟動作業(yè)

使用Python和LLM搜索啟動作業(yè)

Jan 27, 2025 pm 08:15 PM

Search startup jobs with Python and LLMs

許多公司網(wǎng)站發(fā)布的職位信息,在主流求職網(wǎng)站上並不總是能找到。例如,尋找遠(yuǎn)程初創(chuàng)公司的工作可能具有挑戰(zhàn)性,因為這些公司甚至可能未在求職網(wǎng)站上列出。要找到這些工作,您需要:

  • 尋找有潛力的公司
  • 搜索他們的職業(yè)頁面
  • 分析可用的職位列表
  • 手動記錄職位詳細(xì)信息

這非常耗時,但我們將對其進(jìn)行自動化。

準(zhǔn)備工作

我們將使用Parsera庫來自動化職位抓取。 Parsera提供兩種使用選項:

  • 本地模式: 使用您選擇的LLM在您的機(jī)器上處理頁面;
  • API模式: 所有處理都在Parsera的服務(wù)器上進(jìn)行。

在本例中,我們將使用本地模式,因為這是一個一次性的、小規(guī)模的提取。

首先,安裝所需的軟件包:

<code>pip install parsera
playwright install</code>

由於我們正在運(yùn)行本地設(shè)置,因此需要LLM連接。為簡便起見,我們將使用OpenAI的gpt-4o-mini,只需要設(shè)置一個環(huán)境變量:

<code>import os
from parsera import Parsera

os.environ["OPENAI_API_KEY"] = "<your_openai_api_key_here>"

scraper = Parsera(model=llm)
</your_openai_api_key_here></code>

一切設(shè)置完成後,我們就可以開始抓取了。

步驟1:獲取最新A輪融資初創(chuàng)公司的列表

首先,我們需要找到我們感興趣的公司及其網(wǎng)站列表。我找到了一份上個月完成A輪融資的100家初創(chuàng)公司的列表。增長型公司和新一輪融資的公司似乎是不錯的選擇。

讓我們獲取這些公司的國家和網(wǎng)站:

<code>url = "https://growthlist.co/series-a-startups/"
elements = {
    "Website": "公司的網(wǎng)站",
    "Country": "公司的國家",
}
all_startups = await scraper.arun(url=url, elements=elements)</code>

有了國家信息,我們可以過濾我們感興趣的國家。讓我們將搜索範(fàn)圍縮小到美國:

<code>us_websites = [
    item["Website"] for item in all_startups if item["Country"] == "United States"
]</code>

步驟2:查找職業(yè)頁面

現(xiàn)在,我們有了一個來自美國的A輪融資初創(chuàng)公司網(wǎng)站列表。下一步是找到他們的職業(yè)頁面。我們將直接從他們的主頁提取職業(yè)頁面:

<code>from urllib.parse import urljoin

# 定義我們的目標(biāo)
careers_target = {"url": "職業(yè)頁面網(wǎng)址"}

careers_pages = []
for website in us_websites:
    website = "https://" + website
    result = await scraper.arun(url=website, elements=careers_target)
    if len(result) > 0:
        url = result[0]["url"]
        if url.startswith("/") or url.startswith("./"):
            url = urljoin(website, url)
        careers_pages.append(url)</code>

請注意,可以選擇使用搜索API替換此步驟,用搜索調(diào)用替換LLM調(diào)用。

步驟3:抓取開放職位

最後一步是從網(wǎng)站的職業(yè)頁面加載所有開放職位。假設(shè)我們正在尋找軟件工程職位,那麼我們將查找職位名稱、地點、鏈接以及它是否與軟件工程相關(guān):

<code>jobs_target = {
    "Title": "職位的名稱",
    "Location": "職位的所在地",
    "Link": "職位發(fā)布的鏈接",
    "SE": "如果這是軟件工程職位,則為True,否則為False",
}

jobs = []
for page in careers_pages:
    result = await scraper.arun(url=page, elements=jobs_target)
    if len(result) > 0:
        for row in result:
            row["url"] = page
            row["Link"] = urljoin(row["url"], row["Link"])
    jobs.extend(result)</code>

所有職位都已提取,我們可以過濾掉所有非軟件工程職位並將它們保存到.csv文件中:

<code>import csv

engineering_jobs = [job for job in jobs if job["SE"] == "True"]

with open("jobs.csv", "w") as f:
    write = csv.writer(f)
    write.writerow(engineering_jobs[0].keys())
    for job in engineering_jobs:
        write.writerow(job.values())
</code>

最後,我們得到一個包含職位列表的表格,如下所示:

職位名稱 所在地 鏈接 軟件工程職位 網(wǎng)址
AI技術(shù)主管經(jīng)理 班加羅爾 https://job-boards.greenhouse.io/enterpret/jobs/6286095003 True https://boards.greenhouse.io/enterpret/
后端開發(fā)人員 特拉維夫 https://www.upwind.io/careers/co/tel-aviv/BA.04A/backend-developer/all#jobs True https://www.upwind.io/careers
... ... ... ... ...
結(jié)論 ------------

下一步,我們可以重複相同的過程來從完整的職位清單中提取更多資訊。例如,取得技術(shù)堆疊或過濾遠(yuǎn)端新創(chuàng)公司的工作。這將節(jié)省手動查看所有頁面的時間。您可以嘗試自行迭代Link字段並提取您感興趣的元素。

希望您覺得這篇文章有幫助,如果您有任何問題,請告訴我。

以上是使用Python和LLM搜索啟動作業(yè)的詳細(xì)內(nèi)容。更多資訊請關(guān)注PHP中文網(wǎng)其他相關(guān)文章!

本網(wǎng)站聲明
本文內(nèi)容由網(wǎng)友自願投稿,版權(quán)歸原作者所有。本站不承擔(dān)相應(yīng)的法律責(zé)任。如發(fā)現(xiàn)涉嫌抄襲或侵權(quán)的內(nèi)容,請聯(lián)絡(luò)admin@php.cn

熱AI工具

Undress AI Tool

Undress AI Tool

免費脫衣圖片

Undresser.AI Undress

Undresser.AI Undress

人工智慧驅(qū)動的應(yīng)用程序,用於創(chuàng)建逼真的裸體照片

AI Clothes Remover

AI Clothes Remover

用於從照片中去除衣服的線上人工智慧工具。

Clothoff.io

Clothoff.io

AI脫衣器

Video Face Swap

Video Face Swap

使用我們完全免費的人工智慧換臉工具,輕鬆在任何影片中換臉!

熱工具

記事本++7.3.1

記事本++7.3.1

好用且免費的程式碼編輯器

SublimeText3漢化版

SublimeText3漢化版

中文版,非常好用

禪工作室 13.0.1

禪工作室 13.0.1

強(qiáng)大的PHP整合開發(fā)環(huán)境

Dreamweaver CS6

Dreamweaver CS6

視覺化網(wǎng)頁開發(fā)工具

SublimeText3 Mac版

SublimeText3 Mac版

神級程式碼編輯軟體(SublimeText3)

熱門話題

Laravel 教程
1597
29
PHP教程
1488
72
Python類中的多態(tài)性 Python類中的多態(tài)性 Jul 05, 2025 am 02:58 AM

多態(tài)是Python面向?qū)ο缶幊讨械暮诵母拍睿浮耙环N接口,多種實現(xiàn)”,允許統(tǒng)一處理不同類型的對象。 1.多態(tài)通過方法重寫實現(xiàn),子類可重新定義父類方法,如Animal類的speak()方法在Dog和Cat子類中有不同實現(xiàn)。 2.多態(tài)的實際用途包括簡化代碼結(jié)構(gòu)、增強(qiáng)可擴(kuò)展性,例如圖形繪製程序中統(tǒng)一調(diào)用draw()方法,或遊戲開發(fā)中處理不同角色的共同行為。 3.Python實現(xiàn)多態(tài)需滿足:父類定義方法,子類重寫該方法,但不要求繼承同一父類,只要對象實現(xiàn)相同方法即可,這稱為“鴨子類型”。 4.注意事項包括保持方

解釋Python發(fā)電機(jī)和迭代器。 解釋Python發(fā)電機(jī)和迭代器。 Jul 05, 2025 am 02:55 AM

迭代器是實現(xiàn)__iter__()和__next__()方法的對象,生成器是簡化版的迭代器,通過yield關(guān)鍵字自動實現(xiàn)這些方法。 1.迭代器每次調(diào)用next()返回一個元素,無更多元素時拋出StopIteration異常。 2.生成器通過函數(shù)定義,使用yield按需生成數(shù)據(jù),節(jié)省內(nèi)存且支持無限序列。 3.處理已有集合時用迭代器,動態(tài)生成大數(shù)據(jù)或需惰性求值時用生成器,如讀取大文件時逐行加載。注意:列表等可迭代對像不是迭代器,迭代器到盡頭後需重新創(chuàng)建,生成器只能遍歷一次。

如何處理Python中的API身份驗證 如何處理Python中的API身份驗證 Jul 13, 2025 am 02:22 AM

處理API認(rèn)證的關(guān)鍵在於理解並正確使用認(rèn)證方式。 1.APIKey是最簡單的認(rèn)證方式,通常放在請求頭或URL參數(shù)中;2.BasicAuth使用用戶名和密碼進(jìn)行Base64編碼傳輸,適合內(nèi)部系統(tǒng);3.OAuth2需先通過client_id和client_secret獲取Token,再在請求頭中帶上BearerToken;4.為應(yīng)對Token過期,可封裝Token管理類自動刷新Token;總之,根據(jù)文檔選擇合適方式,並安全存儲密鑰信息是關(guān)鍵。

解釋Python斷言。 解釋Python斷言。 Jul 07, 2025 am 12:14 AM

Assert是Python用於調(diào)試的斷言工具,當(dāng)條件不滿足時拋出AssertionError。其語法為assert條件加可選錯誤信息,適用於內(nèi)部邏輯驗證如參數(shù)檢查、狀態(tài)確認(rèn)等,但不能用於安全或用戶輸入檢查,且應(yīng)配合清晰提示信息使用,僅限開發(fā)階段輔助調(diào)試而非替代異常處理。

如何一次迭代兩個列表 如何一次迭代兩個列表 Jul 09, 2025 am 01:13 AM

在Python中同時遍歷兩個列表的常用方法是使用zip()函數(shù),它會按順序配對多個列表並以最短為準(zhǔn);若列表長度不一致,可使用itertools.zip_longest()以最長為準(zhǔn)並填充缺失值;結(jié)合enumerate()可同時獲取索引。 1.zip()簡潔實用,適合成對數(shù)據(jù)迭代;2.zip_longest()處理不一致長度時可填充默認(rèn)值;3.enumerate(zip())可在遍歷時獲取索引,滿足多種複雜場景需求。

什麼是Python迭代器? 什麼是Python迭代器? Jul 08, 2025 am 02:56 AM

Inpython,IteratorSareObjectSthallowloopingThroughCollectionsByImplementing_iter __()和__next __()。 1)iteratorsWiaTheIteratorProtocol,使用__ITER __()toreTurnterateratoratoranteratoratoranteratoratorAnterAnteratoratorant antheittheext__()

什麼是Python型提示? 什麼是Python型提示? Jul 07, 2025 am 02:55 AM

typeHintsInpyThonsolverbromblemboyofambiguityandPotentialBugSindyNamalytyCodeByallowingDevelopsosteSpecefectifyExpectedTypes.theyenhancereadability,enablellybugdetection,andimprovetool.typehintsupport.typehintsareadsareadsareadsareadsareadsareadsareadsareadsareaddedusidocolon(

Python Fastapi教程 Python Fastapi教程 Jul 12, 2025 am 02:42 AM

要使用Python創(chuàng)建現(xiàn)代高效的API,推薦使用FastAPI;其基於標(biāo)準(zhǔn)Python類型提示,可自動生成文檔,性能優(yōu)越。安裝FastAPI和ASGI服務(wù)器uvicorn後,即可編寫接口代碼。通過定義路由、編寫處理函數(shù)並返回數(shù)據(jù),可以快速構(gòu)建API。 FastAPI支持多種HTTP方法,並提供自動生成的SwaggerUI和ReDoc文檔系統(tǒng)。 URL參數(shù)可通過路徑定義捕獲,查詢參數(shù)則通過函數(shù)參數(shù)設(shè)置默認(rèn)值實現(xiàn)。合理使用Pydantic模型有助於提升開發(fā)效率和準(zhǔn)確性。

See all articles