BAGEL







產(chǎn)品信息
什么是百吉餅?
Bagel by bytedance-seed是Apache 2.0開源統(tǒng)一的多模型,旨在高級圖像/文本理解,生成,編輯和導航。它提供的功能可與GPT-4O和Gemini 2.0等專有系統(tǒng)相媲美。百吉餅可以在任何地方進行微調,蒸餾和部署,通過其本質的多模式結構提供精確,準確和逼真的輸出。
如何使用百吉餅?
百吉餅可以通過其統(tǒng)一的多模式接口使用,以混合格式接受圖像和文本輸入和輸出。用戶可以從事多轉交談,生成高保真圖像和視頻幀,執(zhí)行圖像編輯,應用樣式傳輸,導航虛擬環(huán)境,并通過提供提示并與模型進行交互來利用其組成和思維模式。
百吉餅的核心特征
統(tǒng)一的多模式模型
圖像/文字理解
圖像/文本生成(影像圖像,視頻幀)
圖像編輯(保存視覺標識和細節(jié))
樣式轉移
導航(在不同的環(huán)境中)
組成能力(多轉交談)
思考模式(通過推理增強產(chǎn)生和編輯)
從大語模型初始化的預訓練
轉變器 - 專家(MOT)體系結構的混合物
百吉餅的用例
描述和理解圖像(例如,“告訴我這張照片”)
從文本提示中生成逼真的圖像(例如,“三個古董玻璃魔藥的照片”)
在保存細節(jié)的同時編輯圖像(例如,“他蹲下并觸摸了狗的頭”)
轉換圖像樣式(例如,“更改為3D動畫樣式”)
導航和與虛擬環(huán)境進行互動(例如,“ 0.40之后,前進”)
通過構圖推理進行多轉交談(例如,為一個娃娃創(chuàng)建口號)
完善提示,使用“思考”模式來詳細且相干的視覺輸出
百吉餅公司
百吉餅公司的名稱:bytedance。
百吉餅github
Bagel Github鏈接:https://github.com/bytedance-seed/bagel
相關資源

熱門文章
前7個筆記本替代品
1 個月前
By Jack chen
Pyscript:輕松在瀏覽器中運行Python -Analytics Vidhya
2 個月前
By Jack chen
AI投資者停滯不前? 3條購買,建造或與人工智能供應商合作的戰(zhàn)略途徑
1 個月前
By DDD
從采用到優(yōu)勢:2025年塑造企業(yè)LLM的10個趨勢
1 個月前
By DDD
Alphafold 3將建模能力擴展到更多的生物學靶標
1 個月前
By DDD