久久久久久亚洲精品不卡,欧美日韩精品一区二区视频,亚洲国产午夜精品理论片

2。信頼性、スケーラビリティ、および効率

テキスト要約

結(jié)論

次のリソースで學(xué)習(xí)を続けます。

ホームページ

テクノロジー周辺機(jī)器

Google Geminiとは何ですか？ GoogleのChatGptのライバルについて知る必要があるすべて

Lisa Kudrow

Mar 08, 2025 am 09:32 AM

Googleは最近、新しい生成AIモデルであるGeminiをリリースしました。 Google Researchのメンバーを含むGoogleのさまざまなチームによる共同の取り組みから生じます。 Googleがこれまでに開(kāi)発した最も有能で汎用的なAIと呼んでいるモデルは、マルチモーダルになるように設(shè)計(jì)されています。これは、ジェミニがテキスト、オーディオ、畫(huà)像、ビデオ、コードなどのさまざまなデータ型を理解できることを意味します。この記事の殘りについては、説明します。

geminiとは？

geminiのバージョンは何ですか？

に探索されました
Gemini
Google Geminiは何ですか？
2023年12月6日、Google DeepmindはGemini 1.0を発表しました。リリースされると、Googleはそれを最も高度な大規(guī)模な言語(yǔ)モデル（LLMS）として説明したため、同じ年の5月にデビューした経路Langaugeモデル（Palm 2）に取って代わりました。

楽しい事実：Googleの共同設(shè)立者であるSergey Brinは、Geminiモデルの貢獻(xiàn)者の1人として稱されています。

最近まで、マルチモーダルモデルを開(kāi)発するための標(biāo)準(zhǔn)的な手順は、さまざまなモダリティの個(gè)々のコンポーネントをトレーニングし、それらをつなぎ合わせて機(jī)能の一部を模倣して構(gòu)成されていました。このようなモデルは、畫(huà)像の説明などの特定のタスクの実行に時(shí)々優(yōu)れていますが、より洗練された複雑な推論に問(wèn)題があります。

ジェミニは、ネイティブにマルチモーダルになるように設(shè)計(jì)されています。したがって、それは最初からいくつかのモダリティで事前に訓(xùn)練されていました。その有効性をさらに改善するために、Googleは追加のマルチモーダルデータで微調(diào)整しました。 GoogleおよびAlphabetのCEOであるSundar PichaiとGoogle DeepmindのCEO兼共同設(shè)立であるDemis Hassabisによると、Geminiは、ゼロからの幅広い入力についての理解と推論において、既存のマルチモーダルモデルよりもかなり能力があります。彼らはまた、ジェミニの能力は「ほぼすべてのドメインの最先端」であると述べています。

Google Geminiキー機(jī)能

Geminiモデルの主要な機(jī)能には次のものが含まれます 1。テキスト、畫(huà)像、オーディオ、およびその他の理解を理解しますマルチモーダルAIは、より高いパフォーマンスを?qū)g現(xiàn)するために異なるデータ型を複數(shù)のアルゴリズムと統(tǒng)合する新しいAIパラダイムを獲得する新しいAIパラダイムです。 Geminiはこのパラダイムを活用します。つまり、さまざまなデータ型とうまく統(tǒng)合されています。畫(huà)像、オーディオ、テキスト、その他のデータ型を入力して、より自然なAIの相互作用をもたらすことができます。

2。信頼性、スケーラビリティ、および効率

GeminiはGoogleのTPUV5チップを活用しているため、GPT-4よりも5倍強(qiáng)力になっていると伝えられています。処理をより高速にすると、Geminiは複雑なタスクに比較的簡(jiǎn)単に取り組むことができ、複數(shù)のリクエストを同時(shí)に処理できます。
3。洗練された推論

ジェミニは、テキストとコードの膨大なデータセットで訓(xùn)練されました。これにより、モデルが最新の情報(bào)にアクセスし、クエリに対して正確で信頼できる応答を提供できるようになります。 Googleによると、このモデルは、さまざまなインテリジェンステスト（MMLUベンチマークなど）でOpenaiのGPT-4および「専門(mén)家レベル」の人間を上回ります。
4。 Advanced Coding

gemini 1.0は、Python、Java、C、Goなど、最も広く使用されているプログラミング言語(yǔ)で高品質(zhì)のコードを理解、説明、生成できます。これにより、グローバルにコーディングするための主要な基礎(chǔ)モデルの1つになります。
このモデルは、コーディングタスクのパフォーマンスを評(píng)価するための高度に想定されている業(yè)界標(biāo)準(zhǔn)であるHumanvalを含む、いくつかのコーディングベンチマークにも優(yōu)れています。また、Webからの情報(bào)の代わりに著者生成コードを活用するGoogleの內(nèi)部的な保有データセットでもうまく機(jī)能しました。
5。責(zé)任と安全

Geminiのマルチモーダル機(jī)能を説明するために、GoogleのAI原則とポリシーに新しい保護(hù)が追加されました。 Googleは、「Geminiには、バイアスや毒性を含め、これまでのGoogle AIモデルの最も包括的な安全性評(píng)価があります?！贡摔椁悉蓼?、「サイバー攻撃、説得、自律性などの潛在的なリスク分野の新しい研究を?qū)g施し、Geminiの展開(kāi)に先立って重要な安全性の問(wèn)題を特定するために、Google Researchのクラス最高の敵対的テスト技術(shù)を適用した」と述べました。
geminiのバージョンは何ですか？

Googleは、LamdaとPalm 2の後継者であるGeminiは、「これまでで最も柔軟なモデルであり、データセンターからモバイルデバイスまであらゆるものを効率的に実行できる」と言います。彼らはまた、ジェミニの最先端の機(jī)能により、開(kāi)発者とビジネスクライアントがAIを構(gòu)築および拡大する方法を改善すると考えています。
ジェミニの最初のバージョン、當(dāng)然のことながらジェミニ1.0という名前は、3つの異なるサイズでリリースされました。

gemini nano - ジェミニナノは、外部サーバーに接続せずに効率的なAI処理を必要とするデバイス上のタスクの最も効率的なモデルです。言い換えれば、スマートフォン、特にGoogle Pixel 8で実行するように設(shè)計(jì)されています。

gemini pro - gemini proは、さまざまなタスクにわたってスケーリングするための最適なモデルです。 Googleの最新のAIチャットボットであるBardをパワーバードするように設(shè)計(jì)されています。したがって、複雑なクエリを理解し、迅速に応答できます
gemini ultra
- ジェミニウルトラは、複雑なタスクの最大かつ最も有能なモデルであり、大規(guī)模な言語(yǔ)モデル（LLM）の研究と開(kāi)発のための32の一般的に使用されているベンチマークのうち30を超える現(xiàn)在の最先端の結(jié)果を超えています。どのようにしてジェミニにアクセスできますか？

2023年12月13日以來(lái)、開(kāi)発者とエンタープライズの顧客は、Google AI StudioまたはGoogle Cloud Vertex AIのGeminiのAPIを介してGemini Proにアクセスすることができました。?

Google AI Studioは、開(kāi)発者が生成モデルをプロトタイプに使用し、APIキーを使用してアプリケーションを簡(jiǎn)単に起動(dòng)できるように使用できる自由に利用可能なブラウザベースのIDEです。一方、Google Cloud Vertexは、生成AIの構(gòu)築と使用に必要なすべてのツールを提供する完全に管理されたAIプラットフォームです。 Googleによると、「Vertex AIは、エンタープライズセキュリティ、安全性、プライバシー、データガバナンス、コンプライアンスのための追加のGoogleクラウド機(jī)能からの完全なデータ制御と利點(diǎn)を備えたGeminiのカスタマイズを許可します。」
Android 14を備えた新しいシステム機(jī)能、Android Developersは、Pixel 8 Pro Devicesから始まるAndroid開(kāi)発者を介して、デバイス上のタスクに最も効率的なモデルであるGemini Nanoで構(gòu)築できます。
geminiベンチマークは
に探索されました
ジェミニモデルは、リリース前に広範(fàn)なタスクにわたってパフォーマンスを評(píng)価するために広範(fàn)なテストを受けました。 Googleは、Gemini Ultra Modelが、大規(guī)模な言語(yǔ)モデル（LLM）の研究と開(kāi)発のための32の一般的に使用されている學(xué)術(shù)ベンチマークのうち30の既存の最先端の結(jié)果を上回ると言います。これらのタスクは、自然像、オーディオ、ビデオの理解から數(shù)學(xué)的な推論に及びます。
Geminiの紹介ブログ投稿で、GoogleはGemini Ultraが90.0％のスコアで大規(guī)模なマルチタスク言語(yǔ)理解（MMLU）で人間の専門(mén)家を上回る史上初のモデルであると主張しています。 MMLUには、問(wèn)題を解決する能力と世界の一般的な理解を評(píng)価するために、數(shù)學(xué)、物理學(xué)、歴史、法律、醫(yī)學(xué)、倫理を含む57の異なる主題が組み込まれていることに注意してください。
MMLUへの新しいMMLUベンチマークメソッドにより、Geminiは、挑戦的な質(zhì)問(wèn)に対応する前に、その推論力を使用してより徹底的に審議することにより、その第一印象を単に活用するだけでなく、大幅な改善を行うことができます。
ジェミニがテキストタスクでどのように実行したかは次のとおりです

調(diào)査結(jié)果は、ジェミニがテキストやコーディングを含む幅広いベンチマークで最先端のパフォーマンスを上回っていることを明らかにしています。 [ソース]

ジェミニウルトラモデルは、59.4％のスコアで、新しい大規(guī)模なマルチディシプラインマルチモーダル理解（MMMU）ベンチマークで最先端を達(dá)成しました。この評(píng)価は、意図的な推論を必要とするさまざまなドメインにわたるマルチモーダルタスクで構(gòu)成されています。
Googleは言った、「私たちがテストした畫(huà)像ベンチマークで、Gemini Ultraは、畫(huà)像からテキストを抽出する光學(xué)文字認(rèn)識(shí)（OCR）システムからの支援なしで、以前の最先端モデルよりも優(yōu)れていました。」

調(diào)査結(jié)果は、ジェミニが幅広いマルチモーダルベンチマークで最先端のパフォーマンスを上回っていることを明らかにしています。?[ソース]

Geminiによって設(shè)定されたベンチマークは、モデルの生來(lái)のマルチモダリティを示し、より洗練された推論の能力の初期の証拠を示しています。 gemini vs. gpt-4
次に発生する明らかな質(zhì)問(wèn)は、「ジェミニはGPT-4とどのように比較されますか？」
です。
両方のモデルには同様の機(jī)能セットがあり、テキスト、畫(huà)像、ビデオ、オーディオ、およびコードデータと対話して解釈できるため、ユーザーはさまざまなタスクに適用できます。両方のツールのユーザーには、ファクトチェックするオプションがありますが、この機(jī)能を提供する方法は異なります。 OpenaiのGPT-4が主張するソースリンクを提供する場(chǎng)合、GeminiはユーザーがGoogle検索を?qū)g行してボタンをクリックして応答を確認(rèn)できます。
追加の拡張機(jī)能で両方のモデルを増強(qiáng)することもできますが、執(zhí)筆時(shí)點(diǎn)では、GoogleのGeminiモデルははるかに制限されています。たとえば、
フライト、マップ、YouTube、Geminiとのワークスペースアプリケーションの範(fàn)囲などのGoogleツールを利用することができます。対照的に、OpenAIのGPT-4で利用できるプラグインと拡張機(jī)能のはるかに大きく選択されており、そのほとんどはサードパーティによって作成されています。 GPT-4では、オンザフライ畫(huà)像作成も可能です。 Geminiはそのような機(jī)能が可能になるように設(shè)計(jì)されていますが、執(zhí)筆時(shí)點(diǎn)ではできません。一方、ジェミニの応答時(shí)間はGPT-4の応答時(shí)間よりも速く、プラットフォーム上のユーザーの量が膨大な量のために遅くなったり、完全に中斷することがあります。 Gemini
の使用ケース

GoogleのGeminiモデルは、テキスト、オーディオ、畫(huà)像、ビデオの理解など、いくつかのモダリティでさまざまなタスクを?qū)g行できます。 Geminiのマルチモーダルの性質(zhì)により、さまざまなモダリティを組み合わせて出力を理解および生成することも可能です。
geminiのユースケースの例は次のとおりです
テキスト要約

Geminiモデルは、さまざまなデータ型からコンテンツを要約できます。 Gemini：抽象的なテキスト要約における文レベルの要約スタイルを制御するタイトルの研究論文によると、Geminiモデルは「書(shū)き換えと発電機(jī)をそれぞれ統(tǒng)合して、それぞれテクニックを書(shū)き直し、抽象化するテクニックを模倣します?！?
すなわち、Geminiは、特定のドキュメント文を書(shū)き換えるか、概要の文を完全にゼロから生成するかどうかを適応的に選択します。実験の結(jié)果は、ジェミニが使用したアプローチが3つのベンチマークデータセットで純粋な抽象的で書(shū)き換えたベースラインを上回り、wikihowで最良の結(jié)果を達(dá)成したことを明らかにしました。
テキスト生成

Geminiは、ユーザープロンプトに応じてテキストベースの入力を生成できます。このテキストは、Q＆Aスタイルのチャットボットインターフェイスによっても駆動(dòng)できます。したがって、geminiを展開(kāi)して顧客の問(wèn)い合わせを処理し、自然でありながら魅力的な方法で支援を提供します。これにより、人間のエージェントの責(zé)任を解放して、複雑なタスクにもっと適用し、顧客満足度を向上させることができます。また、小説を共同執(zhí)筆したり、さまざまなスタイルで詩(shī)を書(shū)いたり、映畫(huà)や演劇のスクリプトを生成するなど、創(chuàng)造的な執(zhí)筆にも使用される場(chǎng)合があります。これにより、創(chuàng)造的な作家の生産性が大幅に向上し、作家のブロックによって引き起こされる緊張を減らすことができます。
テキストの翻訳とオーディオ?jiǎng)I理

幅広い多言語(yǔ)機(jī)能により、ジェミニモデルは100以上の異なる言語(yǔ)を理解して翻訳することができます。 Googleによると、Geminiは、自動(dòng)音聲認(rèn)識(shí)（ASR）や自動(dòng)音聲翻訳など、「さまざまなマルチモーダルベンチマークでGPT-4Vの最先端のパフォーマンスをチャットします。
畫(huà)像とビデオ?jiǎng)I理

ジェミニは畫(huà)像を理解して解釈することができ、畫(huà)像のキャプションと視覚的なQ＆Aユースケースに適しています。モデルは、外部OCRツールを必要とせずに、図、図、チャートなどの複雑なビジュアルを解析することもできます。
コード分析と生成

開(kāi)発者は、Geminiを使用して複雑なコーディングタスクを解決し、コードをデバッグできます。このモデルは、Python、Java、C、Goなど、最も使用されているプログラミング言語(yǔ)で理解、説明、生成することができます。
結(jié)論

Googleのマルチモーダル大手言語(yǔ)モデル（LLMS）の新しいセット、GeminiはLamdaとPalm 2の後継者です。ジェミニは、最も人気のあるプログラミング言語(yǔ)の多くで高品質(zhì)のコードを生成することもできます。
このモデルは、さまざまなタスクで最先端の機(jī)能を達(dá)成しており、Googleの多くは、AIが日常生活を改善するのに役立つ方法に大きな跳躍を表していると考えています。
次のリソースで學(xué)習(xí)を続けます。

llamaindex：LLMSに個(gè)人データの追加

今日試すことができるトップ10のchatgptの代替品

chatgptの紹介

そして、行く前に、YouTubeチャンネルを購(gòu)読することを忘れないでください。 Geminiでマルチモーダルアプリを構(gòu)築する方法に関するチュートリアルなど、最も関連性の高いトレンドのトピックに優(yōu)れたコンテンツがあります。

以上がGoogle Geminiとは何ですか？ GoogleのChatGptのライバルについて知る必要があるすべての詳細(xì)內(nèi)容です。詳細(xì)については、PHP 中國(guó)語(yǔ) Web サイトの他の関連記事を參照してください。

このウェブサイトの聲明

この記事の內(nèi)容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰屬します。このサイトは、それに相當(dāng)する法的責(zé)任を負(fù)いません。盜作または侵害の疑いのあるコンテンツを見(jiàn)つけた場(chǎng)合は、admin@php.cn までご連絡(luò)ください。