グーグル、Gemini 2.5正式提供を開始――最速・最安モデル「Flash-Lite」も公開である

Gemini 2.5
目次

はじめに

  • Gemini 2.5シリーズに追加された各モデルの特徴と用途が分かる
  • Flash/Flash-Liteの新価格体系とコストインパクトを把握できる
  • 「思考(reasoning)機能」のオン/オフが現場の選定基準になる理由を理解できる

1. 最速・最安のFlash-Lite、分類や要約タスクに最適である

米グーグルは米国時間2025年6月17日、大規模言語モデル「Gemini 2.5」ファミリーの正式版(GA)をリリースし、あわせてプレビュー版として「Gemini 2.5 Flash-Lite」を投入した。

Flash-Liteは処理速度とコスト効率を最重視した設計で、「思考モデル」──出力前に一時的な内省プロセスを走らせる推論機能──をデフォルトで無効化している。

このため、高スループットで単純処理が主体の分類・要約ワークロードに好適であるとされる。

Flash-Liteの主要仕様

項目内容
コンテキスト長1 Mトークン
思考機能デフォルト無効(有効化不可)
想定タスク一括分類、要約、システムメッセージ生成など
価格(有料ティア)入力0.10 USD/100万トークン、出力0.40 USD/100万トークン

Flash-Liteは既存のGemini 1.5/2.0 Flash-Liteから容易に乗り換え可能とされ、リアルタイム処理やバッチ分析系のツール開発に追い風となる見込みである。

2. FlashとProは安定版に昇格――価格改定で入力高騰・出力値下がりである

同日、プレビューだった「Gemini 2.5 Flash」「Gemini 2.5 Pro」も安定版へ移行した。

特にFlash GA版は「価値向上」を理由に価格体系が変更され、入力単価が0.15 USD→0.30 USD/100万トークンと2倍に、出力単価は3.50 USD→2.50 USDへと下がった。

これにより推論コストの中心が「生成側」から「入力側」へシフトし、プロンプトサイズの最適化がコスト管理の鍵となる。

一方Proモデルは価格据え置きで、長大コンテキストでの高度なコーディング支援やエージェント型タスク向けに位置付けられている。

3. 用途分化が進むGemini 2.5――AI導入の裾野さらに拡大である

モデル位置付け主なユースケース入力/出力価格(USD, 1M tokens)
2.5 Flash-Lite (Preview)超高速・低コスト分類、要約、大量チャット0.10 / 0.40
2.5 Flash (GA)バランス型ストリーミング生成、対話ボット0.30 / 2.50
2.5 Pro (GA)高精度・高機能複雑なコーディング、エージェント1.25〜 / 10.00〜

これにより開発者は速度重視バランス重視品質重視の三択から最適モデルを選定できる。

特にFlash-Liteは「思考オフ」による低レイテンシが魅力で、チャットボットやモデレーションAPI、ログ分析ツールなどのリアルタイムシステムでの採用が見込まれる。

一方で複雑な文脈理解やクリエイティブ生成ではPro/Flash+思考オンの方が品質が高く、評価指標(品質KPI)ごとの切り分けが欠かせない。

現在、すべてのモデルはGoogle AI StudioとVertex AIで提供され、FlashとProはGeminiアプリ経由でも利用可能である。

今後の実運用フィードバックがモデル改良の鍵を握るだろう。

今後の注目ポイント

  1. Flash-Liteのパフォーマンス検証:公開ベンチマークでどこまでFlash GAに迫れるか
  2. 価格最適化戦略:入力コスト高騰へのプロンプト圧縮やRAG導入効果
  3. 思考機能の設定指針:フラグ制御による「速度と品質のトレードオフ」最適解探し

Gemini 2.5シリーズの用途分化は生成AIの導入障壁をさらに下げ、より多様な業務シナリオでの実装を後押しする見通しである。

よかったらシェアしてね!
  • URLをコピーしました!
  • URLをコピーしました!

この記事を書いた人

株式会社LINK代表。
日々、ChatGPT・Claude・Gemini・Notionなどの最新AIツールを駆使し、記事作成や業務効率化、プライベートにも積極的に活用中。
当メディアでは、AIの最新情報や活用ノウハウ、ツールのレビュー・比較などを発信しています。
「誰でもAIを使いこなせる時代」を目指し、有益で実践的な情報をお届けします。

コメント

コメントする

CAPTCHA


目次