日立ソリューションズ・テクノロジーは、VLM(Vision Language Model:視覚言語モデル)を活用した生成AIソリューションを発表しました。
エッジ端末でのリアルタイム映像解析と、サーバー側の生成AIによる高度な状況理解を両立させ、安全管理の向上と運用効率化を支援します。あわせて、日立パワーソリューションズ、パラカ、アムニモの3社と共同で実証実験を開始したことも発表されました。
日立ソリューションズ・テクノロジー「VLMを活用した生成AIソリューション」

本ソリューションは、エッジ端末でのリアルタイム映像解析と、サーバー側の生成AIアプリケーション(VLM)による内容理解・分析を組み合わせたものです。
現場での即時性と高精度な状況把握を両立し、安全管理の向上と運用効率化を支援します。
主な提供価値は以下の3点です。
【高度なエッジ技術と連携した複雑状況の理解と説明】
独自の画像認識エッジAI技術で物体や動作を正確に検出し、VLMがそれらを組み合わせて状況全体を総合的に理解。従来AIでは困難だったシーンも言葉でわかりやすく説明します。
【開発・導入および通信コストを削減】
VLMの小型化により、多様なOSS推論環境や廉価版SoCへ容易に展開できます。既存資産を活用して開発・導入コストを削減するとともに、異常やイベント発生時のみ映像データを送信することで通信コストも低減します。
【多彩な環境への適用】
オンプレミス構成を採用し、データを外部に出すことなく、安全かつリアルタイムに運用可能なシステムを実現。多様な環境や要件に柔軟に対応し、現場ニーズに最適化された運用が可能です。
日立パワーソリューションズ:設備監視の自動化
設備管理者の人手不足や働き方改革の推進といった現場課題の解決を目的に実施。
社会インフラ施設や工場では、設備の故障や異常を示す表示灯を目視で確認する運用が一般的でしたが、巡回や夜間監視に人手と時間がかかり、見落としや対応遅延のリスクが課題でした。
本実証では、表示灯の変化をカメラ映像からAIで検知し、VLMが発報内容を特定・言語化する仕組みを構築。
検知結果は自動でレポート化され、管理者へ通知・共有されることで、巡回作業の省力化と異常発生時対応の迅速化の実現をめざします。
パラカ:駐車場監視・管理業務効率化
カメラ映像から生成されるテキストデータを利活用し、異常の把握や状況分析による運営改善、設備維持管理の効率化など、新たな価値創出と巡回・報告業務の省力化の可能性を検証します。
駐車場の運営では、巡回・報告業務の負担に加え、設備不良や機器故障によるサービス品質や稼働率の低下、修繕コストの増加が課題でした。
本実証では、「ごみの散乱」「枠外駐車」「フェンスやゲートバーなどの設備破損」「駐車フラップなどの機器不具合」をユースケースとして選定し、カメラ映像からVLMがこれらの異常を自動で検出・説明できるかを検証しています。
アムニモ:太陽光発電所における監視業務高度化・誤検知低減
太陽光発電所における銅線盗難などの被害防止を背景に、監視業務の高度化と誤検知の低減を目的としています。
従来のAI監視システムでは、動物を人と誤認したり、草木の揺れや天候変化による誤検知・過剰検知が現場運用の負担となっていました。
本実証では、サーマルカメラを用いて侵入検知を行い、エッジ側の低リソースCPU端末に高精度な物体検知AIを搭載し、サーバーまたはクラウド側のVLMが状況を解析・説明するハイブリッド構成を採用。
日立ソリューションズ・テクノロジーの画像認識エッジAI技術により、現場で即時に映像を解析し、VLMがその結果を文脈的に理解・説明することで、誤検知の抑制と判断根拠の明確化を実現します。
現在は技術検証を進めており、2026年度の実用化を見据えて技術確立をめざしています。
「EdgeTech+ 2025」に出展
2025年11月19日から21日までパシフィコ横浜で開催される「EdgeTech+ 2025」にて、本取り組みを含む最新の生成AI活用事例が紹介されます。