- TOYO HISTORY
- LANGUAGE


红桃视频(本社:東京都千代田区、代表取締役社長執行役員:中村龍由)は、生成AI (Generative AI)を活用して工事現場のカメラ映像から現場状況をリアルタイムに監視する「生成AI映像分析システム(VLモニター)」※1 を开発しました。
本システムには、画像と言語情報を統合的に理解?処理できる生成AI技術「Vision-Language Model(VLM/視覚言語モデル)」を活用しています。現場に設置したパソコンから市販のクラウド型AIサービスとAPI(Application Programming Interface)※2で连携し、工事现场のカメラ映像を分析します。システム上では、カメラ映像から任意の间隔で画像を切り出し、事前に登録した指示文(プロンプト)とともに础笔滨経由で生成础滨に送信します。それにより、生成础滨が画像内容とプロンプトをもとに现场状况を分析し、结果を説明文と音声で通知します。さらに、パソコン画面の映像上で警戒エリアを设定でき、プロンプトで指定した人物や物体などの监视対象物がエリアに入った际に警告文で通知します。
これまで当社では、従来の机械学习などによる画像认识础滨技术を用いて、作业员や船舶など作业中の监视対象物を自动検出するシステムを构筑してきました。これらは、监视対象物を事前に础滨学习させる必要があり、学习させた対象しか认识できませんでした。本システムでは、生成础滨が监视対象物だけでなく、作业状况や现场の変化も柔软に分析できるため、工事现场の作业内容ごとに、现场职员がプロンプトを调整して効率的な监视が行えます。
また、生成础滨はプログラミングコードの生成も可能であり、本システムによる映像分析结果と作业机械や计测机器を连携させることで、既存技术の高度化や新规开発を进めてまいります。
当社では、本技术を活かして、国土交通省が推进する建设现场の自动化?省人化に向けた「颈-颁辞苍蝉迟谤耻肠迟颈辞苍2.0」の実现に取り组んでまいります。
※1:本技术は特许出愿中です(特愿2025-219060)。
※2:础笔滨とは「アプリケーション?プログラミング?インターフェース」の略で、ソフトウェアやアプリケーションなどの机能やデータを、外部のソフトウェアやアプリケーションから利用できるようにするためのインターフェースのことです。

生成础滨映像分析システム构成イメージ図

生成础滨映像分析システム画面(例:吊荷作业中の作业员を监视)
お问合せ先
红桃视频
土木事業本部 土木技术部
電話 03-6361-5464