リコー 「GENIAC」第3期に採択 リーズニング性能を持つマルチモーダルLLMの開発開始
リコー 2025年7月15日発表
リコーは、経済産業省と国立研究開発法人新エネルギー・産業技術総合開発機構(NEDO)が実施する、国内における生成AIの開発力強化を目的としたプロジェクト「GENIAC(Generative AI Accelerator Challenge)」第3期に採択されたと、7月15日に発表した。これにより、2期連続での採択となる。
リコーは、本事業において、企業の知の結晶である様々な企業内ドキュメント群を、多段推論を行うことでより高精度に読み取ることができるリーズニング性能を持つマルチモーダルLLM(リーズニングLMM)を開発する。画像トークンの圧縮技術で省リソース・低コストで運用可能なモデル開発と、モデルマージの技術などを活用した効率的な開発プロセスの確立を目指す。
LMMとは、テキスト・画像・音声・動画など複数の種類のデータを一度に処理できるAI技術のことである。スクリーンショットからのテキストの要約や、図を使った質問への適切な回答など、さまざまなタスクに優れており、幅広いデータ形式を効果的に処理する適応性に期待が集まっている。
リコーは2024年8月から実施されたGENIACの第2期において、LMMの基本モデルを開発完了し、7月29日に基本モデルおよび独自に開発したベンチマークツールを無償で公開することを発表している。本事業では、より高精度かつ低コストで運用・開発できるリーズニングLMMの開発を目指す。具体的には、多段推論によって文書画像の理解力向上を図りつつ、高性能化に伴って増大する顧客側の運用コストを画像トークン圧縮などで、開発側の開発コストをモデルマージ技術の適用などで、それぞれ低減を目指す。