リコー 「GENIAC」第3期でリーズニング性能を備えたマルチモーダル大規模言語モデルを開発
複雑な図表を含む企業ドキュメントの読解に対応 軽量モデルを無償公開
リコー 2026年3月30日発表
リコーは、経済産業省と国立研究開発法人新エネルギー・産業技術総合開発機構(NEDO)が実施する、国内における生成AIの開発力強化を目的としたプロジェクト「GENIAC(Generative AI Accelerator Challenge)」第3期において、図表を含む多様なドキュメントを高精度に読み取ることができる、リーズニング性能を備えたマルチモーダル大規模言語モデル(リーズニングLMM)の基本モデル「Qwen3-VL-Ricoh-32B-20260227」の開発を完了したと発表した。本モデルは、多段推論を通じて複雑なドキュメントを理解できる点が特徴である。
また、本モデル開発で適用した技術を活用した軽量モデル「Qwen3-VL-Ricoh-8B-20260227」を、3月30日から無償公開している。さらに、リーズニング性能の評価に特化したリコー独自開発のベンチマークツールについても、今後公開する予定である。
■今回の成果
第3期では、「Qwen3-VL-32B-Instruct」をベースに、多段推論によって複雑なドキュメントを高精度に理解できるリーズニングLMMの基本モデル「Qwen3-VL-Ricoh-32B-20260227」を開発した。本モデルでは、強化学習やカリキュラム学習といった学習手法の工夫により、複数ページにまたがる図表を関連付けて理解し、読解難易度の高い質問に対しても、高精度な回答を生成することが可能になった。強化学習では、独自の報酬関数を設定することで、学習効率を高める一方、過学習を抑制している。また、カリキュラム学習では、難易度設定と学習ペースの最適化を行った。
これらの取り組みにより、「Gemini2.5-Pro」などの大型商用モデルと同等のベンチマーク結果を確認している(2026年2月17日時点)。なお、本モデルのリーズニング性能を評価するため、リコーは独自のベンチマークツールを開発しており、今後公開する予定である。
さらに、日本企業での実務利用を想定し、思考プロセスの日本語化にも取り組んだ。これにより、日本語文書の読み取り精度向上に加え、回答の判断根拠や前提条件を日本語で確認できるようになり、実務利用における信頼性を高めている。
■本モデルの性能面での特徴
《図表読解の深化》 強化学習やカリキュラム学習による推論プロセスの導入することで、複雑なドキュメントの読み間違いを大幅に低減。
《論理思考力の向上》 データの抽出に留まらず、読み取った数値に基づく計算や比較分析の精度が向上。
《高信頼な回答生成》 思考プロセスを日本語化することで回答の根拠を明確化し、ビジネス実務における信頼性が向上。

■企業での活用に向けて
セキュリティ、プライバシー、ガバナンスの観点から、オンプレミスや自社データセンターなどの社内専用環境でAIを利用したいと考える企業は多く、省リソースでAIを活用できる環境へのニーズが高まっている。リコーが開発した本モデルは、オンプレミス環境での導入が可能であり、企業の業種・業務に応じたファインチューニングにも対応している。
また、企業内での活用を加速するためには、開発コストや運用コストの低減も重要な課題である。リコーは、モデルマージ技術の活用により、効率的な開発プロセスを確立し、プライベートモデルの提供に活用していく。さらに、独自の画像トークンの圧縮技術を用いることで、高性能化に伴い増大する運用コストの低減にも取り組む。
本モデルの具体的な適用例として、製造業の顧客からは、トラブル発生時に社内ドキュメントを高精度に参照することによる早期解決や、製品開発段階における設計図と要求仕様の適合確認などのニーズが寄せられており、今後実証実験を進めていく予定である。


