リコー 自社開発のセーフガードモデルを無償公開 生成AIの安全な利活用に

リコー 2026年5月20日発表


 リコーは、大規模言語モデル(LLM)に対する有害情報の入出力を検知する自社開発のガードレール機能を組み込んだLLM「Llama-Ricoh-SafeGuard-20260520」(セーフガードモデル)を、5月20日から無償公開した。

 本モデルは米Meta Platforms社が提供する「Meta-Llama-3.1-8B」の日本語性能を向上させた「Llama-3.1-Swallow-8B-Instruct-v0.5」をベースに、リコーで追加開発を行ったものである。さらに、リコー独自の量子化技術により、小型・軽量化を実現している。
 これまで本モデルは、リコージャパンが提供する「RICOH オンプレLLMスターターキット」に標準搭載し、顧客へ提供してきた。今回、生成AIの安全な利活用により一層貢献することを目的に無償で公開する。

■セーフガードモデル開発の背景
 生成AIの社会的な広がりとともに、業務にAIを活用することによる生産性向上や付加価値の高い働き方を実現する取り組みが注目を集めている。一方で、生成AIの安全な利活用という点ではまだ多くの課題がある。
 リコーは、2024年10月にLLMの安全性対策を目的とした社内プロジェクトを立ち上げ、規制や技術動向の把握に加え、LLMの安全性に関する評価指標の整備や、安全性を満たす効果的な手法の開発、それらの社会実装に向けて取り組んできた。
 本セーフガードモデルは、その取り組みの一環として開発されたものである。2025年8月には、有害なプロンプト入力を対象とした判別機能をリリースし、同年12月には、LLMが生成する有害な出力情報の検知にも対応した。

■無償公開の狙い
 近年、LLMの活用が広がる一方で、日本においてはLLM分野におけるオープンモデルの選択肢が少ないという課題が指摘されている。
 リコーはこれまで、経済産業省と国立研究開発法人新エネルギー・産業技術総合開発機構(NEDO)が推進する、国内における生成AIの開発力強化を目的としたプロジェクト「GENIAC(Generative AI Accelerator Challenge)」の第2期、第3期に参画し、図表を含む多様なドキュメントを高精度に読み取るマルチモーダル大規模言語モデルを無償公開してきた。
 また、ガードレールLLMにおいても重要性が高まる一方で、日本のビジネスの現場で実用的に利用できるモデルは少ない状況がある。リコーは、本セーフガードモデルをいち早く無償公開することで、その重要性を社会に提起するとともに、生成AIの安全な利活用の推進に貢献していく。
 リコーは、企業の業務革新と付加価値の高い働き方を支援し、企業理念の使命と目指す姿として掲げる「“はたらく”に歓びを」の実現に向けて、引き続き取り組んでいく。

■セーフガードモデルについて
 本セーフガードモデルは、LLMに対するガードレールとして機能し、入力されたプロンプト、およびLLMが生成した回答を監視することで、不適切または有害な内容を自動的に検出する。具体的には、暴力や犯罪、差別、プライバシー侵害など14種類のラベルに分類された、リコー独自に構築した数千件規模のデータを学習させている。これにより、LLMへの有害情報の入力や、LLMから出力される有害な回答を高精度に判別し、検知・ブロックすることが可能となる。

リコー 自社開発のセーフガードモデルを無償公開 生成AIの安全な利活用に