
企業内の技術資料は、図面やグラフ、表が混在しており扱いにくいことが多い。「寸法と公差表を照合したい」「複数ページにわたる報告書から原因を特定したい」といった場面では、時間や手間がかかるケースも少なくない。
リコーが新モデルを発表
こうした実務上の課題に対し、リコーは2026年3月30日、新たなマルチモーダルモデルを発表した。経済産業省とNEDOの「GENIAC」第3期で開発された「Qwen3-VL-Ricoh-32B-20260227」で、多段推論により複数ページの図表を関連づけて理解できる設計となっている。複雑な読解を要する質問にも対応可能としている。
ベンチマークでも一定の結果
開発では、強化学習に独自の報酬関数を導入し過学習を抑制、カリキュラム学習により難易度と進行を調整したという。ベンチマークでは、2026年2月17日時点でJDocQA-Reasoningが0.826、JDocQAが4.08を記録。Gemini 2.5 Proと同等水準の結果が示されている。
日本語での思考プロセスに対応
特徴の一つとして、思考プロセスを日本語で扱える点が挙げられる。日本語文書の理解精度向上に加え、回答の根拠や前提条件も日本語で確認しやすくなっている。経営企画による決算資料の分析や、保守業務におけるマニュアル参照など、実務での活用も想定される。
軽量版も無償公開
同日には軽量版「Qwen3-VL-Ricoh-8B-20260227」も無償公開された。今後はリコー独自のベンチマークツールの提供も予定されており、段階的な導入検討がしやすい環境が整えられている。
従来は前提とされてきた資料読解のプロセスについても、こうした技術の進展により変化が生じる可能性がある。