お知らせ
What's New

川端篤さんが、事業内容文書からの取扱品目に関する情報の抽出に関する研究成果について、情報科学技術フォーラムで発表しました。

2025年10月29日

DEMLセンターの川端篤さんが、企事業内容文書からの取扱品目に関する情報の抽出に関する研究成果について、2025年9月4日(木)「第24回情報科学技術フォーラム(FIT2025)」にて発表しました。その研究成果の概要を本ページで紹介します。プログラムや予稿の詳細は、開催プログラムをご覧ください。

【概要】
日本標準産業分類は、経済活動を分析するための基盤として広く利用されている。しかし、産業構造の変化に伴い、既存の産業分類だけでは最新の産業動向を正確に捉えることが困難となっている。本研究では、web等で容易に取得可能な企業の事業内容文書から取扱品目に関する情報抽出に取り組んだ。BERTや生成AIを用いて、固有表現抽出により文書中から取扱品目を抽出した後、エンティティリンキングにより取扱品目の曖昧性解消を行う手法を提案した。これにより、企業毎の取扱品目の分類を自動的に企業に付与できるようになる。

本研究は、企業の事業分類のためのコストを抑えられるだけでなく、分類の追加・変更にも即座に対応可能である。また、企業のサプライチェーンの把握にも応用できると考えられる。