金融&IT業界の情報サイト
 
 


 
【IT業界ニュース】 >> 記事詳細

2020/04/20

【TIS】TIS、自然言語処理で企業名認識を行うための辞書「JCLdic」を無償公開~ 企業名のカバレッジ範囲が高い辞書で、自然言語処理など多様なシーンでの活用を目指す~

| by:ウェブ管理者
TISインテックグループのTIS株式会社(本社:東京都新宿区、代表取締役会長兼社長:桑野 徹、以下:TIS)は、自然言語処理で企業名認識を行うための辞書「JCLdic」(日本会社名辞書)を無償公開し、辞書を生成するコードをオープンソースソフトウェア(OSS)として公開することを発表します。

「JCLdic」公開ページ:https://github.com/chakki-works/Japanese-Company-Lexicon
(利用は上記のページからダウンロード)
「JCLdic」は800万以上の企業名を収録している企業名辞書です。国税庁が公開している法人情報(2019年12月27日まで)の商号に対して、別名生成手法を適用してTISが作成しました。同一企業に対する複数名称を含むため、自然言語処理を行う際に「TIS」「ティアイエス」「テイアイエス」など同じ企業を指す企業名の表記揺れを吸収して、商号を認識することなどを可能にします。

TISでは、企業に関するナレッジグラフ※1を構築するため、テキストからの情報抽出に取り組み、これまでの辞書では企業名のカバレッジが低く、表記揺れで認識にくいという問題を解決するため、「JCLdic」を作成しました。今回、同様の研究を行う研究者にも活用をしてもらい、その知見を交換することを目的に「JCLdic」を無償公開します。


原文はこちら
https://www.tis.co.jp/news/2020/tis_news/20200420_1.html

17:08 | IT:一般
 

【免責事項】
サイト掲載情報の正確性、および完全性については最善を尽くしておりますが、その内容を保証するものではございません。また利用者が当サイト、およびサイトに関連するコンテンツ、リンク先サイトにおける一切のサービス等を利用されたことに起因、または関連して生じた一切の損害(間接的、直接的を問わず)について、当社、当サイト、投稿者および情報提供者は一切の責任を負いません。

Copyright © 2010- GoodWay Inc. All rights reserved.