自動要約システム

NLP

トピック自動要約システム概要

文章の「要約」には、文章が構成する主題および起承転結を
要点よくまとめることが 求められます。

しかし、その為には起・承・転・結それぞれに対応する文群を
文章中から探し、必要に応じて外部の情報(コンテクスト)も加え、最後に要約文として完成させます。
そのために文同士の文法的な調整を図る必要があります。

一方、目的によっては文章の主題(トピック)を知るだけで
足りる場合もあります。
我々はこれを「トピック要約」と呼びます。

つまりトピックを表す文の羅列をトピック要約と呼び、要約文の代替と考えます。
トピック要約システムの最大の特徴は、

1. 文章内容に関する様々な事項に関する事前学習
2. 要約する際に必要な知識・情報を補うための外部コンテクスト

の2つを使用しない点にあります。


つまり、与えらた文章のみを使い、トピック要約文を作ります。当然、通常の機械要約システムと比べ、劣る部分は多々ありますが、条件(後述)が揃うと トピック要約 ≡ 要約となることがあります。


イメージ図

システムの位置付け

デモ実演をご希望の方はお気軽にお問い合わせください!