製品情報

トピック要約システム概要

文章の「要約」には、文章が構成する主題および起承転結を
要点よくまとめることが 求められます。

しかし、その為には起・承・転・結それぞれに対応する文群を
文章中から探し、必要に応じて外部の情報(コンテクスト)も加え、最後に要約文として完成させます。
そのために文同士の文法的な調整を図る必要があります。

一方、目的によっては文章の主題(トピック)を知るだけで
足りる場合もあります。
我々はこれを「トピック要約」と呼びます。

つまりトピックを表す文の羅列をトピック要約と呼び、要約文の代替と考えます。
トピック要約システムの最大の特徴は、

1. 文章内容に関する様々な事項に関する事前学習
2. 要約する際に必要な知識・情報を補うための外部コンテクスト

の2つを使用しない点にあります。



システムイメージ図

※画像をクリックで拡大



つまり、与えらた文章のみを使い、トピック要約文を作ります。当然、通常の機械要約システムと比べ、劣る部分は多々ありますが、条件(後述)が揃うと トピック要約 ≡ 要約となることがあります。



システムの位置付け

※画像をクリックで拡大

デモ

トピック要約

サンプル1
サンプル2
サンプル3
サンプル4
サンプル5


原文
結果

サンプルを選択してください。


システム比較表

下記の表は通常の「文章自動要約システム」と我々の開発した「トピック要約システム」を比較したものです。
トピック要約システム 自動要約システム
分野毎の事前学習 不要 必要
外部知識 不要 必要
計算コスト
精度判定メトリック あり + 直感的 あり + 直感的でない
得意対象 長文テキスト 応用毎に専用システムを作成