AI

artificial intelligence

--「ただのデータ」から「価値あるデータ」へ --

私たちは溜まりにたまったデータを最強の武器へと進化させます。

「データはあるけど活用の仕方が分からない」「データを有効活用したいけど詳しい人がいない」

このような悩みを解決しデータに付加価値をつける事でお客様のビジネスを加速させる事を目指しております。

非構造型データ・テキストデータ

を軸にサポート

テキスト解析

膨大なテキストデータから有益な情報を抽出し、付加価値の高いデータへ変換します。

テキスト要約

テキストデータを機会が読み込んで、必要最低限のテキストに要約をします。

データ解析・コンサルティング

蓄積されたデータにどのような価値があり、どう活用すればビジネスへ活用できるのかをコンサルティングします。

テキスト要約エンジンを開発しました!

例えば下記の文章を要約すると・・・

<前提>
・実際の入力では冒頭の二行を削除
・タイトル文は入力データに含まない

東京都大田区に住む山口明彦(41)=仮名=は、消費税率が8%から10%へ引き上げられる10月1日が迫り、憂鬱(ゆううつ)になっている。山口が社会に出た平成10年代前半は、いわゆる「就職氷河期」。大企業はこぞって新卒採用を抑制していた。就職活動は案の定うまくいかず、家庭教師や塾講師など、非正規の仕事を転々としてきた。「いつかは正社員に」という思いはあったが、大学時代に心の病を患い、ずっと通院を続けていたこともあり、うまくいかなかった。年齢を重ねるたびに再就職は厳しくなり、現在は都内のハローワークに通う日々を送っている。 実家住まいで家賃こそかからないが、親は高齢で息子の面倒をみる余裕はない。節約するため一番安いスーパーマーケットを探し、値下げされる時間帯を狙って食料品を買う。生活は苦しい。貯金は満足にできず結婚も考えられない。自身が年金を受け取る年齢になるのはまだまだ先だ。「生きるのに精いっぱい。負担だけしかない」。恨み節が口をついた。政府は酒類を除く飲食料品などの税率を据え置く「軽減税率」を初めて実施し、家計への影響を最小限にとどめようとしている。だが、広告大手の博報堂が3月、20~60代の男女約2300人を対象に行った意識調査で、前回(26年)の増税より「家計への負担を感じる」との回答は7割に上った。理由の1位は「収入減」。年代別では男女とも40代が最も高い。働き盛り世代である今の30代後半から40代前半は、「ロストジェネレーション(ロスジェネ)」と呼ばれる。バブル崩壊後の経済低迷期に社会人生活を歩んでおり、賃金の上昇率が上の世代より低く、山口のように非正規雇用で生活基盤が不安定な人も少なくない。29年版の厚生労働白書によると、世帯主が40代の世帯の年間平均所得は、6年の753万円から26年の686万円と70万円近く減少。年間所得が300万円未満の世帯の割合は、6年の11・2%から26年は16・6%に増えた。20年間で1・5倍になった計算だ。 育児問題などに取り組むNPO法人「フローレンス」代表理事の駒崎弘樹は「一定数を雇うと国から給付金などが出る障害者雇用の仕組みと同じように、非正規で長く働いてきた人を正社員として雇えば企業に補助が出るなどの制度を作るべきだ」と、格差是正策の強化を訴える。今回の増税に合わせて幼保無償化や大学無償化を同時に行い、子育て世代への支援をアピールする政府は、令和2年度予算の概算要求で、ロスジェネ世代の就労強化に向けた集中支援策として1344億円を計上。ようやく対策に乗り出そうとしている。消費税をめぐっては、誰もが買い物のたびに適用される「公平性」の一方、「逆進性」の問題も指摘される。所得税は、収入が多い人ほど高い税率が適用されるのに対して、消費税は、富裕層に比べて所得に対する消費の割合が高い低所得者ほど負担は大きい。今回のように増税があれば痛みは増す。ぎりぎりの生活をしている人であればあるほど影響は深刻で、借金の拡大や生活保護の受給にもつながりかねない。生活困窮者を支援するNPO法人「ほっとプラス」代表理事の藤田孝典は「日本は(ロスジェネ世代などの)働く世代への社会保障がもともと弱い。彼らを再配分の対象にすることで、税負担に対する納得感を広げていく必要がある」と語り、こう提言する。「消費税だけで社会保障費はまかなえない。(富裕層が所有する株や証券などの)金融資産に対する課税を段階的に高めていくなど、広く財源確保に向けた議論を続けていくべきだ」

要約結果

1. 「増税がロスジェネ世代の生活負担を圧迫」
2. 「消費増税がロスジェネ世代の生活負担を圧迫」

解析ツール

■形態素解析    :sudachipy(sudachiのPython版)
■トピックモデル解析:LDA (Latent Dirichlet Allocation) gensim

利活用シーン

メディア記事の要約

金融市場のセンチメント分析

少しでも気になったり質問がある方はお問い合わせ下さい!


下記の培った知見と技術で確かな「モノ」を作ります

数学的知見・技術力

■数学的知見の技術化
・線形代数
・統計モデル
・ベイズ
・ベクトル
・行列
・その他機械学習に必要とされるもの全般

機械学習

■アルゴリズム全般 ・NN系(CNN,RNN,Region-CNN,ResNet等)
・べイズ(ナイーブベイズ)
・k近傍法
・確率的機械学習
・ディープボルツマンマシン
・アンサンブル学習(ランダムフォレスト,Boosted Tree, AdaBoost)
・データ分析系(k-means法,主成分分析,混合ガウスの分布クラスタリング,X-means法,ヘイズ最適化,EM法の概要)
・遺伝的アルゴリズム(進化的アルゴリズム,多目的遺伝的アルゴリズム)

自然言語処理

・文章要約(グラフ理論,word2vec,LexRank,seq2seq,LDA)
・文章生成(マルコフ連鎖)
・情報記憶(end_to_end_memory_network,dynamic_memory_network)

画像・動画系

・画像生成(PGGAN,CycleGAN,pix2pix)
・物体検出(Faster R-CNN, YOLO, SSD)