ヤマムギ

growing hard days.

*

Developers Summit 2018 「自然言語処理・機械学習を活用したファクトチェック業務の支援」を聞きました

      2018/02/21


以下は、思ったことや気になったことをメモしていますので、必ずしも登壇者の発表内容やご意見ではないことを、ご承知おきください。

スピーカーはスマートニュースの小宮さん

「フェイクニュース」と「ファクトチェック」とは

まず、「フェイクニュース」と「ファクトチェック」についての説明からでした。


フェイクニュースとは、意図的に虚偽の言説を含んだ情報。意図的でないものはフェイクニュースではない。


ファクトチェックとは公表されている言説に対して事実として正確かを検証すること。
フェイクニュースだけでなく色々なものが対象で、報道機関のニュース、webメディア発信、SNSの一般人の発言も。
「正しい/間違い」だけをチェックするのではなく、対象は何か、事実化誤りか、不正確か、ミスリーディングか、裏付けは何かなどをチェックする。

発信情報から探索情報(検索、フィルタリング、機械的に補足、1日1万以上)、端緒情報(人手のよるスクリーニング、探索情報1,000件あたり数件)を経てファクトチェック記事(予備調査、裏付け)を公開するまでが一連の手順。

探索情報の中から端緒情報を探し出すのは量的に辛い。

ファクトチェック支援システム検証

ファクトチェック支援システムの検証をしたのでここからはその話。


発信媒体はインターネットに限定、データソースはTwitter。

入力を探索情報にして、出力は端緒情報の可能性数値。
なので正例は端緒情報である、誤例は端緒情報でない、となる。
ファクトチェッカーはこの可能性数値が高い情報からスクリーニングする。


前処理で、ツイートからノイズとなる情報(タイトル、ハッシュタグなど)を除去する。


分かち書きしてEmbeddingして予測するという流れ。

構成

オライリーの「仕事ではじめる機械学習」がおすすめの書籍。


GUIは探索結果を表示、
CollectorはTwitter APIでツイートを収集、
Learnerは学習用データセットをもとにモデルを構築する。
Predictorはモデルに基づいて端緒情報である確率を予測する。


Docker / Kurbernetesを利用してプロビジョニング、デプロイしている。

ファクトチェック・イニシアティブ活動は参加、支援出来るらしい。

@yamamanx

開発ベンダー5年、ユーザ企業システム部門通算9年、ITトレーナー1年目のSoftware Engineerです。
質問はコメントかSNSなどからお気軽にどうぞ。
出来る限りなるべく答えます。

このブログの内容/発言の一切は個人の見解であり、所属する組織とは関係ありません。

また、勉強会やイベントのレポートは自分が気になったことをメモしたり、聞いて思ったことを書いていますので、登壇者の意見や発表内容ではありません。

 - study

ad

ad

  関連記事

家族目線(HVC-C2W)SDKサンプルコードを実行してみました(iOS編)

オムロンさんの家族目線(HVC-C2W)SDKサンプルコードを実行してみました。 …

「Botの王道:配達ピザの注文をさばくBotを2時間で開発するワークショップ@大阪」に参加しました

「Botの王道:配達ピザの注文をさばくBotを2時間で開発するワークショップ@大 …

IoTセミナー in おおさか「IoTで変わる!企業と働き方」に行ってきました

これからの企業と働き方 ~IoT・AIが創造する未来~ さくらインターネット株式 …

「第3回【関西ITベンチャー】開発ツール チラ見せ♡ナイト@大阪」に行ってきました

「第3回【関西ITベンチャー】開発ツール チラ見せ♡ナイト@大阪」に行ってきまし …

JAWS DAYS 2018の1日前に名古屋にいました「JAWS-UG名古屋 AWS勉強会 JAWS DAYS 2018前夜祭」

仕事の都合でJAWS DAYS 2018の前日は名古屋にいました。 宿泊地はお店 …

「神戸Pythonの会 #2 meetup」に行ってきました

「神戸Pythonの会 #2 meetup」に行ってきました。 所感など Ato …

「JAWS-UG Osaka 第22回勉強会 東西の中の人が語る!!! Microservices × Serverless On AWS」で運営と懇親会LTをしてきました

「JAWS-UG Osaka 第22回勉強会 東西の中の人が語る!!! Micr …

「JP_Stripes Tokyo Vol.7 Stripe at Doorkeeper and MakeLeaps」で受付をしました

全編英語でJP_Stripes(Stripeの勉強会)の開催がありまして、受付を …

Developers Summit 2018 「事例2本立て!Redmineユーザ達が語る現場定着化への取組みと導入アンチパターン」を聞きました

以下は、思ったことや気になったことをメモしていますので、必ずしも登壇者の発表内容 …

DevLOVE関西「SIerから飛び出して、それからどうするの?」に行ってきました

DevLOVE関西「SIerから飛び出して、それからどうするの?」に行ってきまし …