ヤマムギ

growing hard days.

*

Developers Summit 2018 「自然言語処理・機械学習を活用したファクトチェック業務の支援」を聞きました

      2018/02/21


以下は、思ったことや気になったことをメモしていますので、必ずしも登壇者の発表内容やご意見ではないことを、ご承知おきください。

スピーカーはスマートニュースの小宮さん

「フェイクニュース」と「ファクトチェック」とは

まず、「フェイクニュース」と「ファクトチェック」についての説明からでした。


フェイクニュースとは、意図的に虚偽の言説を含んだ情報。意図的でないものはフェイクニュースではない。


ファクトチェックとは公表されている言説に対して事実として正確かを検証すること。
フェイクニュースだけでなく色々なものが対象で、報道機関のニュース、webメディア発信、SNSの一般人の発言も。
「正しい/間違い」だけをチェックするのではなく、対象は何か、事実化誤りか、不正確か、ミスリーディングか、裏付けは何かなどをチェックする。

発信情報から探索情報(検索、フィルタリング、機械的に補足、1日1万以上)、端緒情報(人手のよるスクリーニング、探索情報1,000件あたり数件)を経てファクトチェック記事(予備調査、裏付け)を公開するまでが一連の手順。

探索情報の中から端緒情報を探し出すのは量的に辛い。

ファクトチェック支援システム検証

ファクトチェック支援システムの検証をしたのでここからはその話。


発信媒体はインターネットに限定、データソースはTwitter。

入力を探索情報にして、出力は端緒情報の可能性数値。
なので正例は端緒情報である、誤例は端緒情報でない、となる。
ファクトチェッカーはこの可能性数値が高い情報からスクリーニングする。


前処理で、ツイートからノイズとなる情報(タイトル、ハッシュタグなど)を除去する。


分かち書きしてEmbeddingして予測するという流れ。

構成

オライリーの「仕事ではじめる機械学習」がおすすめの書籍。


GUIは探索結果を表示、
CollectorはTwitter APIでツイートを収集、
Learnerは学習用データセットをもとにモデルを構築する。
Predictorはモデルに基づいて端緒情報である確率を予測する。


Docker / Kurbernetesを利用してプロビジョニング、デプロイしている。

ファクトチェック・イニシアティブ活動は参加、支援出来るらしい。


最後までお読みいただきましてありがとうございました!

【PR】 「AWS認定試験対策 AWS クラウドプラクティショナー」という本を書きました。

【PR】 「AWSではじめるLinux入門ガイド」という本を書きました。

 - study

ad

ad

  関連記事

「SIerIoTLT vol9@サポーターズ 」でLTしました〜

サポーターズさんで開催されたSIerIoTLT vol9でLTしてきました。 今 …

DevLOVE関西「それぞれの現場で実践した【自動化】の話」に行ってきました

DevLOVE関西「それぞれの現場で実践した【自動化】の話」に行ってきました。 …

第四回 八子クラウド座談会in関西 「メーカーとITが急接近!?IoTってどないやねん!?」に参加しました

第四回 八子クラウド座談会in関西 「メーカーとITが急接近!?IoTってどない …

Java SE 7 Silver対策勉強をしながらメモ 2015/2/1

本日は繰り返し処理。 配列や演算でひっかけてくる問題に苦戦。 繰り返しだけに頭を …

「INEVITABLE ja night #7 コネクティッド社会に向けた不可避な流れ」で課題を持ち続けることの大切さを再認識した

INEVITABLE ja nightに参加しました。 今回特に思ったことは、 …

JAWS-UG Osaka 第14回勉強会 「DIY」 〜自社内システムを作る側からの物申す〜に参加、運営、登壇しました

先日、JAWS-UG Osaka 第14回勉強会 「DIY」 〜自社内システムを …

Developers Summit 2018 「Building Real-time Application With AWS AppSync 〜GraphQLの始め方〜」を聞きました

以下は、思ったことや気になったことをメモしていますので、必ずしも登壇者の発表内容 …

AlexaのSmart HomeをAWSで作る方法(Alexa Day 2019でのブログ)

以下は、気になったことのメモとか感想を書いています。 登壇者、発表者、主催企業な …

Alexaで作る受付システム(Alexa Day 2019でのブログ)

ランチタイムセッション3本目はウフルさん。 たくさんのLEDをコントロールされて …

「IoTの法律勉強会 第1回」に行ってきました

「IoTの法律勉強会 第1回」に行ってきました。 「関西のIoTを盛り上げよう」 …