ヤマムギ

growing hard days.

*

Developers Summit 2018 「自然言語処理・機械学習を活用したファクトチェック業務の支援」を聞きました

      2018/02/21

以下は、思ったことや気になったことをメモしていますので、必ずしも登壇者の発表内容やご意見ではないことを、ご承知おきください。

スピーカーはスマートニュースの小宮さん

「フェイクニュース」と「ファクトチェック」とは

まず、「フェイクニュース」と「ファクトチェック」についての説明からでした。


フェイクニュースとは、意図的に虚偽の言説を含んだ情報。意図的でないものはフェイクニュースではない。


ファクトチェックとは公表されている言説に対して事実として正確かを検証すること。
フェイクニュースだけでなく色々なものが対象で、報道機関のニュース、webメディア発信、SNSの一般人の発言も。
「正しい/間違い」だけをチェックするのではなく、対象は何か、事実化誤りか、不正確か、ミスリーディングか、裏付けは何かなどをチェックする。

発信情報から探索情報(検索、フィルタリング、機械的に補足、1日1万以上)、端緒情報(人手のよるスクリーニング、探索情報1,000件あたり数件)を経てファクトチェック記事(予備調査、裏付け)を公開するまでが一連の手順。

探索情報の中から端緒情報を探し出すのは量的に辛い。

ファクトチェック支援システム検証

ファクトチェック支援システムの検証をしたのでここからはその話。


発信媒体はインターネットに限定、データソースはTwitter。

入力を探索情報にして、出力は端緒情報の可能性数値。
なので正例は端緒情報である、誤例は端緒情報でない、となる。
ファクトチェッカーはこの可能性数値が高い情報からスクリーニングする。


前処理で、ツイートからノイズとなる情報(タイトル、ハッシュタグなど)を除去する。


分かち書きしてEmbeddingして予測するという流れ。

構成

オライリーの「仕事ではじめる機械学習」がおすすめの書籍。


GUIは探索結果を表示、
CollectorはTwitter APIでツイートを収集、
Learnerは学習用データセットをもとにモデルを構築する。
Predictorはモデルに基づいて端緒情報である確率を予測する。


Docker / Kurbernetesを利用してプロビジョニング、デプロイしている。

ファクトチェック・イニシアティブ活動は参加、支援出来るらしい。


最後までお読みいただきましてありがとうございました!

「AWS認定資格試験テキスト&問題集 AWS認定ソリューションアーキテクト - プロフェッショナル 改訂第2版」という本を書きました。

「AWS認定資格試験テキスト AWS認定クラウドプラクティショナー 改訂第3版」という本を書きました。

「AWS認定資格試験テキスト AWS認定AIプラクティショナー」という本を書きました。

「ポケットスタディ AWS認定 デベロッパーアソシエイト [DVA-C02対応] 」という本を書きました。

「要点整理から攻略するAWS認定ソリューションアーキテクト-アソシエイト」という本を書きました。

「AWSではじめるLinux入門ガイド」という本を書きました。

 - study

  関連記事

Developers Summit 2024「技術的負債との戦い! PR TIMESエンジニアチームのオブザーバビリティ改善ジャーニー」を見ました

New Relic株式会社 テクニカルアカウントマネージャ 小林 良太郎さん 株 …

Developers Summit 2024「徹底解剖!?JALインフォテック様が取り組む予兆検知/早期復旧を可能にするデータ分析/活用戦略とは?」を見ました

株式会社JALインフォテック サービス事業本部 IT基盤事業部 共通サービス基盤 …

「Rによる機械学習」に参加しました

異業種データサイエンス研究会を主宰されている井伊さんが開催された「Rによる機械学 …

「kintone Café 大阪 Vol.15 〜kintone Night Café 2017 〜」でLTしてきました

「kintone Café 大阪 Vol.15 〜kintone Night C …

「CLS高知2023戻り鰹編」に参加しました

12回目のCLS高知、2023戻り鰹編に参加しました。 高知駅付近から弁天座へ自 …

JAWS DAYS 2018で初めてのランチタイムセッションをやってみました

日本のAWSユーザーグループはJAWS-UGと言います。 JAWS-UGでは年に …

Innovation EGG 第8回 『可視化・課題と支える技術』に行ってきました

Innovation EGG 第8回 『可視化・課題と支える技術』に行ってきまし …

ヤマムギ vol.10 (AWS)EC2モニタリングハンズオン 手順

このブログは2020/5/6に開催しました、「ヤマムギ vol.10 (AWS) …

AWS Summit Tokyo 2017 聴講したセッションのメモ

2017年6月に参加しましたAWS Summitで聴講したセッションのメモを記し …

「【Japan AWS Jr. Champions主催】若手応援LT会 in AWS大阪オフィス」に参加しました!

Opening ゆっきぃさんと運営の皆さん。 「JAWS-UGから初登壇は敷居が …