ヤマムギ

growing hard days.

*

第17回 人工知能研究会 「今後のDeepLearning技術の発展とビジネス応用」に行ってきました

   


第17回 人工知能研究会 「今後のDeepLearning技術の発展とビジネス応用」に行ってきました。

データを集めること、分析することが目的になってはならないですが、何のために分析するのかそのためにどういったデータが必要なのか設計したときに肝心のデータがなく、そこから集めだすとならないように、やっぱりデータの蓄積は始めておくに越したことはないと思いました。
転移元として売れるかもしれないですしね。

あと、NanoNetsをやってみようと思いました。
こういったサービスがこれからどんどん増えていくんだろうなとも思うし、モデルも使った分だけ従量課金とかでデータを貯めていなくても予測が始められるようになるんだろうなと思いました。

講師の古屋さん、運営の皆さまありがとうございました。

講師さん

株式会社エクサインテリジェンス 古屋さん
* 人間と同じように会話できるAIを作りたい
* 高校時代より人工知能技術に興味を持つ
* 大学では認知科学を学んだ後、統計学の理論研究で3冊の本を出版
* 卒論は百貨店のPOSデータ解析、統計学のビジネス応用に興味
* 大学院修士時代には株の運用に機械学習を使い運用モデルを作る
* 修士時代にデータ解析会社を設立、「Googleの猫」を見て衝撃を受ける
* 大学院博士時代にエクサインテリジェンス設立

DeepLearning技術紹介

DeepLearningはやばい

  • 伸びしろがやばい
  • 今できることは氷山の一角
  • 5年後、10年後にはもっとすごい事が出来る
  • シンプルなモデルから複雑なモデルへ進化
  • GPUの性能向上
  • 人間の脳に近い事をやり始めている

2016年から2017年の技術遷移

  • 音声認識 実用レベル
  • 画像認識 開発レベル→実用レベル目前
  • 言語認識 研究レベル→開発レベル

転移学習

  • 全然関係ない学習済みモデルを他のデータの学習済みモデルとして転用しそこに再学習させる
  • 例えば動物を判別するモデルを医療画像の判別に転用など
  • 少量のデータしかないドメインで大量のデータがあるドメインから転用して高い精度を出せる

One Shot学習

  • 転移学習よりもさらに少ないデータ(十数枚)で学習させる
  • 特徴空間を利用

DCGAN

  • 古屋さん注目技術第3位
  • 生成系ネットワークと判別系ネットワークを戦わせて学習させていく
  • Training Loop of DCGAN
  • 画像の一部を欠損させて保管させるなど

DQN

  • 古屋さん注目技術第2位
  • アルファ碁
  • 過去の碁譜を読ませてやや強いAIを作る
  • やや強いAI同士を何万回も戦わせて強くしていく
  • 問題点は計算コスト、時間がかかる事とゲームのように勝ち負けが明確だと作りやすい点

マルチモーダルDeepLearning

  • 古屋さん注目技術第1位
  • あらゆる構造のデータを同時に学習し概念を獲得していく
  • 言語認識精度の向上が見込まれる
  • 動画、音声、テキスト、数値など
  • 例えば自然言語をイメージ化、テキスト化することで人間の思考に近くなる
  • 今後 テキスト→画像→動画変換などへの応用に期待

データサイエンティストの教育とデータ分析のコツ

データサイエンティストに必要な能力

  • 統計学の知識、数式の理解
  • DeepLearnngにおけるプログラミング技術
  • ビジネス課題の抽出力と解決力
  • コアとなる学問分野と幅広い知識が必要

統計学と機械学習の違い

  • 統計学は要因を見つける、理由づけをする
  • 機械学習は予測精度の追求、予測を当てる

AIシステム構築の流れ

  1. 課題設定
  2. AIモデル設計
  3. データ取得
  4. データ前処理(実データ解析において重要)
  5. アルゴリズム実装
  6. 分析
  7. 結果
    2 ~7を回す

DeepLearning開発環境

  • TensorFlow
  • docker

詳細画像識別

  • データの前処理が必要
  • 入力画像→特徴抽出→解析→結果

AIによくある誤解

  • X データが大量にあればいい→○ データの質も必要(横長ではなく縦長)
  • X 分類対象が多いと精度が上がる→○ 分類するものの数が少ないほど高い精度が出る
  • X テスト結果で高い精度が出たからといって実運用で高い精度が出る→○ 実運用ではテスト結果より精度が下がることが多い

ビッグデータ解析と人工知能の違い

ビッグデータ解析

  • 蓄積されたデータをあらゆるパターンで解析し当然の結果を出す
  • データありきの手法

人工知能

  • 何をするためにどういうデータが必要かを設計する。
  • システムを利用すればするほど精度が上がる
  • 溜まったビッグデータを解析することが目的になってはいけない

AIを導入しやすい領域

  • AIとの親和性が高い、データが取りやすいなど技術的課題がマッチした領域
  • 失敗した時の影響、否定的な人など社会的課題の少ない領域
  • 広告、人事、芸術など

サービス事例

AnyReco

  • アキネーターの医療版
  • 予算もデータもなかった
  • 利用者を増やすことでAIを育てる

飲食店での意見集約システム

  • 交渉自動化、会議の円滑化の課題から
  • GUIでモデルを設定
  • 複数意見の最適解を結果として出力

NanoNets

  • GUIで入力、設定した内容をもとにモデルを生成
  • 10分程度で自分だけのモデルが出来る

最後までお読みいただきましてありがとうございました!
【PR】 「AWS認定試験対策 AWS クラウドプラクティショナー」という本を書きました。

 - study , ,

ad

ad

  関連記事

Developers Summit 2016 KANSAIに行ってきました

Developers Summit 2016 KANSAIに行ってきました。 熱 …

「神戸Pythonの会 #2 meetup」に行ってきました

「神戸Pythonの会 #2 meetup」に行ってきました。 目次 所感など本 …

Innovation EGG 第9回 『ITの可能性と楽しさを語ろう!』に行ってきました

目次 JAZUG LINE 砂金さんGoogle佐藤さんさくらインターネット 小 …

Alexa Day 2018にサポーターの中の人として(初)参加しました

2018/2/11に神戸三ノ宮のスペースアルファ三宮で開催されたAlexa Da …

Developers Summit 2018 「AWSのフルマネージドな環境でCI/CDをやってみよう!AWS Cloud9からAWS Fargateへの継続的デプロイをご紹介」を聞きました

※写真は展示のAmazon Echoです。 以下は、思ったことや気になったことを …

Alexa Day 2018 で「金融機関向けAmazon Echo/Alexaへの取り組み事例紹介」を聞きました

Alexa Day 2018 で「金融機関向けAmazon Echo/Alexa …

「IBM Cloud Community Summit 2018 フルマネージドデータベースというのは使えるのか?IBM Cloudでのデータ活用事例いろいろ」でIBm Cloudのデータベースサービスを聞かせていただいた

IBM Cloud Community Summit 2018におじゃましました …

LINEとAWSとTwilioとkintoneでBOTを作ってみるハンズオン~ラッキーコンテンツ手順~

LINEとAWSとTwilioとkintoneでBOTを作ってみるハンズオンで一 …

AWS Summit 2016 Tokyoに参加してきました (Day2)

馬込は非常に良い天気です。 泊まっている部屋が2Fでしたので窓を明けると歩いてい …

Java SE 7 Silver模擬テストの結果気になる問題をメモ 2015/2/13

違う種類の模擬テスト1回目。 90問中77問正解。 正解率85%。 まだまだ不安 …