ヤマムギ

growing hard days.

*

IPython Notebookで梅田のラーメン屋さんの統計情報を抽出するというハンズオンに行ってきました

      2016/09/18


IPython Notebookで梅田のラーメン屋さんの情報をWebスクレイピングして抽出して統計情報にするというハンズオンに行ってきました。

環境構築はLinux Mint 17 MATE 64bit にIPython Notebookをインストールするをご参照ください。
※Mac、Windowsでの環境はWeb検索でお願いいたします。。。。。

ハンズオン本編

Webスクレイピングに必要なライブラリをインポートします

お店ごとの要素を配列にします

URLを見れば丸わかりですがとあるサイトから情報をとっています

お店情報の要素配列をループして欲しい情報だけの配列にします

データ配列を見てみます

こんなデータが取れました。

  • comment : コメント数
  • name : 店名
  • point_gokei : 評価点

Screenshot-DataSicenceStudy01-2

統計分析に必要なライブラリをインポートします

データフレームを作成します

要約統計量を計算します

Screenshot-DataSicenceStudy01-3

相関係数を計算します

0.54091975491834943

散布図を出力します

Screenshot-DataSicenceStudy01 -4

面白い!


最後までお読みいただきましてありがとうございました!

【PR】 「AWS認定試験対策 AWS クラウドプラクティショナー」という本を書きました。

【PR】 「AWSではじめるLinux入門ガイド」という本を書きました。

 - Python, study ,

ad

ad

  関連記事

「自ら修羅の道を作り、修羅場を楽しみ、自内外に変化を起こし続ける」(『ソフトウェアファースト』読書感想)

「ソフトウェア・ファースト あらゆるビジネスを一変させる最強戦略」を読みました。 …

Oracle Java SE7 Silverを受験してみて

受験の目的 Goldの前提条件だから Gold資格を取得する目的は技術レベルを理 …

Linux Mint 17 MATE 64bit にTensorFlowをインストールする

勉強会でTensorFlowを使用しますので、Linux Mint 17 MAT …

CentOS 6でPythonからOracleに接続する

OracleのデータをPythonでさわりたくて、その実行環境がCentOS6の …

「kintone カスタマイズハンズオン」に行ってきました

ハンズオン中のメモです Rest API ログイン認証だとトークン認証で出来ない …

feedlyでタグ付けした記事を自動でメール配信する

feedlyを使っていて、良記事や知っておいて欲しい記事とかを部門とかチームとか …

DevLove関西 「プロジェクトマネジメントの勘所」に行ってきました

DevLove関西 「プロジェクトマネジメントの勘所」に行ってきました。 サイボ …

Java SE 7 Silver対策勉強をしながらメモ 2015/2/2

本日はクラス定義とオブジェクト。 一気に範囲が広がった感。 いつものごとくマーク …

Java SE 7 Gold対策勉強をしながらメモ 2015/9/1

さて、9/26の試験を目指して久しぶりに試験勉強を始めます。 今月は非常に忙しい …

業を営む(To engage in business)

この記事は、クラウド営業 Advent Calendar 2018に参加した記事 …