ヤマムギ

growing hard days.

*

IPython Notebookで梅田のラーメン屋さんの統計情報を抽出するというハンズオンに行ってきました

      2016/09/18


IPython Notebookで梅田のラーメン屋さんの情報をWebスクレイピングして抽出して統計情報にするというハンズオンに行ってきました。

環境構築はLinux Mint 17 MATE 64bit にIPython Notebookをインストールするをご参照ください。
※Mac、Windowsでの環境はWeb検索でお願いいたします。。。。。

ハンズオン本編

Webスクレイピングに必要なライブラリをインポートします

お店ごとの要素を配列にします

URLを見れば丸わかりですがとあるサイトから情報をとっています

お店情報の要素配列をループして欲しい情報だけの配列にします

データ配列を見てみます

こんなデータが取れました。

  • comment : コメント数
  • name : 店名
  • point_gokei : 評価点

Screenshot-DataSicenceStudy01-2

統計分析に必要なライブラリをインポートします

データフレームを作成します

要約統計量を計算します

Screenshot-DataSicenceStudy01-3

相関係数を計算します

0.54091975491834943

散布図を出力します

Screenshot-DataSicenceStudy01 -4

面白い!


最後までお読みいただきましてありがとうございました!
【PR】 「AWS認定試験対策 AWS クラウドプラクティショナー」という本を書きました。

【PR】 「AWSではじめるLinux入門ガイド」という本を書きました。

 - Python, study ,

ad

ad

  関連記事

Java SE 7 Silver模擬テストの結果間違えたとこをメモ 2015/2/12

模擬テスト1回目。 90問中79問正解。 正解率87%。 まだ不安。 いつものご …

Alexa Day2018で「Alexa連携デバイスクラウドを構成するAWS ソリューション」を聞きました

以下は、思ったことや気になったことをメモしていますので、必ずしも登壇者の発表内容 …

「JP_Stripes Tokyo Vol.7 Stripe at Doorkeeper and MakeLeaps」で受付をしました

全編英語でJP_Stripes(Stripeの勉強会)の開催がありまして、受付を …

業を営む(To engage in business)

この記事は、クラウド営業 Advent Calendar 2018に参加した記事 …

「API Meetup Tokyo #29 ニッポンのAPIエコノミー最前線 〜国産APIが社会を変える〜」に参加しました

API Meetup Tokyoに来ました〜 会場はおしゃれなDEJIMAさんで …

持ち帰って欲しいもの

「カスタマーサクセス Advent Calendar 2018」にお誘いを受けま …

Alexa Day 2018で「kokexaの話」を聞いてきました

スピーカーはサバワ坂本さん これは、私、山下の勝手な印象とか思い込みですが、坂本 …

Innovation EGG 第9回 『ITの可能性と楽しさを語ろう!』に行ってきました

目次 JAZUG LINE 砂金さんGoogle佐藤さんさくらインターネット 小 …

pyenv update で「pyenv: no such command `update’ 」

目次 環境pyenvのアップデート 環境 macOS Sierra 10.12. …

「MasterCloud-Alexa makes the world a better place-」で登壇しました

クラウド全体を扱う勉強会MasterCloudのAlexaの会で登壇してきました …