ヤマムギ

growing hard days.

*

IPython Notebookで梅田のラーメン屋さんの統計情報を抽出するというハンズオンに行ってきました

      2016/09/18

IPython Notebookで梅田のラーメン屋さんの情報をWebスクレイピングして抽出して統計情報にするというハンズオンに行ってきました。

環境構築はLinux Mint 17 MATE 64bit にIPython Notebookをインストールするをご参照ください。
※Mac、Windowsでの環境はWeb検索でお願いいたします。。。。。

ハンズオン本編

Webスクレイピングに必要なライブラリをインポートします

お店ごとの要素を配列にします

URLを見れば丸わかりですがとあるサイトから情報をとっています

お店情報の要素配列をループして欲しい情報だけの配列にします

データ配列を見てみます

こんなデータが取れました。

  • comment : コメント数
  • name : 店名
  • point_gokei : 評価点

Screenshot-DataSicenceStudy01-2

統計分析に必要なライブラリをインポートします

データフレームを作成します

要約統計量を計算します

Screenshot-DataSicenceStudy01-3

相関係数を計算します

0.54091975491834943

散布図を出力します

Screenshot-DataSicenceStudy01 -4

面白い!


最後までお読みいただきましてありがとうございました!

「AWS認定資格試験テキスト&問題集 AWS認定ソリューションアーキテクト - プロフェッショナル 改訂第2版」という本を書きました。

「AWS認定資格試験テキスト AWS認定クラウドプラクティショナー 改訂第3版」という本を書きました。

「AWS認定資格試験テキスト AWS認定AIプラクティショナー」という本を書きました。

「ポケットスタディ AWS認定 デベロッパーアソシエイト [DVA-C02対応] 」という本を書きました。

「要点整理から攻略するAWS認定ソリューションアーキテクト-アソシエイト」という本を書きました。

「AWSではじめるLinux入門ガイド」という本を書きました。

 - Python, study ,

  関連記事

Alexa Day 2018で「Alexa Skill Contest」を聞きました

Alexa Day 2018のラストセッションは、「Alexa Skill Co …

「DMM meetup #24 〜DMMのセキュリティ脅威への取り組み事例〜」に参加しました

内容が内容ですので、もちろん運営さんにブログを書いていいかの確認はしております。 …

DevLOVE関西「事業会社の現場を知ろう~モノタロウ編~」に行ってきました

DevLOVE関西「事業会社の現場を知ろう~モノタロウ編~」 モノタロウさんプラ …

「四国クラウドお遍路 2024 in 高知」に参加しました

JAWS-UGの四国4支部合同による四国クラウドお遍路に参加してきました。 せっ …

「Talend ハンズオンセミナー」に行ってきました

Talendとは データの整備・統合 ビッグデータ対応 ストリーミングデータ ア …

Java SE 7 Silver対策勉強をしながらメモ 2015/2/1

本日は繰り返し処理。 配列や演算でひっかけてくる問題に苦戦。 繰り返しだけに頭を …

Oracle Java SE7 Silverを受験してみて

受験の目的 Goldの前提条件だから Gold資格を取得する目的は技術レベルを理 …

「JAWS-UG 初心者支部#35 LT大会!!」に参加しました。

オンライン開催でした〜 AWS AthenaとFluentdでログ集約基盤構築 …

「JAWS-UG Osaka AWSデビューするなら大阪から!大阪リージョン触ろうの会」に参加しました

3/2に大阪リージョンがオープンしたことを受けて、大阪リージョンでサーバーレスア …

AWS認定オンライン受験をしてみました(OnVUE)

本日2020年5月28日より、AWS認定試験のオンライン受験が、日本国内でも可能 …