ヤマムギ

growing hard days.

*

IPython Notebookで梅田のラーメン屋さんの統計情報を抽出するというハンズオンに行ってきました

      2016/09/18

IPython Notebookで梅田のラーメン屋さんの情報をWebスクレイピングして抽出して統計情報にするというハンズオンに行ってきました。

環境構築はLinux Mint 17 MATE 64bit にIPython Notebookをインストールするをご参照ください。
※Mac、Windowsでの環境はWeb検索でお願いいたします。。。。。

ハンズオン本編

Webスクレイピングに必要なライブラリをインポートします

お店ごとの要素を配列にします

URLを見れば丸わかりですがとあるサイトから情報をとっています

お店情報の要素配列をループして欲しい情報だけの配列にします

データ配列を見てみます

こんなデータが取れました。

  • comment : コメント数
  • name : 店名
  • point_gokei : 評価点

Screenshot-DataSicenceStudy01-2

統計分析に必要なライブラリをインポートします

データフレームを作成します

要約統計量を計算します

Screenshot-DataSicenceStudy01-3

相関係数を計算します

0.54091975491834943

散布図を出力します

Screenshot-DataSicenceStudy01 -4

面白い!


最後までお読みいただきましてありがとうございました!

「AWS認定資格試験テキスト&問題集 AWS認定ソリューションアーキテクト - プロフェッショナル 改訂第2版」という本を書きました。

「AWS認定資格試験テキスト AWS認定クラウドプラクティショナー 改訂第3版」という本を書きました。

「ポケットスタディ AWS認定 デベロッパーアソシエイト [DVA-C02対応] 」という本を書きました。

「要点整理から攻略するAWS認定ソリューションアーキテクト-アソシエイト」という本を書きました。

「AWSではじめるLinux入門ガイド」という本を書きました。

 - Python, study ,

ad

ad

  関連記事

「機械学習・データサイエンス基礎講座(1)」に参加しました

異業種データサイエンス研究会を主宰されている井伊さんが開催される連続の基礎講座の …

「streamlit勉強会」に参加しました

streamlitってなんだろう? と思いながら参加しまししました。 fin-p …

SQLAlchemy Session.executeでinsertしてAUTO INCREMENTでセットされたプライマリキーを取得したい

PythohのORMライブラリSQLAlchemyでMySQLにインサートしたレ …

「Serverless Days Tokyo 2023 サーバーレスで負荷試験を行う必要性と実践的プラクティスの紹介」を見ました

2023/9/23にServerless Days Tokyo 2023に参加し …

「はじめての Amazon Lookout for Vision ハンズオン」に参加しました

Amazon Lookout for Visionのハンズオンに参加しました。 …

「JAWS-UG Osaka AWSデビューするなら大阪から!大阪リージョン触ろうの会」に参加しました

3/2に大阪リージョンがオープンしたことを受けて、大阪リージョンでサーバーレスア …

「Fin-JAWS 第20回 〜Go to Fin-JAWS School! 2021〜」で発表しました

2021/3/22の「Fin-JAWS 第20回 〜Go to Fin-JAWS …

「CLS高知2023戻り鰹編」に参加しました

12回目のCLS高知、2023戻り鰹編に参加しました。 高知駅付近から弁天座へ自 …

Developers Summit 2018 「本番環境で使うContainer – Amazon ECS, AWS Fargate, Amazon EKS」を聞きました

※写真は展示のAmazon Echo とルンバです。 以下は、思ったことや気にな …

ヤマムギ vol.10 (AWS)EC2モニタリングハンズオン 手順

このブログは2020/5/6に開催しました、「ヤマムギ vol.10 (AWS) …