ヤマムギ

growing hard days.

*

IPython Notebookで梅田のラーメン屋さんの統計情報を抽出するというハンズオンに行ってきました

      2016/09/18


IPython Notebookで梅田のラーメン屋さんの情報をWebスクレイピングして抽出して統計情報にするというハンズオンに行ってきました。

環境構築はLinux Mint 17 MATE 64bit にIPython Notebookをインストールするをご参照ください。
※Mac、Windowsでの環境はWeb検索でお願いいたします。。。。。

ハンズオン本編

Webスクレイピングに必要なライブラリをインポートします

お店ごとの要素を配列にします

URLを見れば丸わかりですがとあるサイトから情報をとっています

お店情報の要素配列をループして欲しい情報だけの配列にします

データ配列を見てみます

こんなデータが取れました。

  • comment : コメント数
  • name : 店名
  • point_gokei : 評価点

Screenshot-DataSicenceStudy01-2

統計分析に必要なライブラリをインポートします

データフレームを作成します

要約統計量を計算します

Screenshot-DataSicenceStudy01-3

相関係数を計算します

0.54091975491834943

散布図を出力します

Screenshot-DataSicenceStudy01 -4

面白い!


最後までお読みいただきましてありがとうございました!
【PR】 「AWS認定試験対策 AWS クラウドプラクティショナー」という本を書きました。

 - Python, study ,

ad

ad

  関連記事

Developers Summit 2018 「Kubernetesを用いた最強のマイクロサービス環境をGKEで実現しよう」を聞きました

以下は、思ったことや気になったことをメモしていますので、必ずしも登壇者の発表内容 …

「GitLab Meetup Tokyo #7: 新年度応援&GitLab 11.0」にSNS & ブログ枠で参加しました

GitLabのミートアップがあるのか!さすが大東京! GitLabのもとユーザと …

Salesforce WorldTour Tokyo 2018で、つながる世界の熱気を感じた

去年はたしか芝公園の方だったかと思いますが、今年はビッグサイトです。 数千人レベ …

Python openpyxlで結合セルを含むExcelファイルを開くと罫線が消える

PythonのExcelを読み書きするためのライブラリ、openpyxlで結合セ …

「神戸Pythonの会 #2 meetup」に行ってきました

「神戸Pythonの会 #2 meetup」に行ってきました。 目次 所感など本 …

DevLOVE関西 「サイボウズ開発の現場」に行ってきました

DevLOVE関西 「サイボウズ開発の現場」に行ってきました 目次 所感kint …

JINS MEME DEVELOPER HANDS-ON #5に行ってきました

世界初、自分を見るアイウェアの「JINS MEME」のSDK勉強会に行ってきまし …

「Bluemix勉強会 -Watson、Node-RED 最新情報を学ぼう!」に行ってきました

「Bluemix勉強会 -Watson、Node-RED 最新情報を学ぼう! 」 …

「関ジャバ Java開発のためのDocker & てらださんせきらら in MS関西」に行ってきました

「関ジャバ Java開発のためのDocker & てらださんせきらら i …

SendGrid(Python)で添付ファイル付きのメールを送信する

SendGridを使って添付ファイル付きのメールを送信するサンプルをPython …