ヤマムギ

growing hard days.

*

IPython Notebookで梅田のラーメン屋さんの統計情報を抽出するというハンズオンに行ってきました

      2016/09/18


IPython Notebookで梅田のラーメン屋さんの情報をWebスクレイピングして抽出して統計情報にするというハンズオンに行ってきました。

環境構築はLinux Mint 17 MATE 64bit にIPython Notebookをインストールするをご参照ください。
※Mac、Windowsでの環境はWeb検索でお願いいたします。。。。。

ハンズオン本編

Webスクレイピングに必要なライブラリをインポートします

お店ごとの要素を配列にします

URLを見れば丸わかりですがとあるサイトから情報をとっています

お店情報の要素配列をループして欲しい情報だけの配列にします

データ配列を見てみます

こんなデータが取れました。

  • comment : コメント数
  • name : 店名
  • point_gokei : 評価点

Screenshot-DataSicenceStudy01-2

統計分析に必要なライブラリをインポートします

データフレームを作成します

要約統計量を計算します

Screenshot-DataSicenceStudy01-3

相関係数を計算します

0.54091975491834943

散布図を出力します

Screenshot-DataSicenceStudy01 -4

面白い!

@yamamanx

開発ベンダー5年、ユーザ企業システム部門通算9年、ITトレーナー1年目のSoftware Engineerです。
質問はコメントかSNSなどからお気軽にどうぞ。
出来る限りなるべく答えます。

このブログの内容/発言の一切は個人の見解であり、所属する組織とは関係ありません。

また、勉強会やイベントのレポートは自分が気になったことをメモしたり、聞いて思ったことを書いていますので、登壇者の意見や発表内容ではありません。

 - Python, study ,

ad

ad

  関連記事

「kintone Café 大阪 Vol.15 〜kintone Night Café 2017 〜」でLTしてきました

「kintone Café 大阪 Vol.15 〜kintone Night C …

Java SE 7 Silver対策勉強をしながらメモ 2015/1/27

だんだんなんだか日記じみてきましたが、試験対策メモをいつものごとくマークダウンで …

Developers Summit 2018 「Spinnakerで実現するデプロイの自動化」を聞きました

以下は、思ったことや気になったことをメモしていますので、必ずしも登壇者の発表内容 …

「Talend ハンズオンセミナー」に行ってきました

Talendとは データの整備・統合 ビッグデータ対応 ストリーミングデータ ア …

Java SE 7 Silver模擬テストの結果間違えたとこをメモ 2015/2/12

模擬テスト1回目。 90問中79問正解。 正解率87%。 まだ不安。 いつものご …

家族目線(HVC-C2W)SDKサンプルコードを実行してみました(iOS編)

オムロンさんの家族目線(HVC-C2W)SDKサンプルコードを実行してみました。 …

ヤマムギvol.5 「BI ファーストステップ ~re:dash , PowerBI , Google Data Studio , Wave~」を開催しました

僭越ながら主催運営していますヤマムギの第5回目勉強会「BI ファーストステップ …

SQLAlchemyでシンプルにjoinする

過去のSQLAlchemyでjoinするという記事でPythonのSQLAlch …

「大阪Pythonユーザの集まり」に行ってきました

「大阪Pythonユーザの集まり」 に行ってきました。 あんまりメモ取れてません …

feedlyでタグ付けした記事を自動でメール配信する

feedlyを使っていて、良記事や知っておいて欲しい記事とかを部門とかチームとか …