ヤマムギ

growing hard days.

*

IPython Notebookで梅田のラーメン屋さんの統計情報を抽出するというハンズオンに行ってきました

      2016/09/18


IPython Notebookで梅田のラーメン屋さんの情報をWebスクレイピングして抽出して統計情報にするというハンズオンに行ってきました。

環境構築はLinux Mint 17 MATE 64bit にIPython Notebookをインストールするをご参照ください。
※Mac、Windowsでの環境はWeb検索でお願いいたします。。。。。

ハンズオン本編

Webスクレイピングに必要なライブラリをインポートします

お店ごとの要素を配列にします

URLを見れば丸わかりですがとあるサイトから情報をとっています

お店情報の要素配列をループして欲しい情報だけの配列にします

データ配列を見てみます

こんなデータが取れました。

  • comment : コメント数
  • name : 店名
  • point_gokei : 評価点

Screenshot-DataSicenceStudy01-2

統計分析に必要なライブラリをインポートします

データフレームを作成します

要約統計量を計算します

Screenshot-DataSicenceStudy01-3

相関係数を計算します

0.54091975491834943

散布図を出力します

Screenshot-DataSicenceStudy01 -4

面白い!


最後までお読みいただきましてありがとうございました!

【PR】 「AWS認定試験対策 AWS クラウドプラクティショナー」という本を書きました。

【PR】 「AWSではじめるLinux入門ガイド」という本を書きました。

i

【PR】 「ポケットスタディ AWS認定 デベロッパーアソシエイト」という本を書きました。

 - Python, study ,

ad

ad

  関連記事

MySQL勉強会 in 大阪(第10回)に行ってきました

MySQL勉強会 in 大阪(第10回)に行ってきました。 オプティマイザー、G …

「JBUG広島#7 × Agile Japan」に参加しました

JBUG広島さんとAgile Japanさんの合同勉強会に参加しました。 きっと …

「MonotaRo Tech #3 テスト自動化」に行ってきました

モノタロウさんの「MonotaRo Tech #3 テスト自動化」に行ってきまし …

Backlog World 2021 旅 ~Journey~ オンラインに参加しました

Backlog World 2021 旅 ~Journey~ オンラインに参加し …

「Rによる機械学習」に参加しました

異業種データサイエンス研究会を主宰されている井伊さんが開催された「Rによる機械学 …

JAWS SONIC 2020 & MIDNIGHT JAWS 2020 の深夜のパワポカラオケに挑戦しました

2020/9/12(土) 16:50 ~ 2020/9/13(日) 17:20( …

「AWS re:Invent報告会 by Yappli」で機械学習を始めてみようという気になった

YappliさんとSpeeeさん合同のre:Invent報告会におじゃましました …

DevLOVE関西 現場甲子園2015 「西日本大会」に行ってきました

DevLOVE関西 現場甲子園2015 「西日本大会」に行ってきました。 全部で …

「JAWS-UG 新潟 プチキャッチアップ 2021 #3」に参加しました

「当日、始まってからやること決めます。 AWSに関する記事や動画を見ながら、参加 …

Developers Summit 2018 「事例2本立て!Redmineユーザ達が語る現場定着化への取組みと導入アンチパターン」を聞きました

以下は、思ったことや気になったことをメモしていますので、必ずしも登壇者の発表内容 …