futurebase’s diary

おもしろいもの、役に立つものを仕事にしたい系ベンチャー企業のブログです。

特定地域のツイートを抜き出してみた

TwitterAPIには色々機能があって、時間を見つけては試しています。
その中にgeocodeという検索機能があります。
ツイートを検索する際に、緯度経度と半径を指定すると
その緯度経度を中心にした円の中で投稿されたツイートを取得できます。
勿論、位置情報をONにしているユーザーの投稿しか検索できません。
しかし、これは便利な機能です。

1.使用するデータ

Twitter APIで検索をしました。
15/01/08~15/01/14 期間の
横浜駅から半径20km内のツイート
②弥生台駅から半径5km内のツイート
弥生台駅は相鉄線にある駅の一つ。
横浜ではあまり発展していない地域にあります。
横浜駅との比較するデータとして使用します。

2.結果

①時間別推移
横浜駅周辺のツイート数の時間別推移
縦軸は時間です。0(0:00~0:59)、1(1:00~1:59)になっています。
平日は7時(起床時)と12時(昼食時)が凸になっていますね。
休日は、バラバラな時間で行動しているのか凸になっていません。




・弥生台駅周辺のツイート数の時間別推移
数が少ないため、線グラフがかなり乱れた形になっています。




②両駅の比較
・ツイート数の推移
両駅の時刻ごとの中央値を取り出して比較します。
01/08~01/14は、平日が4日、祝休日が3日だったので
横浜駅は平日寄りの動きになりました。
先ほどのグラフでは形が分からなかった弥生台駅も
中央値を取れば、横浜駅と似た動きをしていることが分かります。


・ツイート数の比較
横浜駅から半径20km、弥生台駅から半径5km・・・
単純に考えれば面積比が16:1なので、ツイート数も16:1になると考えられます。
両駅の時刻ごとの中央値を取り出して比較します。

青の線が、その時刻の横浜駅の中央値を弥生台駅の中央値で割った数値になります。
黄色の線は、面積から考えられる16。

ツイートの投稿数がピークになる22~0時は、16に近くなっているのが不思議です。
他の時間帯は、だいぶ外れた値になっています。
4時が最も差が大きい時間。一般市民は寝ている時間です。
都心のほうが夜更かししているユーザーが多いのでしょうか?





③地図にプロット
緯度経度をgeojsonに変換して地図上にプロットします。
結構重いです。googleMAPと同じ間隔で拡大縮小すると固まりますので注意。
横浜駅半径20km 15/01/10 00:00~05:59  地図その1
横浜駅半径20km 15/01/10 06:00~11:59  地図その2
横浜駅半径20km 15/01/10 12:00~17:59  地図その3
横浜駅半径20km 15/01/10 18:00~23:59  地図その4

全体を見ると、こんな感じです。半径20kmって意外と大きいですね。
弥生台駅も地域に入ってしまっていたようです。
そしてプロットだらけで訳が分かりません。
羽田空港につながる首都高湾岸線に沿ってプロットがあるのは面白いです。



もう少し小さい地域の例を挙げると
・赤レンガ倉庫、大さん橋ふ頭
赤レンガ倉庫・・・観光地。実際は単なるレンガ倉庫。中身は飲食店・洋服屋と色々。
大さん橋ふ頭・・・国内外の客船が停まります。地味に癒されるスポット。
00:00~05:59
まだ人は少ない様子。赤レンガで2人ツイートしていますね。


06:00~11:59
赤レンガ倉庫は、まだ少なめ。
大さん橋は多数のツイートが出てきました。


12:00~17:59
昼食を食べに来たのか、午後に来る予定の人が多いのか・・・赤レンガ倉庫のツイートも多くなります。


18:00~23:59
船が出港済みの大さん橋からのツイートは無くなりました。
赤レンガ倉庫もまばらになりました。


・野毛
言わずと知れた飲み屋街。
00:00~05:59
朝まで飲んでいてツイートする人は少ないのでしょう。

06:00~11:59
閑散としています。


12:00~17:59
ポツポツと増えてきました。


18:00~23:59
飲み街のゴールデンタイム。様々な場所でツイートされています。


以上。
なかなか興味深い結果が得られました。

 

最後まで読んでいただいて、ありがとうございました!

会社のブログには、他の分析記事も載せています。
興味がありましたら是非遊びにきてください。
http://futurebase.co.jp

 ブログランキング・にほんブログ村へ
にほんブログ村