futurebase’s diary

おもしろいもの、役に立つものを仕事にしたい系ベンチャー企業のブログです。

Azure SQLデータベースの書き込み速度を調べる

最近、触り始めたAzure。データの転送速度が気になっていたので調べてみることにしました。ちなみにAzure SQLデータベースには3つのサービスレベルがあります。Basic、Standard、Premiumです。「早く大量にデータを使いたければ金払え」と資本主義に基づく形…

「最近はどの曲も似ている」は本当なのか?

「音楽を聴かなくなった」「どの曲も同じに聞こえる」「アイドルの判別ができない」定期的に新聞のコラムなどで見かける話題ですよね。「アイドルの判別」は・・・本当に難しいですよね。48人って歴代徳川将軍の約3倍ですから。顔と名前を覚えるのが苦手な自分…

鳥取にスターバックスがオープン。県民の反応は?

鳥取県にスターバックスが出店したそうです。お洒落空間に耐性のない自分は、スタバとは縁遠いです。Twitterのプロフィール欄からユーザーの居住地を推定するプログラムの練習としてこの出来事を解析したいと思います。 鳥取県ユーザーのつぶやきが増加して…

Twitterのフォロー・フォロワー数の関係性

花見に雪が降ったかと思ったら、一気に最高気温26度と容赦が無いですね。冬物と夏物しか準備しなくて良いので助かってますけど。 さて今までもTwitterAPIで情報を収集してきたのですが、思い出してみると使用していない数値がありました。・ツイート数・フォ…

全国の駅名で最も多く使われている漢字は?一位はあの漢字!

我が家では夕飯はテレビを見ながら食べています。月曜日は「ネプリーグ」というクイズ番組を見ていたりするのですが、「首都圏で『谷』がつく駅名、10個答えよ」という問題がありました。渋谷、市ヶ谷、四谷、鶯谷、西谷・・・意外と思い出せないものです。…

LANDSAT-8の精度って?

今日はNASAの地球観測衛星LANDSAT-8の幾何学補正の精度が凄く良いという話。 LANDSAT-8のデータは http://landsat8.geogrid.org/l8/index.php/ja/産総研のWEBサイトからダウンロードできます。 LANDSAT衛星やデータについても詳しく書かれています。 …

プログラムねた その一『緯度経度の表示変換メソッド』

よく使う(あくまで自分が、、)プログラムの小技を紹介します。 Pythonでリモセン、GIS系のプログラムを書いている時によく使う緯度経度の表示変換メソッドを紹介します。 緯度経度を60進か10進どっちを使うかです。。。関数で一発変換できれば便利です…

社内システムを考える その①

新年度に入り気持ちも新たに”まめにブログを更新”することにしました。漠然とはかけないのでテーマを絞って書いて行くことにしました。そこで暫くは社内システムです。弊社はコンピュータソフト、システムを作成・運用することを生業としています。社内で日…

ドラマ『相棒』、監督・脚本家・シーズン・放送枠のどれが視聴率に影響するのか調べてみた

だいぶ前の話になりますが、ドラマ「相棒」s13が最終回となりましたね。ネタバレになりますので内容については触れませんが・・・次シーズンが作成できるのか非常に不安です。再放送があるのでしばらくはそれで相棒成分を補充したいと思います。さて本題。集…

tf-idfで各政党の特徴を探ってみた

今回のメインである「tf-idf」文章中の単語に関する重みの一種です。wikipediaの説明ページはコチラ数式アレルギーが若干あると泣きたくなりますけど、噛み砕いてしまえば簡単。色々計算方法はありますが、今回はPythonのライブラリーであるnltkを基準にして…

Google+APIとTwitterAPIで箸休め

「風立ちぬ」が地上波放送されました。シベリヤは関東地方ではわりとポピュラーなお菓子らしいです。大学時代、自分を田舎者だと吊るしあげた友人(大阪出身)に教えてあげたい。更なる被害者を出さないためにも山崎パンさんには全国展開を頑張ってもらいた…

ツイートは視聴率になりうるか?を調べてみた

視聴率を図っているビデオリサーチ社さんがTwitter TV エコー というものをやっています。テレビ番組のネットでの評価をTwitterへの投稿文から読み解こうという解析方法みたいです。以前、NHKでもやっていました。それの真似事をしてみたくなったので、少し…

特定地域のツイートを抜き出してみた

TwitterAPIには色々機能があって、時間を見つけては試しています。その中にgeocodeという検索機能があります。ツイートを検索する際に、緯度経度と半径を指定するとその緯度経度を中心にした円の中で投稿されたツイートを取得できます。勿論、位置情報をONに…

NHK紅白歌合戦のツイート数を観察してみた

少しネタは古いですが年末!コタツ!紅白歌合戦!ということで年末の一大イベント(?)でもある紅白歌合戦のツイート数を観察します。1.使用するデータTwitterAPIで取得した2014/12/31 19:15~2014/12/31 23:45の間で投稿された「#NHK紅白」のハッシュタグを付…

KH coderを用いた形態素解析

※12/19 15:54 内容を一部修正しました。 KH coderという凄いフリーソフトがあることを教えられました。まだチュートリアル程度しか触っていませんが今までやってきたのは何だったんだ・・・というレベルで便利すぎます。これをカスタマイズするためにPerlとRを…

各政党のSNS利用数と活用率を調べてみた

ネット選挙解禁により、各政党はSNSツールを活用しています。それぞれの候補者さんがどんなツールを使っているのか、を調べてみました∩(・x・)∩ まずはこちら、政党別SNSツール数(今回の衆議院選の立候補者限定です) グラフ下にも書いてありますが、各政党…

Twitter分析で、フォロワー数から見る各政党の様子を調べてみた

制限はありますが、便利なTwitterAPI。「指定ユーザをフォローしているユーザID一覧を取得」という機能では、15分で5000×15回。最大75000件収集できます。 ∩(・x・)∩ 今回はこの機能を使って、政党ごとのフォロワーを比較してみました。1.政党について・Tw…

コーヒーメーカーの商品レビューを分析して、ユーザーの動向を探ってみた

前回(http://futurebase.hatenablog.com/entry/2014/11/21/150741)に引き続き、家電系の商品レビューの分析をやってみました。 今回の題材は「コーヒーメーカー」です∩(・x・)∩価格comのレビュー投稿・製品登録を時間別に分けて、どのような結果がでるかを…

ショッピングサイトの商品レビュー文を分析して、その商品の利点・改善点をフィードバックしてみた

amazonや楽天などのショッピングサイトでは、いろいろな商品が買えますよね。私もよく利用しています、とても便利。 ところで、各商品のページには「その商品の評価とレビュー」がある。↓このレビューの文章を分析したら、その商品の利点・改善点がかんたん…