futurebase’s diary

おもしろいもの、役に立つものを仕事にしたい系ベンチャー企業のブログです。

2015-04-01から1ヶ月間の記事一覧

Twitterのフォロー・フォロワー数の関係性

花見に雪が降ったかと思ったら、一気に最高気温26度と容赦が無いですね。冬物と夏物しか準備しなくて良いので助かってますけど。 さて今までもTwitterAPIで情報を収集してきたのですが、思い出してみると使用していない数値がありました。・ツイート数・フォ…

全国の駅名で最も多く使われている漢字は?一位はあの漢字!

我が家では夕飯はテレビを見ながら食べています。月曜日は「ネプリーグ」というクイズ番組を見ていたりするのですが、「首都圏で『谷』がつく駅名、10個答えよ」という問題がありました。渋谷、市ヶ谷、四谷、鶯谷、西谷・・・意外と思い出せないものです。…

LANDSAT-8の精度って?

今日はNASAの地球観測衛星LANDSAT-8の幾何学補正の精度が凄く良いという話。 LANDSAT-8のデータは http://landsat8.geogrid.org/l8/index.php/ja/産総研のWEBサイトからダウンロードできます。 LANDSAT衛星やデータについても詳しく書かれています。 …

プログラムねた その一『緯度経度の表示変換メソッド』

よく使う(あくまで自分が、、)プログラムの小技を紹介します。 Pythonでリモセン、GIS系のプログラムを書いている時によく使う緯度経度の表示変換メソッドを紹介します。 緯度経度を60進か10進どっちを使うかです。。。関数で一発変換できれば便利です…

社内システムを考える その①

新年度に入り気持ちも新たに”まめにブログを更新”することにしました。漠然とはかけないのでテーマを絞って書いて行くことにしました。そこで暫くは社内システムです。弊社はコンピュータソフト、システムを作成・運用することを生業としています。社内で日…

ドラマ『相棒』、監督・脚本家・シーズン・放送枠のどれが視聴率に影響するのか調べてみた

だいぶ前の話になりますが、ドラマ「相棒」s13が最終回となりましたね。ネタバレになりますので内容については触れませんが・・・次シーズンが作成できるのか非常に不安です。再放送があるのでしばらくはそれで相棒成分を補充したいと思います。さて本題。集…

tf-idfで各政党の特徴を探ってみた

今回のメインである「tf-idf」文章中の単語に関する重みの一種です。wikipediaの説明ページはコチラ数式アレルギーが若干あると泣きたくなりますけど、噛み砕いてしまえば簡単。色々計算方法はありますが、今回はPythonのライブラリーであるnltkを基準にして…