【統計っぽい】pixivイラスト投稿数の変遷@2011/11/17〜2012/02/05

pixivやめるだの不定期ROMだの言いつつ平然と巡回を続けている俺ですが。
そんなわけなので未だにpixivブクマ枚数 still No.1なんじゃないかと思われるわけですが。
いや嘘ですが。
〜〜〜〜〜〜〜〜
何やら前回書いたやつTwitterだか何だかでチマッと取り上げられたり、気づけばブクマがついてたりしたようなので、続編をやってみることに。

■調査内容

2011/11/16〜現在までの、日々の投稿イラスト数の変遷を調べる。

■調査方法

2011/11/16頃に投稿されたillust_id=23090000のイラストから、最新に近いillust_id=24850000のイラストまで、10000枚ごとに投稿時刻を取得し、日々の投稿数の(ほぼ正しいだろうとは言えあくまでも)推測値を算出する。最終的にはグラフ化してニヨニヨと眺める。

■結果


これがほぼ素に近いデータ。真ん中ら辺にそびえ立つ投稿数の突出した日は言わずもがなの2012/01/01、そのちょっと左で突出してるのが2011/12/25と2012/12/24……うふふ。2012/01/12の投稿数が際立って少ない理由は不明。なんかあったっけ。そして2012/01/13以降、定期的に投稿数が跳ね上がってるのは土日。
いずれにせよ、バラけすぎてて全体の傾向が見えづらいよね。均そう。

というわけで、前後3日、計1週間分の投稿数で平均をとって均したデータがこちら。
以下の3つの傾向が分かる……のかな?

  1. 年末の盛り上がり、パねぇ。
  2. 年末前後でやや投稿数増えたね。
  3. 2012/01/28辺りから投稿数が急増してる。

1つ目は言うまでもないとは言え、こうもコブのように隆起されると割と異様すな。ROMとしても年末年始はコミケ絡みもあってか力作がたくさん投稿されるのでホクホクです。……まあ、それが結局ROM生活をやめられなかった理由でもあるから何とも言えんけれども。
2つ目は、去年7月を機にpixivが下り坂と考えたかった向きにはやや不利なデータなんかな? 分からんけど。まぁ、何も起きなければまだまだ勢力拡大を続けるサイトってことなんかね。せめて会員を幸せにするサイトであってほしいよね。個人的には、TINAMIと比較すると微妙なところだけど、ニコニコ静画よりはpixivに頑張ってほしいす。
3つ目。2012/01/28ってアレです。pixiv会員数400万人の報がアチコチのサイトを駆け巡った日です。まぁ、あくまでも投稿数に関する推測データに過ぎないわけだけど、これを信じる限り、ああいうニュースって結構効果あるんだねぇ……。

■雑感

といった感じじゃろうか。あんまり意味のあるデータじゃなかったかもね。

■おまけ、調査過程。

なんか前回のデータと微妙に齟齬が生じた感がある気がするので、今回の調査過程を公開しておく。対象期間が短い分、前回より精度は高い調査になってるはず。

作業はMicrosoft Excelで、データ採取は手作業でやった。

A列【参照イラストIDの基点】
前回の調査からの続きということで、前回の最終データだったillust_id=23200000より少し前の23090000から、24850000まで10000ずつインクリメントさせた値が並んでいる。これを全部そのまま対象データとして使えればいいんだけど、削除されてたりマイピク限定だったりすることがちまちまあるので、あくまでも基点。
B列【イラスト参照不能チェック】
イラストを参照してみた結果、削除されていたり非公開になっていたりした場合、ここの数字を1ずつインクリメントしていく。B列とC列の値の加算値を基に、最終的に参照するD列のillust_idを更新していく。
C列【マイピク限定チェック】
イラストを参照してみた結果、マイピク限定でデータを見られなかった場合、ここの数字を1ずつインクリメントしていく。B列とC列の値の加算値を基に、最終的に参照するD列のillust_idを更新していく。
D列【実際に参照するイラストID】
A〜C列の値から算出された、実際に参照するillust_id。問題がなければA列のIDを、何か問題(B、C列)があるごとに、+1→-1→+2→-2……のIDを参照する。余談ながら、今回最初に参照しようとした177枚のイラストのうち、22%に当たる39枚が「削除または非公開(ほぼ削除)」で参照不能だった。キリ番イラストに特有の事情があるのか、これがpixivのイラスト全般の生存率なのかは、不明。
E列【ハイパーリンク
D列のillust_idをイラストへのハイパーリンクに変換している列。クリック一発でイラストを開ける。画像では非表示。
F列【投稿日時】
D列のイラストを参照できた場合、イラストページから投稿日時をコピペで貼り付け。手作業Death。
G列【日付】
F列の文字列から投稿日付を抽出した列。
H列【時刻/日】
F列の文字列から投稿時刻を抽出し、0時を0.0、24時を1.0とする数値に変換した列。
I列【投稿時間差】
G、H列を基に、前行との投稿日時の差を24時間=1.0の数値で表した列。実は計算に使わなかった……。
J列【日付跨ぎチェック】
前行とG列を比較し、日付が変わっている場合に前行の日付をYYYYMMDD形式の数値で表した列。実は「前行の日付」としたのは誤りで、後の作業は「現在行の日付」で行っている。
K列【推定0時投稿イラストID】
日付が変わる前後の投稿日時を基に、0時ジャストに投稿されたであろうイラストのID(推定値)を計算で求めた列。具体的には、23時に投稿されたイラストが10000番で、翌4時に投稿されたイラストが15000番だった場合、5時間で5000増えたんだから23時から24時までには1000増えて11000番がジャストで投稿されたんじゃね? 的な計算をしている。ので実際とは誤差があるけどさほどずれてもいないのでよしとする。

で、このJ・K列を基に、グラフを作成することになる。

A列【前画像のJ列……の翌日】
前の画像のJ列の値をそのまま持ってきたもの……のはずだったけど、前述の通りJ列の値は誤っているので、1日足した日付が表示されている。
B列【前画像のK列】
ここは前画像のK列そのままで、A列の日付の0時に投稿されたイラストID推定値が表示されている。
D-E列【毎日の投稿数】
A・B列で毎日の0時投稿イラスト推定値を出したので、その差分を求めることで毎日の投稿数の推定値が求まる。この値を基に1つ目のグラフを作成。
G-H列【毎日の投稿数(均し後)】
1つ目のグラフでは値がバラけ過ぎて全体的な傾向が見づらいため、3日前〜3日後まで7日分の投稿数の平均値を取り、凹凸を均した投稿数推定値。この値を基に2つ目のグラフを作成。

といった感じで、グラフを作成した。
いじょ。