なんちゃって協調フィルタリング@pixiv-たぶん最後-

pixivのイラストに対して協調フィルタリングっぽい何かを用いて、指定したイラストに傾向や内容の近いイラストを抽出、レコメンドしようとする試み。色々出して結果を見てみようかと。
オフィシャルにそういう機能があったら嬉しいという下心も込みで。

概ね手法が確定したなんちゃって協調フィルタリングのその後

とりあえず、パラメータはこんなもんでいいだろう、ということで、pixiv内にて「fromイラストtoイラスト」という名称でブックマークグループにて展開中。興味のある方は見に来てみてください。現時点で20超のイラストについて、39枚ずつの関連イラストを提示する形になってます(元絵を含めて計40枚となっています)。
…↓fromイラストtoイラスト」が対象イラストの一覧、「…「XXXXXXX:〜〜〜〜〜〜」好きに」が、タイトルに示した対象イラストの関連イラスト群、となっています。
ブックマークの範囲内での再現のため、自分がブックマークしないようなイラストを含む場合公開できないのが玉に瑕です。数はまだまだ興味本位で増えていくと思いますが、これ以上大きな展開は、オフィシャルに似たような機能が載るまで難しいかと思います。
個人的には、現在のpixivにない楽しい閲覧スタイルになっている、と思っています。

手法自体の課題

ある段階までは同時ブクマ数や全体ブクマ数自体の影響力が強く、全体が底上げされるにつれて関連度の影響力が強くなる、というアプローチ自体は、悪くないと思っています。問題は、その実現にシグモイド関数を使っていることと、その具体的な設定(閾値)の妥当性にあると言えると思います。
現在の閾値、「同時ブクマ数:20」「全体ブクマ数:50」は、

  • 同時ブクマ数は20あれば十分に信頼できる
  • 全体ブクマ数の影響力は少なくしておこう

という考えの下に設定されていますが、ある程度数をこなしてみて、

  • 同時ブクマ数が20くらいだと、十分に信頼できるとは言えない、かも知れない
  • 対象イラストのブクマ数が少ない時、もう少し同時ブクマ数が強く出た方がいいかも知れない

と考え直すようになりました。多分20・50はちょっと甘い設定だったと思います。モアベター閾値が存在するかもしれませんし、そもそも閾値は定数ではまずいかも知れません。

今後

とりあえず、普段のブクマ稼業の合間にちまちま数を増やせれば、と思っています。オフィシャルに提案するとか、データ提供を頼んでみるとかは、シャイボーイなのでパス、ということで、pixivにこういうのがあればいいなぁと思ってくれた他の誰かに期待して引き篭もっておきます。
現在は、投稿者ごとに代表作(作風を代表しつつ支持もされている作品)を選ぶ計算法を思案中で、ある程度良いのが出来たら、なんちゃって協調フィルタリングと併せて「from絵師to絵師」とかやろうかなぁと思っています。
「fromユーザtoユーザ」はもともと「お気に入り」機能の方を使って実現しようと思ってたんだけど、「○○をお気に入りに入れているユーザ一覧」は現在は本人しか閲覧できないので無理でしたorz。