服部哲弥『Amazonランキングの謎を解く』読了。
面白かった。この本の確率過程論の手ほどき部分が、
いい感じに効いた自分は、もしかするとニッチな読者。
p.15の「原則」を満たすランキングを自分が作るとして、
まず思いついたのは、下記のスコアp(t)による順位付け。
p(t) = Σ_[t=-∞,0] q(t) (1+β)^t
q(t)は時間 t において売れた本の数。
(離散モデルなので t は幅を持った時間)
β>0は割引率、現在の売上を過去の売上よりも高く評価するための項。
(連続モデル ∫_[t=-∞,0] q(t) e^[βt] dt を意識した形)
メリットは、プログラミングがラクそうなことと、
現在・過去をどうバランスさせて順位付けするかを、
結果を見ながらパラメータβで調整できること。
あとは個人的に、こういう関数型に慣れているためw
たぶん、本の総数Nが十分多く、その中で十分マイナーな本に着目すれば、
時間の単位 t を、本が2冊同時に売れることがない程度に短くとることができて、
かつ、β>1(すると現在売れた本の順位は過去売れた本より上になる)ので、
自分のモデルと本書のモデルは一致する。
本書のモデルはなんとなく、いろんなモデルと極限では一致するように思う。
しかも恣意性が少ないところが、数学的に筋が良いのだろう。
(パラメータで調整できることをメリットと考える自分はいかにも邪悪)
文中にそう書いてあった気もする。本の内容は正直100%は理解できてないw
ところで、ランキングの順位に「正解」はあるか。おそらく無い。
ランキングは「これから売れる確率」の順に並べるのが「正解」だけど、
「これから売れる確率」を、過去の売れ行きから
どのように推定すればよいかがわからないからだ。
それなのに、なぜ本書のモデルは、
いろんなモデルの極限になりそうな気配があるのかな。
なんらかの順位の「真の値」に対する不偏性みたいなのがあるんだろうか。
----
あと、ロングテール性については、
市場競争と、総数Nの有限性が、本質的かもとおもった。
後者はおもっただけなのでw 前者についてだけ書く。
Nが無限になったときに、分布の裾が重くなるかならないか、
という視点は数学的には重要。
でも、分布の裾が重くないからといって、
ロングテール市場がもうからない、というわけではない。
ビッグヒットとロングテールで
どちらのほうが市場が大きいかというと
ビッグヒットかもしれないけれど、
そっちは競争も多い。
もしロングテールを扱うのに長けていれば、
そちらで競争するほうが、もうかる。
amazonは、
これまでうまく扱えなかったロングテール部分を、
効率的に商売の対象にできるようにしたのが
エライのだとおもう。
現在のamazonが、ビッグヒット・ロングテールの
どちらから多く収益を得ているかとは、また別の話。
0 件のコメント:
コメントを投稿