まとめ
口の悪さとエンジニアとしての能力に相関があるかどうか、という話題をFacebookで見て「それ数理モデルで説明できるぞ」と思ったので書いてみた。
まず、エンジニアがxとyの2つの能力を持っているとする。例えばxが口の良さでyがプログラミング能力だと思ってもよい。
この2つの能力が標準正規分布に従うとすると、全エンジニアの分布は以下のようになる。能力間に相関はない。
で、世の中には選抜の機会がある。上記分布からランダムに10人選び出し、その中で能力の総和 x + y が一番大きい人だけを選ぶ、という選抜を行おう。選抜された人の分布は以下のようになる。
ちなみに相関係数は -0.46 である。xが小さくなるほどyが大きくなる、という相関があるわけだ。 選抜された人の能力の平均はそれぞれ 1.1 程度。つまり偏差値で言うなら61くらい。 それくらい「能力が高い人たちの集団」であるにもかかわらず、xが全エンジニア平均の0よりも小さい人がいる。 意外かもしれないが選抜された人の1割くらいがそうだ。
この「xが平均より悪い人たち」のスキルの平均は(-0.37, 1.87)だから、偏差値で言うなら46と69。エンジニア全体の分布と比較すると、平均より少々xが悪いことと引き換えにyが格段に高い、ということになる。
この逆相関は10倍という高い競争率の選抜を掛けたことによって発生している。例えば高い競争率の大学の研究室は似た状況だから、口が悪いけどもプログラミングスキルが高いということは大いにあり得る。 一方で、口の悪い人が就活で訪れた場合、その人は選抜を経ていない、もしくは「選抜で勝った人は就活をすることなく就職していて、負けた人だから就活している」とも言える。なので、そういう人は採用しなくてよい。
追記: なおこの実験では x + y という総合的なスキルで選抜をしてから、 xの低い人のyの高低を見ている。 綜合的なスキル x + y で測ると、選抜された人の平均スキルは 2.2 で、 口の悪い人の平均スキルは 1.5 である。 つまり「総合スキルで選抜された人のxは観測できるがyは観測できないという状況で、yの高い人を採用したいならxの低い人を取ることは合理的だが、総合的に x + y の高い人を取りたいなら素直にxの高い人を取った方がいい」ということになる。
#数理モデル思考 #合流点バイアス #選択バイアス
#要実験