オンラインIQテストを標準化する。本物の値に近づけたい人のために。

ンラインIQテストのスコアはもの凄く高く出る。が、そこから何とかWAIS-IIIなどの本物の知能検査の値に近づけたいという人のために、簡易標準化作業をご紹介したい。

まず、Twitterなどに結果を載せている人達を一通り見渡し、50件以上のサンプルを収集する。
※ランキングが公開されている場合は上位の密度を見る。上位の値(特に最高スコア)周辺に密集していれば能力差がないから、出現率から見て実際にはその値が平均寄りだと考える。

※IQや偏差値は標準正規分布に沿うため、IQ 130以上、偏差値70以上は常に上位2%と決まっている。予め定員が決まっているカンジ。難しい問題が解けた人全員が高知能・高偏差値とはならず、解ける人が多ければそれを平均と見なす。

※テストの成績(得点)と平均は静的(static)だが、IQや偏差値は全体に対する相対的な値付けであるため動的(dynamic)と考えてイイ。


速計算してみよう。
例えば150が30件、180が20件、210が10件見つかれば170が平均だから、このオンラインIQテストで言うスコア170がIQ 100と置き換えられる(こういった手続きを「標準化」という)。

/*
どれだけランダムにサンプルを抽出したとしても、結果を公開している人達のほとんどは、自分のスコアは平均より高い(だろう)という自信に基づいているため、散々な結果だった人は恐らく含まれない。よって底上げ(平均が高く出る)されていることを考慮する必要がある。
*/

次に偏差、偏差平方和、分散、標準偏差と計算すると(こちらがわかりやすい)、このサンプル50件の標準偏差は22.36であることがわかり、標準偏差10の偏差値(平均は50)、標準偏差15のIQ(平均は100)に換算すると、

スコア150 → 偏差値41.1(SD10)、IQ86.58(SD15)
スコア170 → 偏差値54.47(SD10)、IQ106.71(SD15)
スコア210 → 偏差値67.89(SD10)、IQ126.83(SD15)

となる。

※現代の成人知能検査はDIQ=偏差IQ(Deviation IQ)という偏差値ベースの値なので、母集団と試験内容が異なるだけで計算式は同じだ。

●平均を100とする標準偏差15のIQ計算式:
 知能指数 = 15×(自分の得点 − 平均点)÷標準偏差+100
 ※平均点と標準偏差を同世代(同一年齢)の値で計算することが多い様子。その場合は同じIQの20才と30才とでは賢さは異なる(後述)。

●平均を50とする標準偏差10の偏差値計算式:
 偏差値 = 10×(自分の得点 − 平均点)÷標準偏差+50

オンラインIQテストを標準化する。本物の値に近づけたい人のために。_f0337316_18462538.png
2018年01月21日:図を新しくした。


/*

1SD(=1σ)だから、偏差値40〜60(50±10)が普通(全体の68%)、偏差値30〜70が全体の95%(2σ圏)であり、70を超えたら上位2%(3σ圏)に入る。

同じくIQは85〜115(100±15(=1σ))が普通(全体の68%)であり、70〜130が全体の95%(2σ圏)、130を超えたら上位2%(3σ圏)に入る。

※偏差値70だからIQが130あるわけではないしその逆も然り。出現率は同じでも、測っているものが学力なのか知能指数なのかで内容は全く異なる。例えば100メートル走のタイムで偏差値70とか、年収偏差値70という表現方法もできる。
*/

WEB上で収集し底上げされた平均で計算した結果なので、実際よりも自分の偏差値(及びIQ)が低く出ることになるが(全体が高く出ると高いスコアの有意性が下がるということ)、オンラインIQテストの問題自体が系統の偏り(例えば聴覚は使わないとか)と、他との類似性によってユーザーが慣れてしまい、スコアが高く出やすいため、相殺すると実際はもっと低く出るはずだ。

そこで得意分野、まぁまぁ分野、苦手分野の3種を受け各スコアを自分で標準化し、標準偏差15に換算した上で3種の平均を出す。そこから「−10」くらいがWAIS-IIIの結果に近いだろうと思う。

偏差IQとは偏差値そのものであり、「他人にもできることが自分もできる」だけでは平均的でしかない。他人にできることはそれ以上にでき、更に他人に出来ないことができる場合に偏差値が上がる。


オンラインIQテストを標準化する。本物の値に近づけたい人のために。_f0337316_16174390.jpg

差値の仕組みを簡単にまとめると、100点満点のテストで90点を採り「90点だった、オレってすげー!」と喜んでいたら、隣もその隣も見渡す限り95点以上だった場合どうだろうか。スゴイどころか最下位の可能性もある。もし95点が平均だったら、それを中心(平均)に前後に散らすと上は100点、下が90点になる。

その場合100点が希に見る快挙かというとそうでもなく、上・下・平均の差があまりないため、当該テストでは能力差を正確に測ることはできないと考えられる。よって、簡単なテストの90点と難しいテストの90点の違いを数値化したものが偏差値と標準偏差だ。

早い話、平均からどのぐらい上下しているかという指標。マラソンで言うと、平均的なタイムのランナーと比べ、どのくらい前(または後ろ)を走っているかを知るための便利な指標だ。

※そもそもオンラインIQテスト提供側が標準化しているんじゃないかと考える人もいるかもしれない。公開する前に何百人、何千人に受けてもらって検証した結果配点を決めているならともかく、そこまではしていない。本来は公開後、スコアを動的に標準化(最新の平均値(すなわち移動平均)から偏差値の再計算)し、自分の出したスコアが毎日変化していくよう作れば悪くない(相場のように)。そうすれば、いずれは良く揉まれた(標準化された)正規分布に沿うスコアとして収束を迎えるだろう。

※※ただし、2回目以降のスコアを除外する技術が必要だ。会員IDやクッキー、メールアドレスで判別するくらいのことしかできないが、IPアドレスは止めた方がいい。会社や公共無線LAN、同じマンションに住む人が同一人物としてスコアを共有することになるからだ(笑)。

WAIS(ウェクスラー)などの結果もオンラインで即時反映させ、動的なリアルタイム偏差値式に変更すればいいと思うんだが(そうすれば20年も最新バージョンの標準化を待つ必要がない)、テストを作る側が天才なわけではないので、測定できる上限(天井)も低いだろうと思う。

次回に続く。

チャーリー(
JAPAN MENSA会員

AEAJアロマテラピー検定1級
AEAJ認定アロマテラピーアドバイザー
AEAJ認定環境カオリスタ
AEAJ認定アロマテラピーインストラクター
AEAJ認定アロマブレンドデザイナー
AEAJ個人正会員
JAMHAメディカルハーブ検定1級
JAMHA認定メディカルハーブコーディネーター
JAMHAハーバルセラピスト試験合格
ITパスポート試験合格(笑)。
情報セキュリティマネジメント試験合格
臭気判定士試験合格
薬学検定1級合格
HTML5プロフェッショナル認定資格 レベル1試験に合格。
個人情報保護士認定試験に合格。

チャーリーのタンブラー(毎日更新、日記・ブックマーク的な)


by charlie-ls | 2017-02-10 08:56 | 個人ブログ

情報処理安全確保支援士☆チャーリーのブログ


by チャーリー
カレンダー
S M T W T F S
1 2
3 4 5 6 7 8 9
10 11 12 13 14 15 16
17 18 19 20 21 22 23
24 25 26 27 28 29 30
31