皆さん機械学習やプログラミングの教科書を見ると、学習の結果予想した値の変数名をy_hatとしているのをよく見かけると思います。
このy_hat、一体何かの略なのでしょうか?
実は統計用語と深い関係があります。下の式を見てください。
この式は以前行った最小二乗回帰の概念の式ですが、ここでアルファベットの「y」に注目すると「^」マークが上についているのがお分かりになりますか?
小さな帽子(hat)が乗っているみたいで可愛いですね。
この記号を英語で言うと「y_hat」となり、Pythonを含めた多くのプログラミング言語でこの記号自体出力できない、もしくはめんどくさいためこのようにプログラムの文中では「y_hat」と表記しているんですね!
ちなみに統計学の教科書で「y_hat」が出てくると以下のような意味になります。
「y_hat」(ŷと表記)は、回帰方程式におけるy(従属変数)の予測値です。 これは、応答変数の平均値と見なすこともできます。
(https://www.statisticshowto.com/の記事を和訳)
つまり最小二乗法などの回帰分析の結果を「y_hat」と一般に表している、といことですね。
なので、皆さんも今後様々なプログラムを見ていく中で「y_hat」を見かけたら、
「この行で予想をしているんだな」、
とあたりがつけられるようになりましたね。