注意機構は辞書オブジェクトか?
内積注意について考える $Attention(query, Key, Value) = Softmax(query \cdot Key) \cdot Value$
Key-Value Memory Networks for Directly Reading Documents