What is Nostr?
f6XF
npub19ym…djan
2025-02-20 13:56:27
in reply to nevent1q…cfgc

f6XF on Nostr: ...

手写了一个Transformer架构计算注意力机制的简单例子,希望明天具备一定理科能力的文科生,能看懂。另外个别理科生可以更好的理解注意力机制。

别看这个例子,不熟悉excel,搞了2h才弄好,太麻烦了。 ​​​

https://postimg.cc/fkZHLM9q

Author Public Key
npub19ymyv276scfw9y83wgclmh9f5evtgungpjmxrdfhkyfp6keadqasy8djan