“Our experiments reveal that LSTM and Transformer language models (i) ...

2025-02-11 15:54:04

“Our experiments reveal that LSTM and Transformer language models (i) systematically underestimate the probability of sequences drawn from the target language, and (ii) do so more severely for less-probable sequences.”

https://arxiv.org/abs/2203.12788

Author Public Key

npub15zs3ldrhvr75wyyvjmgkwj42ykqrmlryt8azhnhxuy74w560zx0q68x48u

Seen on

wss://relay.nostr.band

Show more details

Jack Rusher on Nostr: “Our experiments reveal that LSTM and Transformer language models (i) ...