Update TE version for support of `pad_between_seqs=True` #12174

cyanguwa · 2025-02-13T22:31:15Z

Describe the bug

Currently, NeMo 25.02rc2 container uses TE 1.14.0+87fbe81, which blocks certain attention use cases for pad_between_seqs=True when qkv_format=thd. Please include this PR in the next container build:
NVIDIA/TransformerEngine#1387

In particular, these lines are the fix:
https://github.com/NVIDIA/TransformerEngine/blob/f0d22ca12f574233053da20516997e45d99eb65c/transformer_engine/pytorch/attention.py#L7457-L7463

The text was updated successfully, but these errors were encountered:

cyanguwa added the bug Something isn't working label Feb 13, 2025

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Update TE version for support of `pad_between_seqs=True` #12174

Update TE version for support of `pad_between_seqs=True` #12174

cyanguwa commented Feb 13, 2025

Update TE version for support of pad_between_seqs=True #12174

Update TE version for support of pad_between_seqs=True #12174

Comments

cyanguwa commented Feb 13, 2025

Update TE version for support of `pad_between_seqs=True` #12174

Update TE version for support of `pad_between_seqs=True` #12174