pre-compute lexer DFA states for large regexes #110

mmoskal · 2025-01-20T17:55:31Z

For lexemes with large regexes (eg very large enums from JSON schema) we could run mock computation of mask on the tokenizer to pre-compute a bunch of lexer states. Otherwise, the first time we compute that mask there is cost. For 2k 50 byte enum entries it's about 4ms.

mmoskal self-assigned this Jan 20, 2025

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

pre-compute lexer DFA states for large regexes #110

pre-compute lexer DFA states for large regexes #110

mmoskal commented Jan 20, 2025

pre-compute lexer DFA states for large regexes #110

pre-compute lexer DFA states for large regexes #110

Comments

mmoskal commented Jan 20, 2025