From bed51f7c81feca9fd6b69d6d8dedc0d104e284b6 Mon Sep 17 00:00:00 2001
From: Grant Lemons <grantlemons@aol.com>
Date: Mon, 25 Nov 2024 01:42:29 -0700
Subject: [PATCH 01/51] feat(#230): map basic typst expressions to tokens

---
 Cargo.lock                       | 190 +++++++++++++++++++++++++++++++
 harper-core/Cargo.toml           |   1 +
 harper-core/src/parsers/mod.rs   |   1 +
 harper-core/src/parsers/typst.rs | 170 +++++++++++++++++++++++++++
 4 files changed, 362 insertions(+)
 create mode 100644 harper-core/src/parsers/typst.rs

diff --git a/Cargo.lock b/Cargo.lock
index 1a2a5767..c263f4b9 100644
--- a/Cargo.lock
+++ b/Cargo.lock
@@ -322,6 +322,31 @@ dependencies = [
  "itertools 0.10.5",
 ]
 
+[[package]]
+name = "crossbeam-deque"
+version = "0.8.5"
+source = "registry+https://github.com/rust-lang/crates.io-index"
+checksum = "613f8cc01fe9cf1a3eb3d7f488fd2fa8388403e97039e2f73692932e291a770d"
+dependencies = [
+ "crossbeam-epoch",
+ "crossbeam-utils",
+]
+
+[[package]]
+name = "crossbeam-epoch"
+version = "0.9.18"
+source = "registry+https://github.com/rust-lang/crates.io-index"
+checksum = "5b82ac4a3c2ca9c3460964f020e1402edd5753411d7737aa39c3714ad1b5420e"
+dependencies = [
+ "crossbeam-utils",
+]
+
+[[package]]
+name = "crossbeam-utils"
+version = "0.8.20"
+source = "registry+https://github.com/rust-lang/crates.io-index"
+checksum = "22ec99545bb0ed0ea7bb9b8e1e9122ea386ff8a48c0922e43f36d45ab09e0e80"
+
 [[package]]
 name = "crunchy"
 version = "0.2.2"
@@ -393,6 +418,15 @@ dependencies = [
  "syn",
 ]
 
+[[package]]
+name = "ecow"
+version = "0.2.3"
+source = "registry+https://github.com/rust-lang/crates.io-index"
+checksum = "e42fc0a93992b20c58b99e59d61eaf1635a25bfbe49e4275c34ba0aee98119ba"
+dependencies = [
+ "serde",
+]
+
 [[package]]
 name = "either"
 version = "1.13.0"
@@ -610,6 +644,7 @@ dependencies = [
  "serde_json",
  "smallvec",
  "thiserror 2.0.4",
+ "typst-syntax",
  "unicode-blocks",
  "unicode-width 0.2.0",
 ]
@@ -850,6 +885,16 @@ dependencies = [
  "icu_properties",
 ]
 
+[[package]]
+name = "indexmap"
+version = "2.6.0"
+source = "registry+https://github.com/rust-lang/crates.io-index"
+checksum = "707907fe3c25f5424cce2cb7e1cbcafee6bdbe735ca90ef77c29e84591e5b9da"
+dependencies = [
+ "equivalent",
+ "hashbrown 0.15.1",
+]
+
 [[package]]
 name = "is-docker"
 version = "0.2.0"
@@ -1161,6 +1206,12 @@ version = "0.1.0"
 source = "registry+https://github.com/rust-lang/crates.io-index"
 checksum = "8b870d8c151b6f2fb93e84a13146138f05d02ed11c7e7c54f8826aaaf7c9f184"
 
+[[package]]
+name = "portable-atomic"
+version = "1.10.0"
+source = "registry+https://github.com/rust-lang/crates.io-index"
+checksum = "280dc24453071f1b63954171985a0b0d30058d287960968b9b2aca264c8d4ee6"
+
 [[package]]
 name = "ppv-lite86"
 version = "0.2.20"
@@ -1239,6 +1290,26 @@ dependencies = [
  "serde",
 ]
 
+[[package]]
+name = "rayon"
+version = "1.10.0"
+source = "registry+https://github.com/rust-lang/crates.io-index"
+checksum = "b418a60154510ca1a002a752ca9714984e21e4241e804d32555251faf8b78ffa"
+dependencies = [
+ "either",
+ "rayon-core",
+]
+
+[[package]]
+name = "rayon-core"
+version = "1.12.1"
+source = "registry+https://github.com/rust-lang/crates.io-index"
+checksum = "1465873a3dfdaa8ae7cb14b4383657caab0b3e8a0aa9ae8e04b044854c8dfce2"
+dependencies = [
+ "crossbeam-deque",
+ "crossbeam-utils",
+]
+
 [[package]]
 name = "redox_syscall"
 version = "0.5.7"
@@ -1378,6 +1449,15 @@ dependencies = [
  "syn",
 ]
 
+[[package]]
+name = "serde_spanned"
+version = "0.6.8"
+source = "registry+https://github.com/rust-lang/crates.io-index"
+checksum = "87607cb1398ed59d48732e575a4c28a7a8ebf2454b964fe3f224f2afc07909e1"
+dependencies = [
+ "serde",
+]
+
 [[package]]
 name = "sharded-slab"
 version = "0.1.7"
@@ -1387,6 +1467,12 @@ dependencies = [
  "lazy_static",
 ]
 
+[[package]]
+name = "siphasher"
+version = "1.0.1"
+source = "registry+https://github.com/rust-lang/crates.io-index"
+checksum = "56199f7ddabf13fe5074ce809e7d3f42b42ae711800501b5b16ea82ad029c39d"
+
 [[package]]
 name = "slab"
 version = "0.4.9"
@@ -1449,6 +1535,12 @@ dependencies = [
  "syn",
 ]
 
+[[package]]
+name = "thin-vec"
+version = "0.2.13"
+source = "registry+https://github.com/rust-lang/crates.io-index"
+checksum = "a38c90d48152c236a3ab59271da4f4ae63d678c5d7ad6b7714d7cb9760be5e4b"
+
 [[package]]
 name = "thiserror"
 version = "1.0.69"
@@ -1559,6 +1651,40 @@ dependencies = [
  "tokio",
 ]
 
+[[package]]
+name = "toml"
+version = "0.8.19"
+source = "registry+https://github.com/rust-lang/crates.io-index"
+checksum = "a1ed1f98e3fdc28d6d910e6737ae6ab1a93bf1985935a1193e68f93eeb68d24e"
+dependencies = [
+ "serde",
+ "serde_spanned",
+ "toml_datetime",
+ "toml_edit",
+]
+
+[[package]]
+name = "toml_datetime"
+version = "0.6.8"
+source = "registry+https://github.com/rust-lang/crates.io-index"
+checksum = "0dd7358ecb8fc2f8d014bf86f6f638ce72ba252a2c3a2572f2a795f1d23efb41"
+dependencies = [
+ "serde",
+]
+
+[[package]]
+name = "toml_edit"
+version = "0.22.22"
+source = "registry+https://github.com/rust-lang/crates.io-index"
+checksum = "4ae48d6208a266e853d946088ed816055e556cc6028c5e8e2b84d9fa5dd7c7f5"
+dependencies = [
+ "indexmap",
+ "serde",
+ "serde_spanned",
+ "toml_datetime",
+ "winnow",
+]
+
 [[package]]
 name = "tower"
 version = "0.4.13"
@@ -1857,6 +1983,37 @@ dependencies = [
  "tree-sitter",
 ]
 
+[[package]]
+name = "typst-syntax"
+version = "0.12.0"
+source = "registry+https://github.com/rust-lang/crates.io-index"
+checksum = "05b7be8b6ed6b2cb39ca495947d548a28d7db0ba244008e44c5a759120327693"
+dependencies = [
+ "ecow",
+ "once_cell",
+ "serde",
+ "toml",
+ "typst-utils",
+ "unicode-ident",
+ "unicode-math-class",
+ "unicode-script",
+ "unicode-segmentation",
+ "unscanny",
+]
+
+[[package]]
+name = "typst-utils"
+version = "0.12.0"
+source = "registry+https://github.com/rust-lang/crates.io-index"
+checksum = "8f0305443ed97f0b658471487228f86bf835705e7525fbdcc671cebd864f7a40"
+dependencies = [
+ "once_cell",
+ "portable-atomic",
+ "rayon",
+ "siphasher",
+ "thin-vec",
+]
+
 [[package]]
 name = "unicase"
 version = "2.8.0"
@@ -1875,6 +2032,24 @@ version = "1.0.13"
 source = "registry+https://github.com/rust-lang/crates.io-index"
 checksum = "e91b56cd4cadaeb79bbf1a5645f6b4f8dc5bde8834ad5894a8db35fda9efa1fe"
 
+[[package]]
+name = "unicode-math-class"
+version = "0.1.0"
+source = "registry+https://github.com/rust-lang/crates.io-index"
+checksum = "7d246cf599d5fae3c8d56e04b20eb519adb89a8af8d0b0fbcded369aa3647d65"
+
+[[package]]
+name = "unicode-script"
+version = "0.5.7"
+source = "registry+https://github.com/rust-lang/crates.io-index"
+checksum = "9fb421b350c9aff471779e262955939f565ec18b86c15364e6bdf0d662ca7c1f"
+
+[[package]]
+name = "unicode-segmentation"
+version = "1.12.0"
+source = "registry+https://github.com/rust-lang/crates.io-index"
+checksum = "f6ccf251212114b54433ec949fd6a7841275f9ada20dddd2f29e9ceea4501493"
+
 [[package]]
 name = "unicode-width"
 version = "0.1.14"
@@ -1887,6 +2062,12 @@ version = "0.2.0"
 source = "registry+https://github.com/rust-lang/crates.io-index"
 checksum = "1fc81956842c57dac11422a97c3b8195a1ff727f06e85c84ed2e8aa277c9a0fd"
 
+[[package]]
+name = "unscanny"
+version = "0.1.0"
+source = "registry+https://github.com/rust-lang/crates.io-index"
+checksum = "e9df2af067a7953e9c3831320f35c1cc0600c30d44d9f7a12b01db1cd88d6b47"
+
 [[package]]
 name = "url"
 version = "2.5.3"
@@ -2173,6 +2354,15 @@ version = "0.52.6"
 source = "registry+https://github.com/rust-lang/crates.io-index"
 checksum = "589f6da84c646204747d1270a2a5661ea66ed1cced2631d546fdfb155959f9ec"
 
+[[package]]
+name = "winnow"
+version = "0.6.20"
+source = "registry+https://github.com/rust-lang/crates.io-index"
+checksum = "36c1fec1a2bb5866f07c25f68c26e565c4c200aebb96d7e55710c19d3e8ac49b"
+dependencies = [
+ "memchr",
+]
+
 [[package]]
 name = "write16"
 version = "1.0.0"
diff --git a/harper-core/Cargo.toml b/harper-core/Cargo.toml
index 1d5bdb0c..69f41a4c 100644
--- a/harper-core/Cargo.toml
+++ b/harper-core/Cargo.toml
@@ -24,6 +24,7 @@ thiserror = "2.0.4"
 unicode-blocks = "0.1.9"
 unicode-width = "0.2.0"
 levenshtein_automata = { version = "0.2.1", features = ["fst_automaton"] }
+typst-syntax = "0.12.0"
 
 [dev-dependencies]
 criterion = { version = "0.5.1", default-features = false }
diff --git a/harper-core/src/parsers/mod.rs b/harper-core/src/parsers/mod.rs
index f35f209b..08f53bbf 100644
--- a/harper-core/src/parsers/mod.rs
+++ b/harper-core/src/parsers/mod.rs
@@ -3,6 +3,7 @@ mod isolate_english;
 mod markdown;
 mod mask;
 mod plain_english;
+mod typst;
 
 use blanket::blanket;
 pub use collapse_identifiers::CollapseIdentifiers;
diff --git a/harper-core/src/parsers/typst.rs b/harper-core/src/parsers/typst.rs
new file mode 100644
index 00000000..9f5c6f85
--- /dev/null
+++ b/harper-core/src/parsers/typst.rs
@@ -0,0 +1,170 @@
+use itertools::Itertools;
+
+use typst_syntax::ast::{AstNode, Expr};
+
+use super::{Parser, PlainEnglish};
+use crate::{parsers::StrParser, Token, TokenKind, WordMetadata};
+
+/// A parser that wraps the [`PlainEnglish`] parser that allows one to parse
+/// Typst files.
+pub struct Typst;
+
+macro_rules! constant_token {
+    ($offset:ident, $doc:ident, $a:ident, $to:expr) => {{
+        let range = $doc.range($a.span()).unwrap();
+        *$offset += range.len();
+        Some(vec![Token {
+            span: range.into(),
+            kind: $to,
+        }])
+    }};
+}
+macro_rules! recursive_env {
+    ($offset:ident, $expr:ident, $doc:ident, $parser:ident) => {
+        Some(
+            $expr
+                .body()
+                .exprs()
+                .filter_map(|e| map_token(e, $doc, $parser, $offset))
+                .flatten()
+                .collect_vec(),
+        )
+    };
+}
+
+fn map_token(
+    ex: typst_syntax::ast::Expr,
+    doc: &typst_syntax::Source,
+    parser: &mut PlainEnglish,
+    offset: &mut usize,
+) -> Option<Vec<Token>> {
+    match ex {
+        Expr::Text(text) => Some(
+            parser
+                .parse_str(text.get())
+                .into_iter()
+                .map(|mut t| {
+                    t.span.push_by(*offset);
+                    t
+                })
+                .collect_vec(),
+        ),
+        Expr::Space(a) => constant_token!(offset, doc, a, TokenKind::Space(1)),
+        Expr::Linebreak(a) => constant_token!(offset, doc, a, TokenKind::Newline(1)),
+        Expr::Parbreak(a) => constant_token!(offset, doc, a, TokenKind::Newline(2)),
+        Expr::Escape(_) => None,
+        Expr::Shorthand(_) => None,
+        Expr::SmartQuote(_) => None,
+        Expr::Strong(strong) => recursive_env!(offset, strong, doc, parser),
+        Expr::Emph(emph) => recursive_env!(offset, emph, doc, parser),
+        Expr::Raw(_) => None,
+        Expr::Link(a) => constant_token!(offset, doc, a, TokenKind::Url),
+        Expr::Label(label) => Some(
+            parser
+                .parse_str(label.get())
+                .into_iter()
+                .map(|mut t| {
+                    t.span.push_by(*offset);
+                    t
+                })
+                .collect_vec(),
+        ),
+        Expr::Ref(a) => {
+            constant_token!(offset, doc, a, TokenKind::Word(WordMetadata::default()))
+        }
+        Expr::Heading(heading) => recursive_env!(offset, heading, doc, parser),
+        Expr::List(list_item) => recursive_env!(offset, list_item, doc, parser),
+        Expr::Enum(enum_item) => recursive_env!(offset, enum_item, doc, parser),
+        Expr::Term(term_item) => Some(
+            term_item
+                .term()
+                .exprs()
+                .chain(term_item.description().exprs())
+                .filter_map(|e| map_token(e, doc, parser, offset))
+                .flatten()
+                .collect_vec(),
+        ),
+        Expr::Equation(a) => constant_token!(offset, doc, a, TokenKind::Unlintable),
+        Expr::Math(_) => None,
+        Expr::MathIdent(_) => None,
+        Expr::MathShorthand(_) => None,
+        Expr::MathAlignPoint(_) => None,
+        Expr::MathDelimited(_) => None,
+        Expr::MathAttach(_) => None,
+        Expr::MathPrimes(_) => None,
+        Expr::MathFrac(_) => None,
+        Expr::MathRoot(_) => None,
+        Expr::Ident(a) => constant_token!(offset, doc, a, TokenKind::Word(WordMetadata::default())),
+        Expr::None(a) => constant_token!(offset, doc, a, TokenKind::Word(WordMetadata::default())),
+        Expr::Auto(a) => constant_token!(offset, doc, a, TokenKind::Word(WordMetadata::default())),
+        Expr::Bool(a) => constant_token!(offset, doc, a, TokenKind::Word(WordMetadata::default())),
+        Expr::Int(int) => todo!(),
+        Expr::Float(float) => todo!(),
+        Expr::Numeric(a) => constant_token!(offset, doc, a, TokenKind::Unlintable),
+        Expr::Str(text) => Some(
+            parser
+                .parse_str(text.get())
+                .into_iter()
+                .map(|mut t| {
+                    t.span.push_by(*offset);
+                    t
+                })
+                .collect_vec(),
+        ),
+        Expr::Code(a) => constant_token!(offset, doc, a, TokenKind::Unlintable),
+        Expr::Content(content_block) => recursive_env!(offset, content_block, doc, parser),
+        Expr::Parenthesized(parenthesized) => map_token(parenthesized.expr(), doc, parser, offset),
+        Expr::Array(array) => Some(
+            array
+                .items()
+                .filter_map(|i| {
+                    if let typst_syntax::ast::ArrayItem::Pos(e) = i {
+                        map_token(e, doc, parser, offset)
+                    } else {
+                        None
+                    }
+                })
+                .flatten()
+                .collect_vec(),
+        ),
+        Expr::Dict(dict) => todo!(),
+        Expr::Unary(unary) => todo!(),
+        Expr::Binary(binary) => todo!(),
+        Expr::FieldAccess(field_access) => todo!(),
+        Expr::FuncCall(func_call) => todo!(),
+        Expr::Closure(closure) => todo!(),
+        Expr::Let(let_binding) => todo!(),
+        Expr::DestructAssign(destruct_assignment) => todo!(),
+        Expr::Set(set_rule) => todo!(),
+        Expr::Show(show_rule) => todo!(),
+        Expr::Contextual(contextual) => todo!(),
+        Expr::Conditional(conditional) => todo!(),
+        Expr::While(while_loop) => todo!(),
+        Expr::For(for_loop) => todo!(),
+        Expr::Import(module_import) => todo!(),
+        Expr::Include(module_include) => todo!(),
+        Expr::Break(loop_break) => todo!(),
+        Expr::Continue(loop_continue) => todo!(),
+        Expr::Return(func_return) => todo!(),
+    }
+}
+
+impl Parser for Typst {
+    fn parse(&mut self, source: &[char]) -> Vec<Token> {
+        let mut english_parser = PlainEnglish;
+
+        let source_str: String = source.iter().collect();
+        let typst_document = typst_syntax::Source::detached(source_str);
+        let typst_tree = typst_syntax::ast::Markup::from_untyped(typst_document.root())
+            .expect("Unable to create typst document from parsed tree!");
+        let mut offset = 0;
+
+        // NOTE: the range spits out __byte__ indices, not char indices.
+        // This is why we keep track above.
+        typst_tree
+            .exprs()
+            .filter_map(|ex| map_token(ex, &typst_document, &mut english_parser, &mut offset))
+            .flatten()
+            .collect_vec()
+    }
+}

From 7201575d5f2080f8bcb576f07f8345bce55b8800 Mon Sep 17 00:00:00 2001
From: Grant Lemons <grantlemons@aol.com>
Date: Mon, 25 Nov 2024 11:29:57 -0700
Subject: [PATCH 02/51] feat(#230): change recursive shorthand from macro to
 function

---
 harper-core/src/parsers/typst.rs | 54 +++++++++++++++++---------------
 1 file changed, 29 insertions(+), 25 deletions(-)

diff --git a/harper-core/src/parsers/typst.rs b/harper-core/src/parsers/typst.rs
index 9f5c6f85..4f7e27b9 100644
--- a/harper-core/src/parsers/typst.rs
+++ b/harper-core/src/parsers/typst.rs
@@ -1,6 +1,6 @@
 use itertools::Itertools;
 
-use typst_syntax::ast::{AstNode, Expr};
+use typst_syntax::ast::{AstNode, Expr, Markup};
 
 use super::{Parser, PlainEnglish};
 use crate::{parsers::StrParser, Token, TokenKind, WordMetadata};
@@ -19,17 +19,19 @@ macro_rules! constant_token {
         }])
     }};
 }
-macro_rules! recursive_env {
-    ($offset:ident, $expr:ident, $doc:ident, $parser:ident) => {
-        Some(
-            $expr
-                .body()
-                .exprs()
-                .filter_map(|e| map_token(e, $doc, $parser, $offset))
-                .flatten()
-                .collect_vec(),
-        )
-    };
+
+fn recursive_env(
+    exprs: &mut dyn Iterator<Item = typst_syntax::ast::Expr>,
+    doc: &typst_syntax::Source,
+    parser: &mut PlainEnglish,
+    offset: &mut usize,
+) -> Option<Vec<Token>> {
+    Some(
+        exprs
+            .filter_map(|e| map_token(e, doc, parser, offset))
+            .flatten()
+            .collect_vec(),
+    )
 }
 
 fn map_token(
@@ -55,8 +57,8 @@ fn map_token(
         Expr::Escape(_) => None,
         Expr::Shorthand(_) => None,
         Expr::SmartQuote(_) => None,
-        Expr::Strong(strong) => recursive_env!(offset, strong, doc, parser),
-        Expr::Emph(emph) => recursive_env!(offset, emph, doc, parser),
+        Expr::Strong(strong) => recursive_env(&mut strong.body().exprs(), doc, parser, offset),
+        Expr::Emph(emph) => recursive_env(&mut emph.body().exprs(), doc, parser, offset),
         Expr::Raw(_) => None,
         Expr::Link(a) => constant_token!(offset, doc, a, TokenKind::Url),
         Expr::Label(label) => Some(
@@ -72,17 +74,17 @@ fn map_token(
         Expr::Ref(a) => {
             constant_token!(offset, doc, a, TokenKind::Word(WordMetadata::default()))
         }
-        Expr::Heading(heading) => recursive_env!(offset, heading, doc, parser),
-        Expr::List(list_item) => recursive_env!(offset, list_item, doc, parser),
-        Expr::Enum(enum_item) => recursive_env!(offset, enum_item, doc, parser),
-        Expr::Term(term_item) => Some(
-            term_item
+        Expr::Heading(heading) => recursive_env(&mut heading.body().exprs(), doc, parser, offset),
+        Expr::List(list_item) => recursive_env(&mut list_item.body().exprs(), doc, parser, offset),
+        Expr::Enum(enum_item) => recursive_env(&mut enum_item.body().exprs(), doc, parser, offset),
+        Expr::Term(term_item) => recursive_env(
+            &mut term_item
                 .term()
                 .exprs()
-                .chain(term_item.description().exprs())
-                .filter_map(|e| map_token(e, doc, parser, offset))
-                .flatten()
-                .collect_vec(),
+                .chain(term_item.description().exprs()),
+            doc,
+            parser,
+            offset,
         ),
         Expr::Equation(a) => constant_token!(offset, doc, a, TokenKind::Unlintable),
         Expr::Math(_) => None,
@@ -112,7 +114,9 @@ fn map_token(
                 .collect_vec(),
         ),
         Expr::Code(a) => constant_token!(offset, doc, a, TokenKind::Unlintable),
-        Expr::Content(content_block) => recursive_env!(offset, content_block, doc, parser),
+        Expr::Content(content_block) => {
+            recursive_env(&mut content_block.body().exprs(), doc, parser, offset)
+        }
         Expr::Parenthesized(parenthesized) => map_token(parenthesized.expr(), doc, parser, offset),
         Expr::Array(array) => Some(
             array
@@ -155,7 +159,7 @@ impl Parser for Typst {
 
         let source_str: String = source.iter().collect();
         let typst_document = typst_syntax::Source::detached(source_str);
-        let typst_tree = typst_syntax::ast::Markup::from_untyped(typst_document.root())
+        let typst_tree = Markup::from_untyped(typst_document.root())
             .expect("Unable to create typst document from parsed tree!");
         let mut offset = 0;
 

From d880613dc56e5670063db3dfa1e47b68836c1643 Mon Sep 17 00:00:00 2001
From: Grant Lemons <grantlemons@aol.com>
Date: Mon, 25 Nov 2024 23:12:02 -0700
Subject: [PATCH 03/51] feat(#230): flesh out more complicated typst syntax
 parsing

---
 harper-core/src/parsers/typst.rs | 260 +++++++++++++++++++++++--------
 1 file changed, 195 insertions(+), 65 deletions(-)

diff --git a/harper-core/src/parsers/typst.rs b/harper-core/src/parsers/typst.rs
index 4f7e27b9..6c15494e 100644
--- a/harper-core/src/parsers/typst.rs
+++ b/harper-core/src/parsers/typst.rs
@@ -3,14 +3,14 @@ use itertools::Itertools;
 use typst_syntax::ast::{AstNode, Expr, Markup};
 
 use super::{Parser, PlainEnglish};
-use crate::{parsers::StrParser, Token, TokenKind, WordMetadata};
+use crate::{parsers::StrParser, Punctuation, Token, TokenKind, WordMetadata};
 
 /// A parser that wraps the [`PlainEnglish`] parser that allows one to parse
 /// Typst files.
 pub struct Typst;
 
 macro_rules! constant_token {
-    ($offset:ident, $doc:ident, $a:ident, $to:expr) => {{
+    ($offset:ident, $doc:ident, $a:expr, $to:expr) => {{
         let range = $doc.range($a.span()).unwrap();
         *$offset += range.len();
         Some(vec![Token {
@@ -20,6 +20,18 @@ macro_rules! constant_token {
     }};
 }
 
+macro_rules! merge_expr {
+    ($($inner:expr),*) => {
+        Some(
+            [$($inner),*]
+                .into_iter()
+                .flatten()
+                .flatten()
+                .collect_vec(),
+        )
+    };
+}
+
 fn recursive_env(
     exprs: &mut dyn Iterator<Item = typst_syntax::ast::Expr>,
     doc: &typst_syntax::Source,
@@ -28,12 +40,33 @@ fn recursive_env(
 ) -> Option<Vec<Token>> {
     Some(
         exprs
-            .filter_map(|e| map_token(e, doc, parser, offset))
+            .filter_map(|e| {
+                let range = doc.range(e.span()).unwrap();
+                *offset += range.len();
+                map_token(e, doc, parser, offset)
+            })
             .flatten()
             .collect_vec(),
     )
 }
 
+fn parse_english(
+    str: impl Into<String>,
+    parser: &mut PlainEnglish,
+    offset: &mut usize,
+) -> Option<Vec<Token>> {
+    let res = parser
+        .parse_str(str.into())
+        .into_iter()
+        .map(|mut t| {
+            t.span.push_by(*offset);
+            t
+        })
+        .collect_vec();
+    *offset = res.last()?.span.end - 1;
+    Some(res)
+}
+
 fn map_token(
     ex: typst_syntax::ast::Expr,
     doc: &typst_syntax::Source,
@@ -41,36 +74,34 @@ fn map_token(
     offset: &mut usize,
 ) -> Option<Vec<Token>> {
     match ex {
-        Expr::Text(text) => Some(
-            parser
-                .parse_str(text.get())
-                .into_iter()
-                .map(|mut t| {
-                    t.span.push_by(*offset);
-                    t
-                })
-                .collect_vec(),
-        ),
+        Expr::Text(text) => parse_english(text.get(), parser, offset),
         Expr::Space(a) => constant_token!(offset, doc, a, TokenKind::Space(1)),
         Expr::Linebreak(a) => constant_token!(offset, doc, a, TokenKind::Newline(1)),
         Expr::Parbreak(a) => constant_token!(offset, doc, a, TokenKind::Newline(2)),
-        Expr::Escape(_) => None,
-        Expr::Shorthand(_) => None,
-        Expr::SmartQuote(_) => None,
+        Expr::Escape(a) => constant_token!(offset, doc, a, TokenKind::Unlintable),
+        Expr::Shorthand(a) => constant_token!(offset, doc, a, TokenKind::Unlintable),
+        Expr::SmartQuote(quote) => {
+            if quote.double() {
+                constant_token!(
+                    offset,
+                    doc,
+                    quote,
+                    TokenKind::Punctuation(Punctuation::Quote(crate::Quote { twin_loc: None }))
+                )
+            } else {
+                constant_token!(
+                    offset,
+                    doc,
+                    quote,
+                    TokenKind::Punctuation(Punctuation::Apostrophe)
+                )
+            }
+        }
         Expr::Strong(strong) => recursive_env(&mut strong.body().exprs(), doc, parser, offset),
         Expr::Emph(emph) => recursive_env(&mut emph.body().exprs(), doc, parser, offset),
-        Expr::Raw(_) => None,
+        Expr::Raw(a) => constant_token!(offset, doc, a, TokenKind::Unlintable),
         Expr::Link(a) => constant_token!(offset, doc, a, TokenKind::Url),
-        Expr::Label(label) => Some(
-            parser
-                .parse_str(label.get())
-                .into_iter()
-                .map(|mut t| {
-                    t.span.push_by(*offset);
-                    t
-                })
-                .collect_vec(),
-        ),
+        Expr::Label(label) => parse_english(label.get(), parser, offset),
         Expr::Ref(a) => {
             constant_token!(offset, doc, a, TokenKind::Word(WordMetadata::default()))
         }
@@ -87,15 +118,15 @@ fn map_token(
             offset,
         ),
         Expr::Equation(a) => constant_token!(offset, doc, a, TokenKind::Unlintable),
-        Expr::Math(_) => None,
-        Expr::MathIdent(_) => None,
-        Expr::MathShorthand(_) => None,
-        Expr::MathAlignPoint(_) => None,
-        Expr::MathDelimited(_) => None,
-        Expr::MathAttach(_) => None,
-        Expr::MathPrimes(_) => None,
-        Expr::MathFrac(_) => None,
-        Expr::MathRoot(_) => None,
+        Expr::Math(_) => panic!("Unexpected math outside equation environment."),
+        Expr::MathIdent(_) => panic!("Unexpected math outside equation environment."),
+        Expr::MathShorthand(_) => panic!("Unexpected math outside equation environment."),
+        Expr::MathAlignPoint(_) => panic!("Unexpected math outside equation environment."),
+        Expr::MathDelimited(_) => panic!("Unexpected math outside equation environment."),
+        Expr::MathAttach(_) => panic!("Unexpected math outside equation environment."),
+        Expr::MathPrimes(_) => panic!("Unexpected math outside equation environment."),
+        Expr::MathFrac(_) => panic!("Unexpected math outside equation environment."),
+        Expr::MathRoot(_) => panic!("Unexpected math outside equation environment."),
         Expr::Ident(a) => constant_token!(offset, doc, a, TokenKind::Word(WordMetadata::default())),
         Expr::None(a) => constant_token!(offset, doc, a, TokenKind::Word(WordMetadata::default())),
         Expr::Auto(a) => constant_token!(offset, doc, a, TokenKind::Word(WordMetadata::default())),
@@ -103,16 +134,7 @@ fn map_token(
         Expr::Int(int) => todo!(),
         Expr::Float(float) => todo!(),
         Expr::Numeric(a) => constant_token!(offset, doc, a, TokenKind::Unlintable),
-        Expr::Str(text) => Some(
-            parser
-                .parse_str(text.get())
-                .into_iter()
-                .map(|mut t| {
-                    t.span.push_by(*offset);
-                    t
-                })
-                .collect_vec(),
-        ),
+        Expr::Str(text) => parse_english(text.get(), parser, offset),
         Expr::Code(a) => constant_token!(offset, doc, a, TokenKind::Unlintable),
         Expr::Content(content_block) => {
             recursive_env(&mut content_block.body().exprs(), doc, parser, offset)
@@ -131,25 +153,64 @@ fn map_token(
                 .flatten()
                 .collect_vec(),
         ),
-        Expr::Dict(dict) => todo!(),
-        Expr::Unary(unary) => todo!(),
-        Expr::Binary(binary) => todo!(),
-        Expr::FieldAccess(field_access) => todo!(),
-        Expr::FuncCall(func_call) => todo!(),
-        Expr::Closure(closure) => todo!(),
-        Expr::Let(let_binding) => todo!(),
-        Expr::DestructAssign(destruct_assignment) => todo!(),
-        Expr::Set(set_rule) => todo!(),
-        Expr::Show(show_rule) => todo!(),
-        Expr::Contextual(contextual) => todo!(),
-        Expr::Conditional(conditional) => todo!(),
-        Expr::While(while_loop) => todo!(),
-        Expr::For(for_loop) => todo!(),
-        Expr::Import(module_import) => todo!(),
-        Expr::Include(module_include) => todo!(),
-        Expr::Break(loop_break) => todo!(),
-        Expr::Continue(loop_continue) => todo!(),
-        Expr::Return(func_return) => todo!(),
+        // TODO: actually parse dictionaries
+        Expr::Dict(a) => constant_token!(offset, doc, a, TokenKind::Unlintable),
+        Expr::Unary(a) => constant_token!(offset, doc, a, TokenKind::Unlintable),
+        Expr::Binary(a) => constant_token!(offset, doc, a, TokenKind::Unlintable),
+        Expr::FieldAccess(field_access) => merge_expr!(
+            map_token(field_access.target(), doc, parser, offset),
+            constant_token!(
+                offset,
+                doc,
+                field_access.field(),
+                TokenKind::Word(WordMetadata::default())
+            )
+        ),
+        Expr::FuncCall(a) => constant_token!(offset, doc, a, TokenKind::Unlintable),
+        Expr::Closure(a) => constant_token!(offset, doc, a, TokenKind::Unlintable),
+        Expr::Let(let_binding) => let_binding
+            .init()
+            .and_then(|e| map_token(e, doc, parser, offset)),
+        Expr::DestructAssign(destruct_assignment) => {
+            map_token(destruct_assignment.value(), doc, parser, offset)
+        }
+        Expr::Set(set_rule) => merge_expr!(
+            map_token(set_rule.target(), doc, parser, offset),
+            map_token(set_rule.condition()?, doc, parser, offset)
+        ),
+        Expr::Show(show_rule) => merge_expr!(
+            map_token(show_rule.transform(), doc, parser, offset),
+            map_token(show_rule.selector()?, doc, parser, offset)
+        ),
+        Expr::Contextual(contextual) => map_token(contextual.body(), doc, parser, offset),
+        Expr::Conditional(conditional) => merge_expr!(
+            map_token(conditional.condition(), doc, parser, offset),
+            map_token(conditional.if_body(), doc, parser, offset),
+            map_token(conditional.else_body()?, doc, parser, offset)
+        ),
+        Expr::While(while_loop) => merge_expr!(
+            map_token(while_loop.condition(), doc, parser, offset),
+            map_token(while_loop.body(), doc, parser, offset)
+        ),
+        Expr::For(for_loop) => merge_expr!(
+            map_token(for_loop.iterable(), doc, parser, offset),
+            map_token(for_loop.body(), doc, parser, offset)
+        ),
+        Expr::Import(module_import) => {
+            merge_expr!(
+                map_token(module_import.source(), doc, parser, offset),
+                constant_token!(
+                    offset,
+                    doc,
+                    module_import.new_name()?,
+                    TokenKind::Word(WordMetadata::default())
+                )
+            )
+        }
+        Expr::Include(module_include) => map_token(module_include.source(), doc, parser, offset),
+        Expr::Break(a) => constant_token!(offset, doc, a, TokenKind::Unlintable),
+        Expr::Continue(a) => constant_token!(offset, doc, a, TokenKind::Unlintable),
+        Expr::Return(a) => constant_token!(offset, doc, a, TokenKind::Unlintable),
     }
 }
 
@@ -172,3 +233,72 @@ impl Parser for Typst {
             .collect_vec()
     }
 }
+
+#[cfg(test)]
+mod tests {
+    use super::Typst;
+    use crate::{parsers::StrParser, Punctuation, TokenKind};
+
+    #[test]
+    fn conjunction() {
+        let source = r"doesn't";
+
+        let tokens = Typst.parse_str(source);
+
+        let token_kinds = tokens.iter().map(|t| t.kind).collect::<Vec<_>>();
+
+        dbg!(&token_kinds);
+
+        assert!(matches!(token_kinds.as_slice(), &[TokenKind::Word(_),]))
+    }
+
+    #[test]
+    fn sentence() {
+        let source = r"This is a sentence, it does not have any particularly interesting elements of the typst syntax.";
+
+        let tokens = Typst.parse_str(source);
+
+        let token_kinds = tokens.iter().map(|t| t.kind).collect::<Vec<_>>();
+
+        dbg!(&token_kinds);
+
+        assert!(matches!(
+            token_kinds.as_slice(),
+            &[
+                TokenKind::Word(_),
+                TokenKind::Space(1),
+                TokenKind::Word(_),
+                TokenKind::Space(1),
+                TokenKind::Word(_),
+                TokenKind::Space(1),
+                TokenKind::Word(_),
+                TokenKind::Punctuation(Punctuation::Comma),
+                TokenKind::Space(1),
+                TokenKind::Word(_),
+                TokenKind::Space(1),
+                TokenKind::Word(_),
+                TokenKind::Space(1),
+                TokenKind::Word(_),
+                TokenKind::Space(1),
+                TokenKind::Word(_),
+                TokenKind::Space(1),
+                TokenKind::Word(_),
+                TokenKind::Space(1),
+                TokenKind::Word(_),
+                TokenKind::Space(1),
+                TokenKind::Word(_),
+                TokenKind::Space(1),
+                TokenKind::Word(_),
+                TokenKind::Space(1),
+                TokenKind::Word(_),
+                TokenKind::Space(1),
+                TokenKind::Word(_),
+                TokenKind::Space(1),
+                TokenKind::Word(_),
+                TokenKind::Space(1),
+                TokenKind::Word(_),
+                TokenKind::Punctuation(Punctuation::Period),
+            ]
+        ))
+    }
+}

From 9376e71e8abf8d869a6071817c62cb9538435ed1 Mon Sep 17 00:00:00 2001
From: Grant Lemons <grantlemons@aol.com>
Date: Mon, 25 Nov 2024 23:25:17 -0700
Subject: [PATCH 04/51] feat(#230): delegate typst files to parser in
 harper-cli and harper-ls

---
 harper-cli/src/main.rs         | 4 +++-
 harper-core/src/parsers/mod.rs | 1 +
 harper-ls/src/backend.rs       | 6 +++++-
 3 files changed, 9 insertions(+), 2 deletions(-)

diff --git a/harper-cli/src/main.rs b/harper-cli/src/main.rs
index 73b7d45d..1a3e3639 100644
--- a/harper-cli/src/main.rs
+++ b/harper-cli/src/main.rs
@@ -7,7 +7,7 @@ use ariadne::{Color, Label, Report, ReportKind, Source};
 use clap::Parser;
 use harper_comments::CommentParser;
 use harper_core::linting::{LintGroup, LintGroupConfig, Linter};
-use harper_core::parsers::Markdown;
+use harper_core::parsers::{Markdown, Typst};
 use harper_core::{remove_overlaps, Dictionary, Document, FstDictionary};
 
 #[derive(Debug, Parser)]
@@ -107,6 +107,8 @@ fn load_file(file: &Path) -> anyhow::Result<(Document, String)> {
     let mut parser: Box<dyn harper_core::parsers::Parser> =
         if let Some("md") = file.extension().map(|v| v.to_str().unwrap()) {
             Box::new(Markdown)
+        } else if let Some("typ") = file.extension().map(|v| v.to_str().unwrap()) {
+            Box::new(Typst)
         } else {
             Box::new(
                 CommentParser::new_from_filename(file)
diff --git a/harper-core/src/parsers/mod.rs b/harper-core/src/parsers/mod.rs
index 08f53bbf..af742a3e 100644
--- a/harper-core/src/parsers/mod.rs
+++ b/harper-core/src/parsers/mod.rs
@@ -11,6 +11,7 @@ pub use isolate_english::IsolateEnglish;
 pub use markdown::Markdown;
 pub use mask::Mask;
 pub use plain_english::PlainEnglish;
+pub use typst::Typst;
 
 pub use crate::token::{Token, TokenKind, TokenStringExt};
 
diff --git a/harper-ls/src/backend.rs b/harper-ls/src/backend.rs
index 73ceedeb..7357d4f2 100644
--- a/harper-ls/src/backend.rs
+++ b/harper-ls/src/backend.rs
@@ -5,7 +5,9 @@ use std::sync::Arc;
 use anyhow::anyhow;
 use harper_comments::CommentParser;
 use harper_core::linting::{LintGroup, Linter};
-use harper_core::parsers::{CollapseIdentifiers, IsolateEnglish, Markdown, Parser, PlainEnglish};
+use harper_core::parsers::{
+    CollapseIdentifiers, IsolateEnglish, Markdown, Parser, PlainEnglish, Typst,
+};
 use harper_core::{
     Dictionary, Document, FstDictionary, FullDictionary, MergedDictionary, Token, TokenKind,
     WordMetadata,
@@ -206,6 +208,8 @@ impl Backend {
                 }
             } else if language_id == "markdown" {
                 Some(Box::new(Markdown))
+            } else if language_id == "typst" {
+                Some(Box::new(Typst))
             } else if language_id == "git-commit" {
                 Some(Box::new(GitCommitParser))
             } else if language_id == "html" {

From 749e6dd47366edfa14d04104a6a88e66d975a136 Mon Sep 17 00:00:00 2001
From: Grant Lemons <grantlemons@aol.com>
Date: Mon, 25 Nov 2024 23:32:28 -0700
Subject: [PATCH 05/51] fix(#230): fix offset update after delegating parser

---
 harper-core/src/parsers/typst.rs | 2 +-
 1 file changed, 1 insertion(+), 1 deletion(-)

diff --git a/harper-core/src/parsers/typst.rs b/harper-core/src/parsers/typst.rs
index 6c15494e..3a894112 100644
--- a/harper-core/src/parsers/typst.rs
+++ b/harper-core/src/parsers/typst.rs
@@ -63,7 +63,7 @@ fn parse_english(
             t
         })
         .collect_vec();
-    *offset = res.last()?.span.end - 1;
+    *offset = res.last()?.span.end;
     Some(res)
 }
 

From ba3c3070f62ced7b6173a608e6f46ff22b1c20ae Mon Sep 17 00:00:00 2001
From: Grant Lemons <grantlemons@aol.com>
Date: Mon, 25 Nov 2024 23:58:30 -0700
Subject: [PATCH 06/51] fix(#230): ParBreak to ParBreak, not two Newlines

---
 harper-core/src/parsers/typst.rs | 2 +-
 1 file changed, 1 insertion(+), 1 deletion(-)

diff --git a/harper-core/src/parsers/typst.rs b/harper-core/src/parsers/typst.rs
index 3a894112..8d9b5e02 100644
--- a/harper-core/src/parsers/typst.rs
+++ b/harper-core/src/parsers/typst.rs
@@ -77,7 +77,7 @@ fn map_token(
         Expr::Text(text) => parse_english(text.get(), parser, offset),
         Expr::Space(a) => constant_token!(offset, doc, a, TokenKind::Space(1)),
         Expr::Linebreak(a) => constant_token!(offset, doc, a, TokenKind::Newline(1)),
-        Expr::Parbreak(a) => constant_token!(offset, doc, a, TokenKind::Newline(2)),
+        Expr::Parbreak(a) => constant_token!(offset, doc, a, TokenKind::ParagraphBreak),
         Expr::Escape(a) => constant_token!(offset, doc, a, TokenKind::Unlintable),
         Expr::Shorthand(a) => constant_token!(offset, doc, a, TokenKind::Unlintable),
         Expr::SmartQuote(quote) => {

From c6a4d05ed83dab35876006f0353b9e0c0fddf1e7 Mon Sep 17 00:00:00 2001
From: Grant Lemons <grantlemons@aol.com>
Date: Tue, 26 Nov 2024 16:58:26 -0700
Subject: [PATCH 07/51] feat(#230): remove offset variable, and just use the
 start of an environment's span

---
 harper-core/src/parsers/typst.rs | 138 +++++++++++++------------------
 1 file changed, 59 insertions(+), 79 deletions(-)

diff --git a/harper-core/src/parsers/typst.rs b/harper-core/src/parsers/typst.rs
index 8d9b5e02..8edfe427 100644
--- a/harper-core/src/parsers/typst.rs
+++ b/harper-core/src/parsers/typst.rs
@@ -10,11 +10,9 @@ use crate::{parsers::StrParser, Punctuation, Token, TokenKind, WordMetadata};
 pub struct Typst;
 
 macro_rules! constant_token {
-    ($offset:ident, $doc:ident, $a:expr, $to:expr) => {{
-        let range = $doc.range($a.span()).unwrap();
-        *$offset += range.len();
+    ($doc:ident, $a:expr, $to:expr) => {{
         Some(vec![Token {
-            span: range.into(),
+            span: $doc.range($a.span()).unwrap().into(),
             kind: $to,
         }])
     }};
@@ -36,15 +34,10 @@ fn recursive_env(
     exprs: &mut dyn Iterator<Item = typst_syntax::ast::Expr>,
     doc: &typst_syntax::Source,
     parser: &mut PlainEnglish,
-    offset: &mut usize,
 ) -> Option<Vec<Token>> {
     Some(
         exprs
-            .filter_map(|e| {
-                let range = doc.range(e.span()).unwrap();
-                *offset += range.len();
-                map_token(e, doc, parser, offset)
-            })
+            .filter_map(|e| map_token(e, doc, parser))
             .flatten()
             .collect_vec(),
     )
@@ -52,18 +45,18 @@ fn recursive_env(
 
 fn parse_english(
     str: impl Into<String>,
+    doc: &typst_syntax::Source,
     parser: &mut PlainEnglish,
-    offset: &mut usize,
+    span: &typst_syntax::Span,
 ) -> Option<Vec<Token>> {
     let res = parser
         .parse_str(str.into())
         .into_iter()
         .map(|mut t| {
-            t.span.push_by(*offset);
+            t.span.push_by(doc.range(*span).unwrap().start);
             t
         })
         .collect_vec();
-    *offset = res.last()?.span.end;
     Some(res)
 }
 
@@ -71,43 +64,36 @@ fn map_token(
     ex: typst_syntax::ast::Expr,
     doc: &typst_syntax::Source,
     parser: &mut PlainEnglish,
-    offset: &mut usize,
 ) -> Option<Vec<Token>> {
     match ex {
-        Expr::Text(text) => parse_english(text.get(), parser, offset),
-        Expr::Space(a) => constant_token!(offset, doc, a, TokenKind::Space(1)),
-        Expr::Linebreak(a) => constant_token!(offset, doc, a, TokenKind::Newline(1)),
-        Expr::Parbreak(a) => constant_token!(offset, doc, a, TokenKind::ParagraphBreak),
-        Expr::Escape(a) => constant_token!(offset, doc, a, TokenKind::Unlintable),
-        Expr::Shorthand(a) => constant_token!(offset, doc, a, TokenKind::Unlintable),
+        Expr::Text(text) => parse_english(text.get(), doc, parser, &text.span()),
+        Expr::Space(a) => constant_token!(doc, a, TokenKind::Space(1)),
+        Expr::Linebreak(a) => constant_token!(doc, a, TokenKind::Newline(1)),
+        Expr::Parbreak(a) => constant_token!(doc, a, TokenKind::ParagraphBreak),
+        Expr::Escape(a) => constant_token!(doc, a, TokenKind::Unlintable),
+        Expr::Shorthand(a) => constant_token!(doc, a, TokenKind::Unlintable),
         Expr::SmartQuote(quote) => {
             if quote.double() {
                 constant_token!(
-                    offset,
                     doc,
                     quote,
                     TokenKind::Punctuation(Punctuation::Quote(crate::Quote { twin_loc: None }))
                 )
             } else {
-                constant_token!(
-                    offset,
-                    doc,
-                    quote,
-                    TokenKind::Punctuation(Punctuation::Apostrophe)
-                )
+                constant_token!(doc, quote, TokenKind::Punctuation(Punctuation::Apostrophe))
             }
         }
-        Expr::Strong(strong) => recursive_env(&mut strong.body().exprs(), doc, parser, offset),
-        Expr::Emph(emph) => recursive_env(&mut emph.body().exprs(), doc, parser, offset),
-        Expr::Raw(a) => constant_token!(offset, doc, a, TokenKind::Unlintable),
-        Expr::Link(a) => constant_token!(offset, doc, a, TokenKind::Url),
-        Expr::Label(label) => parse_english(label.get(), parser, offset),
+        Expr::Strong(strong) => recursive_env(&mut strong.body().exprs(), doc, parser),
+        Expr::Emph(emph) => recursive_env(&mut emph.body().exprs(), doc, parser),
+        Expr::Raw(a) => constant_token!(doc, a, TokenKind::Unlintable),
+        Expr::Link(a) => constant_token!(doc, a, TokenKind::Url),
+        Expr::Label(label) => parse_english(label.get(), doc, parser, &label.span()),
         Expr::Ref(a) => {
-            constant_token!(offset, doc, a, TokenKind::Word(WordMetadata::default()))
+            constant_token!(doc, a, TokenKind::Word(WordMetadata::default()))
         }
-        Expr::Heading(heading) => recursive_env(&mut heading.body().exprs(), doc, parser, offset),
-        Expr::List(list_item) => recursive_env(&mut list_item.body().exprs(), doc, parser, offset),
-        Expr::Enum(enum_item) => recursive_env(&mut enum_item.body().exprs(), doc, parser, offset),
+        Expr::Heading(heading) => recursive_env(&mut heading.body().exprs(), doc, parser),
+        Expr::List(list_item) => recursive_env(&mut list_item.body().exprs(), doc, parser),
+        Expr::Enum(enum_item) => recursive_env(&mut enum_item.body().exprs(), doc, parser),
         Expr::Term(term_item) => recursive_env(
             &mut term_item
                 .term()
@@ -115,9 +101,8 @@ fn map_token(
                 .chain(term_item.description().exprs()),
             doc,
             parser,
-            offset,
         ),
-        Expr::Equation(a) => constant_token!(offset, doc, a, TokenKind::Unlintable),
+        Expr::Equation(a) => constant_token!(doc, a, TokenKind::Unlintable),
         Expr::Math(_) => panic!("Unexpected math outside equation environment."),
         Expr::MathIdent(_) => panic!("Unexpected math outside equation environment."),
         Expr::MathShorthand(_) => panic!("Unexpected math outside equation environment."),
@@ -127,25 +112,25 @@ fn map_token(
         Expr::MathPrimes(_) => panic!("Unexpected math outside equation environment."),
         Expr::MathFrac(_) => panic!("Unexpected math outside equation environment."),
         Expr::MathRoot(_) => panic!("Unexpected math outside equation environment."),
-        Expr::Ident(a) => constant_token!(offset, doc, a, TokenKind::Word(WordMetadata::default())),
-        Expr::None(a) => constant_token!(offset, doc, a, TokenKind::Word(WordMetadata::default())),
-        Expr::Auto(a) => constant_token!(offset, doc, a, TokenKind::Word(WordMetadata::default())),
-        Expr::Bool(a) => constant_token!(offset, doc, a, TokenKind::Word(WordMetadata::default())),
+        Expr::Ident(a) => constant_token!(doc, a, TokenKind::Word(WordMetadata::default())),
+        Expr::None(a) => constant_token!(doc, a, TokenKind::Word(WordMetadata::default())),
+        Expr::Auto(a) => constant_token!(doc, a, TokenKind::Word(WordMetadata::default())),
+        Expr::Bool(a) => constant_token!(doc, a, TokenKind::Word(WordMetadata::default())),
         Expr::Int(int) => todo!(),
         Expr::Float(float) => todo!(),
-        Expr::Numeric(a) => constant_token!(offset, doc, a, TokenKind::Unlintable),
-        Expr::Str(text) => parse_english(text.get(), parser, offset),
-        Expr::Code(a) => constant_token!(offset, doc, a, TokenKind::Unlintable),
+        Expr::Numeric(a) => constant_token!(doc, a, TokenKind::Unlintable),
+        Expr::Str(text) => parse_english(text.get(), doc, parser, &text.span()),
+        Expr::Code(a) => constant_token!(doc, a, TokenKind::Unlintable),
         Expr::Content(content_block) => {
-            recursive_env(&mut content_block.body().exprs(), doc, parser, offset)
+            recursive_env(&mut content_block.body().exprs(), doc, parser)
         }
-        Expr::Parenthesized(parenthesized) => map_token(parenthesized.expr(), doc, parser, offset),
+        Expr::Parenthesized(parenthesized) => map_token(parenthesized.expr(), doc, parser),
         Expr::Array(array) => Some(
             array
                 .items()
                 .filter_map(|i| {
                     if let typst_syntax::ast::ArrayItem::Pos(e) = i {
-                        map_token(e, doc, parser, offset)
+                        map_token(e, doc, parser)
                     } else {
                         None
                     }
@@ -154,63 +139,59 @@ fn map_token(
                 .collect_vec(),
         ),
         // TODO: actually parse dictionaries
-        Expr::Dict(a) => constant_token!(offset, doc, a, TokenKind::Unlintable),
-        Expr::Unary(a) => constant_token!(offset, doc, a, TokenKind::Unlintable),
-        Expr::Binary(a) => constant_token!(offset, doc, a, TokenKind::Unlintable),
+        Expr::Dict(a) => constant_token!(doc, a, TokenKind::Unlintable),
+        Expr::Unary(a) => constant_token!(doc, a, TokenKind::Unlintable),
+        Expr::Binary(a) => constant_token!(doc, a, TokenKind::Unlintable),
         Expr::FieldAccess(field_access) => merge_expr!(
-            map_token(field_access.target(), doc, parser, offset),
+            map_token(field_access.target(), doc, parser),
             constant_token!(
-                offset,
                 doc,
                 field_access.field(),
                 TokenKind::Word(WordMetadata::default())
             )
         ),
-        Expr::FuncCall(a) => constant_token!(offset, doc, a, TokenKind::Unlintable),
-        Expr::Closure(a) => constant_token!(offset, doc, a, TokenKind::Unlintable),
-        Expr::Let(let_binding) => let_binding
-            .init()
-            .and_then(|e| map_token(e, doc, parser, offset)),
+        Expr::FuncCall(a) => constant_token!(doc, a, TokenKind::Unlintable),
+        Expr::Closure(a) => constant_token!(doc, a, TokenKind::Unlintable),
+        Expr::Let(let_binding) => let_binding.init().and_then(|e| map_token(e, doc, parser)),
         Expr::DestructAssign(destruct_assignment) => {
-            map_token(destruct_assignment.value(), doc, parser, offset)
+            map_token(destruct_assignment.value(), doc, parser)
         }
         Expr::Set(set_rule) => merge_expr!(
-            map_token(set_rule.target(), doc, parser, offset),
-            map_token(set_rule.condition()?, doc, parser, offset)
+            map_token(set_rule.target(), doc, parser),
+            map_token(set_rule.condition()?, doc, parser)
         ),
         Expr::Show(show_rule) => merge_expr!(
-            map_token(show_rule.transform(), doc, parser, offset),
-            map_token(show_rule.selector()?, doc, parser, offset)
+            map_token(show_rule.transform(), doc, parser),
+            map_token(show_rule.selector()?, doc, parser)
         ),
-        Expr::Contextual(contextual) => map_token(contextual.body(), doc, parser, offset),
+        Expr::Contextual(contextual) => map_token(contextual.body(), doc, parser),
         Expr::Conditional(conditional) => merge_expr!(
-            map_token(conditional.condition(), doc, parser, offset),
-            map_token(conditional.if_body(), doc, parser, offset),
-            map_token(conditional.else_body()?, doc, parser, offset)
+            map_token(conditional.condition(), doc, parser),
+            map_token(conditional.if_body(), doc, parser),
+            map_token(conditional.else_body()?, doc, parser)
         ),
         Expr::While(while_loop) => merge_expr!(
-            map_token(while_loop.condition(), doc, parser, offset),
-            map_token(while_loop.body(), doc, parser, offset)
+            map_token(while_loop.condition(), doc, parser),
+            map_token(while_loop.body(), doc, parser)
         ),
         Expr::For(for_loop) => merge_expr!(
-            map_token(for_loop.iterable(), doc, parser, offset),
-            map_token(for_loop.body(), doc, parser, offset)
+            map_token(for_loop.iterable(), doc, parser),
+            map_token(for_loop.body(), doc, parser)
         ),
         Expr::Import(module_import) => {
             merge_expr!(
-                map_token(module_import.source(), doc, parser, offset),
+                map_token(module_import.source(), doc, parser),
                 constant_token!(
-                    offset,
                     doc,
                     module_import.new_name()?,
                     TokenKind::Word(WordMetadata::default())
                 )
             )
         }
-        Expr::Include(module_include) => map_token(module_include.source(), doc, parser, offset),
-        Expr::Break(a) => constant_token!(offset, doc, a, TokenKind::Unlintable),
-        Expr::Continue(a) => constant_token!(offset, doc, a, TokenKind::Unlintable),
-        Expr::Return(a) => constant_token!(offset, doc, a, TokenKind::Unlintable),
+        Expr::Include(module_include) => map_token(module_include.source(), doc, parser),
+        Expr::Break(a) => constant_token!(doc, a, TokenKind::Unlintable),
+        Expr::Continue(a) => constant_token!(doc, a, TokenKind::Unlintable),
+        Expr::Return(a) => constant_token!(doc, a, TokenKind::Unlintable),
     }
 }
 
@@ -222,13 +203,12 @@ impl Parser for Typst {
         let typst_document = typst_syntax::Source::detached(source_str);
         let typst_tree = Markup::from_untyped(typst_document.root())
             .expect("Unable to create typst document from parsed tree!");
-        let mut offset = 0;
 
         // NOTE: the range spits out __byte__ indices, not char indices.
         // This is why we keep track above.
         typst_tree
             .exprs()
-            .filter_map(|ex| map_token(ex, &typst_document, &mut english_parser, &mut offset))
+            .filter_map(|ex| map_token(ex, &typst_document, &mut english_parser))
             .flatten()
             .collect_vec()
     }

From 042511096bb624611fe53e45132ae10debaa3f56 Mon Sep 17 00:00:00 2001
From: Grant Lemons <grantlemons@aol.com>
Date: Wed, 27 Nov 2024 11:45:34 -0700
Subject: [PATCH 08/51] feat(#230): parse numbers properly and add test for
 numbers

---
 harper-core/src/parsers/typst.rs | 54 ++++++++++++++++++++++++++++++--
 1 file changed, 52 insertions(+), 2 deletions(-)

diff --git a/harper-core/src/parsers/typst.rs b/harper-core/src/parsers/typst.rs
index 8edfe427..3621bc7c 100644
--- a/harper-core/src/parsers/typst.rs
+++ b/harper-core/src/parsers/typst.rs
@@ -116,8 +116,12 @@ fn map_token(
         Expr::None(a) => constant_token!(doc, a, TokenKind::Word(WordMetadata::default())),
         Expr::Auto(a) => constant_token!(doc, a, TokenKind::Word(WordMetadata::default())),
         Expr::Bool(a) => constant_token!(doc, a, TokenKind::Word(WordMetadata::default())),
-        Expr::Int(int) => todo!(),
-        Expr::Float(float) => todo!(),
+        Expr::Int(int) => {
+            constant_token!(doc, int, TokenKind::Number((int.get() as f64).into(), None))
+        }
+        Expr::Float(float) => {
+            constant_token!(doc, float, TokenKind::Number(float.get().into(), None))
+        }
         Expr::Numeric(a) => constant_token!(doc, a, TokenKind::Unlintable),
         Expr::Str(text) => parse_english(text.get(), doc, parser, &text.span()),
         Expr::Code(a) => constant_token!(doc, a, TokenKind::Unlintable),
@@ -216,6 +220,8 @@ impl Parser for Typst {
 
 #[cfg(test)]
 mod tests {
+    use ordered_float::OrderedFloat;
+
     use super::Typst;
     use crate::{parsers::StrParser, Punctuation, TokenKind};
 
@@ -232,6 +238,50 @@ mod tests {
         assert!(matches!(token_kinds.as_slice(), &[TokenKind::Word(_),]))
     }
 
+    #[test]
+    fn number() {
+        let source = r"The number 12 is larger than 11, but is much less than 11!";
+
+        let tokens = Typst.parse_str(source);
+
+        let token_kinds = tokens.iter().map(|t| t.kind).collect::<Vec<_>>();
+
+        dbg!(&token_kinds);
+
+        assert!(matches!(
+            token_kinds.as_slice(),
+            &[
+                TokenKind::Word(_),
+                TokenKind::Space(1),
+                TokenKind::Word(_),
+                TokenKind::Space(1),
+                TokenKind::Number(OrderedFloat(12.0), None),
+                TokenKind::Space(1),
+                TokenKind::Word(_),
+                TokenKind::Space(1),
+                TokenKind::Word(_),
+                TokenKind::Space(1),
+                TokenKind::Word(_),
+                TokenKind::Space(1),
+                TokenKind::Number(OrderedFloat(11.0), None),
+                TokenKind::Punctuation(Punctuation::Comma),
+                TokenKind::Space(1),
+                TokenKind::Word(_),
+                TokenKind::Space(1),
+                TokenKind::Word(_),
+                TokenKind::Space(1),
+                TokenKind::Word(_),
+                TokenKind::Space(1),
+                TokenKind::Word(_),
+                TokenKind::Space(1),
+                TokenKind::Word(_),
+                TokenKind::Space(1),
+                TokenKind::Number(OrderedFloat(11.0), None),
+                TokenKind::Punctuation(Punctuation::Bang),
+            ]
+        ))
+    }
+
     #[test]
     fn sentence() {
         let source = r"This is a sentence, it does not have any particularly interesting elements of the typst syntax.";

From 1f43b27eefd3e6712b30af94e91470a5c271b2e2 Mon Sep 17 00:00:00 2001
From: Grant Lemons <grantlemons@aol.com>
Date: Wed, 27 Nov 2024 14:23:52 -0700
Subject: [PATCH 09/51] feat(#230): consolidate words separated by apostrophes
 into possessives or conjunctions

---
 harper-core/src/parsers/typst.rs             | 51 ++++++++++++++++++--
 harper-core/src/patterns/sequence_pattern.rs |  1 +
 2 files changed, 48 insertions(+), 4 deletions(-)

diff --git a/harper-core/src/parsers/typst.rs b/harper-core/src/parsers/typst.rs
index 3621bc7c..682413e8 100644
--- a/harper-core/src/parsers/typst.rs
+++ b/harper-core/src/parsers/typst.rs
@@ -1,9 +1,13 @@
 use itertools::Itertools;
-
+use std::collections::VecDeque;
 use typst_syntax::ast::{AstNode, Expr, Markup};
 
 use super::{Parser, PlainEnglish};
-use crate::{parsers::StrParser, Punctuation, Token, TokenKind, WordMetadata};
+use crate::{
+    parsers::StrParser,
+    patterns::{PatternExt, SequencePattern},
+    ConjunctionData, Lrc, Punctuation, Span, Token, TokenKind, VecExt, WordMetadata,
+};
 
 /// A parser that wraps the [`PlainEnglish`] parser that allows one to parse
 /// Typst files.
@@ -199,6 +203,13 @@ fn map_token(
     }
 }
 
+thread_local! {
+    static WORD_APOSTROPHE_WORD: Lrc<SequencePattern> = Lrc::new(SequencePattern::default()
+                .then_any_word()
+                .then_apostrophe()
+                .then_any_word());
+}
+
 impl Parser for Typst {
     fn parse(&mut self, source: &[char]) -> Vec<Token> {
         let mut english_parser = PlainEnglish;
@@ -210,11 +221,43 @@ impl Parser for Typst {
 
         // NOTE: the range spits out __byte__ indices, not char indices.
         // This is why we keep track above.
-        typst_tree
+        let mut tokens = typst_tree
             .exprs()
             .filter_map(|ex| map_token(ex, &typst_document, &mut english_parser))
             .flatten()
-            .collect_vec()
+            .collect_vec();
+
+        // Consolidate conjunctions
+        let mut to_remove = VecDeque::default();
+        for tok_span in WORD_APOSTROPHE_WORD
+            .with(|v| v.clone())
+            .find_all_matches(&tokens, source)
+        {
+            let start_tok = &tokens[tok_span.start];
+            let end_tok = &tokens[tok_span.end - 1];
+            let char_span = Span::new(start_tok.span.start, end_tok.span.end);
+
+            if let TokenKind::Word(metadata) = start_tok.kind {
+                if end_tok.span.get_content(source) == &['s'] {
+                    if let Some(mut noun) = metadata.noun {
+                        noun.is_possessive = Some(true);
+                    }
+                } else {
+                    tokens[tok_span.start].kind = TokenKind::Word(WordMetadata {
+                        conjunction: Some(ConjunctionData {}),
+                        ..metadata
+                    });
+                };
+
+                tokens[tok_span.start].span = char_span;
+                to_remove.extend(tok_span.start + 1..tok_span.end);
+            } else {
+                panic!("Apostrophe consolidation does not start with Word Token!")
+            }
+        }
+        tokens.remove_indices(to_remove.into_iter().sorted().unique().collect());
+
+        tokens
     }
 }
 
diff --git a/harper-core/src/patterns/sequence_pattern.rs b/harper-core/src/patterns/sequence_pattern.rs
index c26a2035..02a3788e 100644
--- a/harper-core/src/patterns/sequence_pattern.rs
+++ b/harper-core/src/patterns/sequence_pattern.rs
@@ -43,6 +43,7 @@ impl SequencePattern {
     gen_then_from_is!(case_separator);
     gen_then_from_is!(adverb);
     gen_then_from_is!(adjective);
+    gen_then_from_is!(apostrophe);
 
     pub fn then_exact_word(mut self, word: &'static str) -> Self {
         self.token_patterns

From 835c3964c45b61d977d23e06cd55d272655a6be6 Mon Sep 17 00:00:00 2001
From: Grant Lemons <grantlemons@aol.com>
Date: Wed, 27 Nov 2024 14:25:58 -0700
Subject: [PATCH 10/51] fix(clippy): satisfy clippy

---
 harper-core/src/parsers/typst.rs | 2 +-
 1 file changed, 1 insertion(+), 1 deletion(-)

diff --git a/harper-core/src/parsers/typst.rs b/harper-core/src/parsers/typst.rs
index 682413e8..1ce641ba 100644
--- a/harper-core/src/parsers/typst.rs
+++ b/harper-core/src/parsers/typst.rs
@@ -238,7 +238,7 @@ impl Parser for Typst {
             let char_span = Span::new(start_tok.span.start, end_tok.span.end);
 
             if let TokenKind::Word(metadata) = start_tok.kind {
-                if end_tok.span.get_content(source) == &['s'] {
+                if end_tok.span.get_content(source) == ['s'] {
                     if let Some(mut noun) = metadata.noun {
                         noun.is_possessive = Some(true);
                     }

From 4dbc264cda939a32deab24c98f7409411cff040e Mon Sep 17 00:00:00 2001
From: Grant Lemons <grantlemons@aol.com>
Date: Wed, 27 Nov 2024 15:29:18 -0700
Subject: [PATCH 11/51] feat(#230): simplify possessive-conjunction logic and
 add respective tests

---
 harper-core/src/parsers/typst.rs | 89 +++++++++++++++++++++++++-------
 harper-core/src/word_metadata.rs | 10 ++--
 2 files changed, 75 insertions(+), 24 deletions(-)

diff --git a/harper-core/src/parsers/typst.rs b/harper-core/src/parsers/typst.rs
index 1ce641ba..92ba5bb5 100644
--- a/harper-core/src/parsers/typst.rs
+++ b/harper-core/src/parsers/typst.rs
@@ -6,7 +6,7 @@ use super::{Parser, PlainEnglish};
 use crate::{
     parsers::StrParser,
     patterns::{PatternExt, SequencePattern},
-    ConjunctionData, Lrc, Punctuation, Span, Token, TokenKind, VecExt, WordMetadata,
+    ConjunctionData, Lrc, NounData, Punctuation, Span, Token, TokenKind, VecExt, WordMetadata,
 };
 
 /// A parser that wraps the [`PlainEnglish`] parser that allows one to parse
@@ -238,16 +238,26 @@ impl Parser for Typst {
             let char_span = Span::new(start_tok.span.start, end_tok.span.end);
 
             if let TokenKind::Word(metadata) = start_tok.kind {
-                if end_tok.span.get_content(source) == ['s'] {
-                    if let Some(mut noun) = metadata.noun {
-                        noun.is_possessive = Some(true);
-                    }
-                } else {
-                    tokens[tok_span.start].kind = TokenKind::Word(WordMetadata {
-                        conjunction: Some(ConjunctionData {}),
-                        ..metadata
+                tokens[tok_span.start].kind =
+                    TokenKind::Word(if end_tok.span.get_content(source) == ['s'] {
+                        WordMetadata {
+                            noun: Some(NounData {
+                                is_possessive: Some(true),
+                                ..metadata.noun.unwrap_or_default()
+                            }),
+                            conjunction: None,
+                            ..metadata
+                        }
+                    } else {
+                        WordMetadata {
+                            noun: metadata.noun.map(|noun| NounData {
+                                is_possessive: Some(false),
+                                ..noun
+                            }),
+                            conjunction: Some(ConjunctionData {}),
+                            ..metadata
+                        }
                     });
-                };
 
                 tokens[tok_span.start].span = char_span;
                 to_remove.extend(tok_span.start + 1..tok_span.end);
@@ -266,7 +276,7 @@ mod tests {
     use ordered_float::OrderedFloat;
 
     use super::Typst;
-    use crate::{parsers::StrParser, Punctuation, TokenKind};
+    use crate::{parsers::StrParser, NounData, Punctuation, TokenKind, WordMetadata};
 
     #[test]
     fn conjunction() {
@@ -278,12 +288,38 @@ mod tests {
 
         dbg!(&token_kinds);
 
-        assert!(matches!(token_kinds.as_slice(), &[TokenKind::Word(_),]))
+        assert_eq!(token_kinds.len(), 1);
+        assert!(token_kinds.into_iter().all(|t| t.is_conjunction()))
+    }
+
+    #[test]
+    fn possessive() {
+        let source = r"person's";
+
+        let tokens = Typst.parse_str(source);
+
+        let token_kinds = tokens.iter().map(|t| t.kind).collect::<Vec<_>>();
+
+        dbg!(&token_kinds);
+
+        assert_eq!(token_kinds.len(), 1);
+        assert!(token_kinds.into_iter().all(|t| {
+            matches!(
+                t,
+                TokenKind::Word(WordMetadata {
+                    noun: Some(NounData {
+                        is_possessive: Some(true),
+                        ..
+                    }),
+                    ..
+                })
+            )
+        }))
     }
 
     #[test]
     fn number() {
-        let source = r"The number 12 is larger than 11, but is much less than 11!";
+        let source = r"12 is larger than 11, but much less than 11!";
 
         let tokens = Typst.parse_str(source);
 
@@ -294,10 +330,6 @@ mod tests {
         assert!(matches!(
             token_kinds.as_slice(),
             &[
-                TokenKind::Word(_),
-                TokenKind::Space(1),
-                TokenKind::Word(_),
-                TokenKind::Space(1),
                 TokenKind::Number(OrderedFloat(12.0), None),
                 TokenKind::Space(1),
                 TokenKind::Word(_),
@@ -317,14 +349,33 @@ mod tests {
                 TokenKind::Space(1),
                 TokenKind::Word(_),
                 TokenKind::Space(1),
-                TokenKind::Word(_),
-                TokenKind::Space(1),
                 TokenKind::Number(OrderedFloat(11.0), None),
                 TokenKind::Punctuation(Punctuation::Bang),
             ]
         ))
     }
 
+    #[test]
+    fn math_unlintable() {
+        let source = r"$12 > 11$, $12 << 11!$";
+
+        let tokens = Typst.parse_str(source);
+
+        let token_kinds = tokens.iter().map(|t| t.kind).collect::<Vec<_>>();
+
+        dbg!(&token_kinds);
+
+        assert!(matches!(
+            token_kinds.as_slice(),
+            &[
+                TokenKind::Unlintable,
+                TokenKind::Punctuation(Punctuation::Comma),
+                TokenKind::Space(1),
+                TokenKind::Unlintable,
+            ]
+        ))
+    }
+
     #[test]
     fn sentence() {
         let source = r"This is a sentence, it does not have any particularly interesting elements of the typst syntax.";
diff --git a/harper-core/src/word_metadata.rs b/harper-core/src/word_metadata.rs
index 314f855d..326a3572 100644
--- a/harper-core/src/word_metadata.rs
+++ b/harper-core/src/word_metadata.rs
@@ -120,7 +120,7 @@ pub enum Tense {
     Future,
 }
 
-#[derive(Debug, Clone, Copy, Serialize, Deserialize, PartialEq, PartialOrd, Eq, Hash)]
+#[derive(Debug, Clone, Copy, Serialize, Deserialize, PartialEq, PartialOrd, Eq, Hash, Default)]
 pub struct VerbData {
     pub is_linking: Option<bool>,
     pub tense: Option<Tense>,
@@ -136,7 +136,7 @@ impl VerbData {
     }
 }
 
-#[derive(Debug, Clone, Copy, Serialize, Deserialize, PartialEq, PartialOrd, Eq, Hash)]
+#[derive(Debug, Clone, Copy, Serialize, Deserialize, PartialEq, PartialOrd, Eq, Hash, Default)]
 pub struct NounData {
     pub is_proper: Option<bool>,
     pub is_plural: Option<bool>,
@@ -156,7 +156,7 @@ impl NounData {
     }
 }
 
-#[derive(Debug, Clone, Copy, Serialize, Deserialize, PartialEq, PartialOrd, Eq, Hash)]
+#[derive(Debug, Clone, Copy, Serialize, Deserialize, PartialEq, PartialOrd, Eq, Hash, Default)]
 pub struct AdjectiveData {}
 
 impl AdjectiveData {
@@ -166,7 +166,7 @@ impl AdjectiveData {
     }
 }
 
-#[derive(Debug, Clone, Copy, Serialize, Deserialize, PartialEq, PartialOrd, Eq, Hash)]
+#[derive(Debug, Clone, Copy, Serialize, Deserialize, PartialEq, PartialOrd, Eq, Hash, Default)]
 pub struct AdverbData {}
 
 impl AdverbData {
@@ -176,7 +176,7 @@ impl AdverbData {
     }
 }
 
-#[derive(Debug, Clone, Copy, Serialize, Deserialize, PartialEq, PartialOrd, Eq, Hash)]
+#[derive(Debug, Clone, Copy, Serialize, Deserialize, PartialEq, PartialOrd, Eq, Hash, Default)]
 pub struct ConjunctionData {}
 
 impl ConjunctionData {

From f3eda9237dfeb55cf0ac190070abb1b755bc7948 Mon Sep 17 00:00:00 2001
From: Grant Lemons <grantlemons@aol.com>
Date: Thu, 28 Nov 2024 21:20:06 -0700
Subject: [PATCH 12/51] feat(#230): create additional parsers for complex
 dictionary parsing

---
 harper-core/src/parsers/typst.rs | 85 +++++++++++++++++++++++++++++++-
 1 file changed, 83 insertions(+), 2 deletions(-)

diff --git a/harper-core/src/parsers/typst.rs b/harper-core/src/parsers/typst.rs
index 92ba5bb5..5d2b235e 100644
--- a/harper-core/src/parsers/typst.rs
+++ b/harper-core/src/parsers/typst.rs
@@ -64,6 +64,88 @@ fn parse_english(
     Some(res)
 }
 
+fn parse_dict(
+    dict: &mut dyn Iterator<Item = typst_syntax::ast::DictItem>,
+    doc: &typst_syntax::Source,
+    parser: &mut PlainEnglish,
+) -> Option<Vec<Token>> {
+    Some(
+        dict.filter_map(|di| match di {
+            typst_syntax::ast::DictItem::Named(named) => merge_expr!(
+                constant_token!(doc, named.name(), TokenKind::Word(WordMetadata::default())),
+                map_token(named.expr(), doc, parser),
+                parse_pattern(named.pattern(), doc, parser)
+            ),
+            typst_syntax::ast::DictItem::Keyed(keyed) => merge_expr!(
+                map_token(keyed.key(), doc, parser),
+                map_token(keyed.expr(), doc, parser)
+            ),
+            typst_syntax::ast::DictItem::Spread(spread) => spread.sink_ident().map_or_else(
+                || {
+                    spread
+                        .sink_expr()
+                        .and_then(|expr| map_token(expr, doc, parser))
+                },
+                |ident| constant_token!(doc, ident, TokenKind::Word(WordMetadata::default())),
+            ),
+        })
+        .flatten()
+        .collect(),
+    )
+}
+
+fn parse_pattern(
+    pat: typst_syntax::ast::Pattern,
+    doc: &typst_syntax::Source,
+    parser: &mut PlainEnglish,
+) -> Option<Vec<Token>> {
+    match pat {
+        typst_syntax::ast::Pattern::Normal(expr) => map_token(expr, doc, parser),
+        typst_syntax::ast::Pattern::Placeholder(underscore) => {
+            constant_token!(doc, underscore, TokenKind::Unlintable)
+        }
+        typst_syntax::ast::Pattern::Parenthesized(parenthesized) => merge_expr!(
+            map_token(parenthesized.expr(), doc, parser),
+            parse_pattern(parenthesized.pattern(), doc, parser)
+        ),
+        typst_syntax::ast::Pattern::Destructuring(destructuring) => Some(
+            destructuring
+                .items()
+                .filter_map(|item| match item {
+                    typst_syntax::ast::DestructuringItem::Pattern(pattern) => {
+                        parse_pattern(pattern, doc, parser)
+                    }
+                    typst_syntax::ast::DestructuringItem::Named(named) => merge_expr!(
+                        constant_token!(
+                            doc,
+                            named.name(),
+                            TokenKind::Word(WordMetadata::default())
+                        ),
+                        parse_pattern(named.pattern(), doc, parser)
+                    ),
+                    typst_syntax::ast::DestructuringItem::Spread(spread) => {
+                        spread.sink_ident().map_or_else(
+                            || {
+                                spread
+                                    .sink_expr()
+                                    .and_then(|expr| map_token(expr, doc, parser))
+                            },
+                            |ident| {
+                                constant_token!(
+                                    doc,
+                                    ident,
+                                    TokenKind::Word(WordMetadata::default())
+                                )
+                            },
+                        )
+                    }
+                })
+                .flatten()
+                .collect(),
+        ),
+    }
+}
+
 fn map_token(
     ex: typst_syntax::ast::Expr,
     doc: &typst_syntax::Source,
@@ -146,8 +228,7 @@ fn map_token(
                 .flatten()
                 .collect_vec(),
         ),
-        // TODO: actually parse dictionaries
-        Expr::Dict(a) => constant_token!(doc, a, TokenKind::Unlintable),
+        Expr::Dict(a) => parse_dict(&mut a.items(), doc, parser),
         Expr::Unary(a) => constant_token!(doc, a, TokenKind::Unlintable),
         Expr::Binary(a) => constant_token!(doc, a, TokenKind::Unlintable),
         Expr::FieldAccess(field_access) => merge_expr!(

From 24e055182a7f7ae1ac48c5d8683f0dfe841d6ee0 Mon Sep 17 00:00:00 2001
From: Grant Lemons <grantlemons@aol.com>
Date: Fri, 29 Nov 2024 12:14:26 -0700
Subject: [PATCH 13/51] feat(#230): add some tests for dictionary parsing, and
 improve dict parsing to fit better

---
 harper-core/src/parsers/typst.rs | 88 ++++++++++++++++++++++----------
 1 file changed, 61 insertions(+), 27 deletions(-)

diff --git a/harper-core/src/parsers/typst.rs b/harper-core/src/parsers/typst.rs
index 5d2b235e..2beac0af 100644
--- a/harper-core/src/parsers/typst.rs
+++ b/harper-core/src/parsers/typst.rs
@@ -53,15 +53,17 @@ fn parse_english(
     parser: &mut PlainEnglish,
     span: &typst_syntax::Span,
 ) -> Option<Vec<Token>> {
-    let res = parser
-        .parse_str(str.into())
-        .into_iter()
-        .map(|mut t| {
-            t.span.push_by(doc.range(*span).unwrap().start);
-            t
-        })
-        .collect_vec();
-    Some(res)
+    let offset = doc.range(*span).unwrap().start;
+    Some(
+        parser
+            .parse_str(str.into())
+            .into_iter()
+            .map(|mut t| {
+                t.span.push_by(offset);
+                t
+            })
+            .collect_vec(),
+    )
 }
 
 fn parse_dict(
@@ -73,8 +75,7 @@ fn parse_dict(
         dict.filter_map(|di| match di {
             typst_syntax::ast::DictItem::Named(named) => merge_expr!(
                 constant_token!(doc, named.name(), TokenKind::Word(WordMetadata::default())),
-                map_token(named.expr(), doc, parser),
-                parse_pattern(named.pattern(), doc, parser)
+                map_token(named.expr(), doc, parser)
             ),
             typst_syntax::ast::DictItem::Keyed(keyed) => merge_expr!(
                 map_token(keyed.key(), doc, parser),
@@ -241,7 +242,15 @@ fn map_token(
         ),
         Expr::FuncCall(a) => constant_token!(doc, a, TokenKind::Unlintable),
         Expr::Closure(a) => constant_token!(doc, a, TokenKind::Unlintable),
-        Expr::Let(let_binding) => let_binding.init().and_then(|e| map_token(e, doc, parser)),
+        Expr::Let(let_binding) => merge_expr!(
+            match let_binding.kind() {
+                typst_syntax::ast::LetBindingKind::Normal(pattern) =>
+                    parse_pattern(pattern, doc, parser),
+                typst_syntax::ast::LetBindingKind::Closure(ident) =>
+                    constant_token!(doc, ident, TokenKind::Word(WordMetadata::default())),
+            },
+            let_binding.init().and_then(|e| map_token(e, doc, parser))
+        ),
         Expr::DestructAssign(destruct_assignment) => {
             map_token(destruct_assignment.value(), doc, parser)
         }
@@ -354,6 +363,7 @@ impl Parser for Typst {
 
 #[cfg(test)]
 mod tests {
+    use itertools::Itertools;
     use ordered_float::OrderedFloat;
 
     use super::Typst;
@@ -361,12 +371,10 @@ mod tests {
 
     #[test]
     fn conjunction() {
-        let source = r"doesn't";
+        let source = "doesn't";
 
         let tokens = Typst.parse_str(source);
-
         let token_kinds = tokens.iter().map(|t| t.kind).collect::<Vec<_>>();
-
         dbg!(&token_kinds);
 
         assert_eq!(token_kinds.len(), 1);
@@ -375,12 +383,10 @@ mod tests {
 
     #[test]
     fn possessive() {
-        let source = r"person's";
+        let source = "person's";
 
         let tokens = Typst.parse_str(source);
-
         let token_kinds = tokens.iter().map(|t| t.kind).collect::<Vec<_>>();
-
         dbg!(&token_kinds);
 
         assert_eq!(token_kinds.len(), 1);
@@ -400,12 +406,10 @@ mod tests {
 
     #[test]
     fn number() {
-        let source = r"12 is larger than 11, but much less than 11!";
+        let source = "12 is larger than 11, but much less than 11!";
 
         let tokens = Typst.parse_str(source);
-
         let token_kinds = tokens.iter().map(|t| t.kind).collect::<Vec<_>>();
-
         dbg!(&token_kinds);
 
         assert!(matches!(
@@ -438,12 +442,10 @@ mod tests {
 
     #[test]
     fn math_unlintable() {
-        let source = r"$12 > 11$, $12 << 11!$";
+        let source = "$12 > 11$, $12 << 11!$";
 
         let tokens = Typst.parse_str(source);
-
         let token_kinds = tokens.iter().map(|t| t.kind).collect::<Vec<_>>();
-
         dbg!(&token_kinds);
 
         assert!(matches!(
@@ -458,13 +460,45 @@ mod tests {
     }
 
     #[test]
-    fn sentence() {
-        let source = r"This is a sentence, it does not have any particularly interesting elements of the typst syntax.";
+    fn dict_parsing() {
+        let source = r#"#let dict = (
+                        name: "Typst",
+                        born: 2019,
+                      )"#;
 
         let tokens = Typst.parse_str(source);
-
         let token_kinds = tokens.iter().map(|t| t.kind).collect::<Vec<_>>();
+        dbg!(&token_kinds);
+
+        let typst_document = typst_syntax::Source::detached(source);
+        let typst_tree = <typst_syntax::ast::Markup as typst_syntax::ast::AstNode>::from_untyped(
+            typst_document.root(),
+        )
+        .expect("Unable to create typst document from parsed tree!");
+        dbg!(typst_tree.exprs().collect_vec());
 
+        let charslice = source.chars().collect_vec();
+        assert_eq!(tokens[2].span.get_content_string(&charslice), "Typst");
+        assert!(matches!(
+            token_kinds.as_slice(),
+            &[
+                TokenKind::Word(_),
+                TokenKind::Word(_),
+                TokenKind::Punctuation(Punctuation::Quote { .. }),
+                TokenKind::Word(_),
+                TokenKind::Punctuation(Punctuation::Quote { .. }),
+                TokenKind::Word(_),
+                TokenKind::Number(OrderedFloat(2019.0), None),
+            ]
+        ))
+    }
+
+    #[test]
+    fn sentence() {
+        let source = "This is a sentence, it does not have any particularly interesting elements of the typst syntax.";
+
+        let tokens = Typst.parse_str(source);
+        let token_kinds = tokens.iter().map(|t| t.kind).collect::<Vec<_>>();
         dbg!(&token_kinds);
 
         assert!(matches!(

From c63d41a1c300e6eb17c889003e047fb82e4dc467 Mon Sep 17 00:00:00 2001
From: Grant Lemons <grantlemons@aol.com>
Date: Wed, 4 Dec 2024 11:36:40 -0700
Subject: [PATCH 14/51] fix(#230): fix dict parsing by manually getting
 document content in span so quotes aren't escaped

---
 harper-core/src/parsers/typst.rs | 7 +++++--
 1 file changed, 5 insertions(+), 2 deletions(-)

diff --git a/harper-core/src/parsers/typst.rs b/harper-core/src/parsers/typst.rs
index 2beac0af..df10640a 100644
--- a/harper-core/src/parsers/typst.rs
+++ b/harper-core/src/parsers/typst.rs
@@ -210,7 +210,10 @@ fn map_token(
             constant_token!(doc, float, TokenKind::Number(float.get().into(), None))
         }
         Expr::Numeric(a) => constant_token!(doc, a, TokenKind::Unlintable),
-        Expr::Str(text) => parse_english(text.get(), doc, parser, &text.span()),
+        Expr::Str(text) => {
+            // Using `text.get()` doesn't work here, because it escapes quotes
+            parse_english(doc.get(doc.range(text.span())?)?, doc, parser, &text.span())
+        }
         Expr::Code(a) => constant_token!(doc, a, TokenKind::Unlintable),
         Expr::Content(content_block) => {
             recursive_env(&mut content_block.body().exprs(), doc, parser)
@@ -478,7 +481,7 @@ mod tests {
         dbg!(typst_tree.exprs().collect_vec());
 
         let charslice = source.chars().collect_vec();
-        assert_eq!(tokens[2].span.get_content_string(&charslice), "Typst");
+        assert_eq!(tokens[3].span.get_content_string(&charslice), "Typst");
         assert!(matches!(
             token_kinds.as_slice(),
             &[

From f57d6c2300687c85f754cf778dbddfcdc23b17b7 Mon Sep 17 00:00:00 2001
From: Grant Lemons <grantlemons@aol.com>
Date: Wed, 4 Dec 2024 11:39:09 -0700
Subject: [PATCH 15/51] fix(#230): remove debug print of typst ast in test

---
 harper-core/src/parsers/typst.rs | 7 -------
 1 file changed, 7 deletions(-)

diff --git a/harper-core/src/parsers/typst.rs b/harper-core/src/parsers/typst.rs
index df10640a..36d4d9a1 100644
--- a/harper-core/src/parsers/typst.rs
+++ b/harper-core/src/parsers/typst.rs
@@ -473,13 +473,6 @@ mod tests {
         let token_kinds = tokens.iter().map(|t| t.kind).collect::<Vec<_>>();
         dbg!(&token_kinds);
 
-        let typst_document = typst_syntax::Source::detached(source);
-        let typst_tree = <typst_syntax::ast::Markup as typst_syntax::ast::AstNode>::from_untyped(
-            typst_document.root(),
-        )
-        .expect("Unable to create typst document from parsed tree!");
-        dbg!(typst_tree.exprs().collect_vec());
-
         let charslice = source.chars().collect_vec();
         assert_eq!(tokens[3].span.get_content_string(&charslice), "Typst");
         assert!(matches!(

From 550cf20226e26941cab3a62a81b9306a121cfd3b Mon Sep 17 00:00:00 2001
From: Grant Lemons <grantlemons@aol.com>
Date: Wed, 4 Dec 2024 11:43:18 -0700
Subject: [PATCH 16/51] style(#230): expand explainer on str parsing

---
 harper-core/src/parsers/typst.rs | 3 ++-
 1 file changed, 2 insertions(+), 1 deletion(-)

diff --git a/harper-core/src/parsers/typst.rs b/harper-core/src/parsers/typst.rs
index 36d4d9a1..c49bd73e 100644
--- a/harper-core/src/parsers/typst.rs
+++ b/harper-core/src/parsers/typst.rs
@@ -211,7 +211,8 @@ fn map_token(
         }
         Expr::Numeric(a) => constant_token!(doc, a, TokenKind::Unlintable),
         Expr::Str(text) => {
-            // Using `text.get()` doesn't work here, because it escapes quotes
+            // Using `text.get()` doesn't work here, because it escapes quotes which throws off
+            // the span
             parse_english(doc.get(doc.range(text.span())?)?, doc, parser, &text.span())
         }
         Expr::Code(a) => constant_token!(doc, a, TokenKind::Unlintable),

From 7cd135f89925798062e3521f8334caf9a1a36528 Mon Sep 17 00:00:00 2001
From: Grant Lemons <grantlemons@aol.com>
Date: Fri, 20 Dec 2024 12:45:53 -0600
Subject: [PATCH 17/51] feat(#230): remove quotes from Str parsing

---
 Cargo.lock                       |  2 +-
 harper-core/src/parsers/typst.rs | 74 ++++++++++++++++++++++++--------
 2 files changed, 58 insertions(+), 18 deletions(-)

diff --git a/Cargo.lock b/Cargo.lock
index c263f4b9..9367fa74 100644
--- a/Cargo.lock
+++ b/Cargo.lock
@@ -892,7 +892,7 @@ source = "registry+https://github.com/rust-lang/crates.io-index"
 checksum = "707907fe3c25f5424cce2cb7e1cbcafee6bdbe735ca90ef77c29e84591e5b9da"
 dependencies = [
  "equivalent",
- "hashbrown 0.15.1",
+ "hashbrown 0.15.2",
 ]
 
 [[package]]
diff --git a/harper-core/src/parsers/typst.rs b/harper-core/src/parsers/typst.rs
index c49bd73e..af0fedc7 100644
--- a/harper-core/src/parsers/typst.rs
+++ b/harper-core/src/parsers/typst.rs
@@ -211,9 +211,18 @@ fn map_token(
         }
         Expr::Numeric(a) => constant_token!(doc, a, TokenKind::Unlintable),
         Expr::Str(text) => {
-            // Using `text.get()` doesn't work here, because it escapes quotes which throws off
-            // the span
-            parse_english(doc.get(doc.range(text.span())?)?, doc, parser, &text.span())
+            let offset = doc.range(text.span()).unwrap().start + 1;
+            let text = text.to_untyped().text();
+            Some(
+                parser
+                    .parse_str(&text[1..text.len() - 1])
+                    .into_iter()
+                    .map(|mut t| {
+                        t.span.push_by(offset);
+                        t
+                    })
+                    .collect_vec(),
+            )
         }
         Expr::Code(a) => constant_token!(doc, a, TokenKind::Unlintable),
         Expr::Content(content_block) => {
@@ -378,7 +387,7 @@ mod tests {
         let source = "doesn't";
 
         let tokens = Typst.parse_str(source);
-        let token_kinds = tokens.iter().map(|t| t.kind).collect::<Vec<_>>();
+        let token_kinds = tokens.iter().map(|t| t.kind).collect_vec();
         dbg!(&token_kinds);
 
         assert_eq!(token_kinds.len(), 1);
@@ -390,7 +399,7 @@ mod tests {
         let source = "person's";
 
         let tokens = Typst.parse_str(source);
-        let token_kinds = tokens.iter().map(|t| t.kind).collect::<Vec<_>>();
+        let token_kinds = tokens.iter().map(|t| t.kind).collect_vec();
         dbg!(&token_kinds);
 
         assert_eq!(token_kinds.len(), 1);
@@ -413,7 +422,7 @@ mod tests {
         let source = "12 is larger than 11, but much less than 11!";
 
         let tokens = Typst.parse_str(source);
-        let token_kinds = tokens.iter().map(|t| t.kind).collect::<Vec<_>>();
+        let token_kinds = tokens.iter().map(|t| t.kind).collect_vec();
         dbg!(&token_kinds);
 
         assert!(matches!(
@@ -449,7 +458,7 @@ mod tests {
         let source = "$12 > 11$, $12 << 11!$";
 
         let tokens = Typst.parse_str(source);
-        let token_kinds = tokens.iter().map(|t| t.kind).collect::<Vec<_>>();
+        let token_kinds = tokens.iter().map(|t| t.kind).collect_vec();
         dbg!(&token_kinds);
 
         assert!(matches!(
@@ -471,21 +480,52 @@ mod tests {
                       )"#;
 
         let tokens = Typst.parse_str(source);
-        let token_kinds = tokens.iter().map(|t| t.kind).collect::<Vec<_>>();
+        let token_kinds = tokens.iter().map(|t| t.kind).collect_vec();
         dbg!(&token_kinds);
 
         let charslice = source.chars().collect_vec();
-        assert_eq!(tokens[3].span.get_content_string(&charslice), "Typst");
+        assert_eq!(tokens[2].span.get_content_string(&charslice), "Typst");
+
         assert!(matches!(
             token_kinds.as_slice(),
             &[
-                TokenKind::Word(_),
-                TokenKind::Word(_),
-                TokenKind::Punctuation(Punctuation::Quote { .. }),
-                TokenKind::Word(_),
-                TokenKind::Punctuation(Punctuation::Quote { .. }),
-                TokenKind::Word(_),
-                TokenKind::Number(OrderedFloat(2019.0), None),
+                TokenKind::Word(_),                            // identifier
+                TokenKind::Word(_),                            // key 1
+                TokenKind::Word(_),                            // value 1
+                TokenKind::Word(_),                            // key 2
+                TokenKind::Number(OrderedFloat(2019.0), None), // value 2
+            ]
+        ))
+    }
+
+    #[test]
+    fn str_parsing() {
+        let source_with_quotes = r#"#let ident = "This is a string""#;
+        let source_no_quotes = r#"#let ident = This is a string"#;
+
+        let with_quotes_token_kinds = Typst
+            .parse_str(source_with_quotes)
+            .iter()
+            .map(|t| t.kind)
+            .collect_vec();
+        let no_quotes_token_kinds = Typst
+            .parse_str(source_no_quotes)
+            .iter()
+            .map(|t| t.kind)
+            .collect_vec();
+
+        assert_eq!(with_quotes_token_kinds, no_quotes_token_kinds);
+        assert!(matches!(
+            &with_quotes_token_kinds.as_slice(),
+            &[
+                TokenKind::Word(_), // identifier
+                TokenKind::Word(_), // This
+                TokenKind::Space(1),
+                TokenKind::Word(_), // is
+                TokenKind::Space(1),
+                TokenKind::Word(_), // a
+                TokenKind::Space(1),
+                TokenKind::Word(_), // string
             ]
         ))
     }
@@ -495,7 +535,7 @@ mod tests {
         let source = "This is a sentence, it does not have any particularly interesting elements of the typst syntax.";
 
         let tokens = Typst.parse_str(source);
-        let token_kinds = tokens.iter().map(|t| t.kind).collect::<Vec<_>>();
+        let token_kinds = tokens.iter().map(|t| t.kind).collect_vec();
         dbg!(&token_kinds);
 
         assert!(matches!(

From 54418ff204be80c0b2a6a0dafb273e0902bbfb73 Mon Sep 17 00:00:00 2001
From: Grant Lemons <grantlemons@aol.com>
Date: Fri, 20 Dec 2024 15:07:16 -0600
Subject: [PATCH 18/51] fix(#230): remove improper test case

---
 harper-core/src/parsers/typst.rs | 17 +++--------------
 1 file changed, 3 insertions(+), 14 deletions(-)

diff --git a/harper-core/src/parsers/typst.rs b/harper-core/src/parsers/typst.rs
index af0fedc7..151a8a96 100644
--- a/harper-core/src/parsers/typst.rs
+++ b/harper-core/src/parsers/typst.rs
@@ -500,23 +500,12 @@ mod tests {
 
     #[test]
     fn str_parsing() {
-        let source_with_quotes = r#"#let ident = "This is a string""#;
-        let source_no_quotes = r#"#let ident = This is a string"#;
+        let source = r#"#let ident = "This is a string""#;
 
-        let with_quotes_token_kinds = Typst
-            .parse_str(source_with_quotes)
-            .iter()
-            .map(|t| t.kind)
-            .collect_vec();
-        let no_quotes_token_kinds = Typst
-            .parse_str(source_no_quotes)
-            .iter()
-            .map(|t| t.kind)
-            .collect_vec();
+        let token_kinds = Typst.parse_str(source).iter().map(|t| t.kind).collect_vec();
 
-        assert_eq!(with_quotes_token_kinds, no_quotes_token_kinds);
         assert!(matches!(
-            &with_quotes_token_kinds.as_slice(),
+            &token_kinds.as_slice(),
             &[
                 TokenKind::Word(_), // identifier
                 TokenKind::Word(_), // This

From 533677891e65b80fba132a084116e037a8c1e77c Mon Sep 17 00:00:00 2001
From: Grant Lemons <grantlemons@aol.com>
Date: Fri, 27 Dec 2024 12:13:51 -0600
Subject: [PATCH 19/51] tests(#230): add test using unicode apostrophe

---
 harper-cli/src/main.rs           | 12 +++---
 harper-core/src/parsers/typst.rs | 63 +++++++++++++++++++-------------
 2 files changed, 43 insertions(+), 32 deletions(-)

diff --git a/harper-cli/src/main.rs b/harper-cli/src/main.rs
index cdedb164..a66d4a89 100644
--- a/harper-cli/src/main.rs
+++ b/harper-cli/src/main.rs
@@ -143,16 +143,14 @@ fn load_file(file: &Path) -> anyhow::Result<(Document, String)> {
     let source = std::fs::read_to_string(file)?;
 
     let mut parser: Box<dyn harper_core::parsers::Parser> =
-        if let Some("md") = file.extension().map(|v| v.to_str().unwrap()) {
-            Box::new(Markdown)
-        } else if let Some("typ") = file.extension().map(|v| v.to_str().unwrap()) {
-            Box::new(Typst)
-        } else {
-            Box::new(
+        match file.extension().map(|v| v.to_str().unwrap()) {
+            Some("md") => Box::new(Markdown),
+            Some("typ") => Box::new(Typst),
+            _ => Box::new(
                 CommentParser::new_from_filename(file)
                     .map(Box::new)
                     .ok_or(format_err!("Could not detect language ID."))?,
-            )
+            ),
         };
 
     Ok((Document::new_curated(&source, &mut parser), source))
diff --git a/harper-core/src/parsers/typst.rs b/harper-core/src/parsers/typst.rs
index 151a8a96..f620cc54 100644
--- a/harper-core/src/parsers/typst.rs
+++ b/harper-core/src/parsers/typst.rs
@@ -489,11 +489,11 @@ mod tests {
         assert!(matches!(
             token_kinds.as_slice(),
             &[
-                TokenKind::Word(_),                            // identifier
-                TokenKind::Word(_),                            // key 1
-                TokenKind::Word(_),                            // value 1
-                TokenKind::Word(_),                            // key 2
-                TokenKind::Number(OrderedFloat(2019.0), None), // value 2
+                TokenKind::Word(_),                            // Identifier
+                TokenKind::Word(_),                            // Key 1
+                TokenKind::Word(_),                            // Value 1
+                TokenKind::Word(_),                            // Key 2
+                TokenKind::Number(OrderedFloat(2019.0), None), // Value 2
             ]
         ))
     }
@@ -507,21 +507,21 @@ mod tests {
         assert!(matches!(
             &token_kinds.as_slice(),
             &[
-                TokenKind::Word(_), // identifier
+                TokenKind::Word(_), // Identifier
                 TokenKind::Word(_), // This
                 TokenKind::Space(1),
-                TokenKind::Word(_), // is
+                TokenKind::Word(_), // Is
                 TokenKind::Space(1),
-                TokenKind::Word(_), // a
+                TokenKind::Word(_), // A
                 TokenKind::Space(1),
-                TokenKind::Word(_), // string
+                TokenKind::Word(_), // String
             ]
         ))
     }
 
     #[test]
     fn sentence() {
-        let source = "This is a sentence, it does not have any particularly interesting elements of the typst syntax.";
+        let source = "This is a sentence, it is not interesting.";
 
         let tokens = Typst.parse_str(source);
         let token_kinds = tokens.iter().map(|t| t.kind).collect_vec();
@@ -546,24 +546,37 @@ mod tests {
                 TokenKind::Word(_),
                 TokenKind::Space(1),
                 TokenKind::Word(_),
+                TokenKind::Punctuation(Punctuation::Period),
+            ]
+        ))
+    }
+
+    #[test]
+    fn smart_apostrophe_newline() {
+        let source = r#"group’s
+writing"#;
+
+        let tokens = Typst.parse_str(source);
+        let token_kinds = tokens.iter().map(|t| t.kind).collect_vec();
+        dbg!(&token_kinds);
+
+        let charslice = source.chars().collect_vec();
+        assert_eq!(tokens[2].span.get_content_string(&charslice), "writing");
+
+        assert!(matches!(
+            token_kinds.as_slice(),
+            &[
+                TokenKind::Word(WordMetadata {
+                    noun: Some(NounData {
+                        is_possessive: Some(true),
+                        ..
+                    }),
+                    ..
+                }),
                 TokenKind::Space(1),
                 TokenKind::Word(_),
                 TokenKind::Space(1),
-                TokenKind::Word(_),
-                TokenKind::Space(1),
-                TokenKind::Word(_),
-                TokenKind::Space(1),
-                TokenKind::Word(_),
-                TokenKind::Space(1),
-                TokenKind::Word(_),
-                TokenKind::Space(1),
-                TokenKind::Word(_),
-                TokenKind::Space(1),
-                TokenKind::Word(_),
-                TokenKind::Space(1),
-                TokenKind::Word(_),
-                TokenKind::Punctuation(Punctuation::Period),
             ]
-        ))
+        ));
     }
 }

From 60bb98694483964433ff96b75d8c130ad4c17b2d Mon Sep 17 00:00:00 2001
From: Grant Lemons <grantlemons@aol.com>
Date: Fri, 27 Dec 2024 12:25:37 -0600
Subject: [PATCH 20/51] refactor(#230): simplify parsing by moving some helper
 functions inside function

---
 harper-core/src/parsers/typst.rs | 159 +++++++++++++++----------------
 1 file changed, 78 insertions(+), 81 deletions(-)

diff --git a/harper-core/src/parsers/typst.rs b/harper-core/src/parsers/typst.rs
index f620cc54..6bb572df 100644
--- a/harper-core/src/parsers/typst.rs
+++ b/harper-core/src/parsers/typst.rs
@@ -34,19 +34,6 @@ macro_rules! merge_expr {
     };
 }
 
-fn recursive_env(
-    exprs: &mut dyn Iterator<Item = typst_syntax::ast::Expr>,
-    doc: &typst_syntax::Source,
-    parser: &mut PlainEnglish,
-) -> Option<Vec<Token>> {
-    Some(
-        exprs
-            .filter_map(|e| map_token(e, doc, parser))
-            .flatten()
-            .collect_vec(),
-    )
-}
-
 fn parse_english(
     str: impl Into<String>,
     doc: &typst_syntax::Source,
@@ -75,17 +62,17 @@ fn parse_dict(
         dict.filter_map(|di| match di {
             typst_syntax::ast::DictItem::Named(named) => merge_expr!(
                 constant_token!(doc, named.name(), TokenKind::Word(WordMetadata::default())),
-                map_token(named.expr(), doc, parser)
+                parse_expr(named.expr(), doc, parser)
             ),
             typst_syntax::ast::DictItem::Keyed(keyed) => merge_expr!(
-                map_token(keyed.key(), doc, parser),
-                map_token(keyed.expr(), doc, parser)
+                parse_expr(keyed.key(), doc, parser),
+                parse_expr(keyed.expr(), doc, parser)
             ),
             typst_syntax::ast::DictItem::Spread(spread) => spread.sink_ident().map_or_else(
                 || {
                     spread
                         .sink_expr()
-                        .and_then(|expr| map_token(expr, doc, parser))
+                        .and_then(|expr| parse_expr(expr, doc, parser))
                 },
                 |ident| constant_token!(doc, ident, TokenKind::Word(WordMetadata::default())),
             ),
@@ -101,12 +88,12 @@ fn parse_pattern(
     parser: &mut PlainEnglish,
 ) -> Option<Vec<Token>> {
     match pat {
-        typst_syntax::ast::Pattern::Normal(expr) => map_token(expr, doc, parser),
+        typst_syntax::ast::Pattern::Normal(expr) => parse_expr(expr, doc, parser),
         typst_syntax::ast::Pattern::Placeholder(underscore) => {
             constant_token!(doc, underscore, TokenKind::Unlintable)
         }
         typst_syntax::ast::Pattern::Parenthesized(parenthesized) => merge_expr!(
-            map_token(parenthesized.expr(), doc, parser),
+            parse_expr(parenthesized.expr(), doc, parser),
             parse_pattern(parenthesized.pattern(), doc, parser)
         ),
         typst_syntax::ast::Pattern::Destructuring(destructuring) => Some(
@@ -129,7 +116,7 @@ fn parse_pattern(
                             || {
                                 spread
                                     .sink_expr()
-                                    .and_then(|expr| map_token(expr, doc, parser))
+                                    .and_then(|expr| parse_expr(expr, doc, parser))
                             },
                             |ident| {
                                 constant_token!(
@@ -147,49 +134,63 @@ fn parse_pattern(
     }
 }
 
-fn map_token(
+fn parse_expr(
     ex: typst_syntax::ast::Expr,
     doc: &typst_syntax::Source,
     parser: &mut PlainEnglish,
 ) -> Option<Vec<Token>> {
+    macro_rules! constant_token {
+        ($a:expr, $to:expr) => {{
+            Some(vec![Token {
+                span: doc.range($a.span()).unwrap().into(),
+                kind: $to,
+            }])
+        }};
+    }
+    let mut nested_env = |exprs: &mut dyn Iterator<Item = typst_syntax::ast::Expr>| {
+        Some(
+            exprs
+                .filter_map(|e| parse_expr(e, doc, parser))
+                .flatten()
+                .collect_vec(),
+        )
+    };
+
     match ex {
         Expr::Text(text) => parse_english(text.get(), doc, parser, &text.span()),
-        Expr::Space(a) => constant_token!(doc, a, TokenKind::Space(1)),
-        Expr::Linebreak(a) => constant_token!(doc, a, TokenKind::Newline(1)),
-        Expr::Parbreak(a) => constant_token!(doc, a, TokenKind::ParagraphBreak),
-        Expr::Escape(a) => constant_token!(doc, a, TokenKind::Unlintable),
-        Expr::Shorthand(a) => constant_token!(doc, a, TokenKind::Unlintable),
+        Expr::Space(a) => constant_token!(a, TokenKind::Space(1)),
+        Expr::Linebreak(a) => constant_token!(a, TokenKind::Newline(1)),
+        Expr::Parbreak(a) => constant_token!(a, TokenKind::ParagraphBreak),
+        Expr::Escape(a) => constant_token!(a, TokenKind::Unlintable),
+        Expr::Shorthand(a) => constant_token!(a, TokenKind::Unlintable),
         Expr::SmartQuote(quote) => {
             if quote.double() {
                 constant_token!(
-                    doc,
                     quote,
                     TokenKind::Punctuation(Punctuation::Quote(crate::Quote { twin_loc: None }))
                 )
             } else {
-                constant_token!(doc, quote, TokenKind::Punctuation(Punctuation::Apostrophe))
+                constant_token!(quote, TokenKind::Punctuation(Punctuation::Apostrophe))
             }
         }
-        Expr::Strong(strong) => recursive_env(&mut strong.body().exprs(), doc, parser),
-        Expr::Emph(emph) => recursive_env(&mut emph.body().exprs(), doc, parser),
-        Expr::Raw(a) => constant_token!(doc, a, TokenKind::Unlintable),
-        Expr::Link(a) => constant_token!(doc, a, TokenKind::Url),
+        Expr::Strong(strong) => nested_env(&mut strong.body().exprs()),
+        Expr::Emph(emph) => nested_env(&mut emph.body().exprs()),
+        Expr::Raw(a) => constant_token!(a, TokenKind::Unlintable),
+        Expr::Link(a) => constant_token!(a, TokenKind::Url),
         Expr::Label(label) => parse_english(label.get(), doc, parser, &label.span()),
         Expr::Ref(a) => {
-            constant_token!(doc, a, TokenKind::Word(WordMetadata::default()))
+            constant_token!(a, TokenKind::Word(WordMetadata::default()))
         }
-        Expr::Heading(heading) => recursive_env(&mut heading.body().exprs(), doc, parser),
-        Expr::List(list_item) => recursive_env(&mut list_item.body().exprs(), doc, parser),
-        Expr::Enum(enum_item) => recursive_env(&mut enum_item.body().exprs(), doc, parser),
-        Expr::Term(term_item) => recursive_env(
+        Expr::Heading(heading) => nested_env(&mut heading.body().exprs()),
+        Expr::List(list_item) => nested_env(&mut list_item.body().exprs()),
+        Expr::Enum(enum_item) => nested_env(&mut enum_item.body().exprs()),
+        Expr::Term(term_item) => nested_env(
             &mut term_item
                 .term()
                 .exprs()
                 .chain(term_item.description().exprs()),
-            doc,
-            parser,
         ),
-        Expr::Equation(a) => constant_token!(doc, a, TokenKind::Unlintable),
+        Expr::Equation(a) => constant_token!(a, TokenKind::Unlintable),
         Expr::Math(_) => panic!("Unexpected math outside equation environment."),
         Expr::MathIdent(_) => panic!("Unexpected math outside equation environment."),
         Expr::MathShorthand(_) => panic!("Unexpected math outside equation environment."),
@@ -199,17 +200,17 @@ fn map_token(
         Expr::MathPrimes(_) => panic!("Unexpected math outside equation environment."),
         Expr::MathFrac(_) => panic!("Unexpected math outside equation environment."),
         Expr::MathRoot(_) => panic!("Unexpected math outside equation environment."),
-        Expr::Ident(a) => constant_token!(doc, a, TokenKind::Word(WordMetadata::default())),
-        Expr::None(a) => constant_token!(doc, a, TokenKind::Word(WordMetadata::default())),
-        Expr::Auto(a) => constant_token!(doc, a, TokenKind::Word(WordMetadata::default())),
-        Expr::Bool(a) => constant_token!(doc, a, TokenKind::Word(WordMetadata::default())),
+        Expr::Ident(a) => constant_token!(a, TokenKind::Word(WordMetadata::default())),
+        Expr::None(a) => constant_token!(a, TokenKind::Word(WordMetadata::default())),
+        Expr::Auto(a) => constant_token!(a, TokenKind::Word(WordMetadata::default())),
+        Expr::Bool(a) => constant_token!(a, TokenKind::Word(WordMetadata::default())),
         Expr::Int(int) => {
-            constant_token!(doc, int, TokenKind::Number((int.get() as f64).into(), None))
+            constant_token!(int, TokenKind::Number((int.get() as f64).into(), None))
         }
         Expr::Float(float) => {
-            constant_token!(doc, float, TokenKind::Number(float.get().into(), None))
+            constant_token!(float, TokenKind::Number(float.get().into(), None))
         }
-        Expr::Numeric(a) => constant_token!(doc, a, TokenKind::Unlintable),
+        Expr::Numeric(a) => constant_token!(a, TokenKind::Unlintable),
         Expr::Str(text) => {
             let offset = doc.range(text.span()).unwrap().start + 1;
             let text = text.to_untyped().text();
@@ -224,17 +225,15 @@ fn map_token(
                     .collect_vec(),
             )
         }
-        Expr::Code(a) => constant_token!(doc, a, TokenKind::Unlintable),
-        Expr::Content(content_block) => {
-            recursive_env(&mut content_block.body().exprs(), doc, parser)
-        }
-        Expr::Parenthesized(parenthesized) => map_token(parenthesized.expr(), doc, parser),
+        Expr::Code(a) => constant_token!(a, TokenKind::Unlintable),
+        Expr::Content(content_block) => nested_env(&mut content_block.body().exprs()),
+        Expr::Parenthesized(parenthesized) => parse_expr(parenthesized.expr(), doc, parser),
         Expr::Array(array) => Some(
             array
                 .items()
                 .filter_map(|i| {
                     if let typst_syntax::ast::ArrayItem::Pos(e) = i {
-                        map_token(e, doc, parser)
+                        parse_expr(e, doc, parser)
                     } else {
                         None
                     }
@@ -243,66 +242,64 @@ fn map_token(
                 .collect_vec(),
         ),
         Expr::Dict(a) => parse_dict(&mut a.items(), doc, parser),
-        Expr::Unary(a) => constant_token!(doc, a, TokenKind::Unlintable),
-        Expr::Binary(a) => constant_token!(doc, a, TokenKind::Unlintable),
+        Expr::Unary(a) => constant_token!(a, TokenKind::Unlintable),
+        Expr::Binary(a) => constant_token!(a, TokenKind::Unlintable),
         Expr::FieldAccess(field_access) => merge_expr!(
-            map_token(field_access.target(), doc, parser),
+            parse_expr(field_access.target(), doc, parser),
             constant_token!(
-                doc,
                 field_access.field(),
                 TokenKind::Word(WordMetadata::default())
             )
         ),
-        Expr::FuncCall(a) => constant_token!(doc, a, TokenKind::Unlintable),
-        Expr::Closure(a) => constant_token!(doc, a, TokenKind::Unlintable),
+        Expr::FuncCall(a) => constant_token!(a, TokenKind::Unlintable),
+        Expr::Closure(a) => constant_token!(a, TokenKind::Unlintable),
         Expr::Let(let_binding) => merge_expr!(
             match let_binding.kind() {
                 typst_syntax::ast::LetBindingKind::Normal(pattern) =>
                     parse_pattern(pattern, doc, parser),
                 typst_syntax::ast::LetBindingKind::Closure(ident) =>
-                    constant_token!(doc, ident, TokenKind::Word(WordMetadata::default())),
+                    constant_token!(ident, TokenKind::Word(WordMetadata::default())),
             },
-            let_binding.init().and_then(|e| map_token(e, doc, parser))
+            let_binding.init().and_then(|e| parse_expr(e, doc, parser))
         ),
         Expr::DestructAssign(destruct_assignment) => {
-            map_token(destruct_assignment.value(), doc, parser)
+            parse_expr(destruct_assignment.value(), doc, parser)
         }
         Expr::Set(set_rule) => merge_expr!(
-            map_token(set_rule.target(), doc, parser),
-            map_token(set_rule.condition()?, doc, parser)
+            parse_expr(set_rule.target(), doc, parser),
+            parse_expr(set_rule.condition()?, doc, parser)
         ),
         Expr::Show(show_rule) => merge_expr!(
-            map_token(show_rule.transform(), doc, parser),
-            map_token(show_rule.selector()?, doc, parser)
+            parse_expr(show_rule.transform(), doc, parser),
+            parse_expr(show_rule.selector()?, doc, parser)
         ),
-        Expr::Contextual(contextual) => map_token(contextual.body(), doc, parser),
+        Expr::Contextual(contextual) => parse_expr(contextual.body(), doc, parser),
         Expr::Conditional(conditional) => merge_expr!(
-            map_token(conditional.condition(), doc, parser),
-            map_token(conditional.if_body(), doc, parser),
-            map_token(conditional.else_body()?, doc, parser)
+            parse_expr(conditional.condition(), doc, parser),
+            parse_expr(conditional.if_body(), doc, parser),
+            parse_expr(conditional.else_body()?, doc, parser)
         ),
         Expr::While(while_loop) => merge_expr!(
-            map_token(while_loop.condition(), doc, parser),
-            map_token(while_loop.body(), doc, parser)
+            parse_expr(while_loop.condition(), doc, parser),
+            parse_expr(while_loop.body(), doc, parser)
         ),
         Expr::For(for_loop) => merge_expr!(
-            map_token(for_loop.iterable(), doc, parser),
-            map_token(for_loop.body(), doc, parser)
+            parse_expr(for_loop.iterable(), doc, parser),
+            parse_expr(for_loop.body(), doc, parser)
         ),
         Expr::Import(module_import) => {
             merge_expr!(
-                map_token(module_import.source(), doc, parser),
+                parse_expr(module_import.source(), doc, parser),
                 constant_token!(
-                    doc,
                     module_import.new_name()?,
                     TokenKind::Word(WordMetadata::default())
                 )
             )
         }
-        Expr::Include(module_include) => map_token(module_include.source(), doc, parser),
-        Expr::Break(a) => constant_token!(doc, a, TokenKind::Unlintable),
-        Expr::Continue(a) => constant_token!(doc, a, TokenKind::Unlintable),
-        Expr::Return(a) => constant_token!(doc, a, TokenKind::Unlintable),
+        Expr::Include(module_include) => parse_expr(module_include.source(), doc, parser),
+        Expr::Break(a) => constant_token!(a, TokenKind::Unlintable),
+        Expr::Continue(a) => constant_token!(a, TokenKind::Unlintable),
+        Expr::Return(a) => constant_token!(a, TokenKind::Unlintable),
     }
 }
 
@@ -326,7 +323,7 @@ impl Parser for Typst {
         // This is why we keep track above.
         let mut tokens = typst_tree
             .exprs()
-            .filter_map(|ex| map_token(ex, &typst_document, &mut english_parser))
+            .filter_map(|ex| parse_expr(ex, &typst_document, &mut english_parser))
             .flatten()
             .collect_vec();
 

From 299d810f5cf2669a66cd7effdaf9ccd3cb7c668a Mon Sep 17 00:00:00 2001
From: Grant Lemons <grantlemons@aol.com>
Date: Fri, 27 Dec 2024 13:42:26 -0600
Subject: [PATCH 21/51] feat(#230): support unicode characters

---
 harper-core/src/parsers/typst.rs | 300 +++++++++++++++++++++++++------
 1 file changed, 247 insertions(+), 53 deletions(-)

diff --git a/harper-core/src/parsers/typst.rs b/harper-core/src/parsers/typst.rs
index 6bb572df..798c22bd 100644
--- a/harper-core/src/parsers/typst.rs
+++ b/harper-core/src/parsers/typst.rs
@@ -13,6 +13,61 @@ use crate::{
 /// Typst files.
 pub struct Typst;
 
+#[derive(Debug, Clone, Copy)]
+struct Offset<'a> {
+    doc: &'a typst_syntax::Source,
+    pub char: usize,
+    pub byte: usize,
+}
+
+impl<'a> Offset<'a> {
+    pub fn new(doc: &'a typst_syntax::Source) -> Self {
+        Self {
+            doc,
+            char: 0,
+            byte: 0,
+        }
+    }
+
+    pub fn update_to(&mut self, new_byte: usize) {
+        assert!(new_byte >= self.byte);
+        self.char += self.doc.get(self.byte..new_byte).unwrap().chars().count();
+        self.byte = new_byte;
+    }
+
+    pub fn update_by(&mut self, relative_bytes: usize) {
+        self.char += self
+            .doc
+            .get(self.byte..(self.byte + relative_bytes))
+            .unwrap()
+            .chars()
+            .count();
+        self.byte += relative_bytes;
+    }
+
+    pub fn push_to(self, new_byte: usize) -> Self {
+        assert!(new_byte >= self.byte);
+        Self {
+            char: self.doc.get(self.byte..new_byte).unwrap().chars().count(),
+            byte: new_byte,
+            ..self
+        }
+    }
+
+    pub fn push_by(self, relative_bytes: usize) -> Self {
+        let mut new = self;
+        new.update_by(relative_bytes);
+
+        new
+    }
+
+    pub fn push_to_span(self, span: typst_syntax::Span) -> Self {
+        let new_byte = self.doc.range(span).unwrap().start;
+
+        self.push_to(new_byte)
+    }
+}
+
 macro_rules! constant_token {
     ($doc:ident, $a:expr, $to:expr) => {{
         Some(vec![Token {
@@ -36,17 +91,15 @@ macro_rules! merge_expr {
 
 fn parse_english(
     str: impl Into<String>,
-    doc: &typst_syntax::Source,
     parser: &mut PlainEnglish,
-    span: &typst_syntax::Span,
+    offset: Offset,
 ) -> Option<Vec<Token>> {
-    let offset = doc.range(*span).unwrap().start;
     Some(
         parser
             .parse_str(str.into())
             .into_iter()
             .map(|mut t| {
-                t.span.push_by(offset);
+                t.span.push_by(offset.char);
                 t
             })
             .collect_vec(),
@@ -57,22 +110,38 @@ fn parse_dict(
     dict: &mut dyn Iterator<Item = typst_syntax::ast::DictItem>,
     doc: &typst_syntax::Source,
     parser: &mut PlainEnglish,
+    offset: Offset,
 ) -> Option<Vec<Token>> {
     Some(
         dict.filter_map(|di| match di {
             typst_syntax::ast::DictItem::Named(named) => merge_expr!(
                 constant_token!(doc, named.name(), TokenKind::Word(WordMetadata::default())),
-                parse_expr(named.expr(), doc, parser)
+                parse_expr(
+                    named.expr(),
+                    doc,
+                    parser,
+                    offset.push_to_span(named.expr().span())
+                )
             ),
             typst_syntax::ast::DictItem::Keyed(keyed) => merge_expr!(
-                parse_expr(keyed.key(), doc, parser),
-                parse_expr(keyed.expr(), doc, parser)
+                parse_expr(
+                    keyed.key(),
+                    doc,
+                    parser,
+                    offset.push_to_span(keyed.key().span())
+                ),
+                parse_expr(
+                    keyed.expr(),
+                    doc,
+                    parser,
+                    offset.push_to_span(keyed.expr().span())
+                )
             ),
             typst_syntax::ast::DictItem::Spread(spread) => spread.sink_ident().map_or_else(
                 || {
-                    spread
-                        .sink_expr()
-                        .and_then(|expr| parse_expr(expr, doc, parser))
+                    spread.sink_expr().and_then(|expr| {
+                        parse_expr(expr, doc, parser, offset.push_to_span(expr.span()))
+                    })
                 },
                 |ident| constant_token!(doc, ident, TokenKind::Word(WordMetadata::default())),
             ),
@@ -86,22 +155,35 @@ fn parse_pattern(
     pat: typst_syntax::ast::Pattern,
     doc: &typst_syntax::Source,
     parser: &mut PlainEnglish,
+    offset: Offset,
 ) -> Option<Vec<Token>> {
     match pat {
-        typst_syntax::ast::Pattern::Normal(expr) => parse_expr(expr, doc, parser),
+        typst_syntax::ast::Pattern::Normal(expr) => {
+            parse_expr(expr, doc, parser, offset.push_to_span(expr.span()))
+        }
         typst_syntax::ast::Pattern::Placeholder(underscore) => {
             constant_token!(doc, underscore, TokenKind::Unlintable)
         }
         typst_syntax::ast::Pattern::Parenthesized(parenthesized) => merge_expr!(
-            parse_expr(parenthesized.expr(), doc, parser),
-            parse_pattern(parenthesized.pattern(), doc, parser)
+            parse_expr(
+                parenthesized.expr(),
+                doc,
+                parser,
+                offset.push_to_span(parenthesized.expr().span())
+            ),
+            parse_pattern(
+                parenthesized.pattern(),
+                doc,
+                parser,
+                offset.push_to_span(parenthesized.pattern().span())
+            )
         ),
         typst_syntax::ast::Pattern::Destructuring(destructuring) => Some(
             destructuring
                 .items()
                 .filter_map(|item| match item {
                     typst_syntax::ast::DestructuringItem::Pattern(pattern) => {
-                        parse_pattern(pattern, doc, parser)
+                        parse_pattern(pattern, doc, parser, offset.push_to_span(pattern.span()))
                     }
                     typst_syntax::ast::DestructuringItem::Named(named) => merge_expr!(
                         constant_token!(
@@ -109,14 +191,19 @@ fn parse_pattern(
                             named.name(),
                             TokenKind::Word(WordMetadata::default())
                         ),
-                        parse_pattern(named.pattern(), doc, parser)
+                        parse_pattern(
+                            named.pattern(),
+                            doc,
+                            parser,
+                            offset.push_to_span(named.pattern().span())
+                        )
                     ),
                     typst_syntax::ast::DestructuringItem::Spread(spread) => {
                         spread.sink_ident().map_or_else(
                             || {
-                                spread
-                                    .sink_expr()
-                                    .and_then(|expr| parse_expr(expr, doc, parser))
+                                spread.sink_expr().and_then(|expr| {
+                                    parse_expr(expr, doc, parser, offset.push_to_span(expr.span()))
+                                })
                             },
                             |ident| {
                                 constant_token!(
@@ -138,6 +225,7 @@ fn parse_expr(
     ex: typst_syntax::ast::Expr,
     doc: &typst_syntax::Source,
     parser: &mut PlainEnglish,
+    offset: Offset,
 ) -> Option<Vec<Token>> {
     macro_rules! constant_token {
         ($a:expr, $to:expr) => {{
@@ -147,17 +235,18 @@ fn parse_expr(
             }])
         }};
     }
-    let mut nested_env = |exprs: &mut dyn Iterator<Item = typst_syntax::ast::Expr>| {
+    let mut nested_env = |exprs: &mut dyn Iterator<Item = typst_syntax::ast::Expr>,
+                          offset: Offset| {
         Some(
             exprs
-                .filter_map(|e| parse_expr(e, doc, parser))
+                .filter_map(|e| parse_expr(e, doc, parser, offset))
                 .flatten()
                 .collect_vec(),
         )
     };
 
     match ex {
-        Expr::Text(text) => parse_english(text.get(), doc, parser, &text.span()),
+        Expr::Text(text) => parse_english(text.get(), parser, offset.push_to_span(text.span())),
         Expr::Space(a) => constant_token!(a, TokenKind::Space(1)),
         Expr::Linebreak(a) => constant_token!(a, TokenKind::Newline(1)),
         Expr::Parbreak(a) => constant_token!(a, TokenKind::ParagraphBreak),
@@ -173,22 +262,35 @@ fn parse_expr(
                 constant_token!(quote, TokenKind::Punctuation(Punctuation::Apostrophe))
             }
         }
-        Expr::Strong(strong) => nested_env(&mut strong.body().exprs()),
-        Expr::Emph(emph) => nested_env(&mut emph.body().exprs()),
+        Expr::Strong(strong) => nested_env(
+            &mut strong.body().exprs(),
+            offset.push_to_span(strong.span()),
+        ),
+        Expr::Emph(emph) => nested_env(&mut emph.body().exprs(), offset.push_to_span(emph.span())),
         Expr::Raw(a) => constant_token!(a, TokenKind::Unlintable),
         Expr::Link(a) => constant_token!(a, TokenKind::Url),
-        Expr::Label(label) => parse_english(label.get(), doc, parser, &label.span()),
+        Expr::Label(label) => parse_english(label.get(), parser, offset.push_to_span(label.span())),
         Expr::Ref(a) => {
             constant_token!(a, TokenKind::Word(WordMetadata::default()))
         }
-        Expr::Heading(heading) => nested_env(&mut heading.body().exprs()),
-        Expr::List(list_item) => nested_env(&mut list_item.body().exprs()),
-        Expr::Enum(enum_item) => nested_env(&mut enum_item.body().exprs()),
+        Expr::Heading(heading) => nested_env(
+            &mut heading.body().exprs(),
+            offset.push_to_span(heading.span()),
+        ),
+        Expr::List(list_item) => nested_env(
+            &mut list_item.body().exprs(),
+            offset.push_to_span(list_item.span()),
+        ),
+        Expr::Enum(enum_item) => nested_env(
+            &mut enum_item.body().exprs(),
+            offset.push_to_span(enum_item.span()),
+        ),
         Expr::Term(term_item) => nested_env(
             &mut term_item
                 .term()
                 .exprs()
                 .chain(term_item.description().exprs()),
+            offset.push_to_span(term_item.span()),
         ),
         Expr::Equation(a) => constant_token!(a, TokenKind::Unlintable),
         Expr::Math(_) => panic!("Unexpected math outside equation environment."),
@@ -226,14 +328,22 @@ fn parse_expr(
             )
         }
         Expr::Code(a) => constant_token!(a, TokenKind::Unlintable),
-        Expr::Content(content_block) => nested_env(&mut content_block.body().exprs()),
-        Expr::Parenthesized(parenthesized) => parse_expr(parenthesized.expr(), doc, parser),
+        Expr::Content(content_block) => nested_env(
+            &mut content_block.body().exprs(),
+            offset.push_to_span(content_block.span()),
+        ),
+        Expr::Parenthesized(parenthesized) => parse_expr(
+            parenthesized.expr(),
+            doc,
+            parser,
+            offset.push_to_span(parenthesized.span()),
+        ),
         Expr::Array(array) => Some(
             array
                 .items()
                 .filter_map(|i| {
                     if let typst_syntax::ast::ArrayItem::Pos(e) = i {
-                        parse_expr(e, doc, parser)
+                        parse_expr(e, doc, parser, offset.push_to_span(array.span()))
                     } else {
                         None
                     }
@@ -241,11 +351,16 @@ fn parse_expr(
                 .flatten()
                 .collect_vec(),
         ),
-        Expr::Dict(a) => parse_dict(&mut a.items(), doc, parser),
+        Expr::Dict(a) => parse_dict(&mut a.items(), doc, parser, offset.push_to_span(a.span())),
         Expr::Unary(a) => constant_token!(a, TokenKind::Unlintable),
         Expr::Binary(a) => constant_token!(a, TokenKind::Unlintable),
         Expr::FieldAccess(field_access) => merge_expr!(
-            parse_expr(field_access.target(), doc, parser),
+            parse_expr(
+                field_access.target(),
+                doc,
+                parser,
+                offset.push_to_span(field_access.span())
+            ),
             constant_token!(
                 field_access.field(),
                 TokenKind::Word(WordMetadata::default())
@@ -256,47 +371,120 @@ fn parse_expr(
         Expr::Let(let_binding) => merge_expr!(
             match let_binding.kind() {
                 typst_syntax::ast::LetBindingKind::Normal(pattern) =>
-                    parse_pattern(pattern, doc, parser),
+                    parse_pattern(pattern, doc, parser, offset.push_to_span(pattern.span())),
                 typst_syntax::ast::LetBindingKind::Closure(ident) =>
                     constant_token!(ident, TokenKind::Word(WordMetadata::default())),
             },
-            let_binding.init().and_then(|e| parse_expr(e, doc, parser))
+            let_binding.init().and_then(|e| parse_expr(
+                e,
+                doc,
+                parser,
+                offset.push_to_span(e.span())
+            ))
+        ),
+        Expr::DestructAssign(destruct_assignment) => parse_expr(
+            destruct_assignment.value(),
+            doc,
+            parser,
+            offset.push_to_span(destruct_assignment.span()),
         ),
-        Expr::DestructAssign(destruct_assignment) => {
-            parse_expr(destruct_assignment.value(), doc, parser)
-        }
         Expr::Set(set_rule) => merge_expr!(
-            parse_expr(set_rule.target(), doc, parser),
-            parse_expr(set_rule.condition()?, doc, parser)
+            parse_expr(
+                set_rule.target(),
+                doc,
+                parser,
+                offset.push_to_span(set_rule.target().span())
+            ),
+            parse_expr(
+                set_rule.condition()?,
+                doc,
+                parser,
+                offset.push_to_span(set_rule.condition()?.span())
+            )
         ),
         Expr::Show(show_rule) => merge_expr!(
-            parse_expr(show_rule.transform(), doc, parser),
-            parse_expr(show_rule.selector()?, doc, parser)
+            parse_expr(
+                show_rule.transform(),
+                doc,
+                parser,
+                offset.push_to_span(show_rule.transform().span())
+            ),
+            parse_expr(
+                show_rule.selector()?,
+                doc,
+                parser,
+                offset.push_to_span(show_rule.selector()?.span())
+            )
+        ),
+        Expr::Contextual(contextual) => parse_expr(
+            contextual.body(),
+            doc,
+            parser,
+            offset.push_to_span(contextual.span()),
         ),
-        Expr::Contextual(contextual) => parse_expr(contextual.body(), doc, parser),
         Expr::Conditional(conditional) => merge_expr!(
-            parse_expr(conditional.condition(), doc, parser),
-            parse_expr(conditional.if_body(), doc, parser),
-            parse_expr(conditional.else_body()?, doc, parser)
+            parse_expr(
+                conditional.condition(),
+                doc,
+                parser,
+                offset.push_to_span(conditional.condition().span())
+            ),
+            parse_expr(
+                conditional.if_body(),
+                doc,
+                parser,
+                offset.push_to_span(conditional.if_body().span())
+            ),
+            parse_expr(
+                conditional.else_body()?,
+                doc,
+                parser,
+                offset.push_to_span(conditional.else_body()?.span())
+            )
         ),
         Expr::While(while_loop) => merge_expr!(
-            parse_expr(while_loop.condition(), doc, parser),
-            parse_expr(while_loop.body(), doc, parser)
+            parse_expr(
+                while_loop.condition(),
+                doc,
+                parser,
+                offset.push_to_span(while_loop.condition().span())
+            ),
+            parse_expr(
+                while_loop.body(),
+                doc,
+                parser,
+                offset.push_to_span(while_loop.body().span())
+            )
         ),
         Expr::For(for_loop) => merge_expr!(
-            parse_expr(for_loop.iterable(), doc, parser),
-            parse_expr(for_loop.body(), doc, parser)
+            parse_expr(
+                for_loop.iterable(),
+                doc,
+                parser,
+                offset.push_to_span(for_loop.iterable().span())
+            ),
+            parse_expr(
+                for_loop.body(),
+                doc,
+                parser,
+                offset.push_to_span(for_loop.body().span())
+            )
         ),
         Expr::Import(module_import) => {
             merge_expr!(
-                parse_expr(module_import.source(), doc, parser),
+                parse_expr(
+                    module_import.source(),
+                    doc,
+                    parser,
+                    offset.push_to_span(module_import.source().span())
+                ),
                 constant_token!(
                     module_import.new_name()?,
                     TokenKind::Word(WordMetadata::default())
                 )
             )
         }
-        Expr::Include(module_include) => parse_expr(module_include.source(), doc, parser),
+        Expr::Include(a) => constant_token!(a, TokenKind::Unlintable),
         Expr::Break(a) => constant_token!(a, TokenKind::Unlintable),
         Expr::Continue(a) => constant_token!(a, TokenKind::Unlintable),
         Expr::Return(a) => constant_token!(a, TokenKind::Unlintable),
@@ -323,7 +511,14 @@ impl Parser for Typst {
         // This is why we keep track above.
         let mut tokens = typst_tree
             .exprs()
-            .filter_map(|ex| parse_expr(ex, &typst_document, &mut english_parser))
+            .filter_map(|ex| {
+                parse_expr(
+                    ex,
+                    &typst_document,
+                    &mut english_parser,
+                    Offset::new(&typst_document),
+                )
+            })
             .flatten()
             .collect_vec();
 
@@ -572,7 +767,6 @@ writing"#;
                 }),
                 TokenKind::Space(1),
                 TokenKind::Word(_),
-                TokenKind::Space(1),
             ]
         ));
     }

From 58b3fb0248f099bcf78f94d1f69bb9b8c84cc4e1 Mon Sep 17 00:00:00 2001
From: Grant Lemons <grantlemons@aol.com>
Date: Fri, 27 Dec 2024 13:54:43 -0600
Subject: [PATCH 22/51] fix(#230): use offset struct for constant tokens

---
 harper-core/src/parsers/typst.rs | 71 ++++++++++++++++++--------------
 1 file changed, 40 insertions(+), 31 deletions(-)

diff --git a/harper-core/src/parsers/typst.rs b/harper-core/src/parsers/typst.rs
index 798c22bd..bfc1ef55 100644
--- a/harper-core/src/parsers/typst.rs
+++ b/harper-core/src/parsers/typst.rs
@@ -13,6 +13,7 @@ use crate::{
 /// Typst files.
 pub struct Typst;
 
+/// Encapsulation of the translation between byte-based spans and char-based spans
 #[derive(Debug, Clone, Copy)]
 struct Offset<'a> {
     doc: &'a typst_syntax::Source,
@@ -29,22 +30,6 @@ impl<'a> Offset<'a> {
         }
     }
 
-    pub fn update_to(&mut self, new_byte: usize) {
-        assert!(new_byte >= self.byte);
-        self.char += self.doc.get(self.byte..new_byte).unwrap().chars().count();
-        self.byte = new_byte;
-    }
-
-    pub fn update_by(&mut self, relative_bytes: usize) {
-        self.char += self
-            .doc
-            .get(self.byte..(self.byte + relative_bytes))
-            .unwrap()
-            .chars()
-            .count();
-        self.byte += relative_bytes;
-    }
-
     pub fn push_to(self, new_byte: usize) -> Self {
         assert!(new_byte >= self.byte);
         Self {
@@ -55,24 +40,33 @@ impl<'a> Offset<'a> {
     }
 
     pub fn push_by(self, relative_bytes: usize) -> Self {
-        let mut new = self;
-        new.update_by(relative_bytes);
-
-        new
+        let new_byte = self.byte + relative_bytes;
+        Self {
+            char: self.doc.get(self.byte..new_byte).unwrap().chars().count(),
+            byte: new_byte,
+            ..self
+        }
     }
 
     pub fn push_to_span(self, span: typst_syntax::Span) -> Self {
         let new_byte = self.doc.range(span).unwrap().start;
+        assert!(new_byte >= self.byte);
 
         self.push_to(new_byte)
     }
 }
 
 macro_rules! constant_token {
-    ($doc:ident, $a:expr, $to:expr) => {{
+    ($doc:ident, $a:expr, $kind:expr, $offset:expr) => {{
+        let start_char_loc = $offset.push_to($doc.range($a.span()).unwrap().start).char;
+        let end_char_loc = $offset.push_to($doc.range($a.span()).unwrap().end).char;
+
         Some(vec![Token {
-            span: $doc.range($a.span()).unwrap().into(),
-            kind: $to,
+            span: Span {
+                start: start_char_loc,
+                end: end_char_loc,
+            },
+            kind: $kind,
         }])
     }};
 }
@@ -115,7 +109,12 @@ fn parse_dict(
     Some(
         dict.filter_map(|di| match di {
             typst_syntax::ast::DictItem::Named(named) => merge_expr!(
-                constant_token!(doc, named.name(), TokenKind::Word(WordMetadata::default())),
+                constant_token!(
+                    doc,
+                    named.name(),
+                    TokenKind::Word(WordMetadata::default()),
+                    offset
+                ),
                 parse_expr(
                     named.expr(),
                     doc,
@@ -143,7 +142,9 @@ fn parse_dict(
                         parse_expr(expr, doc, parser, offset.push_to_span(expr.span()))
                     })
                 },
-                |ident| constant_token!(doc, ident, TokenKind::Word(WordMetadata::default())),
+                |ident| {
+                    constant_token!(doc, ident, TokenKind::Word(WordMetadata::default()), offset)
+                },
             ),
         })
         .flatten()
@@ -162,7 +163,7 @@ fn parse_pattern(
             parse_expr(expr, doc, parser, offset.push_to_span(expr.span()))
         }
         typst_syntax::ast::Pattern::Placeholder(underscore) => {
-            constant_token!(doc, underscore, TokenKind::Unlintable)
+            constant_token!(doc, underscore, TokenKind::Unlintable, offset)
         }
         typst_syntax::ast::Pattern::Parenthesized(parenthesized) => merge_expr!(
             parse_expr(
@@ -189,7 +190,8 @@ fn parse_pattern(
                         constant_token!(
                             doc,
                             named.name(),
-                            TokenKind::Word(WordMetadata::default())
+                            TokenKind::Word(WordMetadata::default()),
+                            offset
                         ),
                         parse_pattern(
                             named.pattern(),
@@ -209,7 +211,8 @@ fn parse_pattern(
                                 constant_token!(
                                     doc,
                                     ident,
-                                    TokenKind::Word(WordMetadata::default())
+                                    TokenKind::Word(WordMetadata::default()),
+                                    offset
                                 )
                             },
                         )
@@ -228,10 +231,16 @@ fn parse_expr(
     offset: Offset,
 ) -> Option<Vec<Token>> {
     macro_rules! constant_token {
-        ($a:expr, $to:expr) => {{
+        ($a:expr, $kind:expr) => {{
+            let start_char_loc = offset.push_to(doc.range($a.span()).unwrap().start).char;
+            let end_char_loc = offset.push_to(doc.range($a.span()).unwrap().end).char;
+
             Some(vec![Token {
-                span: doc.range($a.span()).unwrap().into(),
-                kind: $to,
+                span: Span {
+                    start: start_char_loc,
+                    end: end_char_loc,
+                },
+                kind: $kind,
             }])
         }};
     }

From 1776346a8543d120f34aa6e24967a278b2675841 Mon Sep 17 00:00:00 2001
From: Grant Lemons <grantlemons@aol.com>
Date: Fri, 27 Dec 2024 15:05:16 -0600
Subject: [PATCH 23/51] feat(#230): mark labels unlintable and add some tests

---
 harper-core/src/parsers/typst.rs | 63 +++++++++++++++++++++++++++++++-
 1 file changed, 62 insertions(+), 1 deletion(-)

diff --git a/harper-core/src/parsers/typst.rs b/harper-core/src/parsers/typst.rs
index bfc1ef55..445c77aa 100644
--- a/harper-core/src/parsers/typst.rs
+++ b/harper-core/src/parsers/typst.rs
@@ -278,7 +278,7 @@ fn parse_expr(
         Expr::Emph(emph) => nested_env(&mut emph.body().exprs(), offset.push_to_span(emph.span())),
         Expr::Raw(a) => constant_token!(a, TokenKind::Unlintable),
         Expr::Link(a) => constant_token!(a, TokenKind::Url),
-        Expr::Label(label) => parse_english(label.get(), parser, offset.push_to_span(label.span())),
+        Expr::Label(a) => constant_token!(a, TokenKind::Unlintable),
         Expr::Ref(a) => {
             constant_token!(a, TokenKind::Word(WordMetadata::default()))
         }
@@ -704,6 +704,7 @@ mod tests {
         let source = r#"#let ident = "This is a string""#;
 
         let token_kinds = Typst.parse_str(source).iter().map(|t| t.kind).collect_vec();
+        dbg!(&token_kinds);
 
         assert!(matches!(
             &token_kinds.as_slice(),
@@ -720,6 +721,66 @@ mod tests {
         ))
     }
 
+    #[test]
+    fn header_parsing() {
+        let source = r"= Header
+                       Paragraph";
+
+        let tokens = Typst.parse_str(source);
+        let token_kinds = tokens.iter().map(|t| t.kind).collect_vec();
+        dbg!(&token_kinds);
+
+        let charslice = source.chars().collect_vec();
+        assert_eq!(tokens[0].span.get_content_string(&charslice), "Header");
+        assert_eq!(tokens[2].span.get_content_string(&charslice), "Paragraph");
+
+        assert!(matches!(
+            &token_kinds.as_slice(),
+            &[TokenKind::Word(_), TokenKind::Space(1), TokenKind::Word(_)]
+        ))
+    }
+
+    #[test]
+    fn parbreak() {
+        let source = r"Paragraph
+
+                       Paragraph";
+
+        let token_kinds = Typst.parse_str(source).iter().map(|t| t.kind).collect_vec();
+        dbg!(&token_kinds);
+
+        assert!(matches!(
+            &token_kinds.as_slice(),
+            &[
+                TokenKind::Word(_),
+                TokenKind::ParagraphBreak,
+                TokenKind::Word(_),
+            ]
+        ))
+    }
+
+    #[test]
+    fn label_unlintable() {
+        let source = r"= Header
+                       <label>
+                       Paragraph";
+
+        let tokens = Typst.parse_str(source);
+        let token_kinds = tokens.iter().map(|t| t.kind).collect_vec();
+        dbg!(&token_kinds);
+
+        assert!(matches!(
+            &token_kinds.as_slice(),
+            &[
+                TokenKind::Word(_),
+                TokenKind::Space(1),
+                TokenKind::Unlintable,
+                TokenKind::Space(1),
+                TokenKind::Word(_),
+            ]
+        ))
+    }
+
     #[test]
     fn sentence() {
         let source = "This is a sentence, it is not interesting.";

From fe4979e4ff5d5db9da7f77399f64661b76471ab2 Mon Sep 17 00:00:00 2001
From: Grant Lemons <grantlemons@aol.com>
Date: Sat, 28 Dec 2024 18:15:43 -0600
Subject: [PATCH 24/51] refactor(#230): simplify matching macros

---
 harper-core/src/parsers/typst.rs | 406 +++++++++----------------------
 1 file changed, 118 insertions(+), 288 deletions(-)

diff --git a/harper-core/src/parsers/typst.rs b/harper-core/src/parsers/typst.rs
index 445c77aa..a7cf593c 100644
--- a/harper-core/src/parsers/typst.rs
+++ b/harper-core/src/parsers/typst.rs
@@ -9,19 +9,18 @@ use crate::{
     ConjunctionData, Lrc, NounData, Punctuation, Span, Token, TokenKind, VecExt, WordMetadata,
 };
 
-/// A parser that wraps the [`PlainEnglish`] parser that allows one to parse
-/// Typst files.
+/// A parser that wraps the [`PlainEnglish`] parser allowing one to parse Typst files.
 pub struct Typst;
 
 /// Encapsulation of the translation between byte-based spans and char-based spans
 #[derive(Debug, Clone, Copy)]
-struct Offset<'a> {
+struct OffsetCursor<'a> {
     doc: &'a typst_syntax::Source,
     pub char: usize,
     pub byte: usize,
 }
 
-impl<'a> Offset<'a> {
+impl<'a> OffsetCursor<'a> {
     pub fn new(doc: &'a typst_syntax::Source) -> Self {
         Self {
             doc,
@@ -30,40 +29,39 @@ impl<'a> Offset<'a> {
         }
     }
 
+    /// Returns a new [`OffsetCursor`] at the given byte based on the current cursor.
     pub fn push_to(self, new_byte: usize) -> Self {
         assert!(new_byte >= self.byte);
-        Self {
-            char: self.doc.get(self.byte..new_byte).unwrap().chars().count(),
-            byte: new_byte,
-            ..self
+
+        if new_byte == self.byte {
+            return self;
         }
-    }
 
-    pub fn push_by(self, relative_bytes: usize) -> Self {
-        let new_byte = self.byte + relative_bytes;
         Self {
-            char: self.doc.get(self.byte..new_byte).unwrap().chars().count(),
+            char: self.char + self.doc.get(self.byte..new_byte).unwrap().chars().count(),
             byte: new_byte,
             ..self
         }
     }
 
+    /// Returns a new [`OffsetCursor`] at the beginning of the given [`typst_syntax::Span`] based
+    /// on the current cursor.
     pub fn push_to_span(self, span: typst_syntax::Span) -> Self {
         let new_byte = self.doc.range(span).unwrap().start;
-        assert!(new_byte >= self.byte);
 
         self.push_to(new_byte)
     }
 }
 
-macro_rules! constant_token {
-    ($doc:ident, $a:expr, $kind:expr, $offset:expr) => {{
-        let start_char_loc = $offset.push_to($doc.range($a.span()).unwrap().start).char;
-        let end_char_loc = $offset.push_to($doc.range($a.span()).unwrap().end).char;
+macro_rules! def_token {
+    ($doc:ident, $a:expr, $kind:expr, $offset:ident) => {{
+        let range = $doc.range($a.span()).unwrap();
+        let start = $offset.push_to(range.start);
+        let end_char_loc = start.push_to(range.end).char;
 
         Some(vec![Token {
             span: Span {
-                start: start_char_loc,
+                start: start.char,
                 end: end_char_loc,
             },
             kind: $kind,
@@ -71,7 +69,7 @@ macro_rules! constant_token {
     }};
 }
 
-macro_rules! merge_expr {
+macro_rules! merge {
     ($($inner:expr),*) => {
         Some(
             [$($inner),*]
@@ -86,7 +84,7 @@ macro_rules! merge_expr {
 fn parse_english(
     str: impl Into<String>,
     parser: &mut PlainEnglish,
-    offset: Offset,
+    offset: OffsetCursor,
 ) -> Option<Vec<Token>> {
     Some(
         parser
@@ -104,47 +102,30 @@ fn parse_dict(
     dict: &mut dyn Iterator<Item = typst_syntax::ast::DictItem>,
     doc: &typst_syntax::Source,
     parser: &mut PlainEnglish,
-    offset: Offset,
+    offset: OffsetCursor,
 ) -> Option<Vec<Token>> {
     Some(
         dict.filter_map(|di| match di {
-            typst_syntax::ast::DictItem::Named(named) => merge_expr!(
-                constant_token!(
+            typst_syntax::ast::DictItem::Named(named) => merge!(
+                def_token!(
                     doc,
                     named.name(),
                     TokenKind::Word(WordMetadata::default()),
                     offset
                 ),
-                parse_expr(
-                    named.expr(),
-                    doc,
-                    parser,
-                    offset.push_to_span(named.expr().span())
-                )
+                parse_expr(named.expr(), doc, parser, offset)
             ),
-            typst_syntax::ast::DictItem::Keyed(keyed) => merge_expr!(
-                parse_expr(
-                    keyed.key(),
-                    doc,
-                    parser,
-                    offset.push_to_span(keyed.key().span())
-                ),
-                parse_expr(
-                    keyed.expr(),
-                    doc,
-                    parser,
-                    offset.push_to_span(keyed.expr().span())
-                )
+            typst_syntax::ast::DictItem::Keyed(keyed) => merge!(
+                parse_expr(keyed.key(), doc, parser, offset),
+                parse_expr(keyed.expr(), doc, parser, offset)
             ),
             typst_syntax::ast::DictItem::Spread(spread) => spread.sink_ident().map_or_else(
                 || {
-                    spread.sink_expr().and_then(|expr| {
-                        parse_expr(expr, doc, parser, offset.push_to_span(expr.span()))
-                    })
-                },
-                |ident| {
-                    constant_token!(doc, ident, TokenKind::Word(WordMetadata::default()), offset)
+                    spread
+                        .sink_expr()
+                        .and_then(|expr| parse_expr(expr, doc, parser, offset))
                 },
+                |ident| def_token!(doc, ident, TokenKind::Word(WordMetadata::default()), offset),
             ),
         })
         .flatten()
@@ -156,59 +137,42 @@ fn parse_pattern(
     pat: typst_syntax::ast::Pattern,
     doc: &typst_syntax::Source,
     parser: &mut PlainEnglish,
-    offset: Offset,
+    offset: OffsetCursor,
 ) -> Option<Vec<Token>> {
     match pat {
-        typst_syntax::ast::Pattern::Normal(expr) => {
-            parse_expr(expr, doc, parser, offset.push_to_span(expr.span()))
-        }
+        typst_syntax::ast::Pattern::Normal(expr) => parse_expr(expr, doc, parser, offset),
         typst_syntax::ast::Pattern::Placeholder(underscore) => {
-            constant_token!(doc, underscore, TokenKind::Unlintable, offset)
+            def_token!(doc, underscore, TokenKind::Unlintable, offset)
         }
-        typst_syntax::ast::Pattern::Parenthesized(parenthesized) => merge_expr!(
-            parse_expr(
-                parenthesized.expr(),
-                doc,
-                parser,
-                offset.push_to_span(parenthesized.expr().span())
-            ),
-            parse_pattern(
-                parenthesized.pattern(),
-                doc,
-                parser,
-                offset.push_to_span(parenthesized.pattern().span())
-            )
+        typst_syntax::ast::Pattern::Parenthesized(parenthesized) => merge!(
+            parse_expr(parenthesized.expr(), doc, parser, offset),
+            parse_pattern(parenthesized.pattern(), doc, parser, offset)
         ),
         typst_syntax::ast::Pattern::Destructuring(destructuring) => Some(
             destructuring
                 .items()
                 .filter_map(|item| match item {
                     typst_syntax::ast::DestructuringItem::Pattern(pattern) => {
-                        parse_pattern(pattern, doc, parser, offset.push_to_span(pattern.span()))
+                        parse_pattern(pattern, doc, parser, offset)
                     }
-                    typst_syntax::ast::DestructuringItem::Named(named) => merge_expr!(
-                        constant_token!(
+                    typst_syntax::ast::DestructuringItem::Named(named) => merge!(
+                        def_token!(
                             doc,
                             named.name(),
                             TokenKind::Word(WordMetadata::default()),
                             offset
                         ),
-                        parse_pattern(
-                            named.pattern(),
-                            doc,
-                            parser,
-                            offset.push_to_span(named.pattern().span())
-                        )
+                        parse_pattern(named.pattern(), doc, parser, offset)
                     ),
                     typst_syntax::ast::DestructuringItem::Spread(spread) => {
                         spread.sink_ident().map_or_else(
                             || {
-                                spread.sink_expr().and_then(|expr| {
-                                    parse_expr(expr, doc, parser, offset.push_to_span(expr.span()))
-                                })
+                                spread
+                                    .sink_expr()
+                                    .and_then(|expr| parse_expr(expr, doc, parser, offset))
                             },
                             |ident| {
-                                constant_token!(
+                                def_token!(
                                     doc,
                                     ident,
                                     TokenKind::Word(WordMetadata::default()),
@@ -228,100 +192,76 @@ fn parse_expr(
     ex: typst_syntax::ast::Expr,
     doc: &typst_syntax::Source,
     parser: &mut PlainEnglish,
-    offset: Offset,
+    old_offset: OffsetCursor,
 ) -> Option<Vec<Token>> {
-    macro_rules! constant_token {
-        ($a:expr, $kind:expr) => {{
-            let start_char_loc = offset.push_to(doc.range($a.span()).unwrap().start).char;
-            let end_char_loc = offset.push_to(doc.range($a.span()).unwrap().end).char;
-
-            Some(vec![Token {
-                span: Span {
-                    start: start_char_loc,
-                    end: end_char_loc,
-                },
-                kind: $kind,
-            }])
-        }};
+    let offset = old_offset.push_to_span(ex.span());
+
+    macro_rules! token {
+        ($a:expr, $kind:expr) => {
+            def_token!(doc, $a, $kind, offset)
+        };
     }
-    let mut nested_env = |exprs: &mut dyn Iterator<Item = typst_syntax::ast::Expr>,
-                          offset: Offset| {
-        Some(
-            exprs
-                .filter_map(|e| parse_expr(e, doc, parser, offset))
-                .flatten()
-                .collect_vec(),
-        )
+    macro_rules! recurse {
+        ($inner:expr) => {
+            parse_expr($inner, doc, parser, offset)
+        };
+        ($($inner:expr),*) => {
+            merge!(
+                $(recurse!($inner)),*
+            )
+        };
+    }
+
+    let mut iter_recurse = |exprs: &mut dyn Iterator<Item = typst_syntax::ast::Expr>| {
+        Some(exprs.filter_map(|e| recurse!(e)).flatten().collect_vec())
     };
 
     match ex {
         Expr::Text(text) => parse_english(text.get(), parser, offset.push_to_span(text.span())),
-        Expr::Space(a) => constant_token!(a, TokenKind::Space(1)),
-        Expr::Linebreak(a) => constant_token!(a, TokenKind::Newline(1)),
-        Expr::Parbreak(a) => constant_token!(a, TokenKind::ParagraphBreak),
-        Expr::Escape(a) => constant_token!(a, TokenKind::Unlintable),
-        Expr::Shorthand(a) => constant_token!(a, TokenKind::Unlintable),
+        Expr::Space(a) => token!(a, TokenKind::Space(1)),
+        Expr::Linebreak(a) => token!(a, TokenKind::Newline(1)),
+        Expr::Parbreak(a) => token!(a, TokenKind::ParagraphBreak),
+        Expr::Escape(a) => token!(a, TokenKind::Unlintable),
+        Expr::Shorthand(a) => token!(a, TokenKind::Unlintable),
         Expr::SmartQuote(quote) => {
             if quote.double() {
-                constant_token!(
+                token!(
                     quote,
                     TokenKind::Punctuation(Punctuation::Quote(crate::Quote { twin_loc: None }))
                 )
             } else {
-                constant_token!(quote, TokenKind::Punctuation(Punctuation::Apostrophe))
+                token!(quote, TokenKind::Punctuation(Punctuation::Apostrophe))
             }
         }
-        Expr::Strong(strong) => nested_env(
-            &mut strong.body().exprs(),
-            offset.push_to_span(strong.span()),
-        ),
-        Expr::Emph(emph) => nested_env(&mut emph.body().exprs(), offset.push_to_span(emph.span())),
-        Expr::Raw(a) => constant_token!(a, TokenKind::Unlintable),
-        Expr::Link(a) => constant_token!(a, TokenKind::Url),
-        Expr::Label(a) => constant_token!(a, TokenKind::Unlintable),
+        Expr::Strong(strong) => iter_recurse(&mut strong.body().exprs()),
+        Expr::Emph(emph) => iter_recurse(&mut emph.body().exprs()),
+        Expr::Raw(a) => token!(a, TokenKind::Unlintable),
+        Expr::Link(a) => token!(a, TokenKind::Url),
+        Expr::Label(a) => token!(a, TokenKind::Unlintable),
         Expr::Ref(a) => {
-            constant_token!(a, TokenKind::Word(WordMetadata::default()))
+            token!(a, TokenKind::Word(WordMetadata::default()))
         }
-        Expr::Heading(heading) => nested_env(
-            &mut heading.body().exprs(),
-            offset.push_to_span(heading.span()),
-        ),
-        Expr::List(list_item) => nested_env(
-            &mut list_item.body().exprs(),
-            offset.push_to_span(list_item.span()),
-        ),
-        Expr::Enum(enum_item) => nested_env(
-            &mut enum_item.body().exprs(),
-            offset.push_to_span(enum_item.span()),
-        ),
-        Expr::Term(term_item) => nested_env(
+        Expr::Heading(heading) => iter_recurse(&mut heading.body().exprs()),
+        Expr::List(list_item) => iter_recurse(&mut list_item.body().exprs()),
+        Expr::Enum(enum_item) => iter_recurse(&mut enum_item.body().exprs()),
+        Expr::Term(term_item) => iter_recurse(
             &mut term_item
                 .term()
                 .exprs()
                 .chain(term_item.description().exprs()),
-            offset.push_to_span(term_item.span()),
         ),
-        Expr::Equation(a) => constant_token!(a, TokenKind::Unlintable),
-        Expr::Math(_) => panic!("Unexpected math outside equation environment."),
-        Expr::MathIdent(_) => panic!("Unexpected math outside equation environment."),
-        Expr::MathShorthand(_) => panic!("Unexpected math outside equation environment."),
-        Expr::MathAlignPoint(_) => panic!("Unexpected math outside equation environment."),
-        Expr::MathDelimited(_) => panic!("Unexpected math outside equation environment."),
-        Expr::MathAttach(_) => panic!("Unexpected math outside equation environment."),
-        Expr::MathPrimes(_) => panic!("Unexpected math outside equation environment."),
-        Expr::MathFrac(_) => panic!("Unexpected math outside equation environment."),
-        Expr::MathRoot(_) => panic!("Unexpected math outside equation environment."),
-        Expr::Ident(a) => constant_token!(a, TokenKind::Word(WordMetadata::default())),
-        Expr::None(a) => constant_token!(a, TokenKind::Word(WordMetadata::default())),
-        Expr::Auto(a) => constant_token!(a, TokenKind::Word(WordMetadata::default())),
-        Expr::Bool(a) => constant_token!(a, TokenKind::Word(WordMetadata::default())),
+        Expr::Equation(a) => token!(a, TokenKind::Unlintable),
+        Expr::Ident(a) => token!(a, TokenKind::Word(WordMetadata::default())),
+        Expr::None(a) => token!(a, TokenKind::Word(WordMetadata::default())),
+        Expr::Auto(a) => token!(a, TokenKind::Word(WordMetadata::default())),
+        Expr::Bool(a) => token!(a, TokenKind::Word(WordMetadata::default())),
         Expr::Int(int) => {
-            constant_token!(int, TokenKind::Number((int.get() as f64).into(), None))
+            token!(int, TokenKind::Number((int.get() as f64).into(), None))
         }
         Expr::Float(float) => {
-            constant_token!(float, TokenKind::Number(float.get().into(), None))
+            token!(float, TokenKind::Number(float.get().into(), None))
         }
-        Expr::Numeric(a) => constant_token!(a, TokenKind::Unlintable),
+        Expr::Numeric(a) => token!(a, TokenKind::Unlintable),
         Expr::Str(text) => {
             let offset = doc.range(text.span()).unwrap().start + 1;
             let text = text.to_untyped().text();
@@ -336,23 +276,15 @@ fn parse_expr(
                     .collect_vec(),
             )
         }
-        Expr::Code(a) => constant_token!(a, TokenKind::Unlintable),
-        Expr::Content(content_block) => nested_env(
-            &mut content_block.body().exprs(),
-            offset.push_to_span(content_block.span()),
-        ),
-        Expr::Parenthesized(parenthesized) => parse_expr(
-            parenthesized.expr(),
-            doc,
-            parser,
-            offset.push_to_span(parenthesized.span()),
-        ),
+        Expr::Code(a) => token!(a, TokenKind::Unlintable),
+        Expr::Content(content_block) => iter_recurse(&mut content_block.body().exprs()),
+        Expr::Parenthesized(parenthesized) => recurse!(parenthesized.expr()),
         Expr::Array(array) => Some(
             array
                 .items()
                 .filter_map(|i| {
                     if let typst_syntax::ast::ArrayItem::Pos(e) = i {
-                        parse_expr(e, doc, parser, offset.push_to_span(array.span()))
+                        recurse!(e)
                     } else {
                         None
                     }
@@ -360,143 +292,41 @@ fn parse_expr(
                 .flatten()
                 .collect_vec(),
         ),
-        Expr::Dict(a) => parse_dict(&mut a.items(), doc, parser, offset.push_to_span(a.span())),
-        Expr::Unary(a) => constant_token!(a, TokenKind::Unlintable),
-        Expr::Binary(a) => constant_token!(a, TokenKind::Unlintable),
-        Expr::FieldAccess(field_access) => merge_expr!(
-            parse_expr(
-                field_access.target(),
-                doc,
-                parser,
-                offset.push_to_span(field_access.span())
-            ),
-            constant_token!(
+        Expr::Dict(a) => parse_dict(&mut a.items(), doc, parser, offset),
+        Expr::Unary(a) => token!(a, TokenKind::Unlintable),
+        Expr::Binary(a) => token!(a, TokenKind::Unlintable),
+        Expr::FieldAccess(field_access) => merge!(
+            recurse!(field_access.target()),
+            token!(
                 field_access.field(),
                 TokenKind::Word(WordMetadata::default())
             )
         ),
-        Expr::FuncCall(a) => constant_token!(a, TokenKind::Unlintable),
-        Expr::Closure(a) => constant_token!(a, TokenKind::Unlintable),
-        Expr::Let(let_binding) => merge_expr!(
+        Expr::FuncCall(func_call) => recurse!(func_call.callee()),
+        Expr::Closure(a) => token!(a, TokenKind::Unlintable),
+        Expr::Let(let_binding) => merge!(
             match let_binding.kind() {
                 typst_syntax::ast::LetBindingKind::Normal(pattern) =>
-                    parse_pattern(pattern, doc, parser, offset.push_to_span(pattern.span())),
+                    parse_pattern(pattern, doc, parser, offset),
                 typst_syntax::ast::LetBindingKind::Closure(ident) =>
-                    constant_token!(ident, TokenKind::Word(WordMetadata::default())),
+                    token!(ident, TokenKind::Word(WordMetadata::default())),
             },
-            let_binding.init().and_then(|e| parse_expr(
-                e,
-                doc,
-                parser,
-                offset.push_to_span(e.span())
-            ))
-        ),
-        Expr::DestructAssign(destruct_assignment) => parse_expr(
-            destruct_assignment.value(),
-            doc,
-            parser,
-            offset.push_to_span(destruct_assignment.span()),
-        ),
-        Expr::Set(set_rule) => merge_expr!(
-            parse_expr(
-                set_rule.target(),
-                doc,
-                parser,
-                offset.push_to_span(set_rule.target().span())
-            ),
-            parse_expr(
-                set_rule.condition()?,
-                doc,
-                parser,
-                offset.push_to_span(set_rule.condition()?.span())
-            )
-        ),
-        Expr::Show(show_rule) => merge_expr!(
-            parse_expr(
-                show_rule.transform(),
-                doc,
-                parser,
-                offset.push_to_span(show_rule.transform().span())
-            ),
-            parse_expr(
-                show_rule.selector()?,
-                doc,
-                parser,
-                offset.push_to_span(show_rule.selector()?.span())
-            )
-        ),
-        Expr::Contextual(contextual) => parse_expr(
-            contextual.body(),
-            doc,
-            parser,
-            offset.push_to_span(contextual.span()),
+            let_binding.init().and_then(|e| recurse!(e))
         ),
-        Expr::Conditional(conditional) => merge_expr!(
-            parse_expr(
-                conditional.condition(),
-                doc,
-                parser,
-                offset.push_to_span(conditional.condition().span())
-            ),
-            parse_expr(
-                conditional.if_body(),
-                doc,
-                parser,
-                offset.push_to_span(conditional.if_body().span())
-            ),
-            parse_expr(
-                conditional.else_body()?,
-                doc,
-                parser,
-                offset.push_to_span(conditional.else_body()?.span())
-            )
-        ),
-        Expr::While(while_loop) => merge_expr!(
-            parse_expr(
-                while_loop.condition(),
-                doc,
-                parser,
-                offset.push_to_span(while_loop.condition().span())
-            ),
-            parse_expr(
-                while_loop.body(),
-                doc,
-                parser,
-                offset.push_to_span(while_loop.body().span())
-            )
-        ),
-        Expr::For(for_loop) => merge_expr!(
-            parse_expr(
-                for_loop.iterable(),
-                doc,
-                parser,
-                offset.push_to_span(for_loop.iterable().span())
-            ),
-            parse_expr(
-                for_loop.body(),
-                doc,
-                parser,
-                offset.push_to_span(for_loop.body().span())
-            )
-        ),
-        Expr::Import(module_import) => {
-            merge_expr!(
-                parse_expr(
-                    module_import.source(),
-                    doc,
-                    parser,
-                    offset.push_to_span(module_import.source().span())
-                ),
-                constant_token!(
-                    module_import.new_name()?,
-                    TokenKind::Word(WordMetadata::default())
-                )
-            )
+        Expr::DestructAssign(destruct_assignment) => {
+            recurse!(destruct_assignment.value())
         }
-        Expr::Include(a) => constant_token!(a, TokenKind::Unlintable),
-        Expr::Break(a) => constant_token!(a, TokenKind::Unlintable),
-        Expr::Continue(a) => constant_token!(a, TokenKind::Unlintable),
-        Expr::Return(a) => constant_token!(a, TokenKind::Unlintable),
+        Expr::Set(set_rule) => recurse!(set_rule.target(), set_rule.condition()?),
+        Expr::Show(show_rule) => recurse!(show_rule.transform(), show_rule.selector()?),
+        Expr::Contextual(contextual) => recurse!(contextual.body()),
+        Expr::Conditional(conditional) => recurse!(
+            conditional.condition(),
+            conditional.if_body(),
+            conditional.else_body()?
+        ),
+        Expr::While(while_loop) => recurse!(while_loop.condition(), while_loop.body()),
+        Expr::For(for_loop) => recurse!(for_loop.iterable(), for_loop.body()),
+        a => token!(a, TokenKind::Unlintable),
     }
 }
 
@@ -525,7 +355,7 @@ impl Parser for Typst {
                     ex,
                     &typst_document,
                     &mut english_parser,
-                    Offset::new(&typst_document),
+                    OffsetCursor::new(&typst_document),
                 )
             })
             .flatten()

From 17585f3245763f4d2ab8631f0541b12f67651ad0 Mon Sep 17 00:00:00 2001
From: Grant Lemons <grantlemons@aol.com>
Date: Sat, 28 Dec 2024 19:17:30 -0600
Subject: [PATCH 25/51] refactor(#230): create helper struct and make parser
 trait non-mut

The parser trait's parse method took an &mut, but it wasn't used
anywhere and was causing significant problems interacting with closures.

If it is needed in the future, I would suggest creating a seperate
mutable parse method.
---
 harper-comments/src/comment_parser.rs         |   2 +-
 harper-comments/src/comment_parsers/go.rs     |   6 +-
 .../src/comment_parsers/javadoc.rs            |   2 +-
 harper-comments/src/comment_parsers/jsdoc.rs  |   2 +-
 harper-comments/src/comment_parsers/unit.rs   |   7 +-
 harper-core/src/mask/mod.rs                   |   2 +-
 .../src/parsers/collapse_identifiers.rs       |   2 +-
 harper-core/src/parsers/isolate_english.rs    |   2 +-
 harper-core/src/parsers/markdown.rs           |   4 +-
 harper-core/src/parsers/mask.rs               |   2 +-
 harper-core/src/parsers/mod.rs                |   8 +-
 harper-core/src/parsers/plain_english.rs      |   5 +-
 harper-core/src/parsers/typst.rs              | 478 +++++++++---------
 harper-html/src/lib.rs                        |   2 +-
 harper-ls/src/git_commit_parser.rs            |   6 +-
 harper-tree-sitter/src/lib.rs                 |   2 +-
 16 files changed, 268 insertions(+), 264 deletions(-)

diff --git a/harper-comments/src/comment_parser.rs b/harper-comments/src/comment_parser.rs
index 54536862..ab874bc3 100644
--- a/harper-comments/src/comment_parser.rs
+++ b/harper-comments/src/comment_parser.rs
@@ -95,7 +95,7 @@ impl CommentParser {
 }
 
 impl Parser for CommentParser {
-    fn parse(&mut self, source: &[char]) -> Vec<Token> {
+    fn parse(&self, source: &[char]) -> Vec<Token> {
         self.inner.parse(source)
     }
 }
diff --git a/harper-comments/src/comment_parsers/go.rs b/harper-comments/src/comment_parsers/go.rs
index 0c90b7d8..f7f824db 100644
--- a/harper-comments/src/comment_parsers/go.rs
+++ b/harper-comments/src/comment_parsers/go.rs
@@ -7,7 +7,7 @@ use super::without_initiators;
 pub struct Go;
 
 impl Parser for Go {
-    fn parse(&mut self, source: &[char]) -> Vec<Token> {
+    fn parse(&self, source: &[char]) -> Vec<Token> {
         let mut actual = without_initiators(source);
         let mut actual_source = actual.get_content(source);
 
@@ -25,9 +25,7 @@ impl Parser for Go {
             actual_source = new_source
         }
 
-        let mut markdown_parser = Markdown;
-
-        let mut new_tokens = markdown_parser.parse(actual_source);
+        let mut new_tokens = Markdown.parse(actual_source);
 
         new_tokens
             .iter_mut()
diff --git a/harper-comments/src/comment_parsers/javadoc.rs b/harper-comments/src/comment_parsers/javadoc.rs
index 93b7f903..ef071488 100644
--- a/harper-comments/src/comment_parsers/javadoc.rs
+++ b/harper-comments/src/comment_parsers/javadoc.rs
@@ -12,7 +12,7 @@ pub struct JavaDoc {
 }
 
 impl Parser for JavaDoc {
-    fn parse(&mut self, source: &[char]) -> Vec<Token> {
+    fn parse(&self, source: &[char]) -> Vec<Token> {
         let actual = without_initiators(source);
         let actual_source = actual.get_content(source);
 
diff --git a/harper-comments/src/comment_parsers/jsdoc.rs b/harper-comments/src/comment_parsers/jsdoc.rs
index 33e4858a..dcc56a0a 100644
--- a/harper-comments/src/comment_parsers/jsdoc.rs
+++ b/harper-comments/src/comment_parsers/jsdoc.rs
@@ -7,7 +7,7 @@ use super::without_initiators;
 pub struct JsDoc;
 
 impl Parser for JsDoc {
-    fn parse(&mut self, source: &[char]) -> Vec<Token> {
+    fn parse(&self, source: &[char]) -> Vec<Token> {
         let mut tokens = Vec::new();
 
         let mut chars_traversed = 0;
diff --git a/harper-comments/src/comment_parsers/unit.rs b/harper-comments/src/comment_parsers/unit.rs
index 324225ca..3185a172 100644
--- a/harper-comments/src/comment_parsers/unit.rs
+++ b/harper-comments/src/comment_parsers/unit.rs
@@ -12,7 +12,7 @@ use super::without_initiators;
 pub struct Unit;
 
 impl Parser for Unit {
-    fn parse(&mut self, source: &[char]) -> Vec<Token> {
+    fn parse(&self, source: &[char]) -> Vec<Token> {
         let mut tokens = Vec::new();
 
         let mut chars_traversed = 0;
@@ -57,10 +57,7 @@ fn parse_line(source: &[char]) -> Vec<Token> {
     }
 
     let source = actual.get_content(source);
-
-    let mut markdown_parser = Markdown;
-
-    let mut new_tokens = markdown_parser.parse(source);
+    let mut new_tokens = Markdown.parse(source);
 
     new_tokens
         .iter_mut()
diff --git a/harper-core/src/mask/mod.rs b/harper-core/src/mask/mod.rs
index 4b677c97..c633d6c6 100644
--- a/harper-core/src/mask/mod.rs
+++ b/harper-core/src/mask/mod.rs
@@ -8,7 +8,7 @@ use crate::Span;
 /// This is primarily used by [`crate::parsers::Mask`] to create parsers for
 /// things like comments of programming languages.
 pub trait Masker: Send + Sync {
-    fn create_mask(&mut self, source: &[char]) -> Mask;
+    fn create_mask(&self, source: &[char]) -> Mask;
 }
 
 /// Identifies portions of a [`char`] sequence that should __not__ be ignored by
diff --git a/harper-core/src/parsers/collapse_identifiers.rs b/harper-core/src/parsers/collapse_identifiers.rs
index 59fd81a1..6cdfe9d7 100644
--- a/harper-core/src/parsers/collapse_identifiers.rs
+++ b/harper-core/src/parsers/collapse_identifiers.rs
@@ -32,7 +32,7 @@ thread_local! {
 }
 
 impl Parser for CollapseIdentifiers {
-    fn parse(&mut self, source: &[char]) -> Vec<Token> {
+    fn parse(&self, source: &[char]) -> Vec<Token> {
         let mut tokens = self.inner.parse(source);
 
         let mut to_remove = VecDeque::default();
diff --git a/harper-core/src/parsers/isolate_english.rs b/harper-core/src/parsers/isolate_english.rs
index 151e5fdd..04d7e8e2 100644
--- a/harper-core/src/parsers/isolate_english.rs
+++ b/harper-core/src/parsers/isolate_english.rs
@@ -19,7 +19,7 @@ impl<D: Dictionary> IsolateEnglish<D> {
 }
 
 impl<D: Dictionary> Parser for IsolateEnglish<D> {
-    fn parse(&mut self, source: &[char]) -> Vec<Token> {
+    fn parse(&self, source: &[char]) -> Vec<Token> {
         let tokens = self.inner.parse(source);
 
         let mut english_tokens: Vec<Token> = Vec::with_capacity(tokens.len());
diff --git a/harper-core/src/parsers/markdown.rs b/harper-core/src/parsers/markdown.rs
index 89ed098b..663a203f 100644
--- a/harper-core/src/parsers/markdown.rs
+++ b/harper-core/src/parsers/markdown.rs
@@ -120,8 +120,8 @@ impl Markdown {
 impl Parser for Markdown {
     /// This implementation is quite gross to look at, but it works.
     /// If any issues arise, it would likely help to refactor this out first.
-    fn parse(&mut self, source: &[char]) -> Vec<Token> {
-        let mut english_parser = PlainEnglish;
+    fn parse(&self, source: &[char]) -> Vec<Token> {
+        let english_parser = PlainEnglish;
 
         let source_str: String = source.iter().collect();
         let md_parser = pulldown_cmark::Parser::new_ext(
diff --git a/harper-core/src/parsers/mask.rs b/harper-core/src/parsers/mask.rs
index 2bd21aae..92282794 100644
--- a/harper-core/src/parsers/mask.rs
+++ b/harper-core/src/parsers/mask.rs
@@ -27,7 +27,7 @@ where
     M: Masker,
     P: Parser,
 {
-    fn parse(&mut self, source: &[char]) -> Vec<Token> {
+    fn parse(&self, source: &[char]) -> Vec<Token> {
         let mask = self.masker.create_mask(source);
 
         let mut tokens: Vec<Token> = Vec::new();
diff --git a/harper-core/src/parsers/mod.rs b/harper-core/src/parsers/mod.rs
index af742a3e..afed02ca 100644
--- a/harper-core/src/parsers/mod.rs
+++ b/harper-core/src/parsers/mod.rs
@@ -18,24 +18,24 @@ pub use crate::token::{Token, TokenKind, TokenStringExt};
 #[cfg(not(feature = "concurrent"))]
 #[blanket(derive(Box))]
 pub trait Parser {
-    fn parse(&mut self, source: &[char]) -> Vec<Token>;
+    fn parse(&self, source: &[char]) -> Vec<Token>;
 }
 
 #[cfg(feature = "concurrent")]
 #[blanket(derive(Box))]
 pub trait Parser: Send + Sync {
-    fn parse(&mut self, source: &[char]) -> Vec<Token>;
+    fn parse(&self, source: &[char]) -> Vec<Token>;
 }
 
 pub trait StrParser {
-    fn parse_str(&mut self, source: impl AsRef<str>) -> Vec<Token>;
+    fn parse_str(&self, source: impl AsRef<str>) -> Vec<Token>;
 }
 
 impl<T> StrParser for T
 where
     T: Parser,
 {
-    fn parse_str(&mut self, source: impl AsRef<str>) -> Vec<Token> {
+    fn parse_str(&self, source: impl AsRef<str>) -> Vec<Token> {
         let source: Vec<_> = source.as_ref().chars().collect();
         self.parse(&source)
     }
diff --git a/harper-core/src/parsers/plain_english.rs b/harper-core/src/parsers/plain_english.rs
index 3f3ef119..13d8df8d 100644
--- a/harper-core/src/parsers/plain_english.rs
+++ b/harper-core/src/parsers/plain_english.rs
@@ -4,12 +4,11 @@ use crate::{Span, Token};
 
 /// A parser that will attempt to lex as many tokens a possible,
 /// without discrimination and until the end of input.
+#[derive(Clone, Copy)]
 pub struct PlainEnglish;
 
-impl PlainEnglish {}
-
 impl Parser for PlainEnglish {
-    fn parse(&mut self, source: &[char]) -> Vec<Token> {
+    fn parse(&self, source: &[char]) -> Vec<Token> {
         let mut cursor = 0;
 
         // Lex tokens
diff --git a/harper-core/src/parsers/typst.rs b/harper-core/src/parsers/typst.rs
index a7cf593c..789f0dfd 100644
--- a/harper-core/src/parsers/typst.rs
+++ b/harper-core/src/parsers/typst.rs
@@ -54,7 +54,7 @@ impl<'a> OffsetCursor<'a> {
 }
 
 macro_rules! def_token {
-    ($doc:ident, $a:expr, $kind:expr, $offset:ident) => {{
+    ($doc:expr, $a:expr, $kind:expr, $offset:ident) => {{
         let range = $doc.range($a.span()).unwrap();
         let start = $offset.push_to(range.start);
         let end_char_loc = start.push_to(range.end).char;
@@ -81,129 +81,144 @@ macro_rules! merge {
     };
 }
 
-fn parse_english(
-    str: impl Into<String>,
-    parser: &mut PlainEnglish,
-    offset: OffsetCursor,
-) -> Option<Vec<Token>> {
-    Some(
-        parser
-            .parse_str(str.into())
-            .into_iter()
-            .map(|mut t| {
-                t.span.push_by(offset.char);
-                t
-            })
-            .collect_vec(),
-    )
-}
-
-fn parse_dict(
-    dict: &mut dyn Iterator<Item = typst_syntax::ast::DictItem>,
-    doc: &typst_syntax::Source,
-    parser: &mut PlainEnglish,
-    offset: OffsetCursor,
-) -> Option<Vec<Token>> {
-    Some(
-        dict.filter_map(|di| match di {
-            typst_syntax::ast::DictItem::Named(named) => merge!(
-                def_token!(
-                    doc,
-                    named.name(),
-                    TokenKind::Word(WordMetadata::default()),
-                    offset
-                ),
-                parse_expr(named.expr(), doc, parser, offset)
-            ),
-            typst_syntax::ast::DictItem::Keyed(keyed) => merge!(
-                parse_expr(keyed.key(), doc, parser, offset),
-                parse_expr(keyed.expr(), doc, parser, offset)
-            ),
-            typst_syntax::ast::DictItem::Spread(spread) => spread.sink_ident().map_or_else(
-                || {
-                    spread
-                        .sink_expr()
-                        .and_then(|expr| parse_expr(expr, doc, parser, offset))
-                },
-                |ident| def_token!(doc, ident, TokenKind::Word(WordMetadata::default()), offset),
-            ),
-        })
-        .flatten()
-        .collect(),
-    )
+/// Contains values used in parsing so they don't have to be passed around so much
+#[derive(Clone, Copy)]
+struct ParseHelper<'a> {
+    parser: PlainEnglish,
+    doc: &'a typst_syntax::Source,
 }
 
-fn parse_pattern(
-    pat: typst_syntax::ast::Pattern,
-    doc: &typst_syntax::Source,
-    parser: &mut PlainEnglish,
-    offset: OffsetCursor,
-) -> Option<Vec<Token>> {
-    match pat {
-        typst_syntax::ast::Pattern::Normal(expr) => parse_expr(expr, doc, parser, offset),
-        typst_syntax::ast::Pattern::Placeholder(underscore) => {
-            def_token!(doc, underscore, TokenKind::Unlintable, offset)
+impl<'a> ParseHelper<'a> {
+    pub fn new(doc: &'a typst_syntax::Source) -> Self {
+        Self {
+            parser: PlainEnglish,
+            doc,
         }
-        typst_syntax::ast::Pattern::Parenthesized(parenthesized) => merge!(
-            parse_expr(parenthesized.expr(), doc, parser, offset),
-            parse_pattern(parenthesized.pattern(), doc, parser, offset)
-        ),
-        typst_syntax::ast::Pattern::Destructuring(destructuring) => Some(
-            destructuring
-                .items()
-                .filter_map(|item| match item {
-                    typst_syntax::ast::DestructuringItem::Pattern(pattern) => {
-                        parse_pattern(pattern, doc, parser, offset)
-                    }
-                    typst_syntax::ast::DestructuringItem::Named(named) => merge!(
+    }
+
+    fn parse_english(self, str: impl Into<String>, offset: OffsetCursor) -> Option<Vec<Token>> {
+        Some(
+            self.parser
+                .parse_str(str.into())
+                .into_iter()
+                .map(|mut t| {
+                    t.span.push_by(offset.char);
+                    t
+                })
+                .collect_vec(),
+        )
+    }
+
+    fn parse_dict(
+        self,
+        dict: &mut dyn Iterator<Item = typst_syntax::ast::DictItem>,
+        offset: OffsetCursor,
+    ) -> Option<Vec<Token>> {
+        Some(
+            dict.filter_map(|di| match di {
+                typst_syntax::ast::DictItem::Named(named) => merge!(
+                    def_token!(
+                        self.doc,
+                        named.name(),
+                        TokenKind::Word(WordMetadata::default()),
+                        offset
+                    ),
+                    self.parse_expr(named.expr(), offset)
+                ),
+                typst_syntax::ast::DictItem::Keyed(keyed) => merge!(
+                    self.parse_expr(keyed.key(), offset),
+                    self.parse_expr(keyed.expr(), offset)
+                ),
+                typst_syntax::ast::DictItem::Spread(spread) => spread.sink_ident().map_or_else(
+                    || {
+                        spread
+                            .sink_expr()
+                            .and_then(|expr| self.parse_expr(expr, offset))
+                    },
+                    |ident| {
                         def_token!(
-                            doc,
-                            named.name(),
+                            self.doc,
+                            ident,
                             TokenKind::Word(WordMetadata::default()),
                             offset
-                        ),
-                        parse_pattern(named.pattern(), doc, parser, offset)
-                    ),
-                    typst_syntax::ast::DestructuringItem::Spread(spread) => {
-                        spread.sink_ident().map_or_else(
-                            || {
-                                spread
-                                    .sink_expr()
-                                    .and_then(|expr| parse_expr(expr, doc, parser, offset))
-                            },
-                            |ident| {
-                                def_token!(
-                                    doc,
-                                    ident,
-                                    TokenKind::Word(WordMetadata::default()),
-                                    offset
-                                )
-                            },
                         )
-                    }
-                })
-                .flatten()
-                .collect(),
-        ),
+                    },
+                ),
+            })
+            .flatten()
+            .collect(),
+        )
     }
-}
 
-fn parse_expr(
-    ex: typst_syntax::ast::Expr,
-    doc: &typst_syntax::Source,
-    parser: &mut PlainEnglish,
-    old_offset: OffsetCursor,
-) -> Option<Vec<Token>> {
-    let offset = old_offset.push_to_span(ex.span());
-
-    macro_rules! token {
-        ($a:expr, $kind:expr) => {
-            def_token!(doc, $a, $kind, offset)
-        };
+    fn parse_pattern(
+        self,
+        pat: typst_syntax::ast::Pattern,
+        offset: OffsetCursor,
+    ) -> Option<Vec<Token>> {
+        match pat {
+            typst_syntax::ast::Pattern::Normal(expr) => self.parse_expr(expr, offset),
+            typst_syntax::ast::Pattern::Placeholder(underscore) => {
+                def_token!(self.doc, underscore, TokenKind::Unlintable, offset)
+            }
+            typst_syntax::ast::Pattern::Parenthesized(parenthesized) => merge!(
+                self.parse_expr(parenthesized.expr(), offset),
+                self.parse_pattern(parenthesized.pattern(), offset)
+            ),
+            typst_syntax::ast::Pattern::Destructuring(destructuring) => Some(
+                destructuring
+                    .items()
+                    .filter_map(|item| match item {
+                        typst_syntax::ast::DestructuringItem::Pattern(pattern) => {
+                            self.parse_pattern(pattern, offset)
+                        }
+                        typst_syntax::ast::DestructuringItem::Named(named) => merge!(
+                            def_token!(
+                                self.doc,
+                                named.name(),
+                                TokenKind::Word(WordMetadata::default()),
+                                offset
+                            ),
+                            self.parse_pattern(named.pattern(), offset)
+                        ),
+                        typst_syntax::ast::DestructuringItem::Spread(spread) => {
+                            spread.sink_ident().map_or_else(
+                                || {
+                                    spread
+                                        .sink_expr()
+                                        .and_then(|expr| self.parse_expr(expr, offset))
+                                },
+                                |ident| {
+                                    def_token!(
+                                        self.doc,
+                                        ident,
+                                        TokenKind::Word(WordMetadata::default()),
+                                        offset
+                                    )
+                                },
+                            )
+                        }
+                    })
+                    .flatten()
+                    .collect(),
+            ),
+        }
     }
-    macro_rules! recurse {
+
+    pub fn parse_expr(
+        self,
+        ex: typst_syntax::ast::Expr,
+        old_offset: OffsetCursor,
+    ) -> Option<Vec<Token>> {
+        let offset = old_offset.push_to_span(ex.span());
+
+        macro_rules! token {
+            ($a:expr, $kind:expr) => {
+                def_token!(self.doc, $a, $kind, offset)
+            };
+        }
+        macro_rules! recurse {
         ($inner:expr) => {
-            parse_expr($inner, doc, parser, offset)
+            self.parse_expr($inner, offset)
         };
         ($($inner:expr),*) => {
             merge!(
@@ -212,121 +227,128 @@ fn parse_expr(
         };
     }
 
-    let mut iter_recurse = |exprs: &mut dyn Iterator<Item = typst_syntax::ast::Expr>| {
-        Some(exprs.filter_map(|e| recurse!(e)).flatten().collect_vec())
-    };
+        let iter_recurse = |exprs: &mut dyn Iterator<Item = typst_syntax::ast::Expr>| {
+            Some(exprs.filter_map(|e| recurse!(e)).flatten().collect_vec())
+        };
 
-    match ex {
-        Expr::Text(text) => parse_english(text.get(), parser, offset.push_to_span(text.span())),
-        Expr::Space(a) => token!(a, TokenKind::Space(1)),
-        Expr::Linebreak(a) => token!(a, TokenKind::Newline(1)),
-        Expr::Parbreak(a) => token!(a, TokenKind::ParagraphBreak),
-        Expr::Escape(a) => token!(a, TokenKind::Unlintable),
-        Expr::Shorthand(a) => token!(a, TokenKind::Unlintable),
-        Expr::SmartQuote(quote) => {
-            if quote.double() {
-                token!(
-                    quote,
-                    TokenKind::Punctuation(Punctuation::Quote(crate::Quote { twin_loc: None }))
+        match ex {
+            Expr::Text(text) => self.parse_english(text.get(), offset.push_to_span(text.span())),
+            Expr::Space(a) => token!(a, TokenKind::Space(1)),
+            Expr::Linebreak(a) => token!(a, TokenKind::Newline(1)),
+            Expr::Parbreak(a) => token!(a, TokenKind::ParagraphBreak),
+            Expr::Escape(a) => token!(a, TokenKind::Unlintable),
+            Expr::Shorthand(a) => token!(a, TokenKind::Unlintable),
+            Expr::SmartQuote(quote) => {
+                if quote.double() {
+                    token!(
+                        quote,
+                        TokenKind::Punctuation(Punctuation::Quote(crate::Quote { twin_loc: None }))
+                    )
+                } else {
+                    token!(quote, TokenKind::Punctuation(Punctuation::Apostrophe))
+                }
+            }
+            Expr::Strong(strong) => iter_recurse(&mut strong.body().exprs()),
+            Expr::Emph(emph) => iter_recurse(&mut emph.body().exprs()),
+            Expr::Raw(a) => token!(a, TokenKind::Unlintable),
+            Expr::Link(a) => token!(a, TokenKind::Url),
+            Expr::Label(a) => token!(a, TokenKind::Unlintable),
+            Expr::Ref(a) => {
+                token!(a, TokenKind::Word(WordMetadata::default()))
+            }
+            Expr::Heading(heading) => iter_recurse(&mut heading.body().exprs()),
+            Expr::List(list_item) => iter_recurse(&mut list_item.body().exprs()),
+            Expr::Enum(enum_item) => iter_recurse(&mut enum_item.body().exprs()),
+            Expr::Term(term_item) => iter_recurse(
+                &mut term_item
+                    .term()
+                    .exprs()
+                    .chain(term_item.description().exprs()),
+            ),
+            Expr::Equation(a) => token!(a, TokenKind::Unlintable),
+            Expr::Ident(a) => token!(a, TokenKind::Word(WordMetadata::default())),
+            Expr::None(a) => token!(a, TokenKind::Word(WordMetadata::default())),
+            Expr::Auto(a) => token!(a, TokenKind::Word(WordMetadata::default())),
+            Expr::Bool(a) => token!(a, TokenKind::Word(WordMetadata::default())),
+            Expr::Int(int) => {
+                token!(int, TokenKind::Number((int.get() as f64).into(), None))
+            }
+            Expr::Float(float) => {
+                token!(float, TokenKind::Number(float.get().into(), None))
+            }
+            Expr::Numeric(a) => token!(a, TokenKind::Unlintable),
+            Expr::Str(text) => {
+                let offset = self.doc.range(text.span()).unwrap().start + 1;
+                let text = text.to_untyped().text();
+                Some(
+                    self.parser
+                        .parse_str(&text[1..text.len() - 1])
+                        .into_iter()
+                        .map(|mut t| {
+                            t.span.push_by(offset);
+                            t
+                        })
+                        .collect_vec(),
                 )
-            } else {
-                token!(quote, TokenKind::Punctuation(Punctuation::Apostrophe))
             }
-        }
-        Expr::Strong(strong) => iter_recurse(&mut strong.body().exprs()),
-        Expr::Emph(emph) => iter_recurse(&mut emph.body().exprs()),
-        Expr::Raw(a) => token!(a, TokenKind::Unlintable),
-        Expr::Link(a) => token!(a, TokenKind::Url),
-        Expr::Label(a) => token!(a, TokenKind::Unlintable),
-        Expr::Ref(a) => {
-            token!(a, TokenKind::Word(WordMetadata::default()))
-        }
-        Expr::Heading(heading) => iter_recurse(&mut heading.body().exprs()),
-        Expr::List(list_item) => iter_recurse(&mut list_item.body().exprs()),
-        Expr::Enum(enum_item) => iter_recurse(&mut enum_item.body().exprs()),
-        Expr::Term(term_item) => iter_recurse(
-            &mut term_item
-                .term()
-                .exprs()
-                .chain(term_item.description().exprs()),
-        ),
-        Expr::Equation(a) => token!(a, TokenKind::Unlintable),
-        Expr::Ident(a) => token!(a, TokenKind::Word(WordMetadata::default())),
-        Expr::None(a) => token!(a, TokenKind::Word(WordMetadata::default())),
-        Expr::Auto(a) => token!(a, TokenKind::Word(WordMetadata::default())),
-        Expr::Bool(a) => token!(a, TokenKind::Word(WordMetadata::default())),
-        Expr::Int(int) => {
-            token!(int, TokenKind::Number((int.get() as f64).into(), None))
-        }
-        Expr::Float(float) => {
-            token!(float, TokenKind::Number(float.get().into(), None))
-        }
-        Expr::Numeric(a) => token!(a, TokenKind::Unlintable),
-        Expr::Str(text) => {
-            let offset = doc.range(text.span()).unwrap().start + 1;
-            let text = text.to_untyped().text();
-            Some(
-                parser
-                    .parse_str(&text[1..text.len() - 1])
-                    .into_iter()
-                    .map(|mut t| {
-                        t.span.push_by(offset);
-                        t
+            Expr::Code(a) => token!(a, TokenKind::Unlintable),
+            Expr::Content(content_block) => iter_recurse(&mut content_block.body().exprs()),
+            Expr::Parenthesized(parenthesized) => recurse!(parenthesized.expr()),
+            Expr::Array(array) => Some(
+                array
+                    .items()
+                    .filter_map(|i| {
+                        if let typst_syntax::ast::ArrayItem::Pos(e) = i {
+                            recurse!(e)
+                        } else {
+                            None
+                        }
                     })
+                    .flatten()
                     .collect_vec(),
-            )
-        }
-        Expr::Code(a) => token!(a, TokenKind::Unlintable),
-        Expr::Content(content_block) => iter_recurse(&mut content_block.body().exprs()),
-        Expr::Parenthesized(parenthesized) => recurse!(parenthesized.expr()),
-        Expr::Array(array) => Some(
-            array
-                .items()
-                .filter_map(|i| {
-                    if let typst_syntax::ast::ArrayItem::Pos(e) = i {
-                        recurse!(e)
-                    } else {
-                        None
-                    }
-                })
-                .flatten()
-                .collect_vec(),
-        ),
-        Expr::Dict(a) => parse_dict(&mut a.items(), doc, parser, offset),
-        Expr::Unary(a) => token!(a, TokenKind::Unlintable),
-        Expr::Binary(a) => token!(a, TokenKind::Unlintable),
-        Expr::FieldAccess(field_access) => merge!(
-            recurse!(field_access.target()),
-            token!(
-                field_access.field(),
-                TokenKind::Word(WordMetadata::default())
-            )
+            ),
+            Expr::Dict(a) => self.parse_dict(&mut a.items(), offset),
+            Expr::Unary(a) => token!(a, TokenKind::Unlintable),
+            Expr::Binary(a) => token!(a, TokenKind::Unlintable),
+            Expr::FieldAccess(field_access) => merge!(
+                recurse!(field_access.target()),
+                token!(
+                    field_access.field(),
+                    TokenKind::Word(WordMetadata::default())
+                )
+            ),
+            Expr::FuncCall(func_call) => recurse!(func_call.callee()),
+            Expr::Closure(a) => token!(a, TokenKind::Unlintable),
+            Expr::Let(let_binding) => merge!(
+                match let_binding.kind() {
+                    typst_syntax::ast::LetBindingKind::Normal(pattern) =>
+                        self.parse_pattern(pattern, offset),
+                    typst_syntax::ast::LetBindingKind::Closure(ident) =>
+                        token!(ident, TokenKind::Word(WordMetadata::default())),
+                },
+                let_binding.init().and_then(|e| recurse!(e))
+            ),
+            Expr::DestructAssign(destruct_assignment) => {
+                recurse!(destruct_assignment.value())
+            }
+            // TODO: properly handle possible components
+            Expr::Set(set_rule) => recurse!(
+            set_rule.target()
+            //, set_rule.condition()?
         ),
-        Expr::FuncCall(func_call) => recurse!(func_call.callee()),
-        Expr::Closure(a) => token!(a, TokenKind::Unlintable),
-        Expr::Let(let_binding) => merge!(
-            match let_binding.kind() {
-                typst_syntax::ast::LetBindingKind::Normal(pattern) =>
-                    parse_pattern(pattern, doc, parser, offset),
-                typst_syntax::ast::LetBindingKind::Closure(ident) =>
-                    token!(ident, TokenKind::Word(WordMetadata::default())),
-            },
-            let_binding.init().and_then(|e| recurse!(e))
+            Expr::Show(show_rule) => recurse!(
+            show_rule.transform()
+            //, show_rule.selector()?
         ),
-        Expr::DestructAssign(destruct_assignment) => {
-            recurse!(destruct_assignment.value())
+            Expr::Contextual(contextual) => recurse!(contextual.body()),
+            Expr::Conditional(conditional) => recurse!(
+                conditional.condition(),
+                conditional.if_body() //, conditional.else_body()?
+            ),
+            Expr::While(while_loop) => recurse!(while_loop.condition(), while_loop.body()),
+            Expr::For(for_loop) => recurse!(for_loop.iterable(), for_loop.body()),
+            a => token!(a, TokenKind::Unlintable),
         }
-        Expr::Set(set_rule) => recurse!(set_rule.target(), set_rule.condition()?),
-        Expr::Show(show_rule) => recurse!(show_rule.transform(), show_rule.selector()?),
-        Expr::Contextual(contextual) => recurse!(contextual.body()),
-        Expr::Conditional(conditional) => recurse!(
-            conditional.condition(),
-            conditional.if_body(),
-            conditional.else_body()?
-        ),
-        Expr::While(while_loop) => recurse!(while_loop.condition(), while_loop.body()),
-        Expr::For(for_loop) => recurse!(for_loop.iterable(), for_loop.body()),
-        a => token!(a, TokenKind::Unlintable),
     }
 }
 
@@ -338,26 +360,16 @@ thread_local! {
 }
 
 impl Parser for Typst {
-    fn parse(&mut self, source: &[char]) -> Vec<Token> {
-        let mut english_parser = PlainEnglish;
-
+    fn parse(&self, source: &[char]) -> Vec<Token> {
         let source_str: String = source.iter().collect();
         let typst_document = typst_syntax::Source::detached(source_str);
         let typst_tree = Markup::from_untyped(typst_document.root())
             .expect("Unable to create typst document from parsed tree!");
+        let parse_helper = ParseHelper::new(&typst_document);
 
-        // NOTE: the range spits out __byte__ indices, not char indices.
-        // This is why we keep track above.
         let mut tokens = typst_tree
             .exprs()
-            .filter_map(|ex| {
-                parse_expr(
-                    ex,
-                    &typst_document,
-                    &mut english_parser,
-                    OffsetCursor::new(&typst_document),
-                )
-            })
+            .filter_map(|ex| parse_helper.parse_expr(ex, OffsetCursor::new(&typst_document)))
             .flatten()
             .collect_vec();
 
diff --git a/harper-html/src/lib.rs b/harper-html/src/lib.rs
index b4aefcf9..f8c7bff8 100644
--- a/harper-html/src/lib.rs
+++ b/harper-html/src/lib.rs
@@ -25,7 +25,7 @@ impl Default for HtmlParser {
 }
 
 impl Parser for HtmlParser {
-    fn parse(&mut self, source: &[char]) -> Vec<Token> {
+    fn parse(&self, source: &[char]) -> Vec<Token> {
         self.inner.parse(source)
     }
 }
diff --git a/harper-ls/src/git_commit_parser.rs b/harper-ls/src/git_commit_parser.rs
index 2b2f7d06..0b86a8eb 100644
--- a/harper-ls/src/git_commit_parser.rs
+++ b/harper-ls/src/git_commit_parser.rs
@@ -6,15 +6,13 @@ pub struct GitCommitParser;
 impl Parser for GitCommitParser {
     /// Admittedly a somewhat naive implementation.
     /// We're going to get _something_ to work, before we polish it off.
-    fn parse(&mut self, source: &[char]) -> Vec<harper_core::Token> {
+    fn parse(&self, source: &[char]) -> Vec<harper_core::Token> {
         // Locate the first `#`
         let end = source
             .iter()
             .position(|c| *c == '#')
             .unwrap_or(source.len());
 
-        let mut md_parser = Markdown;
-
-        md_parser.parse(&source[0..end])
+        Markdown.parse(&source[0..end])
     }
 }
diff --git a/harper-tree-sitter/src/lib.rs b/harper-tree-sitter/src/lib.rs
index abb09aa8..1eb53e3d 100644
--- a/harper-tree-sitter/src/lib.rs
+++ b/harper-tree-sitter/src/lib.rs
@@ -91,7 +91,7 @@ impl TreeSitterMasker {
 }
 
 impl Masker for TreeSitterMasker {
-    fn create_mask(&mut self, source: &[char]) -> Mask {
+    fn create_mask(&self, source: &[char]) -> Mask {
         let text: String = source.iter().collect();
 
         let Some(root) = self.parse_root(&text) else {

From 90d50743edf60500bfeec8c8fcc5826b2cf3a50e Mon Sep 17 00:00:00 2001
From: Grant Lemons <grantlemons@aol.com>
Date: Sat, 28 Dec 2024 20:31:24 -0600
Subject: [PATCH 26/51] refactor(#230): simplify dict and pattern parsing and
 correctly handle optional components

---
 harper-core/src/parsers/typst.rs | 120 +++++++++++--------------------
 1 file changed, 43 insertions(+), 77 deletions(-)

diff --git a/harper-core/src/parsers/typst.rs b/harper-core/src/parsers/typst.rs
index 789f0dfd..808c4807 100644
--- a/harper-core/src/parsers/typst.rs
+++ b/harper-core/src/parsers/typst.rs
@@ -1,6 +1,5 @@
 use itertools::Itertools;
-use std::collections::VecDeque;
-use typst_syntax::ast::{AstNode, Expr, Markup};
+use typst_syntax::ast::{AstNode, DictItem, Expr, Markup, Pattern};
 
 use super::{Parser, PlainEnglish};
 use crate::{
@@ -109,62 +108,25 @@ impl<'a> ParseHelper<'a> {
         )
     }
 
-    fn parse_dict(
-        self,
-        dict: &mut dyn Iterator<Item = typst_syntax::ast::DictItem>,
-        offset: OffsetCursor,
-    ) -> Option<Vec<Token>> {
-        Some(
-            dict.filter_map(|di| match di {
-                typst_syntax::ast::DictItem::Named(named) => merge!(
-                    def_token!(
-                        self.doc,
-                        named.name(),
-                        TokenKind::Word(WordMetadata::default()),
-                        offset
-                    ),
-                    self.parse_expr(named.expr(), offset)
-                ),
-                typst_syntax::ast::DictItem::Keyed(keyed) => merge!(
-                    self.parse_expr(keyed.key(), offset),
-                    self.parse_expr(keyed.expr(), offset)
-                ),
-                typst_syntax::ast::DictItem::Spread(spread) => spread.sink_ident().map_or_else(
-                    || {
-                        spread
-                            .sink_expr()
-                            .and_then(|expr| self.parse_expr(expr, offset))
-                    },
-                    |ident| {
-                        def_token!(
-                            self.doc,
-                            ident,
-                            TokenKind::Word(WordMetadata::default()),
-                            offset
-                        )
-                    },
-                ),
-            })
-            .flatten()
-            .collect(),
-        )
-    }
-
     fn parse_pattern(
         self,
         pat: typst_syntax::ast::Pattern,
         offset: OffsetCursor,
     ) -> Option<Vec<Token>> {
+        macro_rules! token {
+            ($a:expr, $kind:expr) => {
+                def_token!(self.doc, $a, $kind, offset)
+            };
+        }
+
         match pat {
-            typst_syntax::ast::Pattern::Normal(expr) => self.parse_expr(expr, offset),
-            typst_syntax::ast::Pattern::Placeholder(underscore) => {
-                def_token!(self.doc, underscore, TokenKind::Unlintable, offset)
-            }
-            typst_syntax::ast::Pattern::Parenthesized(parenthesized) => merge!(
+            Pattern::Normal(expr) => self.parse_expr(expr, offset),
+            Pattern::Placeholder(underscore) => token!(underscore, TokenKind::Unlintable),
+            Pattern::Parenthesized(parenthesized) => merge!(
                 self.parse_expr(parenthesized.expr(), offset),
                 self.parse_pattern(parenthesized.pattern(), offset)
             ),
-            typst_syntax::ast::Pattern::Destructuring(destructuring) => Some(
+            Pattern::Destructuring(destructuring) => Some(
                 destructuring
                     .items()
                     .filter_map(|item| match item {
@@ -172,12 +134,7 @@ impl<'a> ParseHelper<'a> {
                             self.parse_pattern(pattern, offset)
                         }
                         typst_syntax::ast::DestructuringItem::Named(named) => merge!(
-                            def_token!(
-                                self.doc,
-                                named.name(),
-                                TokenKind::Word(WordMetadata::default()),
-                                offset
-                            ),
+                            token!(named.name(), TokenKind::Word(WordMetadata::default())),
                             self.parse_pattern(named.pattern(), offset)
                         ),
                         typst_syntax::ast::DestructuringItem::Spread(spread) => {
@@ -187,14 +144,7 @@ impl<'a> ParseHelper<'a> {
                                         .sink_expr()
                                         .and_then(|expr| self.parse_expr(expr, offset))
                                 },
-                                |ident| {
-                                    def_token!(
-                                        self.doc,
-                                        ident,
-                                        TokenKind::Word(WordMetadata::default()),
-                                        offset
-                                    )
-                                },
+                                |ident| token!(ident, TokenKind::Word(WordMetadata::default())),
                             )
                         }
                     })
@@ -230,6 +180,23 @@ impl<'a> ParseHelper<'a> {
         let iter_recurse = |exprs: &mut dyn Iterator<Item = typst_syntax::ast::Expr>| {
             Some(exprs.filter_map(|e| recurse!(e)).flatten().collect_vec())
         };
+        let parse_dict = |dict: &mut dyn Iterator<Item = typst_syntax::ast::DictItem>| {
+            Some(
+                dict.filter_map(|di| match di {
+                    DictItem::Named(named) => merge!(
+                        token!(named.name(), TokenKind::Word(WordMetadata::default())),
+                        recurse!(named.expr())
+                    ),
+                    DictItem::Keyed(keyed) => recurse!(keyed.key(), keyed.expr()),
+                    DictItem::Spread(spread) => spread.sink_ident().map_or_else(
+                        || spread.sink_expr().and_then(|expr| recurse!(expr)),
+                        |ident| token!(ident, TokenKind::Word(WordMetadata::default())),
+                    ),
+                })
+                .flatten()
+                .collect_vec(),
+            )
+        };
 
         match ex {
             Expr::Text(text) => self.parse_english(text.get(), offset.push_to_span(text.span())),
@@ -307,7 +274,7 @@ impl<'a> ParseHelper<'a> {
                     .flatten()
                     .collect_vec(),
             ),
-            Expr::Dict(a) => self.parse_dict(&mut a.items(), offset),
+            Expr::Dict(a) => parse_dict(&mut a.items()),
             Expr::Unary(a) => token!(a, TokenKind::Unlintable),
             Expr::Binary(a) => token!(a, TokenKind::Unlintable),
             Expr::FieldAccess(field_access) => merge!(
@@ -331,19 +298,18 @@ impl<'a> ParseHelper<'a> {
             Expr::DestructAssign(destruct_assignment) => {
                 recurse!(destruct_assignment.value())
             }
-            // TODO: properly handle possible components
-            Expr::Set(set_rule) => recurse!(
-            set_rule.target()
-            //, set_rule.condition()?
-        ),
-            Expr::Show(show_rule) => recurse!(
-            show_rule.transform()
-            //, show_rule.selector()?
-        ),
+            Expr::Set(set_rule) => merge!(
+                recurse!(set_rule.target()),
+                set_rule.condition().and_then(|expr| recurse!(expr))
+            ),
+            Expr::Show(show_rule) => merge!(
+                recurse!(show_rule.transform()),
+                show_rule.selector().and_then(|expr| recurse!(expr))
+            ),
             Expr::Contextual(contextual) => recurse!(contextual.body()),
-            Expr::Conditional(conditional) => recurse!(
-                conditional.condition(),
-                conditional.if_body() //, conditional.else_body()?
+            Expr::Conditional(conditional) => merge!(
+                recurse!(conditional.condition(), conditional.if_body()),
+                conditional.else_body().and_then(|expr| recurse!(expr))
             ),
             Expr::While(while_loop) => recurse!(while_loop.condition(), while_loop.body()),
             Expr::For(for_loop) => recurse!(for_loop.iterable(), for_loop.body()),
@@ -374,7 +340,7 @@ impl Parser for Typst {
             .collect_vec();
 
         // Consolidate conjunctions
-        let mut to_remove = VecDeque::default();
+        let mut to_remove = std::collections::VecDeque::default();
         for tok_span in WORD_APOSTROPHE_WORD
             .with(|v| v.clone())
             .find_all_matches(&tokens, source)

From 3f9ecb516fcd97a01c4b53feff6aaf3373948f15 Mon Sep 17 00:00:00 2001
From: Grant Lemons <grantlemons@aol.com>
Date: Sun, 29 Dec 2024 15:22:12 -0600
Subject: [PATCH 27/51] feat(spans-visual): mark unlintable spans as red

---
 harper-cli/src/main.rs | 9 +++++++--
 1 file changed, 7 insertions(+), 2 deletions(-)

diff --git a/harper-cli/src/main.rs b/harper-cli/src/main.rs
index a66d4a89..3209ec4b 100644
--- a/harper-cli/src/main.rs
+++ b/harper-cli/src/main.rs
@@ -8,7 +8,7 @@ use clap::Parser;
 use harper_comments::CommentParser;
 use harper_core::linting::{LintGroup, LintGroupConfig, Linter};
 use harper_core::parsers::{Markdown, Typst};
-use harper_core::{remove_overlaps, Dictionary, Document, FstDictionary};
+use harper_core::{remove_overlaps, Dictionary, Document, FstDictionary, TokenKind};
 
 #[derive(Debug, Parser)]
 enum Args {
@@ -94,6 +94,7 @@ fn main() -> anyhow::Result<()> {
 
             let primary_color = Color::Blue;
             let secondary_color = Color::Magenta;
+            let unlintable_color = Color::Red;
             let filename = file
                 .file_name()
                 .map(|s| s.to_string_lossy().into())
@@ -106,7 +107,11 @@ fn main() -> anyhow::Result<()> {
                 report_builder = report_builder.with_label(
                     Label::new((&filename, token.span.into()))
                         .with_message(format!("[{}, {})", token.span.start, token.span.end))
-                        .with_color(color),
+                        .with_color(if matches!(token.kind, TokenKind::Unlintable) {
+                            unlintable_color
+                        } else {
+                            color
+                        }),
                 );
 
                 // Alternate colors so spans are clear

From 4ec7f7124c1bf74ae2e613bc27f5f39ae34430b1 Mon Sep 17 00:00:00 2001
From: Grant Lemons <grantlemons@aol.com>
Date: Sun, 29 Dec 2024 15:24:37 -0600
Subject: [PATCH 28/51] tests(#230): add complex typst document test

---
 harper-core/tests/run_tests.rs                | 15 +++--
 .../tests/test_sources/complex_typst.typ      | 61 +++++++++++++++++++
 2 files changed, 72 insertions(+), 4 deletions(-)
 create mode 100644 harper-core/tests/test_sources/complex_typst.typ

diff --git a/harper-core/tests/run_tests.rs b/harper-core/tests/run_tests.rs
index 2832132f..2b603459 100644
--- a/harper-core/tests/run_tests.rs
+++ b/harper-core/tests/run_tests.rs
@@ -1,17 +1,17 @@
 use harper_core::linting::{LintGroup, LintGroupConfig, Linter};
 use harper_core::{Document, FstDictionary};
 
-/// Creates a unit test checking that the linting of a Markdown document (in
-/// `tests_sources`) produces the expected number of lints.
+/// Creates a unit test checking that the linting of a document in
+/// `tests_sources` produces the expected number of lints.
 macro_rules! create_test {
-    ($filename:ident.md, $correct_expected:expr) => {
+    ($filename:ident, $ext:literal, $correct_expected:expr) => {
         paste::paste! {
             #[test]
             fn [<lints_ $filename _correctly>](){
                  let source = include_str!(
                     concat!(
                         "./test_sources/",
-                        concat!(stringify!($filename), ".md")
+                        concat!(stringify!($filename), $ext)
                     )
                  );
 
@@ -34,6 +34,12 @@ macro_rules! create_test {
             }
         }
     };
+    ($filename:ident.md, $correct_expected:expr) => {
+        create_test!($filename, ".md", $correct_expected);
+    };
+    ($filename:ident.typ, $correct_expected:expr) => {
+        create_test!($filename, ".typ", $correct_expected);
+    };
 }
 
 create_test!(whack_bullets.md, 1);
@@ -43,3 +49,4 @@ create_test!(issue_109_ext.md, 0);
 create_test!(chinese_lorem_ipsum.md, 2);
 create_test!(obsidian_links.md, 2);
 create_test!(issue_267.md, 0);
+create_test!(complex_typst.typ, 0);
diff --git a/harper-core/tests/test_sources/complex_typst.typ b/harper-core/tests/test_sources/complex_typst.typ
new file mode 100644
index 00000000..81176d96
--- /dev/null
+++ b/harper-core/tests/test_sources/complex_typst.typ
@@ -0,0 +1,61 @@
+#set page(
+  paper: "us-letter",
+  columns: 2,
+)
+
+#let titleblock(
+  title: "Default Title",
+  authors: ("Author 1", "Author 2"),
+  abstract: [*This is content*],
+) = {
+  set page(
+    header: context {
+      if counter(page).get().first() > 1 [
+        #counter(page).get().first() of #counter(page).final().at(0)
+        #h(1fr)
+        #title
+      ]
+    },
+  )
+  place(
+    top + center,
+    float: true,
+    scope: "parent",
+    clearance: 2em,
+  )[
+    #align(center, text(17pt)[
+      *#title*
+    ])
+
+    #let authors = authors.filter(x => x.len() > 0)
+    #let count = authors.len()
+    #let authors_slice = authors.slice(0, calc.min(count, 3))
+    _#if count > 3 {
+        authors_slice.push("et al.")
+        authors_slice.join(", ")
+      } else {
+        authors_slice.join(", ", last: ", and ")
+      }
+    _
+
+    #par(justify: false)[
+      *Abstract* \
+      #abstract
+    ]
+  ]
+}
+
+#show: doc => [
+  #titleblock(
+    title: "A fluid dynamic model for glacier flow",
+    authors: ("Grant Lemons", "John Doe", "Jane Doe"),
+    abstract: lorem(80)
+  )
+  #doc
+]
+
+= Introduction
+#lorem(300)
+
+= Related Work
+#lorem(200)

From 81eb91bd420868b6c9766b1a40204a4f9cd78e72 Mon Sep 17 00:00:00 2001
From: Grant Lemons <grantlemons@aol.com>
Date: Sun, 29 Dec 2024 15:50:12 -0600
Subject: [PATCH 29/51] feat(#230): parsing of arguments and parameters

---
 harper-core/src/parsers/typst.rs | 173 ++++++++++++++++++-------------
 1 file changed, 103 insertions(+), 70 deletions(-)

diff --git a/harper-core/src/parsers/typst.rs b/harper-core/src/parsers/typst.rs
index 808c4807..0a8efce4 100644
--- a/harper-core/src/parsers/typst.rs
+++ b/harper-core/src/parsers/typst.rs
@@ -1,11 +1,17 @@
 use itertools::Itertools;
-use typst_syntax::ast::{AstNode, DictItem, Expr, Markup, Pattern};
+use typst_syntax::{
+    ast::{
+        Arg, ArrayItem, AstNode, DestructuringItem, DictItem, Expr, Ident, LetBindingKind, Markup,
+        Param, Pattern, Spread,
+    },
+    Source,
+};
 
 use super::{Parser, PlainEnglish};
 use crate::{
     parsers::StrParser,
     patterns::{PatternExt, SequencePattern},
-    ConjunctionData, Lrc, NounData, Punctuation, Span, Token, TokenKind, VecExt, WordMetadata,
+    ConjunctionData, Lrc, NounData, Punctuation, Token, TokenKind, VecExt, WordMetadata,
 };
 
 /// A parser that wraps the [`PlainEnglish`] parser allowing one to parse Typst files.
@@ -14,13 +20,13 @@ pub struct Typst;
 /// Encapsulation of the translation between byte-based spans and char-based spans
 #[derive(Debug, Clone, Copy)]
 struct OffsetCursor<'a> {
-    doc: &'a typst_syntax::Source,
+    doc: &'a Source,
     pub char: usize,
     pub byte: usize,
 }
 
 impl<'a> OffsetCursor<'a> {
-    pub fn new(doc: &'a typst_syntax::Source) -> Self {
+    pub fn new(doc: &'a Source) -> Self {
         Self {
             doc,
             char: 0,
@@ -59,7 +65,7 @@ macro_rules! def_token {
         let end_char_loc = start.push_to(range.end).char;
 
         Some(vec![Token {
-            span: Span {
+            span: crate::Span {
                 start: start.char,
                 end: end_char_loc,
             },
@@ -84,11 +90,11 @@ macro_rules! merge {
 #[derive(Clone, Copy)]
 struct ParseHelper<'a> {
     parser: PlainEnglish,
-    doc: &'a typst_syntax::Source,
+    doc: &'a Source,
 }
 
 impl<'a> ParseHelper<'a> {
-    pub fn new(doc: &'a typst_syntax::Source) -> Self {
+    pub fn new(doc: &'a Source) -> Self {
         Self {
             parser: PlainEnglish,
             doc,
@@ -108,11 +114,7 @@ impl<'a> ParseHelper<'a> {
         )
     }
 
-    fn parse_pattern(
-        self,
-        pat: typst_syntax::ast::Pattern,
-        offset: OffsetCursor,
-    ) -> Option<Vec<Token>> {
+    fn parse_pattern(self, pat: Pattern, offset: OffsetCursor) -> Option<Vec<Token>> {
         macro_rules! token {
             ($a:expr, $kind:expr) => {
                 def_token!(self.doc, $a, $kind, offset)
@@ -130,23 +132,19 @@ impl<'a> ParseHelper<'a> {
                 destructuring
                     .items()
                     .filter_map(|item| match item {
-                        typst_syntax::ast::DestructuringItem::Pattern(pattern) => {
-                            self.parse_pattern(pattern, offset)
-                        }
-                        typst_syntax::ast::DestructuringItem::Named(named) => merge!(
+                        DestructuringItem::Pattern(pattern) => self.parse_pattern(pattern, offset),
+                        DestructuringItem::Named(named) => merge!(
                             token!(named.name(), TokenKind::Word(WordMetadata::default())),
                             self.parse_pattern(named.pattern(), offset)
                         ),
-                        typst_syntax::ast::DestructuringItem::Spread(spread) => {
-                            spread.sink_ident().map_or_else(
-                                || {
-                                    spread
-                                        .sink_expr()
-                                        .and_then(|expr| self.parse_expr(expr, offset))
-                                },
-                                |ident| token!(ident, TokenKind::Word(WordMetadata::default())),
-                            )
-                        }
+                        DestructuringItem::Spread(spread) => merge!(
+                            spread
+                                .sink_ident()
+                                .and_then(|ident| self.parse_ident(ident, offset)),
+                            spread
+                                .sink_expr()
+                                .and_then(|expr| self.parse_expr(expr, offset))
+                        ),
                     })
                     .flatten()
                     .collect(),
@@ -154,12 +152,22 @@ impl<'a> ParseHelper<'a> {
         }
     }
 
-    pub fn parse_expr(
-        self,
-        ex: typst_syntax::ast::Expr,
-        old_offset: OffsetCursor,
-    ) -> Option<Vec<Token>> {
-        let offset = old_offset.push_to_span(ex.span());
+    fn parse_ident(self, ident: Ident, offset: OffsetCursor) -> Option<Vec<Token>> {
+        self.parse_expr(Expr::Ident(ident), offset)
+    }
+
+    /// Do not use for spreads contained in DestructuringItem
+    fn parse_spread(self, spread: Spread, offset: OffsetCursor) -> Option<Vec<Token>> {
+        merge!(
+            self.parse_expr(spread.expr(), offset),
+            spread
+                .sink_ident()
+                .and_then(|ident| self.parse_ident(ident, offset))
+        )
+    }
+
+    pub fn parse_expr(self, ex: Expr, offset: OffsetCursor) -> Option<Vec<Token>> {
+        let offset = offset.push_to_span(ex.span());
 
         macro_rules! token {
             ($a:expr, $kind:expr) => {
@@ -177,34 +185,61 @@ impl<'a> ParseHelper<'a> {
         };
     }
 
-        let iter_recurse = |exprs: &mut dyn Iterator<Item = typst_syntax::ast::Expr>| {
+        let iter_recurse = |exprs: &mut dyn Iterator<Item = Expr>| {
             Some(exprs.filter_map(|e| recurse!(e)).flatten().collect_vec())
         };
-        let parse_dict = |dict: &mut dyn Iterator<Item = typst_syntax::ast::DictItem>| {
+        let parse_dict = |dict: &mut dyn Iterator<Item = DictItem>| {
             Some(
                 dict.filter_map(|di| match di {
-                    DictItem::Named(named) => merge!(
-                        token!(named.name(), TokenKind::Word(WordMetadata::default())),
-                        recurse!(named.expr())
-                    ),
+                    DictItem::Named(named) => {
+                        merge!(
+                            self.parse_ident(named.name(), offset),
+                            recurse!(named.expr())
+                        )
+                    }
                     DictItem::Keyed(keyed) => recurse!(keyed.key(), keyed.expr()),
-                    DictItem::Spread(spread) => spread.sink_ident().map_or_else(
-                        || spread.sink_expr().and_then(|expr| recurse!(expr)),
-                        |ident| token!(ident, TokenKind::Word(WordMetadata::default())),
-                    ),
+                    DictItem::Spread(spread) => self.parse_spread(spread, offset),
                 })
                 .flatten()
                 .collect_vec(),
             )
         };
+        let parse_params = |params: &mut dyn Iterator<Item = Param>| {
+            Some(
+                params
+                    .filter_map(|p| match p {
+                        Param::Pos(pattern) => self.parse_pattern(pattern, offset),
+                        Param::Named(named) => merge!(
+                            self.parse_ident(named.name(), offset),
+                            recurse!(named.expr())
+                        ),
+                        Param::Spread(spread) => self.parse_spread(spread, offset),
+                    })
+                    .flatten()
+                    .collect_vec(),
+            )
+        };
+        let parse_args = |params: &mut dyn Iterator<Item = Arg>| {
+            Some(
+                params
+                    .filter_map(|a| match a {
+                        Arg::Pos(expr) => recurse!(expr),
+                        Arg::Named(named) => merge!(
+                            self.parse_ident(named.name(), offset),
+                            recurse!(named.expr())
+                        ),
+                        Arg::Spread(spread) => self.parse_spread(spread, offset),
+                    })
+                    .flatten()
+                    .collect_vec(),
+            )
+        };
 
         match ex {
             Expr::Text(text) => self.parse_english(text.get(), offset.push_to_span(text.span())),
             Expr::Space(a) => token!(a, TokenKind::Space(1)),
             Expr::Linebreak(a) => token!(a, TokenKind::Newline(1)),
             Expr::Parbreak(a) => token!(a, TokenKind::ParagraphBreak),
-            Expr::Escape(a) => token!(a, TokenKind::Unlintable),
-            Expr::Shorthand(a) => token!(a, TokenKind::Unlintable),
             Expr::SmartQuote(quote) => {
                 if quote.double() {
                     token!(
@@ -217,9 +252,7 @@ impl<'a> ParseHelper<'a> {
             }
             Expr::Strong(strong) => iter_recurse(&mut strong.body().exprs()),
             Expr::Emph(emph) => iter_recurse(&mut emph.body().exprs()),
-            Expr::Raw(a) => token!(a, TokenKind::Unlintable),
             Expr::Link(a) => token!(a, TokenKind::Url),
-            Expr::Label(a) => token!(a, TokenKind::Unlintable),
             Expr::Ref(a) => {
                 token!(a, TokenKind::Word(WordMetadata::default()))
             }
@@ -232,21 +265,16 @@ impl<'a> ParseHelper<'a> {
                     .exprs()
                     .chain(term_item.description().exprs()),
             ),
-            Expr::Equation(a) => token!(a, TokenKind::Unlintable),
-            Expr::Ident(a) => token!(a, TokenKind::Word(WordMetadata::default())),
-            Expr::None(a) => token!(a, TokenKind::Word(WordMetadata::default())),
-            Expr::Auto(a) => token!(a, TokenKind::Word(WordMetadata::default())),
-            Expr::Bool(a) => token!(a, TokenKind::Word(WordMetadata::default())),
+            // Expr::Ident(a) => token!(a, TokenKind::Word(WordMetadata::default())),
             Expr::Int(int) => {
                 token!(int, TokenKind::Number((int.get() as f64).into(), None))
             }
             Expr::Float(float) => {
                 token!(float, TokenKind::Number(float.get().into(), None))
             }
-            Expr::Numeric(a) => token!(a, TokenKind::Unlintable),
             Expr::Str(text) => {
-                let offset = self.doc.range(text.span()).unwrap().start + 1;
-                let text = text.to_untyped().text();
+                let offset = offset.push_to_span(text.span()).char + 1;
+                let text = text.to_untyped().text().to_string();
                 Some(
                     self.parser
                         .parse_str(&text[1..text.len() - 1])
@@ -258,14 +286,13 @@ impl<'a> ParseHelper<'a> {
                         .collect_vec(),
                 )
             }
-            Expr::Code(a) => token!(a, TokenKind::Unlintable),
             Expr::Content(content_block) => iter_recurse(&mut content_block.body().exprs()),
             Expr::Parenthesized(parenthesized) => recurse!(parenthesized.expr()),
             Expr::Array(array) => Some(
                 array
                     .items()
                     .filter_map(|i| {
-                        if let typst_syntax::ast::ArrayItem::Pos(e) = i {
+                        if let ArrayItem::Pos(e) = i {
                             recurse!(e)
                         } else {
                             None
@@ -275,8 +302,6 @@ impl<'a> ParseHelper<'a> {
                     .collect_vec(),
             ),
             Expr::Dict(a) => parse_dict(&mut a.items()),
-            Expr::Unary(a) => token!(a, TokenKind::Unlintable),
-            Expr::Binary(a) => token!(a, TokenKind::Unlintable),
             Expr::FieldAccess(field_access) => merge!(
                 recurse!(field_access.target()),
                 token!(
@@ -284,14 +309,10 @@ impl<'a> ParseHelper<'a> {
                     TokenKind::Word(WordMetadata::default())
                 )
             ),
-            Expr::FuncCall(func_call) => recurse!(func_call.callee()),
-            Expr::Closure(a) => token!(a, TokenKind::Unlintable),
             Expr::Let(let_binding) => merge!(
                 match let_binding.kind() {
-                    typst_syntax::ast::LetBindingKind::Normal(pattern) =>
-                        self.parse_pattern(pattern, offset),
-                    typst_syntax::ast::LetBindingKind::Closure(ident) =>
-                        token!(ident, TokenKind::Word(WordMetadata::default())),
+                    LetBindingKind::Normal(pattern) => self.parse_pattern(pattern, offset),
+                    LetBindingKind::Closure(ident) => self.parse_ident(ident, offset),
                 },
                 let_binding.init().and_then(|e| recurse!(e))
             ),
@@ -313,6 +334,18 @@ impl<'a> ParseHelper<'a> {
             ),
             Expr::While(while_loop) => recurse!(while_loop.condition(), while_loop.body()),
             Expr::For(for_loop) => recurse!(for_loop.iterable(), for_loop.body()),
+            Expr::Code(code) => iter_recurse(&mut code.body().exprs()),
+            Expr::Closure(closure) => merge!(
+                closure
+                    .name()
+                    .and_then(|ident| self.parse_ident(ident, offset)),
+                parse_params(&mut closure.params().children()),
+                recurse!(closure.body())
+            ),
+            Expr::FuncCall(func) => merge!(
+                token!(func.callee(), TokenKind::Unlintable),
+                parse_args(&mut func.args().items())
+            ),
             a => token!(a, TokenKind::Unlintable),
         }
     }
@@ -328,7 +361,7 @@ thread_local! {
 impl Parser for Typst {
     fn parse(&self, source: &[char]) -> Vec<Token> {
         let source_str: String = source.iter().collect();
-        let typst_document = typst_syntax::Source::detached(source_str);
+        let typst_document = Source::detached(source_str);
         let typst_tree = Markup::from_untyped(typst_document.root())
             .expect("Unable to create typst document from parsed tree!");
         let parse_helper = ParseHelper::new(&typst_document);
@@ -347,7 +380,7 @@ impl Parser for Typst {
         {
             let start_tok = &tokens[tok_span.start];
             let end_tok = &tokens[tok_span.end - 1];
-            let char_span = Span::new(start_tok.span.start, end_tok.span.end);
+            let char_span = crate::Span::new(start_tok.span.start, end_tok.span.end);
 
             if let TokenKind::Word(metadata) = start_tok.kind {
                 tokens[tok_span.start].kind =
@@ -498,10 +531,10 @@ mod tests {
         assert!(matches!(
             token_kinds.as_slice(),
             &[
-                TokenKind::Word(_),                            // Identifier
-                TokenKind::Word(_),                            // Key 1
+                TokenKind::Unlintable,                         // Ident
+                TokenKind::Unlintable,                         // Key 1
                 TokenKind::Word(_),                            // Value 1
-                TokenKind::Word(_),                            // Key 2
+                TokenKind::Unlintable,                         // Key 2
                 TokenKind::Number(OrderedFloat(2019.0), None), // Value 2
             ]
         ))
@@ -517,7 +550,7 @@ mod tests {
         assert!(matches!(
             &token_kinds.as_slice(),
             &[
-                TokenKind::Word(_), // Identifier
+                TokenKind::Unlintable,
                 TokenKind::Word(_), // This
                 TokenKind::Space(1),
                 TokenKind::Word(_), // Is

From 4457bffe38648e9eeae9033182d17c2c75f00921 Mon Sep 17 00:00:00 2001
From: Grant Lemons <grantlemons@aol.com>
Date: Sun, 29 Dec 2024 15:54:29 -0600
Subject: [PATCH 30/51] tests(#230): comment out et al. in typst test

---
 harper-core/tests/test_sources/complex_typst.typ | 5 ++++-
 1 file changed, 4 insertions(+), 1 deletion(-)

diff --git a/harper-core/tests/test_sources/complex_typst.typ b/harper-core/tests/test_sources/complex_typst.typ
index 81176d96..480595be 100644
--- a/harper-core/tests/test_sources/complex_typst.typ
+++ b/harper-core/tests/test_sources/complex_typst.typ
@@ -31,7 +31,10 @@
     #let count = authors.len()
     #let authors_slice = authors.slice(0, calc.min(count, 3))
     _#if count > 3 {
-        authors_slice.push("et al.")
+        // Disabled because et al. isn't parsed properly, but this isn't the
+        // fault of the typst parser
+        //
+        // authors_slice.push("et al.")
         authors_slice.join(", ")
       } else {
         authors_slice.join(", ", last: ", and ")

From 1d0b9728875bb623272615a51f7a73fb011968d0 Mon Sep 17 00:00:00 2001
From: Grant Lemons <grantlemons@aol.com>
Date: Sun, 29 Dec 2024 16:29:26 -0600
Subject: [PATCH 31/51] fix: only condense adjacent spaces

---
 harper-core/src/document.rs      | 16 +++++++++++-----
 harper-core/src/parsers/typst.rs | 28 ++++++++++++++++++++++++++--
 2 files changed, 37 insertions(+), 7 deletions(-)

diff --git a/harper-core/src/document.rs b/harper-core/src/document.rs
index c6adce90..80e7f2b0 100644
--- a/harper-core/src/document.rs
+++ b/harper-core/src/document.rs
@@ -284,11 +284,17 @@ impl Document {
                     }
 
                     let child_tok = &copy[cursor];
-                    if let TokenKind::Space(n) = child_tok.kind {
-                        *start_count += n;
-                        start_tok.span.end = child_tok.span.end;
-                        remove_these.push_back(cursor);
-                        cursor += 1;
+
+                    // Only condense adjacent spans
+                    if start_tok.span.end == child_tok.span.start {
+                        if let TokenKind::Space(n) = child_tok.kind {
+                            *start_count += n;
+                            start_tok.span.end = child_tok.span.end;
+                            remove_these.push_back(cursor);
+                            cursor += 1;
+                        } else {
+                            break;
+                        }
                     } else {
                         break;
                     };
diff --git a/harper-core/src/parsers/typst.rs b/harper-core/src/parsers/typst.rs
index 0a8efce4..a58f89d8 100644
--- a/harper-core/src/parsers/typst.rs
+++ b/harper-core/src/parsers/typst.rs
@@ -274,10 +274,11 @@ impl<'a> ParseHelper<'a> {
             }
             Expr::Str(text) => {
                 let offset = offset.push_to_span(text.span()).char + 1;
-                let text = text.to_untyped().text().to_string();
+                let string = text.to_untyped().text().to_string();
+
                 Some(
                     self.parser
-                        .parse_str(&text[1..text.len() - 1])
+                        .parse_str(&string[1..string.len() - 1])
                         .into_iter()
                         .map(|mut t| {
                             t.span.push_by(offset);
@@ -562,6 +563,29 @@ mod tests {
         ))
     }
 
+    #[test]
+    fn non_adjacent_spaces_not_condensed() {
+        let source = r#"#authors_slice.join(", ", last: ", and ") "#;
+
+        let token_kinds = Typst.parse_str(source).iter().map(|t| t.kind).collect_vec();
+        dbg!(&token_kinds);
+
+        assert!(matches!(
+            &token_kinds.as_slice(),
+            &[
+                TokenKind::Unlintable, // authors_slice.join
+                TokenKind::Punctuation(Punctuation::Comma),
+                TokenKind::Space(1),
+                TokenKind::Unlintable, // Ident
+                TokenKind::Punctuation(Punctuation::Comma),
+                TokenKind::Space(1),
+                TokenKind::Word(_), // and
+                TokenKind::Space(1),
+                TokenKind::Space(1)
+            ]
+        ))
+    }
+
     #[test]
     fn header_parsing() {
         let source = r"= Header

From b61c78c4753cefa61d37c684eb34766a217cdc20 Mon Sep 17 00:00:00 2001
From: Grant Lemons <grantlemons@aol.com>
Date: Sun, 29 Dec 2024 17:23:19 -0600
Subject: [PATCH 32/51] fix: better handling of spaces and newlines

- Only consolidate adjacent space spans
- Typst spaces distinguish between newlines and spaces
- Typst spaces count number of spaces
- Spans command now defaults to not show newlines
---
 harper-cli/src/main.rs           | 14 ++++++++++--
 harper-core/src/document.rs      | 18 +++++++--------
 harper-core/src/parsers/typst.rs | 38 ++++++++++++++++++++++++--------
 3 files changed, 50 insertions(+), 20 deletions(-)

diff --git a/harper-cli/src/main.rs b/harper-cli/src/main.rs
index 3209ec4b..0478fdf4 100644
--- a/harper-cli/src/main.rs
+++ b/harper-cli/src/main.rs
@@ -30,6 +30,9 @@ enum Args {
     Spans {
         /// The file you wish to display the spans.
         file: PathBuf,
+        /// Include newlines in the output
+        #[arg(short, long)]
+        include_newlines: bool,
     },
     /// Emit decompressed, line-separated list of words in Harper's dictionary.
     Words,
@@ -89,7 +92,10 @@ fn main() -> anyhow::Result<()> {
 
             Ok(())
         }
-        Args::Spans { file } => {
+        Args::Spans {
+            file,
+            include_newlines,
+        } => {
             let (doc, source) = load_file(&file)?;
 
             let primary_color = Color::Blue;
@@ -103,7 +109,11 @@ fn main() -> anyhow::Result<()> {
             let mut report_builder =
                 Report::build(ReportKind::Custom("Spans", primary_color), &filename, 0);
             let mut color = primary_color;
-            for token in doc.tokens() {
+
+            for token in doc.tokens().filter(|t| {
+                include_newlines
+                    || !matches!(t.kind, TokenKind::Newline(_) | TokenKind::ParagraphBreak)
+            }) {
                 report_builder = report_builder.with_label(
                     Label::new((&filename, token.span.into()))
                         .with_message(format!("[{}, {})", token.span.start, token.span.end))
diff --git a/harper-core/src/document.rs b/harper-core/src/document.rs
index 80e7f2b0..612de9ed 100644
--- a/harper-core/src/document.rs
+++ b/harper-core/src/document.rs
@@ -286,15 +286,15 @@ impl Document {
                     let child_tok = &copy[cursor];
 
                     // Only condense adjacent spans
-                    if start_tok.span.end == child_tok.span.start {
-                        if let TokenKind::Space(n) = child_tok.kind {
-                            *start_count += n;
-                            start_tok.span.end = child_tok.span.end;
-                            remove_these.push_back(cursor);
-                            cursor += 1;
-                        } else {
-                            break;
-                        }
+                    if start_tok.span.end != child_tok.span.start {
+                        break;
+                    }
+
+                    if let TokenKind::Space(n) = child_tok.kind {
+                        *start_count += n;
+                        start_tok.span.end = child_tok.span.end;
+                        remove_these.push_back(cursor);
+                        cursor += 1;
                     } else {
                         break;
                     };
diff --git a/harper-core/src/parsers/typst.rs b/harper-core/src/parsers/typst.rs
index a58f89d8..9264dcf1 100644
--- a/harper-core/src/parsers/typst.rs
+++ b/harper-core/src/parsers/typst.rs
@@ -237,7 +237,21 @@ impl<'a> ParseHelper<'a> {
 
         match ex {
             Expr::Text(text) => self.parse_english(text.get(), offset.push_to_span(text.span())),
-            Expr::Space(a) => token!(a, TokenKind::Space(1)),
+            Expr::Space(a) => {
+                let mut chars = self
+                    .doc
+                    .get(self.doc.range(a.span()).unwrap())
+                    .unwrap()
+                    .chars();
+                let first_char = chars.next().unwrap();
+                let length = chars.count() + 1;
+
+                if first_char == '\n' {
+                    token!(a, TokenKind::Newline(1))
+                } else {
+                    token!(a, TokenKind::Space(length))
+                }
+            }
             Expr::Linebreak(a) => token!(a, TokenKind::Newline(1)),
             Expr::Parbreak(a) => token!(a, TokenKind::ParagraphBreak),
             Expr::SmartQuote(quote) => {
@@ -274,7 +288,7 @@ impl<'a> ParseHelper<'a> {
             }
             Expr::Str(text) => {
                 let offset = offset.push_to_span(text.span()).char + 1;
-                let string = text.to_untyped().text().to_string();
+                let string = text.to_untyped().text();
 
                 Some(
                     self.parser
@@ -322,7 +336,8 @@ impl<'a> ParseHelper<'a> {
             }
             Expr::Set(set_rule) => merge!(
                 recurse!(set_rule.target()),
-                set_rule.condition().and_then(|expr| recurse!(expr))
+                set_rule.condition().and_then(|expr| recurse!(expr)),
+                parse_args(&mut set_rule.args().items())
             ),
             Expr::Show(show_rule) => merge!(
                 recurse!(show_rule.transform()),
@@ -565,7 +580,7 @@ mod tests {
 
     #[test]
     fn non_adjacent_spaces_not_condensed() {
-        let source = r#"#authors_slice.join(", ", last: ", and ") "#;
+        let source = r#"#authors_slice.join(", ", last: ", and ")  bob"#;
 
         let token_kinds = Typst.parse_str(source).iter().map(|t| t.kind).collect_vec();
         dbg!(&token_kinds);
@@ -581,7 +596,8 @@ mod tests {
                 TokenKind::Space(1),
                 TokenKind::Word(_), // and
                 TokenKind::Space(1),
-                TokenKind::Space(1)
+                TokenKind::Space(2),
+                TokenKind::Word(_),
             ]
         ))
     }
@@ -601,7 +617,11 @@ mod tests {
 
         assert!(matches!(
             &token_kinds.as_slice(),
-            &[TokenKind::Word(_), TokenKind::Space(1), TokenKind::Word(_)]
+            &[
+                TokenKind::Word(_),
+                TokenKind::Newline(1),
+                TokenKind::Word(_)
+            ]
         ))
     }
 
@@ -638,9 +658,9 @@ mod tests {
             &token_kinds.as_slice(),
             &[
                 TokenKind::Word(_),
-                TokenKind::Space(1),
+                TokenKind::Newline(1),
                 TokenKind::Unlintable,
-                TokenKind::Space(1),
+                TokenKind::Newline(1),
                 TokenKind::Word(_),
             ]
         ))
@@ -700,7 +720,7 @@ writing"#;
                     }),
                     ..
                 }),
-                TokenKind::Space(1),
+                TokenKind::Newline(1),
                 TokenKind::Word(_),
             ]
         ));

From a29b879d9dbf555dcd5ea808528c3bd042faefe9 Mon Sep 17 00:00:00 2001
From: Grant Lemons <grantlemons@aol.com>
Date: Sun, 29 Dec 2024 17:44:47 -0600
Subject: [PATCH 33/51] fix: testing rig takes a parser instead of assuming
 markdown

- Remove unneeded &mut impl Parser in document
---
 harper-cli/src/main.rs         |  4 ++--
 harper-core/src/document.rs    | 16 ++++++++--------
 harper-core/tests/run_tests.rs | 13 ++++++++-----
 harper-ls/src/backend.rs       |  2 +-
 harper-wasm/src/lib.rs         |  4 ++--
 5 files changed, 21 insertions(+), 18 deletions(-)

diff --git a/harper-cli/src/main.rs b/harper-cli/src/main.rs
index 0478fdf4..8a99951d 100644
--- a/harper-cli/src/main.rs
+++ b/harper-cli/src/main.rs
@@ -157,7 +157,7 @@ fn main() -> anyhow::Result<()> {
 fn load_file(file: &Path) -> anyhow::Result<(Document, String)> {
     let source = std::fs::read_to_string(file)?;
 
-    let mut parser: Box<dyn harper_core::parsers::Parser> =
+    let parser: Box<dyn harper_core::parsers::Parser> =
         match file.extension().map(|v| v.to_str().unwrap()) {
             Some("md") => Box::new(Markdown),
             Some("typ") => Box::new(Typst),
@@ -168,5 +168,5 @@ fn load_file(file: &Path) -> anyhow::Result<(Document, String)> {
             ),
         };
 
-    Ok((Document::new_curated(&source, &mut parser), source))
+    Ok((Document::new_curated(&source, &parser), source))
 }
diff --git a/harper-core/src/document.rs b/harper-core/src/document.rs
index 612de9ed..05392495 100644
--- a/harper-core/src/document.rs
+++ b/harper-core/src/document.rs
@@ -21,14 +21,14 @@ pub struct Document {
 
 impl Default for Document {
     fn default() -> Self {
-        Self::new("", &mut PlainEnglish, &FstDictionary::curated())
+        Self::new("", &PlainEnglish, &FstDictionary::curated())
     }
 }
 
 impl Document {
     /// Lexes and parses text to produce a document using a provided language
     /// parser and dictionary.
-    pub fn new(text: &str, parser: &mut impl Parser, dictionary: &impl Dictionary) -> Self {
+    pub fn new(text: &str, parser: &impl Parser, dictionary: &impl Dictionary) -> Self {
         let source: Vec<_> = text.chars().collect();
 
         Self::new_from_vec(Lrc::new(source), parser, dictionary)
@@ -36,7 +36,7 @@ impl Document {
 
     /// Lexes and parses text to produce a document using a provided language
     /// parser and the included curated dictionary.
-    pub fn new_curated(text: &str, parser: &mut impl Parser) -> Self {
+    pub fn new_curated(text: &str, parser: &impl Parser) -> Self {
         let source: Vec<_> = text.chars().collect();
 
         Self::new_from_vec(Lrc::new(source), parser, &FstDictionary::curated())
@@ -46,7 +46,7 @@ impl Document {
     /// parser and dictionary.
     pub fn new_from_vec(
         source: Lrc<Vec<char>>,
-        parser: &mut impl Parser,
+        parser: &impl Parser,
         dictionary: &impl Dictionary,
     ) -> Self {
         let tokens = parser.parse(&source);
@@ -60,25 +60,25 @@ impl Document {
     /// Parse text to produce a document using the built-in [`PlainEnglish`]
     /// parser and curated dictionary.
     pub fn new_plain_english_curated(text: &str) -> Self {
-        Self::new(text, &mut PlainEnglish, &FstDictionary::curated())
+        Self::new(text, &PlainEnglish, &FstDictionary::curated())
     }
 
     /// Parse text to produce a document using the built-in [`PlainEnglish`]
     /// parser and a provided dictionary.
     pub fn new_plain_english(text: &str, dictionary: &impl Dictionary) -> Self {
-        Self::new(text, &mut PlainEnglish, dictionary)
+        Self::new(text, &PlainEnglish, dictionary)
     }
 
     /// Parse text to produce a document using the built-in [`Markdown`] parser
     /// and curated dictionary.
     pub fn new_markdown_curated(text: &str) -> Self {
-        Self::new(text, &mut Markdown, &FstDictionary::curated())
+        Self::new(text, &Markdown, &FstDictionary::curated())
     }
 
     /// Parse text to produce a document using the built-in [`PlainEnglish`]
     /// parser and the curated dictionary.
     pub fn new_markdown(text: &str, dictionary: &impl Dictionary) -> Self {
-        Self::new(text, &mut Markdown, dictionary)
+        Self::new(text, &Markdown, dictionary)
     }
 
     /// Re-parse important language constructs.
diff --git a/harper-core/tests/run_tests.rs b/harper-core/tests/run_tests.rs
index 2b603459..eb4f21c5 100644
--- a/harper-core/tests/run_tests.rs
+++ b/harper-core/tests/run_tests.rs
@@ -1,10 +1,13 @@
 use harper_core::linting::{LintGroup, LintGroupConfig, Linter};
-use harper_core::{Document, FstDictionary};
+use harper_core::{
+    parsers::{Markdown, Typst},
+    Document, FstDictionary,
+};
 
 /// Creates a unit test checking that the linting of a document in
 /// `tests_sources` produces the expected number of lints.
 macro_rules! create_test {
-    ($filename:ident, $ext:literal, $correct_expected:expr) => {
+    ($filename:ident, $ext:literal, $parser:expr, $correct_expected:expr) => {
         paste::paste! {
             #[test]
             fn [<lints_ $filename _correctly>](){
@@ -16,7 +19,7 @@ macro_rules! create_test {
                  );
 
                  let dict = FstDictionary::curated();
-                 let document = Document::new_markdown(&source, &dict);
+                 let document = Document::new(&source, $parser, &dict);
 
                  let mut linter = LintGroup::new(
                      LintGroupConfig::default(),
@@ -35,10 +38,10 @@ macro_rules! create_test {
         }
     };
     ($filename:ident.md, $correct_expected:expr) => {
-        create_test!($filename, ".md", $correct_expected);
+        create_test!($filename, ".md", &Markdown, $correct_expected);
     };
     ($filename:ident.typ, $correct_expected:expr) => {
-        create_test!($filename, ".typ", $correct_expected);
+        create_test!($filename, ".typ", &Typst, $correct_expected);
     };
 }
 
diff --git a/harper-ls/src/backend.rs b/harper-ls/src/backend.rs
index 7357d4f2..422dec2c 100644
--- a/harper-ls/src/backend.rs
+++ b/harper-ls/src/backend.rs
@@ -229,7 +229,7 @@ impl Backend {
                     parser = Box::new(IsolateEnglish::new(parser, doc_state.dict.clone()));
                 }
 
-                doc_state.document = Document::new(text, &mut parser, &doc_state.dict);
+                doc_state.document = Document::new(text, &parser, &doc_state.dict);
             }
         }
 
diff --git a/harper-wasm/src/lib.rs b/harper-wasm/src/lib.rs
index cd243f4e..18d6ff96 100644
--- a/harper-wasm/src/lib.rs
+++ b/harper-wasm/src/lib.rs
@@ -72,7 +72,7 @@ impl Linter {
     pub fn isolate_english(&self, text: String) -> String {
         let document = Document::new(
             &text,
-            &mut IsolateEnglish::new(Box::new(PlainEnglish), self.dictionary.clone()),
+            &IsolateEnglish::new(Box::new(PlainEnglish), self.dictionary.clone()),
             &self.dictionary,
         );
 
@@ -107,7 +107,7 @@ impl Linter {
         let source = Lrc::new(source);
 
         let document =
-            Document::new_from_vec(source.clone(), &mut Markdown, &FullDictionary::curated());
+            Document::new_from_vec(source.clone(), &Markdown, &FullDictionary::curated());
 
         let mut lints = self.lint_group.lint(&document);
 

From 00623b052ace1995a9bd95add4f3ab9994427f4c Mon Sep 17 00:00:00 2001
From: Grant Lemons <grantlemons@aol.com>
Date: Sun, 29 Dec 2024 17:48:51 -0600
Subject: [PATCH 34/51] fix(#230): mark numbers outside text as unlintable

---
 harper-core/src/parsers/typst.rs | 17 +++++------------
 1 file changed, 5 insertions(+), 12 deletions(-)

diff --git a/harper-core/src/parsers/typst.rs b/harper-core/src/parsers/typst.rs
index 9264dcf1..4c09cc83 100644
--- a/harper-core/src/parsers/typst.rs
+++ b/harper-core/src/parsers/typst.rs
@@ -279,13 +279,6 @@ impl<'a> ParseHelper<'a> {
                     .exprs()
                     .chain(term_item.description().exprs()),
             ),
-            // Expr::Ident(a) => token!(a, TokenKind::Word(WordMetadata::default())),
-            Expr::Int(int) => {
-                token!(int, TokenKind::Number((int.get() as f64).into(), None))
-            }
-            Expr::Float(float) => {
-                token!(float, TokenKind::Number(float.get().into(), None))
-            }
             Expr::Str(text) => {
                 let offset = offset.push_to_span(text.span()).char + 1;
                 let string = text.to_untyped().text();
@@ -547,11 +540,11 @@ mod tests {
         assert!(matches!(
             token_kinds.as_slice(),
             &[
-                TokenKind::Unlintable,                         // Ident
-                TokenKind::Unlintable,                         // Key 1
-                TokenKind::Word(_),                            // Value 1
-                TokenKind::Unlintable,                         // Key 2
-                TokenKind::Number(OrderedFloat(2019.0), None), // Value 2
+                TokenKind::Unlintable, // Ident
+                TokenKind::Unlintable, // Key 1
+                TokenKind::Word(_),    // Value 1
+                TokenKind::Unlintable, // Key 2
+                TokenKind::Unlintable, // Value 2
             ]
         ))
     }

From 122436f04d101214bfe05e40a84255669e418108 Mon Sep 17 00:00:00 2001
From: Grant Lemons <grantlemons@aol.com>
Date: Sun, 29 Dec 2024 18:47:01 -0600
Subject: [PATCH 35/51] tests(#230): add document with spelling mistakes in
 different contexts

---
 harper-core/tests/run_tests.rs                |  1 +
 .../tests/test_sources/complex_typst.typ      |  5 +-
 .../test_sources/typst_spelling_mistakes.typ  | 63 +++++++++++++++++++
 3 files changed, 66 insertions(+), 3 deletions(-)
 create mode 100644 harper-core/tests/test_sources/typst_spelling_mistakes.typ

diff --git a/harper-core/tests/run_tests.rs b/harper-core/tests/run_tests.rs
index eb4f21c5..6a8dabc1 100644
--- a/harper-core/tests/run_tests.rs
+++ b/harper-core/tests/run_tests.rs
@@ -53,3 +53,4 @@ create_test!(chinese_lorem_ipsum.md, 2);
 create_test!(obsidian_links.md, 2);
 create_test!(issue_267.md, 0);
 create_test!(complex_typst.typ, 0);
+create_test!(typst_spelling_mistakes.typ, 4);
diff --git a/harper-core/tests/test_sources/complex_typst.typ b/harper-core/tests/test_sources/complex_typst.typ
index 480595be..42aa16b1 100644
--- a/harper-core/tests/test_sources/complex_typst.typ
+++ b/harper-core/tests/test_sources/complex_typst.typ
@@ -31,9 +31,8 @@
     #let count = authors.len()
     #let authors_slice = authors.slice(0, calc.min(count, 3))
     _#if count > 3 {
-        // Disabled because et al. isn't parsed properly, but this isn't the
-        // fault of the typst parser
-        //
+        // et al. isn't parsed properly, but this isn't the fault of the typst
+        // parser
         // authors_slice.push("et al.")
         authors_slice.join(", ")
       } else {
diff --git a/harper-core/tests/test_sources/typst_spelling_mistakes.typ b/harper-core/tests/test_sources/typst_spelling_mistakes.typ
new file mode 100644
index 00000000..0c82635c
--- /dev/null
+++ b/harper-core/tests/test_sources/typst_spelling_mistakes.typ
@@ -0,0 +1,63 @@
+#set page(
+  paper: "us-letter",
+  columns: 2,
+)
+
+#let titleblock(
+  title: "Defalt Title",
+  authors: ("Author 1", "Author 2"),
+  abstract: [*This is contnt*],
+) = {
+  set page(
+    header: context {
+      if counter(page).get().first() > 1 [
+        #counter(page).get().first() of #counter(page).final().at(0)
+        #h(1fr)
+        #title
+      ]
+    },
+  )
+  place(
+    top + center,
+    float: true,
+    scope: "parent",
+    clearance: 2em,
+  )[
+    #align(center, text(17pt)[
+      *#title*
+    ])
+
+    #let authors = authors.filter(x => x.len() > 0)
+    #let count = authors.len()
+    #let authors_slice = authors.slice(0, calc.min(count, 3))
+    _#if count > 3 {
+        // et al. isn't parsed properly, but this isn't the fault of the typst
+        // parser
+        // authors_slice.push("et al.")
+        authors_slice.join(", ")
+      } else {
+        authors_slice.join(", ", last: ", and ")
+      }
+    _
+
+    #par(justify: false)[
+      *Abstract* \
+      #abstract
+    ]
+  ]
+}
+
+#show: doc => [
+  #titleblock(
+    title: "A fluid dynamic model for glaier flow",
+    authors: ("Grant Lemons", "John Doe", "Jane Doe"),
+    abstract: lorem(80)
+  )
+  #doc
+]
+
+= Introduction
+#lorem(300)
+
+= Related ork
+#lorem(200)

From 5f832755924b2de76a14d1b573efae6f8234785a Mon Sep 17 00:00:00 2001
From: Grant Lemons <grantlemons@aol.com>
Date: Mon, 30 Dec 2024 13:53:31 -0600
Subject: [PATCH 36/51] tests(#230): edit test macros to parse the extension

---
 harper-core/tests/run_tests.rs | 28 +++++++++++-----------------
 1 file changed, 11 insertions(+), 17 deletions(-)

diff --git a/harper-core/tests/run_tests.rs b/harper-core/tests/run_tests.rs
index 6a8dabc1..3a5a19c8 100644
--- a/harper-core/tests/run_tests.rs
+++ b/harper-core/tests/run_tests.rs
@@ -7,14 +7,14 @@ use harper_core::{
 /// Creates a unit test checking that the linting of a document in
 /// `tests_sources` produces the expected number of lints.
 macro_rules! create_test {
-    ($filename:ident, $ext:literal, $parser:expr, $correct_expected:expr) => {
+    ($filename:ident.$ext:ident, $parser:expr, $correct_expected:expr) => {
         paste::paste! {
             #[test]
             fn [<lints_ $filename _correctly>](){
                  let source = include_str!(
                     concat!(
                         "./test_sources/",
-                        concat!(stringify!($filename), $ext)
+                        concat!(stringify!($filename), ".", stringify!($ext))
                     )
                  );
 
@@ -37,20 +37,14 @@ macro_rules! create_test {
             }
         }
     };
-    ($filename:ident.md, $correct_expected:expr) => {
-        create_test!($filename, ".md", &Markdown, $correct_expected);
-    };
-    ($filename:ident.typ, $correct_expected:expr) => {
-        create_test!($filename, ".typ", &Typst, $correct_expected);
-    };
 }
 
-create_test!(whack_bullets.md, 1);
-create_test!(preexisting.md, 0);
-create_test!(issue_109.md, 0);
-create_test!(issue_109_ext.md, 0);
-create_test!(chinese_lorem_ipsum.md, 2);
-create_test!(obsidian_links.md, 2);
-create_test!(issue_267.md, 0);
-create_test!(complex_typst.typ, 0);
-create_test!(typst_spelling_mistakes.typ, 4);
+create_test!(whack_bullets.md, &Markdown, 1);
+create_test!(preexisting.md, &Markdown, 0);
+create_test!(issue_109.md, &Markdown, 0);
+create_test!(issue_109_ext.md, &Markdown, 0);
+create_test!(chinese_lorem_ipsum.md, &Markdown, 2);
+create_test!(obsidian_links.md, &Markdown, 2);
+create_test!(issue_267.md, &Markdown, 0);
+create_test!(complex_typst.typ, &Typst, 0);
+create_test!(typst_spelling_mistakes.typ, &Typst, 4);

From 2e97afe753c10db2cda6ea622832a0b66fc8429b Mon Sep 17 00:00:00 2001
From: Grant Lemons <grantlemons@aol.com>
Date: Mon, 30 Dec 2024 15:28:03 -0600
Subject: [PATCH 37/51] Revert "feat(spans-visual): mark unlintable spans as
 red"

This reverts commit 3f9ecb516fcd97a01c4b53feff6aaf3373948f15.
---
 harper-cli/src/main.rs | 9 ++-------
 1 file changed, 2 insertions(+), 7 deletions(-)

diff --git a/harper-cli/src/main.rs b/harper-cli/src/main.rs
index 8a99951d..c8f77e46 100644
--- a/harper-cli/src/main.rs
+++ b/harper-cli/src/main.rs
@@ -8,7 +8,7 @@ use clap::Parser;
 use harper_comments::CommentParser;
 use harper_core::linting::{LintGroup, LintGroupConfig, Linter};
 use harper_core::parsers::{Markdown, Typst};
-use harper_core::{remove_overlaps, Dictionary, Document, FstDictionary, TokenKind};
+use harper_core::{remove_overlaps, Dictionary, Document, FstDictionary};
 
 #[derive(Debug, Parser)]
 enum Args {
@@ -100,7 +100,6 @@ fn main() -> anyhow::Result<()> {
 
             let primary_color = Color::Blue;
             let secondary_color = Color::Magenta;
-            let unlintable_color = Color::Red;
             let filename = file
                 .file_name()
                 .map(|s| s.to_string_lossy().into())
@@ -117,11 +116,7 @@ fn main() -> anyhow::Result<()> {
                 report_builder = report_builder.with_label(
                     Label::new((&filename, token.span.into()))
                         .with_message(format!("[{}, {})", token.span.start, token.span.end))
-                        .with_color(if matches!(token.kind, TokenKind::Unlintable) {
-                            unlintable_color
-                        } else {
-                            color
-                        }),
+                        .with_color(color),
                 );
 
                 // Alternate colors so spans are clear

From 83789eb65bb085298b76d7960543527c16aa05f2 Mon Sep 17 00:00:00 2001
From: Grant Lemons <grantlemons@aol.com>
Date: Mon, 30 Dec 2024 15:29:58 -0600
Subject: [PATCH 38/51] Revert portions of "fix: better handling of spaces and
 newlines"

This reverts part of commit b61c78c4753cefa61d37c684eb34766a217cdc20.
The portion reverted is the default hiding of newlines in the span
command, which has been relocated to a new branch
---
 harper-cli/src/main.rs | 14 ++------------
 1 file changed, 2 insertions(+), 12 deletions(-)

diff --git a/harper-cli/src/main.rs b/harper-cli/src/main.rs
index c8f77e46..f2b52797 100644
--- a/harper-cli/src/main.rs
+++ b/harper-cli/src/main.rs
@@ -30,9 +30,6 @@ enum Args {
     Spans {
         /// The file you wish to display the spans.
         file: PathBuf,
-        /// Include newlines in the output
-        #[arg(short, long)]
-        include_newlines: bool,
     },
     /// Emit decompressed, line-separated list of words in Harper's dictionary.
     Words,
@@ -92,10 +89,7 @@ fn main() -> anyhow::Result<()> {
 
             Ok(())
         }
-        Args::Spans {
-            file,
-            include_newlines,
-        } => {
+        Args::Spans { file } => {
             let (doc, source) = load_file(&file)?;
 
             let primary_color = Color::Blue;
@@ -108,11 +102,7 @@ fn main() -> anyhow::Result<()> {
             let mut report_builder =
                 Report::build(ReportKind::Custom("Spans", primary_color), &filename, 0);
             let mut color = primary_color;
-
-            for token in doc.tokens().filter(|t| {
-                include_newlines
-                    || !matches!(t.kind, TokenKind::Newline(_) | TokenKind::ParagraphBreak)
-            }) {
+            for token in doc.tokens() {
                 report_builder = report_builder.with_label(
                     Label::new((&filename, token.span.into()))
                         .with_message(format!("[{}, {})", token.span.start, token.span.end))

From ee1080da64ee125ceccc5a433a6711186aeddb0b Mon Sep 17 00:00:00 2001
From: Grant Lemons <grantlemons@aol.com>
Date: Tue, 31 Dec 2024 17:11:39 -0600
Subject: [PATCH 39/51] feat(#230): make typst into a feature

---
 harper-cli/Cargo.toml          | 4 ++++
 harper-cli/src/main.rs         | 5 ++++-
 harper-core/Cargo.toml         | 5 +++--
 harper-core/src/parsers/mod.rs | 5 ++++-
 harper-core/tests/run_tests.rs | 3 +++
 harper-wasm/Cargo.toml         | 2 +-
 6 files changed, 19 insertions(+), 5 deletions(-)

diff --git a/harper-cli/Cargo.toml b/harper-cli/Cargo.toml
index 9281ea37..b23feef2 100644
--- a/harper-cli/Cargo.toml
+++ b/harper-cli/Cargo.toml
@@ -13,3 +13,7 @@ clap = { version = "4.5.23", features = ["derive"] }
 harper-core = { path = "../harper-core", version = "0.14.0" }
 harper-comments = { path = "../harper-comments", version = "0.14.0" }
 serde_json = "1.0.133"
+
+[features]
+default = ["typst"]
+typst = ["harper-core/typst"]
diff --git a/harper-cli/src/main.rs b/harper-cli/src/main.rs
index f2b52797..b8f4ab9c 100644
--- a/harper-cli/src/main.rs
+++ b/harper-cli/src/main.rs
@@ -7,9 +7,12 @@ use ariadne::{Color, Label, Report, ReportKind, Source};
 use clap::Parser;
 use harper_comments::CommentParser;
 use harper_core::linting::{LintGroup, LintGroupConfig, Linter};
-use harper_core::parsers::{Markdown, Typst};
+use harper_core::parsers::Markdown;
 use harper_core::{remove_overlaps, Dictionary, Document, FstDictionary};
 
+#[cfg(feature = "typst")]
+use harper_core::parsers::Typst;
+
 #[derive(Debug, Parser)]
 enum Args {
     /// Lint a provided document.
diff --git a/harper-core/Cargo.toml b/harper-core/Cargo.toml
index f50ef9d6..d0db5466 100644
--- a/harper-core/Cargo.toml
+++ b/harper-core/Cargo.toml
@@ -24,7 +24,7 @@ thiserror = "2.0.9"
 unicode-blocks = "0.1.9"
 unicode-width = "0.2.0"
 levenshtein_automata = { version = "0.2.1", features = ["fst_automaton"] }
-typst-syntax = "0.12.0"
+typst-syntax = { version = "0.12.0", optional = true }
 
 [dev-dependencies]
 criterion = { version = "0.5.1", default-features = false }
@@ -35,5 +35,6 @@ name = "parse_demo"
 harness = false
 
 [features]
-default = []
+default = ["typst"]
 concurrent = []
+typst = ["typst-syntax"]
diff --git a/harper-core/src/parsers/mod.rs b/harper-core/src/parsers/mod.rs
index afed02ca..f937d000 100644
--- a/harper-core/src/parsers/mod.rs
+++ b/harper-core/src/parsers/mod.rs
@@ -3,7 +3,11 @@ mod isolate_english;
 mod markdown;
 mod mask;
 mod plain_english;
+
+#[cfg(feature = "typst")]
 mod typst;
+#[cfg(feature = "typst")]
+pub use typst::Typst;
 
 use blanket::blanket;
 pub use collapse_identifiers::CollapseIdentifiers;
@@ -11,7 +15,6 @@ pub use isolate_english::IsolateEnglish;
 pub use markdown::Markdown;
 pub use mask::Mask;
 pub use plain_english::PlainEnglish;
-pub use typst::Typst;
 
 pub use crate::token::{Token, TokenKind, TokenStringExt};
 
diff --git a/harper-core/tests/run_tests.rs b/harper-core/tests/run_tests.rs
index d9ee73ef..6a258a27 100644
--- a/harper-core/tests/run_tests.rs
+++ b/harper-core/tests/run_tests.rs
@@ -47,5 +47,8 @@ create_test!(chinese_lorem_ipsum.md, &Markdown, 2);
 create_test!(obsidian_links.md, &Markdown, 2);
 create_test!(issue_267.md, &Markdown, 0);
 create_test!(proper_noun_capitalization.md, &Markdown, 2);
+
+#[cfg(feature = "typst")]
 create_test!(complex_typst.typ, &Typst, 0);
+#[cfg(feature = "typst")]
 create_test!(typst_spelling_mistakes.typ, &Typst, 4);
diff --git a/harper-wasm/Cargo.toml b/harper-wasm/Cargo.toml
index 3b918038..2ea1d21f 100644
--- a/harper-wasm/Cargo.toml
+++ b/harper-wasm/Cargo.toml
@@ -14,7 +14,7 @@ console_error_panic_hook = "0.1.7"
 tracing = "0.1.41"
 tracing-wasm = "0.2.1"
 wasm-bindgen = "0.2.97"
-harper-core = { path = "../harper-core", version = "0.14.0", features = ["concurrent"] }
+harper-core = { path = "../harper-core", version = "0.14.0", features = ["concurrent"], default-features = false }
 once_cell = "1.20.2"
 serde-wasm-bindgen = "0.6.5"
 serde_json = "1.0.133"

From 637398879e0f3ecf512aa5d6e7eb0920ac7d7f3d Mon Sep 17 00:00:00 2001
From: Grant Lemons <grantlemons@aol.com>
Date: Tue, 31 Dec 2024 17:33:37 -0600
Subject: [PATCH 40/51] fix(#230): improve feature interconnectedness in other
 project crates

---
 harper-cli/src/main.rs        | 6 ++----
 harper-comments/Cargo.toml    | 3 +++
 harper-core/Cargo.toml        | 3 +--
 harper-html/Cargo.toml        | 3 +++
 harper-ls/Cargo.toml          | 4 ++++
 harper-tree-sitter/Cargo.toml | 4 ++++
 harper-wasm/Cargo.toml        | 2 +-
 7 files changed, 18 insertions(+), 7 deletions(-)

diff --git a/harper-cli/src/main.rs b/harper-cli/src/main.rs
index b8f4ab9c..56fbeca6 100644
--- a/harper-cli/src/main.rs
+++ b/harper-cli/src/main.rs
@@ -10,9 +10,6 @@ use harper_core::linting::{LintGroup, LintGroupConfig, Linter};
 use harper_core::parsers::Markdown;
 use harper_core::{remove_overlaps, Dictionary, Document, FstDictionary};
 
-#[cfg(feature = "typst")]
-use harper_core::parsers::Typst;
-
 #[derive(Debug, Parser)]
 enum Args {
     /// Lint a provided document.
@@ -148,7 +145,8 @@ fn load_file(file: &Path) -> anyhow::Result<(Document, String)> {
     let parser: Box<dyn harper_core::parsers::Parser> =
         match file.extension().map(|v| v.to_str().unwrap()) {
             Some("md") => Box::new(Markdown),
-            Some("typ") => Box::new(Typst),
+            #[cfg(feature = "typst")]
+            Some("typ") => Box::new(harper_core::parsers::Typst),
             _ => Box::new(
                 CommentParser::new_from_filename(file)
                     .map(Box::new)
diff --git a/harper-comments/Cargo.toml b/harper-comments/Cargo.toml
index 15539bfa..6b393c1d 100644
--- a/harper-comments/Cargo.toml
+++ b/harper-comments/Cargo.toml
@@ -32,3 +32,6 @@ tree-sitter-haskell = "0.15.0"
 
 [dev-dependencies]
 paste = "1.0.15"
+
+[features]
+typst = ["harper-core/typst"]
diff --git a/harper-core/Cargo.toml b/harper-core/Cargo.toml
index d0db5466..0442c18c 100644
--- a/harper-core/Cargo.toml
+++ b/harper-core/Cargo.toml
@@ -35,6 +35,5 @@ name = "parse_demo"
 harness = false
 
 [features]
-default = ["typst"]
-concurrent = []
 typst = ["typst-syntax"]
+concurrent = []
diff --git a/harper-html/Cargo.toml b/harper-html/Cargo.toml
index bcfa535e..5be988b2 100644
--- a/harper-html/Cargo.toml
+++ b/harper-html/Cargo.toml
@@ -14,3 +14,6 @@ tree-sitter = "0.20.10"
 
 [dev-dependencies]
 paste = "1.0.15"
+
+[features]
+typst = ["harper-core/typst"]
diff --git a/harper-ls/Cargo.toml b/harper-ls/Cargo.toml
index 1bf9f91f..419b4018 100644
--- a/harper-ls/Cargo.toml
+++ b/harper-ls/Cargo.toml
@@ -25,3 +25,7 @@ resolve-path = "0.1.0"
 open = "5.3.0"
 futures = "0.3.31"
 serde = { version = "1.0.214", features = ["derive"] }
+
+[features]
+default = ["typst"]
+typst = ["harper-core/typst"]
diff --git a/harper-tree-sitter/Cargo.toml b/harper-tree-sitter/Cargo.toml
index 530f4ba4..9540cdab 100644
--- a/harper-tree-sitter/Cargo.toml
+++ b/harper-tree-sitter/Cargo.toml
@@ -9,3 +9,7 @@ repository = "https://github.com/automattic/harper"
 [dependencies]
 harper-core = { path = "../harper-core", version = "0.14.0" }
 tree-sitter = "0.20.10"
+
+[features]
+default = ["typst"]
+typst = ["harper-core/typst"]
diff --git a/harper-wasm/Cargo.toml b/harper-wasm/Cargo.toml
index 2ea1d21f..3b918038 100644
--- a/harper-wasm/Cargo.toml
+++ b/harper-wasm/Cargo.toml
@@ -14,7 +14,7 @@ console_error_panic_hook = "0.1.7"
 tracing = "0.1.41"
 tracing-wasm = "0.2.1"
 wasm-bindgen = "0.2.97"
-harper-core = { path = "../harper-core", version = "0.14.0", features = ["concurrent"], default-features = false }
+harper-core = { path = "../harper-core", version = "0.14.0", features = ["concurrent"] }
 once_cell = "1.20.2"
 serde-wasm-bindgen = "0.6.5"
 serde_json = "1.0.133"

From f5881c3a444a817fd7bd3389bb04e522125730e1 Mon Sep 17 00:00:00 2001
From: Grant Lemons <grantlemons@aol.com>
Date: Tue, 31 Dec 2024 17:39:08 -0600
Subject: [PATCH 41/51] fix(#230): use dep: syntax in harper-core

---
 harper-core/Cargo.toml | 2 +-
 1 file changed, 1 insertion(+), 1 deletion(-)

diff --git a/harper-core/Cargo.toml b/harper-core/Cargo.toml
index 0442c18c..08d72234 100644
--- a/harper-core/Cargo.toml
+++ b/harper-core/Cargo.toml
@@ -35,5 +35,5 @@ name = "parse_demo"
 harness = false
 
 [features]
-typst = ["typst-syntax"]
+typst = ["dep:typst-syntax"]
 concurrent = []

From df7652b9bcd482567818ab920f102ab785e4fa5f Mon Sep 17 00:00:00 2001
From: Grant Lemons <grantlemons@aol.com>
Date: Sat, 4 Jan 2025 10:48:54 -0600
Subject: [PATCH 42/51] fix: add newline to eof

---
 harper-core/tests/run_tests.rs | 2 +-
 1 file changed, 1 insertion(+), 1 deletion(-)

diff --git a/harper-core/tests/run_tests.rs b/harper-core/tests/run_tests.rs
index 37602854..45b18efc 100644
--- a/harper-core/tests/run_tests.rs
+++ b/harper-core/tests/run_tests.rs
@@ -53,4 +53,4 @@ create_test!(issue_159.md, &Markdown, 1);
 #[cfg(feature = "typst")]
 create_test!(complex_typst.typ, &Typst, 0);
 #[cfg(feature = "typst")]
-create_test!(typst_spelling_mistakes.typ, &Typst, 4);
\ No newline at end of file
+create_test!(typst_spelling_mistakes.typ, &Typst, 4);

From 6dcf841502b958fa144bab989bc876312b10114c Mon Sep 17 00:00:00 2001
From: Grant Lemons <grantlemons@aol.com>
Date: Sat, 4 Jan 2025 13:42:59 -0600
Subject: [PATCH 43/51] refactor: change harper_ls language_id if chain to
 match statement

---
 harper-ls/src/backend.rs                      | 28 +++++++++----------
 .../tests/test_sources/complex_typst.typ      |  0
 .../test_sources/typst_spelling_mistakes.typ  |  0
 3 files changed, 13 insertions(+), 15 deletions(-)
 rename {harper-core => harper-typst}/tests/test_sources/complex_typst.typ (100%)
 rename {harper-core => harper-typst}/tests/test_sources/typst_spelling_mistakes.typ (100%)

diff --git a/harper-ls/src/backend.rs b/harper-ls/src/backend.rs
index 9e13e2fe..2c376549 100644
--- a/harper-ls/src/backend.rs
+++ b/harper-ls/src/backend.rs
@@ -182,8 +182,10 @@ impl Backend {
             return Ok(());
         };
 
-        let parser: Option<Box<dyn Parser>> =
-            if let Some(ts_parser) = CommentParser::new_from_language_id(language_id) {
+        let ts_parser = CommentParser::new_from_language_id(language_id);
+        let parser: Option<Box<dyn Parser>> = match language_id.as_str() {
+            _ if ts_parser.is_some() => {
+                let ts_parser = ts_parser.unwrap();
                 let source: Vec<char> = text.chars().collect();
                 let source = Arc::new(source);
 
@@ -206,19 +208,15 @@ impl Backend {
                 } else {
                     Some(Box::new(ts_parser))
                 }
-            } else if language_id == "markdown" {
-                Some(Box::new(Markdown))
-            } else if language_id == "typst" {
-                Some(Box::new(Typst))
-            } else if language_id == "git-commit" || language_id == "gitcommit" {
-                Some(Box::new(GitCommitParser))
-            } else if language_id == "html" {
-                Some(Box::new(HtmlParser::default()))
-            } else if language_id == "mail" || language_id == "plaintext" {
-                Some(Box::new(PlainEnglish))
-            } else {
-                None
-            };
+            }
+            "markdown" => Some(Box::new(Markdown)),
+            "git-commit" | "gitcommit" => Some(Box::new(GitCommitParser)),
+            "html" => Some(Box::new(HtmlParser::default())),
+            "mail" | "plaintext" => Some(Box::new(PlainEnglish)),
+            #[cfg(feature = "typst")]
+            "typst" => Some(Box::new(Typst)),
+            _ => None,
+        };
 
         match parser {
             None => {
diff --git a/harper-core/tests/test_sources/complex_typst.typ b/harper-typst/tests/test_sources/complex_typst.typ
similarity index 100%
rename from harper-core/tests/test_sources/complex_typst.typ
rename to harper-typst/tests/test_sources/complex_typst.typ
diff --git a/harper-core/tests/test_sources/typst_spelling_mistakes.typ b/harper-typst/tests/test_sources/typst_spelling_mistakes.typ
similarity index 100%
rename from harper-core/tests/test_sources/typst_spelling_mistakes.typ
rename to harper-typst/tests/test_sources/typst_spelling_mistakes.typ

From 1672de3f592af9b02c1435fdab2237a65582b6bd Mon Sep 17 00:00:00 2001
From: Grant Lemons <grantlemons@aol.com>
Date: Sat, 4 Jan 2025 13:44:32 -0600
Subject: [PATCH 44/51] refactor: move typst parsing to a new crate

---
 Cargo.lock                           |  14 +-
 Cargo.toml                           |   2 +-
 harper-cli/Cargo.toml                |   3 +-
 harper-cli/src/main.rs               |   2 +-
 harper-comments/Cargo.toml           |   3 -
 harper-core/Cargo.toml               |   3 +-
 harper-core/src/parsers/mod.rs       |   5 -
 harper-core/src/parsers/typst.rs     | 721 ---------------------------
 harper-core/tests/run_tests.rs       |  10 +-
 harper-html/Cargo.toml               |   3 -
 harper-ls/Cargo.toml                 |   3 +-
 harper-ls/src/backend.rs             |   7 +-
 harper-tree-sitter/Cargo.toml        |   4 -
 harper-typst/Cargo.toml              |  11 +
 harper-typst/src/lib.rs              | 379 ++++++++++++++
 harper-typst/src/offset_cursor.rs    |  42 ++
 harper-typst/src/typst_translator.rs | 317 ++++++++++++
 harper-typst/tests/run_tests.rs      |  41 ++
 18 files changed, 815 insertions(+), 755 deletions(-)
 delete mode 100644 harper-core/src/parsers/typst.rs
 create mode 100644 harper-typst/Cargo.toml
 create mode 100644 harper-typst/src/lib.rs
 create mode 100644 harper-typst/src/offset_cursor.rs
 create mode 100644 harper-typst/src/typst_translator.rs
 create mode 100644 harper-typst/tests/run_tests.rs

diff --git a/Cargo.lock b/Cargo.lock
index 7168ca09..8d823e6e 100644
--- a/Cargo.lock
+++ b/Cargo.lock
@@ -594,6 +594,7 @@ dependencies = [
  "clap",
  "harper-comments",
  "harper-core",
+ "harper-typst",
  "serde_json",
 ]
 
@@ -645,7 +646,6 @@ dependencies = [
  "serde_json",
  "smallvec",
  "thiserror 2.0.9",
- "typst-syntax",
  "unicode-blocks",
  "unicode-width 0.2.0",
 ]
@@ -672,6 +672,7 @@ dependencies = [
  "harper-comments",
  "harper-core",
  "harper-html",
+ "harper-typst",
  "itertools 0.13.0",
  "once_cell",
  "open",
@@ -692,6 +693,17 @@ dependencies = [
  "tree-sitter",
 ]
 
+[[package]]
+name = "harper-typst"
+version = "0.14.0"
+dependencies = [
+ "harper-core",
+ "itertools 0.13.0",
+ "ordered-float",
+ "paste",
+ "typst-syntax",
+]
+
 [[package]]
 name = "harper-wasm"
 version = "0.1.0"
diff --git a/Cargo.toml b/Cargo.toml
index 9a2546b5..746de49f 100644
--- a/Cargo.toml
+++ b/Cargo.toml
@@ -1,5 +1,5 @@
 [workspace]
-members = [ "harper-cli", "harper-core", "harper-ls", "harper-comments", "harper-wasm", "harper-tree-sitter", "harper-html"]
+members = [ "harper-cli", "harper-core", "harper-ls", "harper-comments", "harper-wasm", "harper-tree-sitter", "harper-html", "harper-typst"]
 resolver = "2"
 
 [profile.release]
diff --git a/harper-cli/Cargo.toml b/harper-cli/Cargo.toml
index b23feef2..6efcdb7d 100644
--- a/harper-cli/Cargo.toml
+++ b/harper-cli/Cargo.toml
@@ -12,8 +12,9 @@ ariadne = "0.4.1"
 clap = { version = "4.5.23", features = ["derive"] }
 harper-core = { path = "../harper-core", version = "0.14.0" }
 harper-comments = { path = "../harper-comments", version = "0.14.0" }
+harper-typst = { path = "../harper-typst", version = "0.14.0", optional = true }
 serde_json = "1.0.133"
 
 [features]
 default = ["typst"]
-typst = ["harper-core/typst"]
+typst = ["dep:harper-typst"]
diff --git a/harper-cli/src/main.rs b/harper-cli/src/main.rs
index b9ebc22f..91517ecc 100644
--- a/harper-cli/src/main.rs
+++ b/harper-cli/src/main.rs
@@ -172,7 +172,7 @@ fn load_file(file: &Path) -> anyhow::Result<(Document, String)> {
         match file.extension().map(|v| v.to_str().unwrap()) {
             Some("md") => Box::new(Markdown),
             #[cfg(feature = "typst")]
-            Some("typ") => Box::new(harper_core::parsers::Typst),
+            Some("typ") => Box::new(harper_typst::Typst),
             _ => Box::new(
                 CommentParser::new_from_filename(file)
                     .map(Box::new)
diff --git a/harper-comments/Cargo.toml b/harper-comments/Cargo.toml
index 6b393c1d..15539bfa 100644
--- a/harper-comments/Cargo.toml
+++ b/harper-comments/Cargo.toml
@@ -32,6 +32,3 @@ tree-sitter-haskell = "0.15.0"
 
 [dev-dependencies]
 paste = "1.0.15"
-
-[features]
-typst = ["harper-core/typst"]
diff --git a/harper-core/Cargo.toml b/harper-core/Cargo.toml
index 08d72234..456b9a65 100644
--- a/harper-core/Cargo.toml
+++ b/harper-core/Cargo.toml
@@ -24,7 +24,6 @@ thiserror = "2.0.9"
 unicode-blocks = "0.1.9"
 unicode-width = "0.2.0"
 levenshtein_automata = { version = "0.2.1", features = ["fst_automaton"] }
-typst-syntax = { version = "0.12.0", optional = true }
 
 [dev-dependencies]
 criterion = { version = "0.5.1", default-features = false }
@@ -35,5 +34,5 @@ name = "parse_demo"
 harness = false
 
 [features]
-typst = ["dep:typst-syntax"]
+default = []
 concurrent = []
diff --git a/harper-core/src/parsers/mod.rs b/harper-core/src/parsers/mod.rs
index 66038286..91d81980 100644
--- a/harper-core/src/parsers/mod.rs
+++ b/harper-core/src/parsers/mod.rs
@@ -4,11 +4,6 @@ mod markdown;
 mod mask;
 mod plain_english;
 
-#[cfg(feature = "typst")]
-mod typst;
-#[cfg(feature = "typst")]
-pub use typst::Typst;
-
 use blanket::blanket;
 pub use collapse_identifiers::CollapseIdentifiers;
 pub use isolate_english::IsolateEnglish;
diff --git a/harper-core/src/parsers/typst.rs b/harper-core/src/parsers/typst.rs
deleted file mode 100644
index 4c09cc83..00000000
--- a/harper-core/src/parsers/typst.rs
+++ /dev/null
@@ -1,721 +0,0 @@
-use itertools::Itertools;
-use typst_syntax::{
-    ast::{
-        Arg, ArrayItem, AstNode, DestructuringItem, DictItem, Expr, Ident, LetBindingKind, Markup,
-        Param, Pattern, Spread,
-    },
-    Source,
-};
-
-use super::{Parser, PlainEnglish};
-use crate::{
-    parsers::StrParser,
-    patterns::{PatternExt, SequencePattern},
-    ConjunctionData, Lrc, NounData, Punctuation, Token, TokenKind, VecExt, WordMetadata,
-};
-
-/// A parser that wraps the [`PlainEnglish`] parser allowing one to parse Typst files.
-pub struct Typst;
-
-/// Encapsulation of the translation between byte-based spans and char-based spans
-#[derive(Debug, Clone, Copy)]
-struct OffsetCursor<'a> {
-    doc: &'a Source,
-    pub char: usize,
-    pub byte: usize,
-}
-
-impl<'a> OffsetCursor<'a> {
-    pub fn new(doc: &'a Source) -> Self {
-        Self {
-            doc,
-            char: 0,
-            byte: 0,
-        }
-    }
-
-    /// Returns a new [`OffsetCursor`] at the given byte based on the current cursor.
-    pub fn push_to(self, new_byte: usize) -> Self {
-        assert!(new_byte >= self.byte);
-
-        if new_byte == self.byte {
-            return self;
-        }
-
-        Self {
-            char: self.char + self.doc.get(self.byte..new_byte).unwrap().chars().count(),
-            byte: new_byte,
-            ..self
-        }
-    }
-
-    /// Returns a new [`OffsetCursor`] at the beginning of the given [`typst_syntax::Span`] based
-    /// on the current cursor.
-    pub fn push_to_span(self, span: typst_syntax::Span) -> Self {
-        let new_byte = self.doc.range(span).unwrap().start;
-
-        self.push_to(new_byte)
-    }
-}
-
-macro_rules! def_token {
-    ($doc:expr, $a:expr, $kind:expr, $offset:ident) => {{
-        let range = $doc.range($a.span()).unwrap();
-        let start = $offset.push_to(range.start);
-        let end_char_loc = start.push_to(range.end).char;
-
-        Some(vec![Token {
-            span: crate::Span {
-                start: start.char,
-                end: end_char_loc,
-            },
-            kind: $kind,
-        }])
-    }};
-}
-
-macro_rules! merge {
-    ($($inner:expr),*) => {
-        Some(
-            [$($inner),*]
-                .into_iter()
-                .flatten()
-                .flatten()
-                .collect_vec(),
-        )
-    };
-}
-
-/// Contains values used in parsing so they don't have to be passed around so much
-#[derive(Clone, Copy)]
-struct ParseHelper<'a> {
-    parser: PlainEnglish,
-    doc: &'a Source,
-}
-
-impl<'a> ParseHelper<'a> {
-    pub fn new(doc: &'a Source) -> Self {
-        Self {
-            parser: PlainEnglish,
-            doc,
-        }
-    }
-
-    fn parse_english(self, str: impl Into<String>, offset: OffsetCursor) -> Option<Vec<Token>> {
-        Some(
-            self.parser
-                .parse_str(str.into())
-                .into_iter()
-                .map(|mut t| {
-                    t.span.push_by(offset.char);
-                    t
-                })
-                .collect_vec(),
-        )
-    }
-
-    fn parse_pattern(self, pat: Pattern, offset: OffsetCursor) -> Option<Vec<Token>> {
-        macro_rules! token {
-            ($a:expr, $kind:expr) => {
-                def_token!(self.doc, $a, $kind, offset)
-            };
-        }
-
-        match pat {
-            Pattern::Normal(expr) => self.parse_expr(expr, offset),
-            Pattern::Placeholder(underscore) => token!(underscore, TokenKind::Unlintable),
-            Pattern::Parenthesized(parenthesized) => merge!(
-                self.parse_expr(parenthesized.expr(), offset),
-                self.parse_pattern(parenthesized.pattern(), offset)
-            ),
-            Pattern::Destructuring(destructuring) => Some(
-                destructuring
-                    .items()
-                    .filter_map(|item| match item {
-                        DestructuringItem::Pattern(pattern) => self.parse_pattern(pattern, offset),
-                        DestructuringItem::Named(named) => merge!(
-                            token!(named.name(), TokenKind::Word(WordMetadata::default())),
-                            self.parse_pattern(named.pattern(), offset)
-                        ),
-                        DestructuringItem::Spread(spread) => merge!(
-                            spread
-                                .sink_ident()
-                                .and_then(|ident| self.parse_ident(ident, offset)),
-                            spread
-                                .sink_expr()
-                                .and_then(|expr| self.parse_expr(expr, offset))
-                        ),
-                    })
-                    .flatten()
-                    .collect(),
-            ),
-        }
-    }
-
-    fn parse_ident(self, ident: Ident, offset: OffsetCursor) -> Option<Vec<Token>> {
-        self.parse_expr(Expr::Ident(ident), offset)
-    }
-
-    /// Do not use for spreads contained in DestructuringItem
-    fn parse_spread(self, spread: Spread, offset: OffsetCursor) -> Option<Vec<Token>> {
-        merge!(
-            self.parse_expr(spread.expr(), offset),
-            spread
-                .sink_ident()
-                .and_then(|ident| self.parse_ident(ident, offset))
-        )
-    }
-
-    pub fn parse_expr(self, ex: Expr, offset: OffsetCursor) -> Option<Vec<Token>> {
-        let offset = offset.push_to_span(ex.span());
-
-        macro_rules! token {
-            ($a:expr, $kind:expr) => {
-                def_token!(self.doc, $a, $kind, offset)
-            };
-        }
-        macro_rules! recurse {
-        ($inner:expr) => {
-            self.parse_expr($inner, offset)
-        };
-        ($($inner:expr),*) => {
-            merge!(
-                $(recurse!($inner)),*
-            )
-        };
-    }
-
-        let iter_recurse = |exprs: &mut dyn Iterator<Item = Expr>| {
-            Some(exprs.filter_map(|e| recurse!(e)).flatten().collect_vec())
-        };
-        let parse_dict = |dict: &mut dyn Iterator<Item = DictItem>| {
-            Some(
-                dict.filter_map(|di| match di {
-                    DictItem::Named(named) => {
-                        merge!(
-                            self.parse_ident(named.name(), offset),
-                            recurse!(named.expr())
-                        )
-                    }
-                    DictItem::Keyed(keyed) => recurse!(keyed.key(), keyed.expr()),
-                    DictItem::Spread(spread) => self.parse_spread(spread, offset),
-                })
-                .flatten()
-                .collect_vec(),
-            )
-        };
-        let parse_params = |params: &mut dyn Iterator<Item = Param>| {
-            Some(
-                params
-                    .filter_map(|p| match p {
-                        Param::Pos(pattern) => self.parse_pattern(pattern, offset),
-                        Param::Named(named) => merge!(
-                            self.parse_ident(named.name(), offset),
-                            recurse!(named.expr())
-                        ),
-                        Param::Spread(spread) => self.parse_spread(spread, offset),
-                    })
-                    .flatten()
-                    .collect_vec(),
-            )
-        };
-        let parse_args = |params: &mut dyn Iterator<Item = Arg>| {
-            Some(
-                params
-                    .filter_map(|a| match a {
-                        Arg::Pos(expr) => recurse!(expr),
-                        Arg::Named(named) => merge!(
-                            self.parse_ident(named.name(), offset),
-                            recurse!(named.expr())
-                        ),
-                        Arg::Spread(spread) => self.parse_spread(spread, offset),
-                    })
-                    .flatten()
-                    .collect_vec(),
-            )
-        };
-
-        match ex {
-            Expr::Text(text) => self.parse_english(text.get(), offset.push_to_span(text.span())),
-            Expr::Space(a) => {
-                let mut chars = self
-                    .doc
-                    .get(self.doc.range(a.span()).unwrap())
-                    .unwrap()
-                    .chars();
-                let first_char = chars.next().unwrap();
-                let length = chars.count() + 1;
-
-                if first_char == '\n' {
-                    token!(a, TokenKind::Newline(1))
-                } else {
-                    token!(a, TokenKind::Space(length))
-                }
-            }
-            Expr::Linebreak(a) => token!(a, TokenKind::Newline(1)),
-            Expr::Parbreak(a) => token!(a, TokenKind::ParagraphBreak),
-            Expr::SmartQuote(quote) => {
-                if quote.double() {
-                    token!(
-                        quote,
-                        TokenKind::Punctuation(Punctuation::Quote(crate::Quote { twin_loc: None }))
-                    )
-                } else {
-                    token!(quote, TokenKind::Punctuation(Punctuation::Apostrophe))
-                }
-            }
-            Expr::Strong(strong) => iter_recurse(&mut strong.body().exprs()),
-            Expr::Emph(emph) => iter_recurse(&mut emph.body().exprs()),
-            Expr::Link(a) => token!(a, TokenKind::Url),
-            Expr::Ref(a) => {
-                token!(a, TokenKind::Word(WordMetadata::default()))
-            }
-            Expr::Heading(heading) => iter_recurse(&mut heading.body().exprs()),
-            Expr::List(list_item) => iter_recurse(&mut list_item.body().exprs()),
-            Expr::Enum(enum_item) => iter_recurse(&mut enum_item.body().exprs()),
-            Expr::Term(term_item) => iter_recurse(
-                &mut term_item
-                    .term()
-                    .exprs()
-                    .chain(term_item.description().exprs()),
-            ),
-            Expr::Str(text) => {
-                let offset = offset.push_to_span(text.span()).char + 1;
-                let string = text.to_untyped().text();
-
-                Some(
-                    self.parser
-                        .parse_str(&string[1..string.len() - 1])
-                        .into_iter()
-                        .map(|mut t| {
-                            t.span.push_by(offset);
-                            t
-                        })
-                        .collect_vec(),
-                )
-            }
-            Expr::Content(content_block) => iter_recurse(&mut content_block.body().exprs()),
-            Expr::Parenthesized(parenthesized) => recurse!(parenthesized.expr()),
-            Expr::Array(array) => Some(
-                array
-                    .items()
-                    .filter_map(|i| {
-                        if let ArrayItem::Pos(e) = i {
-                            recurse!(e)
-                        } else {
-                            None
-                        }
-                    })
-                    .flatten()
-                    .collect_vec(),
-            ),
-            Expr::Dict(a) => parse_dict(&mut a.items()),
-            Expr::FieldAccess(field_access) => merge!(
-                recurse!(field_access.target()),
-                token!(
-                    field_access.field(),
-                    TokenKind::Word(WordMetadata::default())
-                )
-            ),
-            Expr::Let(let_binding) => merge!(
-                match let_binding.kind() {
-                    LetBindingKind::Normal(pattern) => self.parse_pattern(pattern, offset),
-                    LetBindingKind::Closure(ident) => self.parse_ident(ident, offset),
-                },
-                let_binding.init().and_then(|e| recurse!(e))
-            ),
-            Expr::DestructAssign(destruct_assignment) => {
-                recurse!(destruct_assignment.value())
-            }
-            Expr::Set(set_rule) => merge!(
-                recurse!(set_rule.target()),
-                set_rule.condition().and_then(|expr| recurse!(expr)),
-                parse_args(&mut set_rule.args().items())
-            ),
-            Expr::Show(show_rule) => merge!(
-                recurse!(show_rule.transform()),
-                show_rule.selector().and_then(|expr| recurse!(expr))
-            ),
-            Expr::Contextual(contextual) => recurse!(contextual.body()),
-            Expr::Conditional(conditional) => merge!(
-                recurse!(conditional.condition(), conditional.if_body()),
-                conditional.else_body().and_then(|expr| recurse!(expr))
-            ),
-            Expr::While(while_loop) => recurse!(while_loop.condition(), while_loop.body()),
-            Expr::For(for_loop) => recurse!(for_loop.iterable(), for_loop.body()),
-            Expr::Code(code) => iter_recurse(&mut code.body().exprs()),
-            Expr::Closure(closure) => merge!(
-                closure
-                    .name()
-                    .and_then(|ident| self.parse_ident(ident, offset)),
-                parse_params(&mut closure.params().children()),
-                recurse!(closure.body())
-            ),
-            Expr::FuncCall(func) => merge!(
-                token!(func.callee(), TokenKind::Unlintable),
-                parse_args(&mut func.args().items())
-            ),
-            a => token!(a, TokenKind::Unlintable),
-        }
-    }
-}
-
-thread_local! {
-    static WORD_APOSTROPHE_WORD: Lrc<SequencePattern> = Lrc::new(SequencePattern::default()
-                .then_any_word()
-                .then_apostrophe()
-                .then_any_word());
-}
-
-impl Parser for Typst {
-    fn parse(&self, source: &[char]) -> Vec<Token> {
-        let source_str: String = source.iter().collect();
-        let typst_document = Source::detached(source_str);
-        let typst_tree = Markup::from_untyped(typst_document.root())
-            .expect("Unable to create typst document from parsed tree!");
-        let parse_helper = ParseHelper::new(&typst_document);
-
-        let mut tokens = typst_tree
-            .exprs()
-            .filter_map(|ex| parse_helper.parse_expr(ex, OffsetCursor::new(&typst_document)))
-            .flatten()
-            .collect_vec();
-
-        // Consolidate conjunctions
-        let mut to_remove = std::collections::VecDeque::default();
-        for tok_span in WORD_APOSTROPHE_WORD
-            .with(|v| v.clone())
-            .find_all_matches(&tokens, source)
-        {
-            let start_tok = &tokens[tok_span.start];
-            let end_tok = &tokens[tok_span.end - 1];
-            let char_span = crate::Span::new(start_tok.span.start, end_tok.span.end);
-
-            if let TokenKind::Word(metadata) = start_tok.kind {
-                tokens[tok_span.start].kind =
-                    TokenKind::Word(if end_tok.span.get_content(source) == ['s'] {
-                        WordMetadata {
-                            noun: Some(NounData {
-                                is_possessive: Some(true),
-                                ..metadata.noun.unwrap_or_default()
-                            }),
-                            conjunction: None,
-                            ..metadata
-                        }
-                    } else {
-                        WordMetadata {
-                            noun: metadata.noun.map(|noun| NounData {
-                                is_possessive: Some(false),
-                                ..noun
-                            }),
-                            conjunction: Some(ConjunctionData {}),
-                            ..metadata
-                        }
-                    });
-
-                tokens[tok_span.start].span = char_span;
-                to_remove.extend(tok_span.start + 1..tok_span.end);
-            } else {
-                panic!("Apostrophe consolidation does not start with Word Token!")
-            }
-        }
-        tokens.remove_indices(to_remove.into_iter().sorted().unique().collect());
-
-        tokens
-    }
-}
-
-#[cfg(test)]
-mod tests {
-    use itertools::Itertools;
-    use ordered_float::OrderedFloat;
-
-    use super::Typst;
-    use crate::{parsers::StrParser, NounData, Punctuation, TokenKind, WordMetadata};
-
-    #[test]
-    fn conjunction() {
-        let source = "doesn't";
-
-        let tokens = Typst.parse_str(source);
-        let token_kinds = tokens.iter().map(|t| t.kind).collect_vec();
-        dbg!(&token_kinds);
-
-        assert_eq!(token_kinds.len(), 1);
-        assert!(token_kinds.into_iter().all(|t| t.is_conjunction()))
-    }
-
-    #[test]
-    fn possessive() {
-        let source = "person's";
-
-        let tokens = Typst.parse_str(source);
-        let token_kinds = tokens.iter().map(|t| t.kind).collect_vec();
-        dbg!(&token_kinds);
-
-        assert_eq!(token_kinds.len(), 1);
-        assert!(token_kinds.into_iter().all(|t| {
-            matches!(
-                t,
-                TokenKind::Word(WordMetadata {
-                    noun: Some(NounData {
-                        is_possessive: Some(true),
-                        ..
-                    }),
-                    ..
-                })
-            )
-        }))
-    }
-
-    #[test]
-    fn number() {
-        let source = "12 is larger than 11, but much less than 11!";
-
-        let tokens = Typst.parse_str(source);
-        let token_kinds = tokens.iter().map(|t| t.kind).collect_vec();
-        dbg!(&token_kinds);
-
-        assert!(matches!(
-            token_kinds.as_slice(),
-            &[
-                TokenKind::Number(OrderedFloat(12.0), None),
-                TokenKind::Space(1),
-                TokenKind::Word(_),
-                TokenKind::Space(1),
-                TokenKind::Word(_),
-                TokenKind::Space(1),
-                TokenKind::Word(_),
-                TokenKind::Space(1),
-                TokenKind::Number(OrderedFloat(11.0), None),
-                TokenKind::Punctuation(Punctuation::Comma),
-                TokenKind::Space(1),
-                TokenKind::Word(_),
-                TokenKind::Space(1),
-                TokenKind::Word(_),
-                TokenKind::Space(1),
-                TokenKind::Word(_),
-                TokenKind::Space(1),
-                TokenKind::Word(_),
-                TokenKind::Space(1),
-                TokenKind::Number(OrderedFloat(11.0), None),
-                TokenKind::Punctuation(Punctuation::Bang),
-            ]
-        ))
-    }
-
-    #[test]
-    fn math_unlintable() {
-        let source = "$12 > 11$, $12 << 11!$";
-
-        let tokens = Typst.parse_str(source);
-        let token_kinds = tokens.iter().map(|t| t.kind).collect_vec();
-        dbg!(&token_kinds);
-
-        assert!(matches!(
-            token_kinds.as_slice(),
-            &[
-                TokenKind::Unlintable,
-                TokenKind::Punctuation(Punctuation::Comma),
-                TokenKind::Space(1),
-                TokenKind::Unlintable,
-            ]
-        ))
-    }
-
-    #[test]
-    fn dict_parsing() {
-        let source = r#"#let dict = (
-                        name: "Typst",
-                        born: 2019,
-                      )"#;
-
-        let tokens = Typst.parse_str(source);
-        let token_kinds = tokens.iter().map(|t| t.kind).collect_vec();
-        dbg!(&token_kinds);
-
-        let charslice = source.chars().collect_vec();
-        assert_eq!(tokens[2].span.get_content_string(&charslice), "Typst");
-
-        assert!(matches!(
-            token_kinds.as_slice(),
-            &[
-                TokenKind::Unlintable, // Ident
-                TokenKind::Unlintable, // Key 1
-                TokenKind::Word(_),    // Value 1
-                TokenKind::Unlintable, // Key 2
-                TokenKind::Unlintable, // Value 2
-            ]
-        ))
-    }
-
-    #[test]
-    fn str_parsing() {
-        let source = r#"#let ident = "This is a string""#;
-
-        let token_kinds = Typst.parse_str(source).iter().map(|t| t.kind).collect_vec();
-        dbg!(&token_kinds);
-
-        assert!(matches!(
-            &token_kinds.as_slice(),
-            &[
-                TokenKind::Unlintable,
-                TokenKind::Word(_), // This
-                TokenKind::Space(1),
-                TokenKind::Word(_), // Is
-                TokenKind::Space(1),
-                TokenKind::Word(_), // A
-                TokenKind::Space(1),
-                TokenKind::Word(_), // String
-            ]
-        ))
-    }
-
-    #[test]
-    fn non_adjacent_spaces_not_condensed() {
-        let source = r#"#authors_slice.join(", ", last: ", and ")  bob"#;
-
-        let token_kinds = Typst.parse_str(source).iter().map(|t| t.kind).collect_vec();
-        dbg!(&token_kinds);
-
-        assert!(matches!(
-            &token_kinds.as_slice(),
-            &[
-                TokenKind::Unlintable, // authors_slice.join
-                TokenKind::Punctuation(Punctuation::Comma),
-                TokenKind::Space(1),
-                TokenKind::Unlintable, // Ident
-                TokenKind::Punctuation(Punctuation::Comma),
-                TokenKind::Space(1),
-                TokenKind::Word(_), // and
-                TokenKind::Space(1),
-                TokenKind::Space(2),
-                TokenKind::Word(_),
-            ]
-        ))
-    }
-
-    #[test]
-    fn header_parsing() {
-        let source = r"= Header
-                       Paragraph";
-
-        let tokens = Typst.parse_str(source);
-        let token_kinds = tokens.iter().map(|t| t.kind).collect_vec();
-        dbg!(&token_kinds);
-
-        let charslice = source.chars().collect_vec();
-        assert_eq!(tokens[0].span.get_content_string(&charslice), "Header");
-        assert_eq!(tokens[2].span.get_content_string(&charslice), "Paragraph");
-
-        assert!(matches!(
-            &token_kinds.as_slice(),
-            &[
-                TokenKind::Word(_),
-                TokenKind::Newline(1),
-                TokenKind::Word(_)
-            ]
-        ))
-    }
-
-    #[test]
-    fn parbreak() {
-        let source = r"Paragraph
-
-                       Paragraph";
-
-        let token_kinds = Typst.parse_str(source).iter().map(|t| t.kind).collect_vec();
-        dbg!(&token_kinds);
-
-        assert!(matches!(
-            &token_kinds.as_slice(),
-            &[
-                TokenKind::Word(_),
-                TokenKind::ParagraphBreak,
-                TokenKind::Word(_),
-            ]
-        ))
-    }
-
-    #[test]
-    fn label_unlintable() {
-        let source = r"= Header
-                       <label>
-                       Paragraph";
-
-        let tokens = Typst.parse_str(source);
-        let token_kinds = tokens.iter().map(|t| t.kind).collect_vec();
-        dbg!(&token_kinds);
-
-        assert!(matches!(
-            &token_kinds.as_slice(),
-            &[
-                TokenKind::Word(_),
-                TokenKind::Newline(1),
-                TokenKind::Unlintable,
-                TokenKind::Newline(1),
-                TokenKind::Word(_),
-            ]
-        ))
-    }
-
-    #[test]
-    fn sentence() {
-        let source = "This is a sentence, it is not interesting.";
-
-        let tokens = Typst.parse_str(source);
-        let token_kinds = tokens.iter().map(|t| t.kind).collect_vec();
-        dbg!(&token_kinds);
-
-        assert!(matches!(
-            token_kinds.as_slice(),
-            &[
-                TokenKind::Word(_),
-                TokenKind::Space(1),
-                TokenKind::Word(_),
-                TokenKind::Space(1),
-                TokenKind::Word(_),
-                TokenKind::Space(1),
-                TokenKind::Word(_),
-                TokenKind::Punctuation(Punctuation::Comma),
-                TokenKind::Space(1),
-                TokenKind::Word(_),
-                TokenKind::Space(1),
-                TokenKind::Word(_),
-                TokenKind::Space(1),
-                TokenKind::Word(_),
-                TokenKind::Space(1),
-                TokenKind::Word(_),
-                TokenKind::Punctuation(Punctuation::Period),
-            ]
-        ))
-    }
-
-    #[test]
-    fn smart_apostrophe_newline() {
-        let source = r#"group’s
-writing"#;
-
-        let tokens = Typst.parse_str(source);
-        let token_kinds = tokens.iter().map(|t| t.kind).collect_vec();
-        dbg!(&token_kinds);
-
-        let charslice = source.chars().collect_vec();
-        assert_eq!(tokens[2].span.get_content_string(&charslice), "writing");
-
-        assert!(matches!(
-            token_kinds.as_slice(),
-            &[
-                TokenKind::Word(WordMetadata {
-                    noun: Some(NounData {
-                        is_possessive: Some(true),
-                        ..
-                    }),
-                    ..
-                }),
-                TokenKind::Newline(1),
-                TokenKind::Word(_),
-            ]
-        ));
-    }
-}
diff --git a/harper-core/tests/run_tests.rs b/harper-core/tests/run_tests.rs
index 45b18efc..c94d4149 100644
--- a/harper-core/tests/run_tests.rs
+++ b/harper-core/tests/run_tests.rs
@@ -1,8 +1,5 @@
 use harper_core::linting::{LintGroup, LintGroupConfig, Linter};
-use harper_core::{
-    parsers::{Markdown, Typst},
-    Document, FstDictionary,
-};
+use harper_core::{parsers::Markdown, Document, FstDictionary};
 
 /// Creates a unit test checking that the linting of a document in
 /// `tests_sources` produces the expected number of lints.
@@ -49,8 +46,3 @@ create_test!(issue_267.md, &Markdown, 0);
 create_test!(proper_noun_capitalization.md, &Markdown, 2);
 create_test!(amazon_hostname.md, &Markdown, 0);
 create_test!(issue_159.md, &Markdown, 1);
-
-#[cfg(feature = "typst")]
-create_test!(complex_typst.typ, &Typst, 0);
-#[cfg(feature = "typst")]
-create_test!(typst_spelling_mistakes.typ, &Typst, 4);
diff --git a/harper-html/Cargo.toml b/harper-html/Cargo.toml
index 5be988b2..bcfa535e 100644
--- a/harper-html/Cargo.toml
+++ b/harper-html/Cargo.toml
@@ -14,6 +14,3 @@ tree-sitter = "0.20.10"
 
 [dev-dependencies]
 paste = "1.0.15"
-
-[features]
-typst = ["harper-core/typst"]
diff --git a/harper-ls/Cargo.toml b/harper-ls/Cargo.toml
index 419b4018..ced89be0 100644
--- a/harper-ls/Cargo.toml
+++ b/harper-ls/Cargo.toml
@@ -10,6 +10,7 @@ repository = "https://github.com/automattic/harper"
 [dependencies]
 harper-core = { path = "../harper-core", version = "0.14.0", features = ["concurrent"] }
 harper-comments = { path = "../harper-comments", version = "0.14.0" }
+harper-typst = { path = "../harper-typst", version = "0.14.0", optional = true }
 harper-html = { path = "../harper-html", version = "0.14.0" }
 tower-lsp = "0.20.0"
 tokio = { version = "1.42.0", features = ["fs", "rt", "rt-multi-thread", "macros", "io-std", "io-util", "net"] }
@@ -28,4 +29,4 @@ serde = { version = "1.0.214", features = ["derive"] }
 
 [features]
 default = ["typst"]
-typst = ["harper-core/typst"]
+typst = ["dep:harper-typst"]
diff --git a/harper-ls/src/backend.rs b/harper-ls/src/backend.rs
index 2c376549..851fb60f 100644
--- a/harper-ls/src/backend.rs
+++ b/harper-ls/src/backend.rs
@@ -5,9 +5,7 @@ use std::sync::Arc;
 use anyhow::anyhow;
 use harper_comments::CommentParser;
 use harper_core::linting::{LintGroup, Linter};
-use harper_core::parsers::{
-    CollapseIdentifiers, IsolateEnglish, Markdown, Parser, PlainEnglish, Typst,
-};
+use harper_core::parsers::{CollapseIdentifiers, IsolateEnglish, Markdown, Parser, PlainEnglish};
 use harper_core::{
     Dictionary, Document, FstDictionary, FullDictionary, MergedDictionary, Token, TokenKind,
     WordMetadata,
@@ -29,6 +27,9 @@ use tower_lsp::lsp_types::{
 use tower_lsp::{Client, LanguageServer};
 use tracing::{error, info};
 
+#[cfg(feature = "typst")]
+use harper_typst::Typst;
+
 use crate::config::Config;
 use crate::diagnostics::{lint_to_code_actions, lints_to_diagnostics};
 use crate::dictionary_io::{load_dict, save_dict};
diff --git a/harper-tree-sitter/Cargo.toml b/harper-tree-sitter/Cargo.toml
index 9540cdab..530f4ba4 100644
--- a/harper-tree-sitter/Cargo.toml
+++ b/harper-tree-sitter/Cargo.toml
@@ -9,7 +9,3 @@ repository = "https://github.com/automattic/harper"
 [dependencies]
 harper-core = { path = "../harper-core", version = "0.14.0" }
 tree-sitter = "0.20.10"
-
-[features]
-default = ["typst"]
-typst = ["harper-core/typst"]
diff --git a/harper-typst/Cargo.toml b/harper-typst/Cargo.toml
new file mode 100644
index 00000000..70e107a4
--- /dev/null
+++ b/harper-typst/Cargo.toml
@@ -0,0 +1,11 @@
+[package]
+name = "harper-typst"
+version = "0.14.0"
+edition = "2021"
+
+[dependencies]
+harper-core = { path = "../harper-core", version = "0.14.0" }
+typst-syntax = { version = "0.12.0" }
+ordered-float = { version = "4.6.0", features = ["serde"] }
+itertools = "0.13.0"
+paste = "1.0.14"
diff --git a/harper-typst/src/lib.rs b/harper-typst/src/lib.rs
new file mode 100644
index 00000000..c8813d08
--- /dev/null
+++ b/harper-typst/src/lib.rs
@@ -0,0 +1,379 @@
+mod offset_cursor;
+mod typst_translator;
+
+use offset_cursor::OffsetCursor;
+use typst_translator::TypstTranslator;
+
+use harper_core::{
+    parsers::Parser,
+    patterns::{PatternExt, SequencePattern},
+    ConjunctionData, Lrc, NounData, Token, TokenKind, VecExt, WordMetadata,
+};
+use itertools::Itertools;
+use typst_syntax::{
+    ast::{AstNode, Markup},
+    Source,
+};
+
+/// A parser that wraps the [`PlainEnglish`] parser allowing one to parse Typst files.
+pub struct Typst;
+
+thread_local! {
+    static WORD_APOSTROPHE_WORD: Lrc<SequencePattern> = Lrc::new(SequencePattern::default()
+                .then_any_word()
+                .then_apostrophe()
+                .then_any_word());
+}
+
+impl Parser for Typst {
+    fn parse(&self, source: &[char]) -> Vec<Token> {
+        let source_str: String = source.iter().collect();
+        let typst_document = Source::detached(source_str);
+        let typst_tree = Markup::from_untyped(typst_document.root())
+            .expect("Unable to create typst document from parsed tree!");
+        let parse_helper = TypstTranslator::new(&typst_document);
+
+        let mut tokens = typst_tree
+            .exprs()
+            .filter_map(|ex| parse_helper.parse_expr(ex, OffsetCursor::new(&typst_document)))
+            .flatten()
+            .collect_vec();
+
+        // Consolidate conjunctions
+        let mut to_remove = std::collections::VecDeque::default();
+        for tok_span in WORD_APOSTROPHE_WORD
+            .with(|v| v.clone())
+            .find_all_matches(&tokens, source)
+        {
+            let start_tok = &tokens[tok_span.start];
+            let end_tok = &tokens[tok_span.end - 1];
+            let char_span = harper_core::Span::new(start_tok.span.start, end_tok.span.end);
+
+            if let TokenKind::Word(metadata) = start_tok.kind {
+                tokens[tok_span.start].kind =
+                    TokenKind::Word(if end_tok.span.get_content(source) == ['s'] {
+                        WordMetadata {
+                            noun: Some(NounData {
+                                is_possessive: Some(true),
+                                ..metadata.noun.unwrap_or_default()
+                            }),
+                            conjunction: None,
+                            ..metadata
+                        }
+                    } else {
+                        WordMetadata {
+                            noun: metadata.noun.map(|noun| NounData {
+                                is_possessive: Some(false),
+                                ..noun
+                            }),
+                            conjunction: Some(ConjunctionData {}),
+                            ..metadata
+                        }
+                    });
+
+                tokens[tok_span.start].span = char_span;
+                to_remove.extend(tok_span.start + 1..tok_span.end);
+            } else {
+                panic!("Apostrophe consolidation does not start with Word Token!")
+            }
+        }
+        tokens.remove_indices(to_remove.into_iter().sorted().unique().collect());
+
+        tokens
+    }
+}
+
+#[cfg(test)]
+mod tests {
+    use itertools::Itertools;
+    use ordered_float::OrderedFloat;
+
+    use super::Typst;
+    use harper_core::{parsers::StrParser, NounData, Punctuation, TokenKind, WordMetadata};
+
+    #[test]
+    fn conjunction() {
+        let source = "doesn't";
+
+        let tokens = Typst.parse_str(source);
+        let token_kinds = tokens.iter().map(|t| t.kind).collect_vec();
+        dbg!(&token_kinds);
+
+        assert_eq!(token_kinds.len(), 1);
+        assert!(token_kinds.into_iter().all(|t| t.is_conjunction()))
+    }
+
+    #[test]
+    fn possessive() {
+        let source = "person's";
+
+        let tokens = Typst.parse_str(source);
+        let token_kinds = tokens.iter().map(|t| t.kind).collect_vec();
+        dbg!(&token_kinds);
+
+        assert_eq!(token_kinds.len(), 1);
+        assert!(token_kinds.into_iter().all(|t| {
+            matches!(
+                t,
+                TokenKind::Word(WordMetadata {
+                    noun: Some(NounData {
+                        is_possessive: Some(true),
+                        ..
+                    }),
+                    ..
+                })
+            )
+        }))
+    }
+
+    #[test]
+    fn number() {
+        let source = "12 is larger than 11, but much less than 11!";
+
+        let tokens = Typst.parse_str(source);
+        let token_kinds = tokens.iter().map(|t| t.kind).collect_vec();
+        dbg!(&token_kinds);
+
+        assert!(matches!(
+            token_kinds.as_slice(),
+            &[
+                TokenKind::Number(OrderedFloat(12.0), None),
+                TokenKind::Space(1),
+                TokenKind::Word(_),
+                TokenKind::Space(1),
+                TokenKind::Word(_),
+                TokenKind::Space(1),
+                TokenKind::Word(_),
+                TokenKind::Space(1),
+                TokenKind::Number(OrderedFloat(11.0), None),
+                TokenKind::Punctuation(Punctuation::Comma),
+                TokenKind::Space(1),
+                TokenKind::Word(_),
+                TokenKind::Space(1),
+                TokenKind::Word(_),
+                TokenKind::Space(1),
+                TokenKind::Word(_),
+                TokenKind::Space(1),
+                TokenKind::Word(_),
+                TokenKind::Space(1),
+                TokenKind::Number(OrderedFloat(11.0), None),
+                TokenKind::Punctuation(Punctuation::Bang),
+            ]
+        ))
+    }
+
+    #[test]
+    fn math_unlintable() {
+        let source = "$12 > 11$, $12 << 11!$";
+
+        let tokens = Typst.parse_str(source);
+        let token_kinds = tokens.iter().map(|t| t.kind).collect_vec();
+        dbg!(&token_kinds);
+
+        assert!(matches!(
+            token_kinds.as_slice(),
+            &[
+                TokenKind::Unlintable,
+                TokenKind::Punctuation(Punctuation::Comma),
+                TokenKind::Space(1),
+                TokenKind::Unlintable,
+            ]
+        ))
+    }
+
+    #[test]
+    fn dict_parsing() {
+        let source = r#"#let dict = (
+                        name: "Typst",
+                        born: 2019,
+                      )"#;
+
+        let tokens = Typst.parse_str(source);
+        let token_kinds = tokens.iter().map(|t| t.kind).collect_vec();
+        dbg!(&token_kinds);
+
+        let charslice = source.chars().collect_vec();
+        assert_eq!(tokens[2].span.get_content_string(&charslice), "Typst");
+
+        assert!(matches!(
+            token_kinds.as_slice(),
+            &[
+                TokenKind::Unlintable, // Ident
+                TokenKind::Unlintable, // Key 1
+                TokenKind::Word(_),    // Value 1
+                TokenKind::Unlintable, // Key 2
+                TokenKind::Unlintable, // Value 2
+            ]
+        ))
+    }
+
+    #[test]
+    fn str_parsing() {
+        let source = r#"#let ident = "This is a string""#;
+
+        let token_kinds = Typst.parse_str(source).iter().map(|t| t.kind).collect_vec();
+        dbg!(&token_kinds);
+
+        assert!(matches!(
+            &token_kinds.as_slice(),
+            &[
+                TokenKind::Unlintable,
+                TokenKind::Word(_), // This
+                TokenKind::Space(1),
+                TokenKind::Word(_), // Is
+                TokenKind::Space(1),
+                TokenKind::Word(_), // A
+                TokenKind::Space(1),
+                TokenKind::Word(_), // String
+            ]
+        ))
+    }
+
+    #[test]
+    fn non_adjacent_spaces_not_condensed() {
+        let source = r#"#authors_slice.join(", ", last: ", and ")  bob"#;
+
+        let token_kinds = Typst.parse_str(source).iter().map(|t| t.kind).collect_vec();
+        dbg!(&token_kinds);
+
+        assert!(matches!(
+            &token_kinds.as_slice(),
+            &[
+                TokenKind::Unlintable, // authors_slice.join
+                TokenKind::Punctuation(Punctuation::Comma),
+                TokenKind::Space(1),
+                TokenKind::Unlintable, // Ident
+                TokenKind::Punctuation(Punctuation::Comma),
+                TokenKind::Space(1),
+                TokenKind::Word(_), // and
+                TokenKind::Space(1),
+                TokenKind::Space(2),
+                TokenKind::Word(_),
+            ]
+        ))
+    }
+
+    #[test]
+    fn header_parsing() {
+        let source = r"= Header
+                       Paragraph";
+
+        let tokens = Typst.parse_str(source);
+        let token_kinds = tokens.iter().map(|t| t.kind).collect_vec();
+        dbg!(&token_kinds);
+
+        let charslice = source.chars().collect_vec();
+        assert_eq!(tokens[0].span.get_content_string(&charslice), "Header");
+        assert_eq!(tokens[2].span.get_content_string(&charslice), "Paragraph");
+
+        assert!(matches!(
+            &token_kinds.as_slice(),
+            &[
+                TokenKind::Word(_),
+                TokenKind::Newline(1),
+                TokenKind::Word(_)
+            ]
+        ))
+    }
+
+    #[test]
+    fn parbreak() {
+        let source = r"Paragraph
+
+                       Paragraph";
+
+        let token_kinds = Typst.parse_str(source).iter().map(|t| t.kind).collect_vec();
+        dbg!(&token_kinds);
+
+        assert!(matches!(
+            &token_kinds.as_slice(),
+            &[
+                TokenKind::Word(_),
+                TokenKind::ParagraphBreak,
+                TokenKind::Word(_),
+            ]
+        ))
+    }
+
+    #[test]
+    fn label_unlintable() {
+        let source = r"= Header
+                       <label>
+                       Paragraph";
+
+        let tokens = Typst.parse_str(source);
+        let token_kinds = tokens.iter().map(|t| t.kind).collect_vec();
+        dbg!(&token_kinds);
+
+        assert!(matches!(
+            &token_kinds.as_slice(),
+            &[
+                TokenKind::Word(_),
+                TokenKind::Newline(1),
+                TokenKind::Unlintable,
+                TokenKind::Newline(1),
+                TokenKind::Word(_),
+            ]
+        ))
+    }
+
+    #[test]
+    fn sentence() {
+        let source = "This is a sentence, it is not interesting.";
+
+        let tokens = Typst.parse_str(source);
+        let token_kinds = tokens.iter().map(|t| t.kind).collect_vec();
+        dbg!(&token_kinds);
+
+        assert!(matches!(
+            token_kinds.as_slice(),
+            &[
+                TokenKind::Word(_),
+                TokenKind::Space(1),
+                TokenKind::Word(_),
+                TokenKind::Space(1),
+                TokenKind::Word(_),
+                TokenKind::Space(1),
+                TokenKind::Word(_),
+                TokenKind::Punctuation(Punctuation::Comma),
+                TokenKind::Space(1),
+                TokenKind::Word(_),
+                TokenKind::Space(1),
+                TokenKind::Word(_),
+                TokenKind::Space(1),
+                TokenKind::Word(_),
+                TokenKind::Space(1),
+                TokenKind::Word(_),
+                TokenKind::Punctuation(Punctuation::Period),
+            ]
+        ))
+    }
+
+    #[test]
+    fn smart_apostrophe_newline() {
+        let source = r#"group’s
+writing"#;
+
+        let tokens = Typst.parse_str(source);
+        let token_kinds = tokens.iter().map(|t| t.kind).collect_vec();
+        dbg!(&token_kinds);
+
+        let charslice = source.chars().collect_vec();
+        assert_eq!(tokens[2].span.get_content_string(&charslice), "writing");
+
+        assert!(matches!(
+            token_kinds.as_slice(),
+            &[
+                TokenKind::Word(WordMetadata {
+                    noun: Some(NounData {
+                        is_possessive: Some(true),
+                        ..
+                    }),
+                    ..
+                }),
+                TokenKind::Newline(1),
+                TokenKind::Word(_),
+            ]
+        ));
+    }
+}
diff --git a/harper-typst/src/offset_cursor.rs b/harper-typst/src/offset_cursor.rs
new file mode 100644
index 00000000..769024aa
--- /dev/null
+++ b/harper-typst/src/offset_cursor.rs
@@ -0,0 +1,42 @@
+use typst_syntax::Source;
+
+/// Encapsulation of the translation between byte-based spans and char-based spans
+#[derive(Debug, Clone, Copy)]
+pub struct OffsetCursor<'a> {
+    doc: &'a Source,
+    pub char: usize,
+    pub byte: usize,
+}
+
+impl<'a> OffsetCursor<'a> {
+    pub fn new(doc: &'a Source) -> Self {
+        Self {
+            doc,
+            char: 0,
+            byte: 0,
+        }
+    }
+
+    /// Returns a new [`OffsetCursor`] at the given byte based on the current cursor.
+    pub fn push_to(self, new_byte: usize) -> Self {
+        assert!(new_byte >= self.byte);
+
+        if new_byte == self.byte {
+            return self;
+        }
+
+        Self {
+            char: self.char + self.doc.get(self.byte..new_byte).unwrap().chars().count(),
+            byte: new_byte,
+            ..self
+        }
+    }
+
+    /// Returns a new [`OffsetCursor`] at the beginning of the given [`typst_syntax::Span`] based
+    /// on the current cursor.
+    pub fn push_to_span(self, span: typst_syntax::Span) -> Self {
+        let new_byte = self.doc.range(span).unwrap().start;
+
+        self.push_to(new_byte)
+    }
+}
diff --git a/harper-typst/src/typst_translator.rs b/harper-typst/src/typst_translator.rs
new file mode 100644
index 00000000..2c9413f2
--- /dev/null
+++ b/harper-typst/src/typst_translator.rs
@@ -0,0 +1,317 @@
+use crate::OffsetCursor;
+use harper_core::{
+    parsers::{PlainEnglish, StrParser},
+    Punctuation, Token, TokenKind, WordMetadata,
+};
+use itertools::Itertools;
+use typst_syntax::{
+    ast::{
+        Arg, ArrayItem, AstNode, DestructuringItem, DictItem, Expr, Ident, LetBindingKind, Param,
+        Pattern, Spread,
+    },
+    Source,
+};
+
+macro_rules! def_token {
+    ($doc:expr, $a:expr, $kind:expr, $offset:ident) => {{
+        let range = $doc.range($a.span()).unwrap();
+        let start = $offset.push_to(range.start);
+        let end_char_loc = start.push_to(range.end).char;
+
+        Some(vec![Token {
+            span: harper_core::Span {
+                start: start.char,
+                end: end_char_loc,
+            },
+            kind: $kind,
+        }])
+    }};
+}
+
+macro_rules! merge {
+    ($($inner:expr),*) => {
+        Some(
+            [$($inner),*]
+                .into_iter()
+                .flatten()
+                .flatten()
+                .collect_vec(),
+        )
+    };
+}
+
+/// Contains values used in parsing so they don't have to be passed around so much
+#[derive(Clone, Copy)]
+pub struct TypstTranslator<'a> {
+    parser: PlainEnglish,
+    doc: &'a Source,
+}
+
+impl<'a> TypstTranslator<'a> {
+    pub fn new(doc: &'a Source) -> Self {
+        Self {
+            parser: PlainEnglish,
+            doc,
+        }
+    }
+
+    fn parse_english(self, str: impl Into<String>, offset: OffsetCursor) -> Option<Vec<Token>> {
+        Some(
+            self.parser
+                .parse_str(str.into())
+                .into_iter()
+                .map(|mut t| {
+                    t.span.push_by(offset.char);
+                    t
+                })
+                .collect_vec(),
+        )
+    }
+
+    fn parse_pattern(self, pat: Pattern, offset: OffsetCursor) -> Option<Vec<Token>> {
+        macro_rules! token {
+            ($a:expr, $kind:expr) => {
+                def_token!(self.doc, $a, $kind, offset)
+            };
+        }
+
+        match pat {
+            Pattern::Normal(expr) => self.parse_expr(expr, offset),
+            Pattern::Placeholder(underscore) => token!(underscore, TokenKind::Unlintable),
+            Pattern::Parenthesized(parenthesized) => merge!(
+                self.parse_expr(parenthesized.expr(), offset),
+                self.parse_pattern(parenthesized.pattern(), offset)
+            ),
+            Pattern::Destructuring(destructuring) => Some(
+                destructuring
+                    .items()
+                    .filter_map(|item| match item {
+                        DestructuringItem::Pattern(pattern) => self.parse_pattern(pattern, offset),
+                        DestructuringItem::Named(named) => merge!(
+                            token!(named.name(), TokenKind::Word(WordMetadata::default())),
+                            self.parse_pattern(named.pattern(), offset)
+                        ),
+                        DestructuringItem::Spread(spread) => merge!(
+                            spread
+                                .sink_ident()
+                                .and_then(|ident| self.parse_ident(ident, offset)),
+                            spread
+                                .sink_expr()
+                                .and_then(|expr| self.parse_expr(expr, offset))
+                        ),
+                    })
+                    .flatten()
+                    .collect(),
+            ),
+        }
+    }
+
+    fn parse_ident(self, ident: Ident, offset: OffsetCursor) -> Option<Vec<Token>> {
+        self.parse_expr(Expr::Ident(ident), offset)
+    }
+
+    /// Do not use for spreads contained in DestructuringItem
+    fn parse_spread(self, spread: Spread, offset: OffsetCursor) -> Option<Vec<Token>> {
+        merge!(
+            self.parse_expr(spread.expr(), offset),
+            spread
+                .sink_ident()
+                .and_then(|ident| self.parse_ident(ident, offset))
+        )
+    }
+
+    pub fn parse_expr(self, ex: Expr, offset: OffsetCursor) -> Option<Vec<Token>> {
+        let offset = offset.push_to_span(ex.span());
+
+        macro_rules! token {
+            ($a:expr, $kind:expr) => {
+                def_token!(self.doc, $a, $kind, offset)
+            };
+        }
+        macro_rules! recurse {
+        ($inner:expr) => {
+            self.parse_expr($inner, offset)
+        };
+        ($($inner:expr),*) => {
+            merge!(
+                $(recurse!($inner)),*
+            )
+        };
+    }
+
+        let iter_recurse = |exprs: &mut dyn Iterator<Item = Expr>| {
+            Some(exprs.filter_map(|e| recurse!(e)).flatten().collect_vec())
+        };
+        let parse_dict = |dict: &mut dyn Iterator<Item = DictItem>| {
+            Some(
+                dict.filter_map(|di| match di {
+                    DictItem::Named(named) => {
+                        merge!(
+                            self.parse_ident(named.name(), offset),
+                            recurse!(named.expr())
+                        )
+                    }
+                    DictItem::Keyed(keyed) => recurse!(keyed.key(), keyed.expr()),
+                    DictItem::Spread(spread) => self.parse_spread(spread, offset),
+                })
+                .flatten()
+                .collect_vec(),
+            )
+        };
+        let parse_params = |params: &mut dyn Iterator<Item = Param>| {
+            Some(
+                params
+                    .filter_map(|p| match p {
+                        Param::Pos(pattern) => self.parse_pattern(pattern, offset),
+                        Param::Named(named) => merge!(
+                            self.parse_ident(named.name(), offset),
+                            recurse!(named.expr())
+                        ),
+                        Param::Spread(spread) => self.parse_spread(spread, offset),
+                    })
+                    .flatten()
+                    .collect_vec(),
+            )
+        };
+        let parse_args = |params: &mut dyn Iterator<Item = Arg>| {
+            Some(
+                params
+                    .filter_map(|a| match a {
+                        Arg::Pos(expr) => recurse!(expr),
+                        Arg::Named(named) => merge!(
+                            self.parse_ident(named.name(), offset),
+                            recurse!(named.expr())
+                        ),
+                        Arg::Spread(spread) => self.parse_spread(spread, offset),
+                    })
+                    .flatten()
+                    .collect_vec(),
+            )
+        };
+
+        match ex {
+            Expr::Text(text) => self.parse_english(text.get(), offset.push_to_span(text.span())),
+            Expr::Space(a) => {
+                let mut chars = self
+                    .doc
+                    .get(self.doc.range(a.span()).unwrap())
+                    .unwrap()
+                    .chars();
+                let first_char = chars.next().unwrap();
+                let length = chars.count() + 1;
+
+                if first_char == '\n' {
+                    token!(a, TokenKind::Newline(1))
+                } else {
+                    token!(a, TokenKind::Space(length))
+                }
+            }
+            Expr::Linebreak(a) => token!(a, TokenKind::Newline(1)),
+            Expr::Parbreak(a) => token!(a, TokenKind::ParagraphBreak),
+            Expr::SmartQuote(quote) => {
+                if quote.double() {
+                    token!(
+                        quote,
+                        TokenKind::Punctuation(Punctuation::Quote(harper_core::Quote {
+                            twin_loc: None
+                        }))
+                    )
+                } else {
+                    token!(quote, TokenKind::Punctuation(Punctuation::Apostrophe))
+                }
+            }
+            Expr::Strong(strong) => iter_recurse(&mut strong.body().exprs()),
+            Expr::Emph(emph) => iter_recurse(&mut emph.body().exprs()),
+            Expr::Link(a) => token!(a, TokenKind::Url),
+            Expr::Ref(a) => {
+                token!(a, TokenKind::Word(WordMetadata::default()))
+            }
+            Expr::Heading(heading) => iter_recurse(&mut heading.body().exprs()),
+            Expr::List(list_item) => iter_recurse(&mut list_item.body().exprs()),
+            Expr::Enum(enum_item) => iter_recurse(&mut enum_item.body().exprs()),
+            Expr::Term(term_item) => iter_recurse(
+                &mut term_item
+                    .term()
+                    .exprs()
+                    .chain(term_item.description().exprs()),
+            ),
+            Expr::Str(text) => {
+                let offset = offset.push_to_span(text.span()).char + 1;
+                let string = text.to_untyped().text();
+
+                Some(
+                    self.parser
+                        .parse_str(&string[1..string.len() - 1])
+                        .into_iter()
+                        .map(|mut t| {
+                            t.span.push_by(offset);
+                            t
+                        })
+                        .collect_vec(),
+                )
+            }
+            Expr::Content(content_block) => iter_recurse(&mut content_block.body().exprs()),
+            Expr::Parenthesized(parenthesized) => recurse!(parenthesized.expr()),
+            Expr::Array(array) => Some(
+                array
+                    .items()
+                    .filter_map(|i| {
+                        if let ArrayItem::Pos(e) = i {
+                            recurse!(e)
+                        } else {
+                            None
+                        }
+                    })
+                    .flatten()
+                    .collect_vec(),
+            ),
+            Expr::Dict(a) => parse_dict(&mut a.items()),
+            Expr::FieldAccess(field_access) => merge!(
+                recurse!(field_access.target()),
+                token!(
+                    field_access.field(),
+                    TokenKind::Word(WordMetadata::default())
+                )
+            ),
+            Expr::Let(let_binding) => merge!(
+                match let_binding.kind() {
+                    LetBindingKind::Normal(pattern) => self.parse_pattern(pattern, offset),
+                    LetBindingKind::Closure(ident) => self.parse_ident(ident, offset),
+                },
+                let_binding.init().and_then(|e| recurse!(e))
+            ),
+            Expr::DestructAssign(destruct_assignment) => {
+                recurse!(destruct_assignment.value())
+            }
+            Expr::Set(set_rule) => merge!(
+                recurse!(set_rule.target()),
+                set_rule.condition().and_then(|expr| recurse!(expr)),
+                parse_args(&mut set_rule.args().items())
+            ),
+            Expr::Show(show_rule) => merge!(
+                recurse!(show_rule.transform()),
+                show_rule.selector().and_then(|expr| recurse!(expr))
+            ),
+            Expr::Contextual(contextual) => recurse!(contextual.body()),
+            Expr::Conditional(conditional) => merge!(
+                recurse!(conditional.condition(), conditional.if_body()),
+                conditional.else_body().and_then(|expr| recurse!(expr))
+            ),
+            Expr::While(while_loop) => recurse!(while_loop.condition(), while_loop.body()),
+            Expr::For(for_loop) => recurse!(for_loop.iterable(), for_loop.body()),
+            Expr::Code(code) => iter_recurse(&mut code.body().exprs()),
+            Expr::Closure(closure) => merge!(
+                closure
+                    .name()
+                    .and_then(|ident| self.parse_ident(ident, offset)),
+                parse_params(&mut closure.params().children()),
+                recurse!(closure.body())
+            ),
+            Expr::FuncCall(func) => merge!(
+                token!(func.callee(), TokenKind::Unlintable),
+                parse_args(&mut func.args().items())
+            ),
+            a => token!(a, TokenKind::Unlintable),
+        }
+    }
+}
diff --git a/harper-typst/tests/run_tests.rs b/harper-typst/tests/run_tests.rs
new file mode 100644
index 00000000..c9c15f73
--- /dev/null
+++ b/harper-typst/tests/run_tests.rs
@@ -0,0 +1,41 @@
+use harper_core::linting::{LintGroup, LintGroupConfig, Linter};
+use harper_core::{Document, FstDictionary};
+use harper_typst::Typst;
+
+/// Creates a unit test checking that the linting of a document in
+/// `tests_sources` produces the expected number of lints.
+macro_rules! create_test {
+    ($filename:ident.$ext:ident, $correct_expected:expr) => {
+        paste::paste! {
+            #[test]
+            fn [<lints_ $filename _correctly>](){
+                 let source = include_str!(
+                    concat!(
+                        "./test_sources/",
+                        concat!(stringify!($filename), ".", stringify!($ext))
+                    )
+                 );
+
+                 let dict = FstDictionary::curated();
+                 let document = Document::new(&source, &Typst, &dict);
+
+                 let mut linter = LintGroup::new(
+                     LintGroupConfig::default(),
+                     dict
+                 );
+                 let lints = linter.lint(&document);
+
+                 dbg!(&lints);
+                 assert_eq!(lints.len(), $correct_expected);
+
+                 // Make sure that all generated tokens span real characters
+                 for token in document.tokens(){
+                     assert!(token.span.try_get_content(document.get_source()).is_some());
+                 }
+            }
+        }
+    };
+}
+
+create_test!(complex_typst.typ, 0);
+create_test!(typst_spelling_mistakes.typ, 4);

From ada56a0cf08082dc5d4113a630f8a5f70e6f1651 Mon Sep 17 00:00:00 2001
From: Grant Lemons <grantlemons@aol.com>
Date: Sat, 4 Jan 2025 14:45:50 -0600
Subject: [PATCH 45/51] refactor: add many comments to typst parser

---
 harper-typst/src/lib.rs              |  58 +++++++-----
 harper-typst/src/offset_cursor.rs    |   4 +-
 harper-typst/src/typst_translator.rs | 132 +++++++++++++++------------
 3 files changed, 112 insertions(+), 82 deletions(-)

diff --git a/harper-typst/src/lib.rs b/harper-typst/src/lib.rs
index c8813d08..bca23982 100644
--- a/harper-typst/src/lib.rs
+++ b/harper-typst/src/lib.rs
@@ -28,18 +28,21 @@ thread_local! {
 impl Parser for Typst {
     fn parse(&self, source: &[char]) -> Vec<Token> {
         let source_str: String = source.iter().collect();
+
+        // Transform the source into an AST through the `typst_syntax` crate
         let typst_document = Source::detached(source_str);
         let typst_tree = Markup::from_untyped(typst_document.root())
             .expect("Unable to create typst document from parsed tree!");
-        let parse_helper = TypstTranslator::new(&typst_document);
 
+        // Recurse through AST to create tokens
+        let parse_helper = TypstTranslator::new(&typst_document);
         let mut tokens = typst_tree
             .exprs()
             .filter_map(|ex| parse_helper.parse_expr(ex, OffsetCursor::new(&typst_document)))
             .flatten()
             .collect_vec();
 
-        // Consolidate conjunctions
+        // Consolidate conjunctions into single tokens
         let mut to_remove = std::collections::VecDeque::default();
         for tok_span in WORD_APOSTROPHE_WORD
             .with(|v| v.clone())
@@ -47,30 +50,39 @@ impl Parser for Typst {
         {
             let start_tok = &tokens[tok_span.start];
             let end_tok = &tokens[tok_span.end - 1];
+
+            // New span including all tokens between `start_tok` and `end_tok` (inclusive) this is
+            // used to replace all the tokens with the single consolidated token
             let char_span = harper_core::Span::new(start_tok.span.start, end_tok.span.end);
 
             if let TokenKind::Word(metadata) = start_tok.kind {
-                tokens[tok_span.start].kind =
-                    TokenKind::Word(if end_tok.span.get_content(source) == ['s'] {
-                        WordMetadata {
-                            noun: Some(NounData {
-                                is_possessive: Some(true),
-                                ..metadata.noun.unwrap_or_default()
-                            }),
-                            conjunction: None,
-                            ..metadata
-                        }
-                    } else {
-                        WordMetadata {
-                            noun: metadata.noun.map(|noun| NounData {
-                                is_possessive: Some(false),
-                                ..noun
-                            }),
-                            conjunction: Some(ConjunctionData {}),
-                            ..metadata
-                        }
-                    });
-
+                // Mark as plural or conjunction depending on if the portion following the
+                // apostrophe is an `s`
+                let new_metadata = if end_tok.span.get_content(source) == ['s'] {
+                    WordMetadata {
+                        noun: Some(NounData {
+                            is_possessive: Some(true),
+                            ..metadata.noun.unwrap_or_default()
+                        }),
+                        conjunction: None,
+                        ..metadata
+                    }
+                } else {
+                    WordMetadata {
+                        // Mark as non-possessive if a noun
+                        noun: metadata.noun.map(|noun| NounData {
+                            is_possessive: Some(false),
+                            ..noun
+                        }),
+                        conjunction: Some(ConjunctionData {}),
+                        ..metadata
+                    }
+                };
+
+                tokens[tok_span.start].kind = TokenKind::Word(new_metadata);
+
+                // Consolidate tokens by updating the span of the first token to include all
+                // characters in all the matched spans and marking the other tokens for deletion.
                 tokens[tok_span.start].span = char_span;
                 to_remove.extend(tok_span.start + 1..tok_span.end);
             } else {
diff --git a/harper-typst/src/offset_cursor.rs b/harper-typst/src/offset_cursor.rs
index 769024aa..4ef8df48 100644
--- a/harper-typst/src/offset_cursor.rs
+++ b/harper-typst/src/offset_cursor.rs
@@ -1,6 +1,8 @@
 use typst_syntax::Source;
 
-/// Encapsulation of the translation between byte-based spans and char-based spans
+/// Encapsulation of the translation between byte-based spans and char-based spans. This is used to
+/// avoid recomputing the number of characters between the beginning of the file and the current
+/// byte since `typst_syntax` uses byte spans while we use char spans.
 #[derive(Debug, Clone, Copy)]
 pub struct OffsetCursor<'a> {
     doc: &'a Source,
diff --git a/harper-typst/src/typst_translator.rs b/harper-typst/src/typst_translator.rs
index 2c9413f2..34400b2a 100644
--- a/harper-typst/src/typst_translator.rs
+++ b/harper-typst/src/typst_translator.rs
@@ -12,6 +12,7 @@ use typst_syntax::{
     Source,
 };
 
+/// Directly translate a span ($a) in a Typst source ($doc) to a token.
 macro_rules! def_token {
     ($doc:expr, $a:expr, $kind:expr, $offset:ident) => {{
         let range = $doc.range($a.span()).unwrap();
@@ -28,8 +29,9 @@ macro_rules! def_token {
     }};
 }
 
+/// Combine the results of multiple parsing calls.
 macro_rules! merge {
-    ($($inner:expr),*) => {
+    [$($inner:expr),*] => {
         Some(
             [$($inner),*]
                 .into_iter()
@@ -40,24 +42,21 @@ macro_rules! merge {
     };
 }
 
-/// Contains values used in parsing so they don't have to be passed around so much
+/// Contains values used in parsing so they don't have to be passed around so much.
 #[derive(Clone, Copy)]
 pub struct TypstTranslator<'a> {
-    parser: PlainEnglish,
     doc: &'a Source,
 }
 
 impl<'a> TypstTranslator<'a> {
     pub fn new(doc: &'a Source) -> Self {
-        Self {
-            parser: PlainEnglish,
-            doc,
-        }
+        Self { doc }
     }
 
+    /// Use the [`PlainEnglish`] parser to parse plain text from a Typst expression.
     fn parse_english(self, str: impl Into<String>, offset: OffsetCursor) -> Option<Vec<Token>> {
         Some(
-            self.parser
+            PlainEnglish
                 .parse_str(str.into())
                 .into_iter()
                 .map(|mut t| {
@@ -68,7 +67,9 @@ impl<'a> TypstTranslator<'a> {
         )
     }
 
+    /// Parse a pattern, one of the elements of Typst syntax
     fn parse_pattern(self, pat: Pattern, offset: OffsetCursor) -> Option<Vec<Token>> {
+        /// Simplification of [`def_token!`] that bakes-in local variables
         macro_rules! token {
             ($a:expr, $kind:expr) => {
                 def_token!(self.doc, $a, $kind, offset)
@@ -78,27 +79,27 @@ impl<'a> TypstTranslator<'a> {
         match pat {
             Pattern::Normal(expr) => self.parse_expr(expr, offset),
             Pattern::Placeholder(underscore) => token!(underscore, TokenKind::Unlintable),
-            Pattern::Parenthesized(parenthesized) => merge!(
+            Pattern::Parenthesized(parenthesized) => merge![
                 self.parse_expr(parenthesized.expr(), offset),
                 self.parse_pattern(parenthesized.pattern(), offset)
-            ),
+            ],
             Pattern::Destructuring(destructuring) => Some(
                 destructuring
                     .items()
                     .filter_map(|item| match item {
                         DestructuringItem::Pattern(pattern) => self.parse_pattern(pattern, offset),
-                        DestructuringItem::Named(named) => merge!(
+                        DestructuringItem::Named(named) => merge![
                             token!(named.name(), TokenKind::Word(WordMetadata::default())),
                             self.parse_pattern(named.pattern(), offset)
-                        ),
-                        DestructuringItem::Spread(spread) => merge!(
+                        ],
+                        DestructuringItem::Spread(spread) => merge![
                             spread
                                 .sink_ident()
                                 .and_then(|ident| self.parse_ident(ident, offset)),
                             spread
                                 .sink_expr()
                                 .and_then(|expr| self.parse_expr(expr, offset))
-                        ),
+                        ],
                     })
                     .flatten()
                     .collect(),
@@ -106,82 +107,78 @@ impl<'a> TypstTranslator<'a> {
         }
     }
 
+    /// Convenience wrapper of [`Self::parse_expr`] that packages the identifier as an expression
     fn parse_ident(self, ident: Ident, offset: OffsetCursor) -> Option<Vec<Token>> {
         self.parse_expr(Expr::Ident(ident), offset)
     }
 
     /// Do not use for spreads contained in DestructuringItem
     fn parse_spread(self, spread: Spread, offset: OffsetCursor) -> Option<Vec<Token>> {
-        merge!(
+        merge![
             self.parse_expr(spread.expr(), offset),
             spread
                 .sink_ident()
                 .and_then(|ident| self.parse_ident(ident, offset))
-        )
+        ]
     }
 
-    pub fn parse_expr(self, ex: Expr, offset: OffsetCursor) -> Option<Vec<Token>> {
-        let offset = offset.push_to_span(ex.span());
+    pub fn parse_expr(self, expr: Expr, offset: OffsetCursor) -> Option<Vec<Token>> {
+        // Update the offset that will be passed to other functions by moving it to the beginning
+        // of the current expression's span.
+        let offset = offset.push_to_span(expr.span());
 
+        /// Simplification of [`def_token!`] that bakes-in local variables
         macro_rules! token {
             ($a:expr, $kind:expr) => {
                 def_token!(self.doc, $a, $kind, offset)
             };
         }
+
+        /// Quickly recurse without needing to pass in local variables.
+        /// Matches both single and many expressions.
         macro_rules! recurse {
         ($inner:expr) => {
             self.parse_expr($inner, offset)
         };
-        ($($inner:expr),*) => {
-            merge!(
+        ($($inner:expr),+) => {
+            merge![
                 $(recurse!($inner)),*
-            )
+            ]
         };
     }
 
+        // Recurse on each element of an iterator
         let iter_recurse = |exprs: &mut dyn Iterator<Item = Expr>| {
             Some(exprs.filter_map(|e| recurse!(e)).flatten().collect_vec())
         };
-        let parse_dict = |dict: &mut dyn Iterator<Item = DictItem>| {
-            Some(
-                dict.filter_map(|di| match di {
-                    DictItem::Named(named) => {
-                        merge!(
-                            self.parse_ident(named.name(), offset),
-                            recurse!(named.expr())
-                        )
-                    }
-                    DictItem::Keyed(keyed) => recurse!(keyed.key(), keyed.expr()),
-                    DictItem::Spread(spread) => self.parse_spread(spread, offset),
-                })
-                .flatten()
-                .collect_vec(),
-            )
-        };
+
+        // Parse the parameters of a function or closure
         let parse_params = |params: &mut dyn Iterator<Item = Param>| {
             Some(
                 params
                     .filter_map(|p| match p {
                         Param::Pos(pattern) => self.parse_pattern(pattern, offset),
-                        Param::Named(named) => merge!(
+                        Param::Named(named) => merge![
                             self.parse_ident(named.name(), offset),
                             recurse!(named.expr())
-                        ),
+                        ],
                         Param::Spread(spread) => self.parse_spread(spread, offset),
                     })
                     .flatten()
                     .collect_vec(),
             )
         };
+
+        // Parse the arguments passed to a function or closure call
         let parse_args = |params: &mut dyn Iterator<Item = Arg>| {
             Some(
                 params
                     .filter_map(|a| match a {
                         Arg::Pos(expr) => recurse!(expr),
-                        Arg::Named(named) => merge!(
+                        Arg::Named(named) => merge![
                             self.parse_ident(named.name(), offset),
                             recurse!(named.expr())
-                        ),
+                        ],
                         Arg::Spread(spread) => self.parse_spread(spread, offset),
                     })
                     .flatten()
@@ -189,7 +186,12 @@ impl<'a> TypstTranslator<'a> {
             )
         };
 
-        match ex {
+        // Delegate parsing based on the kind of Typst expression.
+        // Not all expression kinds have defined behavior, so the default behavior is
+        // an [`harper_core::TokenKind::Unlintable`] token.
+        //
+        // A full list of variants is available in the [typst_syntax docs](https://docs.rs/typst/latest/typst/syntax/ast/enum.Expr.html)
+        match expr {
             Expr::Text(text) => self.parse_english(text.get(), offset.push_to_span(text.span())),
             Expr::Space(a) => {
                 let mut chars = self
@@ -240,7 +242,7 @@ impl<'a> TypstTranslator<'a> {
                 let string = text.to_untyped().text();
 
                 Some(
-                    self.parser
+                    PlainEnglish
                         .parse_str(&string[1..string.len() - 1])
                         .into_iter()
                         .map(|mut t| {
@@ -265,52 +267,66 @@ impl<'a> TypstTranslator<'a> {
                     .flatten()
                     .collect_vec(),
             ),
-            Expr::Dict(a) => parse_dict(&mut a.items()),
-            Expr::FieldAccess(field_access) => merge!(
+            Expr::Dict(dict) => Some(
+                dict.items()
+                    .filter_map(|di| match di {
+                        DictItem::Named(named) => {
+                            merge![
+                                self.parse_ident(named.name(), offset),
+                                recurse!(named.expr())
+                            ]
+                        }
+                        DictItem::Keyed(keyed) => recurse!(keyed.key(), keyed.expr()),
+                        DictItem::Spread(spread) => self.parse_spread(spread, offset),
+                    })
+                    .flatten()
+                    .collect_vec(),
+            ),
+            Expr::FieldAccess(field_access) => merge![
                 recurse!(field_access.target()),
                 token!(
                     field_access.field(),
                     TokenKind::Word(WordMetadata::default())
                 )
-            ),
-            Expr::Let(let_binding) => merge!(
+            ],
+            Expr::Let(let_binding) => merge![
                 match let_binding.kind() {
                     LetBindingKind::Normal(pattern) => self.parse_pattern(pattern, offset),
                     LetBindingKind::Closure(ident) => self.parse_ident(ident, offset),
                 },
                 let_binding.init().and_then(|e| recurse!(e))
-            ),
+            ],
             Expr::DestructAssign(destruct_assignment) => {
                 recurse!(destruct_assignment.value())
             }
-            Expr::Set(set_rule) => merge!(
+            Expr::Set(set_rule) => merge![
                 recurse!(set_rule.target()),
                 set_rule.condition().and_then(|expr| recurse!(expr)),
                 parse_args(&mut set_rule.args().items())
-            ),
-            Expr::Show(show_rule) => merge!(
+            ],
+            Expr::Show(show_rule) => merge![
                 recurse!(show_rule.transform()),
                 show_rule.selector().and_then(|expr| recurse!(expr))
-            ),
+            ],
             Expr::Contextual(contextual) => recurse!(contextual.body()),
-            Expr::Conditional(conditional) => merge!(
+            Expr::Conditional(conditional) => merge![
                 recurse!(conditional.condition(), conditional.if_body()),
                 conditional.else_body().and_then(|expr| recurse!(expr))
-            ),
+            ],
             Expr::While(while_loop) => recurse!(while_loop.condition(), while_loop.body()),
             Expr::For(for_loop) => recurse!(for_loop.iterable(), for_loop.body()),
             Expr::Code(code) => iter_recurse(&mut code.body().exprs()),
-            Expr::Closure(closure) => merge!(
+            Expr::Closure(closure) => merge![
                 closure
                     .name()
                     .and_then(|ident| self.parse_ident(ident, offset)),
                 parse_params(&mut closure.params().children()),
                 recurse!(closure.body())
-            ),
-            Expr::FuncCall(func) => merge!(
+            ],
+            Expr::FuncCall(func) => merge![
                 token!(func.callee(), TokenKind::Unlintable),
                 parse_args(&mut func.args().items())
-            ),
+            ],
             a => token!(a, TokenKind::Unlintable),
         }
     }

From d638a287a96c0ac66fdf278ffa6126898b3e5167 Mon Sep 17 00:00:00 2001
From: Grant Lemons <grantlemons@aol.com>
Date: Mon, 6 Jan 2025 11:56:19 -0700
Subject: [PATCH 46/51] refactor: undo changes to test runner so it is all
 markdown

---
 harper-core/tests/run_tests.rs | 32 ++++++++++++++++----------------
 1 file changed, 16 insertions(+), 16 deletions(-)

diff --git a/harper-core/tests/run_tests.rs b/harper-core/tests/run_tests.rs
index c94d4149..eec35583 100644
--- a/harper-core/tests/run_tests.rs
+++ b/harper-core/tests/run_tests.rs
@@ -1,22 +1,22 @@
 use harper_core::linting::{LintGroup, LintGroupConfig, Linter};
-use harper_core::{parsers::Markdown, Document, FstDictionary};
+use harper_core::{Document, FstDictionary};
 
-/// Creates a unit test checking that the linting of a document in
-/// `tests_sources` produces the expected number of lints.
+/// Creates a unit test checking that the linting of a Markdown document (in
+/// `tests_sources`) produces the expected number of lints.
 macro_rules! create_test {
-    ($filename:ident.$ext:ident, $parser:expr, $correct_expected:expr) => {
+    ($filename:ident.md, $correct_expected:expr) => {
         paste::paste! {
             #[test]
             fn [<lints_ $filename _correctly>](){
                  let source = include_str!(
                     concat!(
                         "./test_sources/",
-                        concat!(stringify!($filename), ".", stringify!($ext))
+                        concat!(stringify!($filename), ".md")
                     )
                  );
 
                  let dict = FstDictionary::curated();
-                 let document = Document::new(&source, $parser, &dict);
+                 let document = Document::new_markdown(&source, &dict);
 
                  let mut linter = LintGroup::new(
                      LintGroupConfig::default(),
@@ -36,13 +36,13 @@ macro_rules! create_test {
     };
 }
 
-create_test!(whack_bullets.md, &Markdown, 1);
-create_test!(preexisting.md, &Markdown, 0);
-create_test!(issue_109.md, &Markdown, 0);
-create_test!(issue_109_ext.md, &Markdown, 0);
-create_test!(chinese_lorem_ipsum.md, &Markdown, 2);
-create_test!(obsidian_links.md, &Markdown, 2);
-create_test!(issue_267.md, &Markdown, 0);
-create_test!(proper_noun_capitalization.md, &Markdown, 2);
-create_test!(amazon_hostname.md, &Markdown, 0);
-create_test!(issue_159.md, &Markdown, 1);
+create_test!(whack_bullets.md, 1);
+create_test!(preexisting.md, 0);
+create_test!(issue_109.md, 0);
+create_test!(issue_109_ext.md, 0);
+create_test!(chinese_lorem_ipsum.md, 2);
+create_test!(obsidian_links.md, 2);
+create_test!(issue_267.md, 0);
+create_test!(proper_noun_capitalization.md, 2);
+create_test!(amazon_hostname.md, 0);
+create_test!(issue_159.md, 1);

From cfb468cf6783c5168d6b15c150aa297f00f6e051 Mon Sep 17 00:00:00 2001
From: Grant Lemons <grantlemons@aol.com>
Date: Mon, 6 Jan 2025 13:05:44 -0700
Subject: [PATCH 47/51] fix: add crate info to Cargo.toml

---
 harper-typst/Cargo.toml | 3 +++
 1 file changed, 3 insertions(+)

diff --git a/harper-typst/Cargo.toml b/harper-typst/Cargo.toml
index 70e107a4..cafbf336 100644
--- a/harper-typst/Cargo.toml
+++ b/harper-typst/Cargo.toml
@@ -2,6 +2,9 @@
 name = "harper-typst"
 version = "0.14.0"
 edition = "2021"
+description = "The language checker for developers."
+license = "Apache-2.0"
+repository = "https://github.com/automattic/harper"
 
 [dependencies]
 harper-core = { path = "../harper-core", version = "0.14.0" }

From 911bcdb0c7281fa210aa0c23584a8b1b5cfe09a1 Mon Sep 17 00:00:00 2001
From: Grant Lemons <grantlemons@aol.com>
Date: Fri, 10 Jan 2025 10:38:02 -0700
Subject: [PATCH 48/51] fix(#230): remove feature flags

---
 harper-cli/Cargo.toml    | 5 ++---
 harper-cli/src/main.rs   | 1 -
 harper-ls/Cargo.toml     | 5 ++---
 harper-ls/src/backend.rs | 5 +----
 4 files changed, 5 insertions(+), 11 deletions(-)

diff --git a/harper-cli/Cargo.toml b/harper-cli/Cargo.toml
index 4adb6553..876c4276 100644
--- a/harper-cli/Cargo.toml
+++ b/harper-cli/Cargo.toml
@@ -12,9 +12,8 @@ ariadne = "0.4.1"
 clap = { version = "4.5.23", features = ["derive"] }
 harper-core = { path = "../harper-core", version = "0.15.0" }
 harper-comments = { path = "../harper-comments", version = "0.15.0" }
-harper-typst = { path = "../harper-typst", version = "0.15.0", optional = true }
+harper-typst = { path = "../harper-typst", version = "0.15.0" }
 serde_json = "1.0.133"
 
 [features]
-default = ["typst"]
-typst = ["dep:harper-typst"]
+default = []
diff --git a/harper-cli/src/main.rs b/harper-cli/src/main.rs
index 91517ecc..6740158c 100644
--- a/harper-cli/src/main.rs
+++ b/harper-cli/src/main.rs
@@ -171,7 +171,6 @@ fn load_file(file: &Path) -> anyhow::Result<(Document, String)> {
     let parser: Box<dyn harper_core::parsers::Parser> =
         match file.extension().map(|v| v.to_str().unwrap()) {
             Some("md") => Box::new(Markdown),
-            #[cfg(feature = "typst")]
             Some("typ") => Box::new(harper_typst::Typst),
             _ => Box::new(
                 CommentParser::new_from_filename(file)
diff --git a/harper-ls/Cargo.toml b/harper-ls/Cargo.toml
index b06af9d8..de1b018c 100644
--- a/harper-ls/Cargo.toml
+++ b/harper-ls/Cargo.toml
@@ -10,7 +10,7 @@ repository = "https://github.com/automattic/harper"
 [dependencies]
 harper-core = { path = "../harper-core", version = "0.15.0", features = ["concurrent"] }
 harper-comments = { path = "../harper-comments", version = "0.15.0" }
-harper-typst = { path = "../harper-typst", version = "0.15.0", optional = true }
+harper-typst = { path = "../harper-typst", version = "0.15.0" }
 harper-html = { path = "../harper-html", version = "0.15.0" }
 tower-lsp = "0.20.0"
 tokio = { version = "1.42.0", features = ["fs", "rt", "rt-multi-thread", "macros", "io-std", "io-util", "net"] }
@@ -28,5 +28,4 @@ futures = "0.3.31"
 serde = { version = "1.0.214", features = ["derive"] }
 
 [features]
-default = ["typst"]
-typst = ["dep:harper-typst"]
+default = []
diff --git a/harper-ls/src/backend.rs b/harper-ls/src/backend.rs
index 1f42de43..02715bf0 100644
--- a/harper-ls/src/backend.rs
+++ b/harper-ls/src/backend.rs
@@ -11,6 +11,7 @@ use harper_core::{
     WordMetadata,
 };
 use harper_html::HtmlParser;
+use harper_typst::Typst;
 use serde_json::Value;
 use tokio::sync::{Mutex, RwLock};
 use tower_lsp::jsonrpc::Result;
@@ -29,9 +30,6 @@ use tower_lsp::lsp_types::{
 use tower_lsp::{Client, LanguageServer};
 use tracing::{error, info, warn};
 
-#[cfg(feature = "typst")]
-use harper_typst::Typst;
-
 use crate::config::Config;
 use crate::diagnostics::{lint_to_code_actions, lints_to_diagnostics};
 use crate::dictionary_io::{load_dict, save_dict};
@@ -216,7 +214,6 @@ impl Backend {
             "git-commit" | "gitcommit" => Some(Box::new(GitCommitParser)),
             "html" => Some(Box::new(HtmlParser::default())),
             "mail" | "plaintext" => Some(Box::new(PlainEnglish)),
-            #[cfg(feature = "typst")]
             "typst" => Some(Box::new(Typst)),
             _ => None,
         };

From 79e743e57426aea4a7da735a9ff5c71484829343 Mon Sep 17 00:00:00 2001
From: Grant Lemons <grantlemons@aol.com>
Date: Fri, 10 Jan 2025 10:57:04 -0700
Subject: [PATCH 49/51] fix(#230): use document in tests to handle contractions

---
 harper-typst/src/lib.rs | 130 ++++++++++++++--------------------------
 1 file changed, 44 insertions(+), 86 deletions(-)

diff --git a/harper-typst/src/lib.rs b/harper-typst/src/lib.rs
index bca23982..8a72fd99 100644
--- a/harper-typst/src/lib.rs
+++ b/harper-typst/src/lib.rs
@@ -4,11 +4,7 @@ mod typst_translator;
 use offset_cursor::OffsetCursor;
 use typst_translator::TypstTranslator;
 
-use harper_core::{
-    parsers::Parser,
-    patterns::{PatternExt, SequencePattern},
-    ConjunctionData, Lrc, NounData, Token, TokenKind, VecExt, WordMetadata,
-};
+use harper_core::{parsers::Parser, patterns::SequencePattern, Lrc, Token};
 use itertools::Itertools;
 use typst_syntax::{
     ast::{AstNode, Markup},
@@ -36,62 +32,11 @@ impl Parser for Typst {
 
         // Recurse through AST to create tokens
         let parse_helper = TypstTranslator::new(&typst_document);
-        let mut tokens = typst_tree
+        typst_tree
             .exprs()
             .filter_map(|ex| parse_helper.parse_expr(ex, OffsetCursor::new(&typst_document)))
             .flatten()
-            .collect_vec();
-
-        // Consolidate conjunctions into single tokens
-        let mut to_remove = std::collections::VecDeque::default();
-        for tok_span in WORD_APOSTROPHE_WORD
-            .with(|v| v.clone())
-            .find_all_matches(&tokens, source)
-        {
-            let start_tok = &tokens[tok_span.start];
-            let end_tok = &tokens[tok_span.end - 1];
-
-            // New span including all tokens between `start_tok` and `end_tok` (inclusive) this is
-            // used to replace all the tokens with the single consolidated token
-            let char_span = harper_core::Span::new(start_tok.span.start, end_tok.span.end);
-
-            if let TokenKind::Word(metadata) = start_tok.kind {
-                // Mark as plural or conjunction depending on if the portion following the
-                // apostrophe is an `s`
-                let new_metadata = if end_tok.span.get_content(source) == ['s'] {
-                    WordMetadata {
-                        noun: Some(NounData {
-                            is_possessive: Some(true),
-                            ..metadata.noun.unwrap_or_default()
-                        }),
-                        conjunction: None,
-                        ..metadata
-                    }
-                } else {
-                    WordMetadata {
-                        // Mark as non-possessive if a noun
-                        noun: metadata.noun.map(|noun| NounData {
-                            is_possessive: Some(false),
-                            ..noun
-                        }),
-                        conjunction: Some(ConjunctionData {}),
-                        ..metadata
-                    }
-                };
-
-                tokens[tok_span.start].kind = TokenKind::Word(new_metadata);
-
-                // Consolidate tokens by updating the span of the first token to include all
-                // characters in all the matched spans and marking the other tokens for deletion.
-                tokens[tok_span.start].span = char_span;
-                to_remove.extend(tok_span.start + 1..tok_span.end);
-            } else {
-                panic!("Apostrophe consolidation does not start with Word Token!")
-            }
-        }
-        tokens.remove_indices(to_remove.into_iter().sorted().unique().collect());
-
-        tokens
+            .collect_vec()
     }
 }
 
@@ -101,26 +46,33 @@ mod tests {
     use ordered_float::OrderedFloat;
 
     use super::Typst;
-    use harper_core::{parsers::StrParser, NounData, Punctuation, TokenKind, WordMetadata};
+    use harper_core::{Document, NounData, Punctuation, TokenKind, WordMetadata};
 
     #[test]
-    fn conjunction() {
-        let source = "doesn't";
-
-        let tokens = Typst.parse_str(source);
-        let token_kinds = tokens.iter().map(|t| t.kind).collect_vec();
+    fn contraction() {
+        let document = Document::new_curated("doesn't", &Typst);
+        let token_kinds = document.tokens().map(|t| t.kind).collect_vec();
         dbg!(&token_kinds);
 
         assert_eq!(token_kinds.len(), 1);
-        assert!(token_kinds.into_iter().all(|t| t.is_conjunction()))
+        assert!(!token_kinds.into_iter().any(|t| {
+            matches!(
+                t,
+                TokenKind::Word(WordMetadata {
+                    noun: Some(NounData {
+                        is_possessive: Some(true),
+                        ..
+                    }),
+                    ..
+                })
+            )
+        }))
     }
 
     #[test]
     fn possessive() {
-        let source = "person's";
-
-        let tokens = Typst.parse_str(source);
-        let token_kinds = tokens.iter().map(|t| t.kind).collect_vec();
+        let document = Document::new_curated("person's", &Typst);
+        let token_kinds = document.tokens().map(|t| t.kind).collect_vec();
         dbg!(&token_kinds);
 
         assert_eq!(token_kinds.len(), 1);
@@ -142,8 +94,8 @@ mod tests {
     fn number() {
         let source = "12 is larger than 11, but much less than 11!";
 
-        let tokens = Typst.parse_str(source);
-        let token_kinds = tokens.iter().map(|t| t.kind).collect_vec();
+        let document = Document::new_curated(source, &Typst);
+        let token_kinds = document.tokens().map(|t| t.kind).collect_vec();
         dbg!(&token_kinds);
 
         assert!(matches!(
@@ -178,8 +130,8 @@ mod tests {
     fn math_unlintable() {
         let source = "$12 > 11$, $12 << 11!$";
 
-        let tokens = Typst.parse_str(source);
-        let token_kinds = tokens.iter().map(|t| t.kind).collect_vec();
+        let document = Document::new_curated(source, &Typst);
+        let token_kinds = document.tokens().map(|t| t.kind).collect_vec();
         dbg!(&token_kinds);
 
         assert!(matches!(
@@ -200,11 +152,12 @@ mod tests {
                         born: 2019,
                       )"#;
 
-        let tokens = Typst.parse_str(source);
-        let token_kinds = tokens.iter().map(|t| t.kind).collect_vec();
+        let document = Document::new_curated(source, &Typst);
+        let token_kinds = document.tokens().map(|t| t.kind).collect_vec();
         dbg!(&token_kinds);
 
         let charslice = source.chars().collect_vec();
+        let tokens = document.tokens().collect_vec();
         assert_eq!(tokens[2].span.get_content_string(&charslice), "Typst");
 
         assert!(matches!(
@@ -223,7 +176,8 @@ mod tests {
     fn str_parsing() {
         let source = r#"#let ident = "This is a string""#;
 
-        let token_kinds = Typst.parse_str(source).iter().map(|t| t.kind).collect_vec();
+        let document = Document::new_curated(source, &Typst);
+        let token_kinds = document.tokens().map(|t| t.kind).collect_vec();
         dbg!(&token_kinds);
 
         assert!(matches!(
@@ -245,7 +199,8 @@ mod tests {
     fn non_adjacent_spaces_not_condensed() {
         let source = r#"#authors_slice.join(", ", last: ", and ")  bob"#;
 
-        let token_kinds = Typst.parse_str(source).iter().map(|t| t.kind).collect_vec();
+        let document = Document::new_curated(source, &Typst);
+        let token_kinds = document.tokens().map(|t| t.kind).collect_vec();
         dbg!(&token_kinds);
 
         assert!(matches!(
@@ -270,11 +225,12 @@ mod tests {
         let source = r"= Header
                        Paragraph";
 
-        let tokens = Typst.parse_str(source);
-        let token_kinds = tokens.iter().map(|t| t.kind).collect_vec();
+        let document = Document::new_curated(source, &Typst);
+        let token_kinds = document.tokens().map(|t| t.kind).collect_vec();
         dbg!(&token_kinds);
 
         let charslice = source.chars().collect_vec();
+        let tokens = document.tokens().collect_vec();
         assert_eq!(tokens[0].span.get_content_string(&charslice), "Header");
         assert_eq!(tokens[2].span.get_content_string(&charslice), "Paragraph");
 
@@ -294,7 +250,8 @@ mod tests {
 
                        Paragraph";
 
-        let token_kinds = Typst.parse_str(source).iter().map(|t| t.kind).collect_vec();
+        let document = Document::new_curated(source, &Typst);
+        let token_kinds = document.tokens().map(|t| t.kind).collect_vec();
         dbg!(&token_kinds);
 
         assert!(matches!(
@@ -313,8 +270,8 @@ mod tests {
                        <label>
                        Paragraph";
 
-        let tokens = Typst.parse_str(source);
-        let token_kinds = tokens.iter().map(|t| t.kind).collect_vec();
+        let document = Document::new_curated(source, &Typst);
+        let token_kinds = document.tokens().map(|t| t.kind).collect_vec();
         dbg!(&token_kinds);
 
         assert!(matches!(
@@ -333,8 +290,8 @@ mod tests {
     fn sentence() {
         let source = "This is a sentence, it is not interesting.";
 
-        let tokens = Typst.parse_str(source);
-        let token_kinds = tokens.iter().map(|t| t.kind).collect_vec();
+        let document = Document::new_curated(source, &Typst);
+        let token_kinds = document.tokens().map(|t| t.kind).collect_vec();
         dbg!(&token_kinds);
 
         assert!(matches!(
@@ -366,11 +323,12 @@ mod tests {
         let source = r#"group’s
 writing"#;
 
-        let tokens = Typst.parse_str(source);
-        let token_kinds = tokens.iter().map(|t| t.kind).collect_vec();
+        let document = Document::new_curated(source, &Typst);
+        let token_kinds = document.tokens().map(|t| t.kind).collect_vec();
         dbg!(&token_kinds);
 
         let charslice = source.chars().collect_vec();
+        let tokens = document.tokens().collect_vec();
         assert_eq!(tokens[2].span.get_content_string(&charslice), "writing");
 
         assert!(matches!(

From ec307abb54ee804f69e458c29529d9513e118dd7 Mon Sep 17 00:00:00 2001
From: Grant Lemons <grantlemons@aol.com>
Date: Sat, 11 Jan 2025 21:19:32 -0700
Subject: [PATCH 50/51] fix(#230): remove pattern previously used for
 contractions

---
 harper-typst/src/lib.rs | 9 +--------
 1 file changed, 1 insertion(+), 8 deletions(-)

diff --git a/harper-typst/src/lib.rs b/harper-typst/src/lib.rs
index 8a72fd99..3cb20a55 100644
--- a/harper-typst/src/lib.rs
+++ b/harper-typst/src/lib.rs
@@ -4,7 +4,7 @@ mod typst_translator;
 use offset_cursor::OffsetCursor;
 use typst_translator::TypstTranslator;
 
-use harper_core::{parsers::Parser, patterns::SequencePattern, Lrc, Token};
+use harper_core::{parsers::Parser, Token};
 use itertools::Itertools;
 use typst_syntax::{
     ast::{AstNode, Markup},
@@ -14,13 +14,6 @@ use typst_syntax::{
 /// A parser that wraps the [`PlainEnglish`] parser allowing one to parse Typst files.
 pub struct Typst;
 
-thread_local! {
-    static WORD_APOSTROPHE_WORD: Lrc<SequencePattern> = Lrc::new(SequencePattern::default()
-                .then_any_word()
-                .then_apostrophe()
-                .then_any_word());
-}
-
 impl Parser for Typst {
     fn parse(&self, source: &[char]) -> Vec<Token> {
         let source_str: String = source.iter().collect();

From 6a16626f0270888a5c48428685566a36f1e2e817 Mon Sep 17 00:00:00 2001
From: Elijah Potter <me@elijahpotter.dev>
Date: Mon, 13 Jan 2025 08:53:34 -0700
Subject: [PATCH 51/51] fix(core): delete erroneous file that was breaking the
 build

---
 harper-ls/src/backend.rs:14:1 | 24 ------------------------
 1 file changed, 24 deletions(-)
 delete mode 100644 harper-ls/src/backend.rs:14:1

diff --git a/harper-ls/src/backend.rs:14:1 b/harper-ls/src/backend.rs:14:1
deleted file mode 100644
index 873cace9..00000000
--- a/harper-ls/src/backend.rs:14:1
+++ /dev/null
@@ -1,24 +0,0 @@
-[?1049h[?1h[H[2J[?2004h[?2026$p[?u[c[?12h[?25h[?25l(B[m[H[2J]112[1 q[?1002h[?1006h[38:2:0:0:0m[K
-[K
-[K
-[K
-[K
-[K
-[K
-[K
-[K
-[K
-[K
-[K
-[K
-[K
-[K
-[K
-[K
-[K
-[K
-[K
-[K
-[K
-[K
-[J[H
\ No newline at end of file