Skip to content

Commit 862b73e

Browse files
committed
fix: correct translation errors
1 parent b25a438 commit 862b73e

File tree

2 files changed

+1
-1
lines changed

2 files changed

+1
-1
lines changed
-19.9 KB
Binary file not shown.

docs/文本分类或回归方法.md

Lines changed: 1 addition & 1 deletion
Original file line numberDiff line numberDiff line change
@@ -97,7 +97,7 @@ corpus_transformed = ctv.transform(corpus)
9797
(4, 21) 1
9898
```
9999

100-
在前面的章节中,我们已经见识过这种表示法。即稀疏表示法。因此,语料库现在是一个稀疏矩阵,其中第一个样本有 4 个元素,第二个样本有 10 个元素,以此类推,第三个样本有 5 个元素,以此类推。我们还可以看到,这些元素都有相关的计数。有些元素会出现两次,有些则只有一次。例如,在样本 2( 1 )中,我们看到第 22 列的数值是 2。这是为什么呢?第 22 列是什么?
100+
在前面的章节中,我们已经见识过这种表示法。即稀疏表示法。因此,语料库现在是一个稀疏矩阵,其中第一个样本有 4 个元素,第二个样本有 10 个元素,以此类推,第三个样本有 5 个元素,以此类推。我们还可以看到,这些元素都有相关的计数。有些元素会出现两次,有些则只有一次。例如,在样本 2( 1 )中,我们看到第 22 列的数值是 2。这是为什么呢?第 22 列是什么?
101101

102102
CountVectorizer 的工作方式是首先对句子进行标记化处理,然后为每个标记赋值。因此,每个标记都由一个唯一索引表示。这些唯一索引就是我们看到的列。CountVectorizer 会存储这些信息。
103103

0 commit comments

Comments
 (0)