Skip to content

Commit 5e9215f

Browse files
authored
Merge pull request #24 from orthosie/patch-1
Added Tamil language stop words
2 parents b40296d + b44cec2 commit 5e9215f

File tree

2 files changed

+138
-0
lines changed

2 files changed

+138
-0
lines changed

lang/ta_TA.pattern

+1
Original file line numberDiff line numberDiff line change
@@ -0,0 +1 @@
1+
/\bவேறு\b|\bவேண்டும்\b|\bவிட்டு\b|\bவிட\b|\bவரையில்\b|\bவரை\b|\bவரும்\b|\bவந்து\b|\bவந்த\b|\bயார்\b|\bமேல்\b|\bமேலும்\b|\bமுறை\b|\bமுதல்\b|\bமீது\b|\bமிகவும்\b|\bமிக\b|\bமற்றும்\b|\bமற்ற\b|\bமட்டும்\b|\bமட்டுமே\b|\bபோல்\b|\bபோல\b|\bபோன்ற\b|\bபோது\b|\bபேர்\b|\bபெரும்\b|\bபிறகு\b|\bபிற\b|\bபின்னர்\b|\bபின்\b|\bபல்வேறு\b|\bபலரும்\b|\bபல\b|\bபற்றிய\b|\bபற்றி\b|\bநீ\b|\bநாம்\b|\bநான்\b|\bதான்\b|\bதவிர\b|\bதன்\b|\bதனது\b|\bசேர்ந்த\b|\bசில\b|\bசிறு\b|\bசற்று\b|\bகொள்ள\b|\bகொண்டு\b|\bகொண்ட\b|\bஓர்\b|\bஒரே\b|\bஒரு\b|\bஏன்\b|\bஎல்லாம்\b|\bஎன்றும்\b|\bஎன்று\b|\bஎன்ற\b|\bஎன்பதை\b|\bஎன்பது\b|\bஎன்னும்\b|\bஎன்ன\b|\bஎன்\b|\bஎனும்\b|\bஎனினும்\b|\bஎனவே\b|\bஎனவும்\b|\bஎனப்படும்\b|\bஎனக்கு\b|\bஎனக்\b|\bஎன\b|\bஎந்த\b|\bஉள்ளன\b|\bஉள்ளது\b|\bஉள்ள\b|\bஉன்\b|\bஇவை\b|\bஇவர்\b|\bஇருந்து\b|\bஇருந்தது\b|\bஇருந்த\b|\bஇருக்கும்\b|\bஇரு\b|\bஇப்போது\b|\bஇன்னும்\b|\bஇந்தப்\b|\bஇந்தத்\b|\bஇந்தக்\b|\bஇந்த\b|\bஇதை\b|\bஇது\b|\bஇதில்\b|\bஇதற்கு\b|\bஇதன்\b|\bஇதனை\b|\bஇதனால்\b|\bஇடம்\b|\bஇடத்தில்\b|\bஇங்கே\b|\bஇங்கு\b|\bஆகும்\b|\bஆகியோர்\b|\bஆகிய\b|\bஅவை\b|\bஅவள்\b|\bஅவர்கள்\b|\bஅவர்\b|\bஅவரது\b|\bஅவன்\b|\bஅல்லது\b|\bஅன்று\b|\bஅந்தப்\b|\bஅந்தக்\b|\bஅந்த\b|\bஅதை\b|\bஅதே\b|\bஅது\b|\bஅதில்\b|\bஅதிக\b|\bஅதற்கு\b|\bஅதன்\b|\bஅதனால்\b|\bஅடுத்த\b|\bஅங்கே\b|\bஅங்கு\b/i

lang/ta_TA.php

+137
Original file line numberDiff line numberDiff line change
@@ -0,0 +1,137 @@
1+
<?php
2+
3+
/**
4+
* Stopwords list for the use in the PHP package rake-php-plus.
5+
* See: https://github.com/Donatello-za/rake-php-plus
6+
*
7+
* Extracted using extractor.php @ 2021-02-15T15:37:44+00:00
8+
*/
9+
10+
return [
11+
'வேறு',
12+
'வேண்டும்',
13+
'விட்டு',
14+
'விட',
15+
'வரையில்',
16+
'வரை',
17+
'வரும்',
18+
'வந்து',
19+
'வந்த',
20+
'யார்',
21+
'மேல்',
22+
'மேலும்',
23+
'முறை',
24+
'முதல்',
25+
'மீது',
26+
'மிகவும்',
27+
'மிக',
28+
'மற்றும்',
29+
'மற்ற',
30+
'மட்டும்',
31+
'மட்டுமே',
32+
'போல்',
33+
'போல',
34+
'போன்ற',
35+
'போது',
36+
'பேர்',
37+
'பெரும்',
38+
'பிறகு',
39+
'பிற',
40+
'பின்னர்',
41+
'பின்',
42+
'பல்வேறு',
43+
'பலரும்',
44+
'பல',
45+
'பற்றிய',
46+
'பற்றி',
47+
'நீ',
48+
'நாம்',
49+
'நான்',
50+
'தான்',
51+
'தவிர',
52+
'தன்',
53+
'தனது',
54+
'சேர்ந்த',
55+
'சில',
56+
'சிறு',
57+
'சற்று',
58+
'கொள்ள',
59+
'கொண்டு',
60+
'கொண்ட',
61+
'ஓர்',
62+
'ஒரே',
63+
'ஒரு',
64+
'ஏன்',
65+
'எல்லாம்',
66+
'என்றும்',
67+
'என்று',
68+
'என்ற',
69+
'என்பதை',
70+
'என்பது',
71+
'என்னும்',
72+
'என்ன',
73+
'என்',
74+
'எனும்',
75+
'எனினும்',
76+
'எனவே',
77+
'எனவும்',
78+
'எனப்படும்',
79+
'எனக்கு',
80+
'எனக்',
81+
'என',
82+
'எந்த',
83+
'உள்ளன',
84+
'உள்ளது',
85+
'உள்ள',
86+
'உன்',
87+
'இவை',
88+
'இவர்',
89+
'இருந்து',
90+
'இருந்தது',
91+
'இருந்த',
92+
'இருக்கும்',
93+
'இரு',
94+
'இப்போது',
95+
'இன்னும்',
96+
'இந்தப்',
97+
'இந்தத்',
98+
'இந்தக்',
99+
'இந்த',
100+
'இதை',
101+
'இது',
102+
'இதில்',
103+
'இதற்கு',
104+
'இதன்',
105+
'இதனை',
106+
'இதனால்',
107+
'இடம்',
108+
'இடத்தில்',
109+
'இங்கே',
110+
'இங்கு',
111+
'ஆகும்',
112+
'ஆகியோர்',
113+
'ஆகிய',
114+
'அவை',
115+
'அவள்',
116+
'அவர்கள்',
117+
'அவர்',
118+
'அவரது',
119+
'அவன்',
120+
'அல்லது',
121+
'அன்று',
122+
'அந்தப்',
123+
'அந்தக்',
124+
'அந்த',
125+
'அதை',
126+
'அதே',
127+
'அது',
128+
'அதில்',
129+
'அதிக',
130+
'அதற்கு',
131+
'அதன்',
132+
'அதனால்',
133+
'அடுத்த',
134+
'அங்கே',
135+
'அங்கு'
136+
];
137+

0 commit comments

Comments
 (0)