-
Notifications
You must be signed in to change notification settings - Fork 10
/
Copy pathtokenizer.py
422 lines (349 loc) · 136 KB
/
tokenizer.py
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
138
139
140
141
142
143
144
145
146
147
148
149
150
151
152
153
154
155
156
157
158
159
160
161
162
163
164
165
166
167
168
169
170
171
172
173
174
175
176
177
178
179
180
181
182
183
184
185
186
187
188
189
190
191
192
193
194
195
196
197
198
199
200
201
202
203
204
205
206
207
208
209
210
211
212
213
214
215
216
217
218
219
220
221
222
223
224
225
226
227
228
229
230
231
232
233
234
235
236
237
238
239
240
241
242
243
244
245
246
247
248
249
250
251
252
253
254
255
256
257
258
259
260
261
262
263
264
265
266
267
268
269
270
271
272
273
274
275
276
277
278
279
280
281
282
283
284
285
286
287
288
289
290
291
292
293
294
295
296
297
298
299
300
301
302
303
304
305
306
307
308
309
310
311
312
313
314
315
316
317
318
319
320
321
322
323
324
325
326
327
328
329
330
331
332
333
334
335
336
337
338
339
340
341
342
343
344
345
346
347
348
349
350
351
352
353
354
355
356
357
358
359
360
361
362
363
364
365
366
367
368
369
370
371
372
373
374
375
376
377
378
379
380
381
382
383
384
385
386
387
388
389
390
391
392
393
394
395
396
397
398
399
400
401
402
403
404
405
406
407
408
409
410
411
412
413
414
415
416
417
418
419
420
421
422
import os
import json
import collections
from typing import Optional
import base64
import regex
import blobfile
from tqdm import tqdm
# 来源:https://github.com/skywind3000/ECDICT,选用各类考试的词汇(除GRE、TOEFL,约5035个)
EN_PRESET_TOKENS = ["3s", "AIDS", "AM", "Africa", "African", "Alaska", "America", "American", "April", "Arab", "Arabian", "Arabic", "Asia", "Asian", "Athens", "Atlantic", "Australia", "Australian", "B.C.", "Belgium", "Berlin", "Birmingham", "Bristol", "Britain", "British", "Buddhism", "Buddhist", "CD", "CD-ROM", "Cambridge", "Canada", "Canadian", "China", "Chinese", "Christ", "Christmas", "December", "Dr", "Easter", "Egyptian", "England", "English", "Englishman", "Europe", "European", "FAX", "February", "France", "French", "Frenchman", "Friday", "German", "Germany", "God", "Greece", "Greek", "Iceland", "India", "Indian", "Ireland", "Irish", "Islam", "Italian", "Italy", "January", "Japan", "Japanese", "Jesus", "Jewish", "July", "June", "Latin", "London", "Malaysia", "Mars", "Marxism", "Marxist", "Mediterranean", "Melbourne", "Mexican", "Mexico", "Mister", "Monday", "Moscow", "Moslem", "Mr.", "Ms.", "North", "November", "OK", "Oceania", "October", "Olympic", "Ottawa", "Oxford", "P.M.", "PETS", "Paris", "Perks", "Portuguese", "Roman", "Russia", "Russian", "Saint", "Saturday", "Saturn", "Scotland", "Scottish", "September", "Shanghai", "Soviet", "Spain", "Spanish", "States", "Sunday", "Swiss", "Switzerland", "T-shirt", "TV", "Thursday", "Tibet", "Tokyo", "Tuesday", "Venus", "Wednesday", "abdomen", "ability", "able", "ably", "abortion", "about", "above", "accent", "accept", "acceptable", "acceptance", "accessary", "accident", "accidents", "accommodation", "accommodations", "accordance", "accordingly", "accountant", "accountants", "accuser", "ache", "aching", "across", "act", "action", "actions", "activities", "activity", "actor", "actress", "acy", "ad", "add", "ade", "adelphous", "adjective", "adjustable", "adolescence", "adult", "adults", "advantage", "advantageous", "advantages", "advantaging", "adverb", "advertisement", "advertisements", "advertising", "aemia", "aeroplane", "aerospace", "affair", "affairs", "afraid", "africans", "after", "afternoon", "afterward", "again", "against", "age", "agencies", "agency", "ago", "agogue", "agree", "agreement", "agricultural", "ahead", "aholic", "aid", "airline", "airmail", "airplane", "airport", "airspace", "aisle", "al", "alas", "album", "alcohol", "alcoholic", "algia", "alia", "alive", "all", "alley", "allied", "allow", "ally", "almost", "along", "alongside", "aloud", "alphabet", "already", "also", "although", "altogether", "always", "ambassador", "ambient", "ambiguities", "ambiguity", "ambulance", "amend", "amends", "amer", "americans", "amidst", "ammunition", "among", "amongst", "ampere", "amplifier", "ams", "amusement", "an", "analogue", "analyse", "analysing", "analyst", "analytic", "analytical", "ance", "ancient", "ancy", "and", "ane", "angel", "anger", "angrier", "angry", "animal", "animals", "ankle", "anniversaries", "anniversary", "annuities", "annuity", "anode", "another", "answer", "ant", "antibiotic", "antibiotics", "antisocial", "antonym", "any", "anybody", "anyhow", "anyone", "anything", "anyway", "anywhere", "apart", "apartment", "ape", "apes", "apologetic", "apologise", "apologising", "appal", "apparent", "appearance", "appendices", "appendix", "apple", "applied", "apply", "approach", "approaches", "ar", "arabians", "arabs", "arch", "archive", "archives", "archy", "ard", "are", "area", "areas", "argue", "arguing", "argument", "arian", "arm", "armchair", "armies", "armour", "army", "around", "arrival", "arrive", "arriving", "arrow", "art", "article", "articles", "artist", "artistic", "ary", "as", "ase", "ash", "ashamed", "ashore", "asians", "aside", "ask", "asleep", "aspirin", "ass", "assassination", "assignment", "assignments", "assimilation", "assurance", "ast", "aster", "astonishment", "astronaut", "at", "ate", "athletic", "athon", "ation", "ative", "atlas", "atmospheric", "ator", "attack", "attacks", "attempt", "attempts", "attent", "attentive", "attentively", "attitude", "audio", "aunt", "aural", "australians", "author", "auto", "automate", "automatically", "automating", "automobile", "autumn", "avail", "availabilities", "availability", "await", "awake", "awaking", "award", "away", "awesome", "awful", "awfully", "awoke", "awoken", "ax", "axial", "babble", "babied", "babies", "baby", "back", "backache", "bacon", "bad", "badly", "badminton", "bag", "bake", "bakeries", "bakery", "baking", "baldness", "ball", "ballpoint", "ballroom", "bamboo", "banana", "band", "bands", "bank", "banking", "barbershop", "barley", "baseball", "basically", "basis", "basket", "basketball", "bat", "bath", "bathe", "bathing", "bathrobe", "bathroom", "bathtub", "battleground", "be", "beach", "beancurd", "bear", "beat", "beats", "beauties", "beautiful", "beauty", "became", "because", "become", "becoming", "bed", "bedclothe", "bedclothes", "beddings", "bedroom", "beds", "bedsit", "bee", "beef", "beehive", "beer", "beetle", "beetling", "before", "began", "beggar", "begin", "beginner", "beginners", "beginning", "begun", "behind", "being", "believe", "believing", "bell", "bellied", "bellies", "belly", "beloved", "belt", "belts", "benefit", "benefits", "berried", "berries", "berry", "berth", "beside", "best", "bet", "better", "between", "beware", "bewaring", "beyond", "bias", "biased", "bible", "bicycle", "bicycles", "bicycling", "big", "bike", "biking", "bingo", "biological", "biology", "biosis", "biotech", "biotic", "bird", "birdcage", "birds", "birth", "birthday", "birthplace", "biscuit", "bishop", "bitterly", "bitumen", "black", "blackboard", "blank", "blast", "blastic", "bless", "blind", "bloc", "block", "blocks", "blond", "blonde", "blood", "bloodied", "bloodies", "bloodiest", "bloody", "blot", "blouse", "blousing", "bluntly", "boat", "boating", "bodied", "bodies", "body", "boiler", "bomb", "bone", "bones", "boning", "book", "bookcase", "booking", "bookkeeper", "booklet", "booklist", "bookmark", "books", "bookshelf", "bookshop", "bookstore", "boot", "booth", "boots", "bored", "born", "borrow", "bosom", "boss", "both", "bother", "bottle", "bottling", "bottom", "bought", "bounties", "bounty", "bowel", "bowl", "bowling", "bowls", "box", "boxing", "boy", "branch", "brandies", "brandy", "brave", "bravery", "braving", "bread", "break", "breakfast", "breakthrough", "breast", "breed", "breeding", "breweries", "brewery", "bride", "bridegroom", "bridge", "bridging", "briefcase", "bright", "brightness", "brilliant", "bring", "broad", "brochure", "brochures", "broke", "broken", "broom", "brother", "brotherhood", "brothers", "brought", "brow", "brunch", "brush", "buddhists", "buffalo", "buffet", "bug", "build", "building", "buildings", "built", "bull", "bullet", "bulletin", "bumper", "bun", "bungalow", "bunk", "bureau", "bureaucratic", "burger", "buried", "buries", "burn", "burner", "bury", "bus", "bushel", "busied", "busier", "busies", "busiest", "business", "businessman", "businessmen", "businesswoman", "businesswomen", "busting", "busy", "but", "butcher", "button", "buy", "by", "bye", "bypass", "cabbage", "cabbaging", "cafe", "cafeteria", "cage", "cages", "caging", "cake", "caking", "call", "came", "camera", "canadians", "cance", "cancer", "candied", "candies", "candle", "candles", "candling", "candy", "cannon", "canteen", "capacitance", "capacitor", "capital", "capitalism", "captain", "captive", "car", "carcase", "carcasing", "card", "cardium", "cards", "care", "caring", "carpet", "carried", "carrier", "carries", "carrot", "carry", "carton", "cartridge", "case", "cash", "cashier", "casing", "castle", "castling", "cat", "catalogue", "cataloguing", "catch", "cater", "catering", "cattle", "caught", "cause", "causes", "cave", "caves", "caving", "cd-roms", "cds", "cele", "celebration", "cene", "cent", "centenaries", "centenary", "center", "centimetre", "central", "centralize", "centralizing", "centre", "centric", "centring", "centuries", "century", "cercal", "certain", "certainly", "certificate", "certificates", "certificating", "certified", "certifies", "certify", "chain", "chair", "chairman", "chairmen", "chairwoman", "chairwomen", "challenge", "challenging", "champagne", "change", "changeable", "changing", "chap", "chapter", "charge", "charges", "charm", "charming", "chatter", "cheap", "cheaper", "cheat", "check", "checks", "cheek", "cheer", "cheerful", "cheers", "cheese", "cheesing", "chemical", "chemist", "chemistry", "cheque", "cherries", "cherry", "chess", "chestnut", "chew", "chick", "chicken", "chicks", "child", "childcare", "childhood", "childish", "children", "chimney", "chin", "chip", "chips", "chocolate", "choice", "choices", "chopstick", "chopsticks", "chrome", "chronicle", "chronicling", "church", "cidal", "cide", "cigar", "cigaret", "cigarette", "cinema", "circus", "cities", "citizen", "city", "civilize", "civilizing", "class", "classic", "classical", "classmate", "classmates", "classroom", "clatter", "clean", "cleaner", "cleaning", "cleanliness", "clear", "clearance", "clearing", "clearly", "clever", "cliche", "click", "client", "clients", "climb", "cline", "clinic", "cloak", "cloathing", "clock", "clone", "cloning", "close-up", "closely", "cloth", "clothe", "clothes", "cloud", "cloudier", "cloudy", "club", "clubs", "co-operation", "co-operative", "coal", "coast", "coastal", "cocaine", "coccus", "cock", "cocktail", "cocoa", "coeducation", "coefficient", "coele", "coffee", "coffin", "coke", "coking", "cola", "cold", "colleague", "colleagues", "collect", "college", "colleges", "colonist", "color", "colour", "colous", "column", "comb", "come", "comfort", "comfortable", "coming", "command", "commercial", "commercials", "common", "commonly", "communism", "communist", "companies", "company", "compatibilities", "compatibility", "competitive", "competitor", "completely", "completion", "composite", "computer", "computers", "comrade", "concentrate", "concentrated", "concentration", "concern", "concession", "concessions", "conclusion", "condition", "conditions", "condolence", "confrontation", "congratulate", "congratulating", "conqueror", "consultancies", "consultancy", "contact", "contacts", "contaminant", "contaminants", "content", "contents", "contingencies", "contingency", "continue", "continuing", "contract", "contracts", "contradiction", "contribution", "conversely", "cook", "cooker", "cookie", "cooking", "cool", "cop", "copyright", "cordless", "cork", "corner", "corporation", "correction", "correctly", "correlation", "cosied", "cosier", "cosies", "cosiest", "cost", "costlier", "costliest", "costly", "costs", "cosy", "cot", "cottage", "couch", "cough", "could", "council", "count", "counter", "counties", "countries", "country", "countryside", "county", "coupon", "courage", "courageous", "course", "coursing", "courtesies", "courtesy", "courtyard", "cousin", "cracy", "cradle", "cradling", "cram", "cramming", "crane", "craning", "crank", "crat", "cratic", "cream", "create", "creating", "creation", "creative", "creature", "cricket", "cried", "cries", "crime", "criminal", "crises", "crisis", "criticism", "criticize", "criticizing", "crocodile", "crop", "crops", "crossroads", "crowd", "crowded", "cruelties", "cruelty", "cruise", "cruising", "cry", "cuckoo", "cultural", "culus", "cumulative", "cup", "cups", "curative", "curl", "curlier", "curlies", "curliest", "curly", "curse", "cursing", "curtain", "curtains", "customer", "customers", "cut", "cute", "cutter", "cutting", "cy", "cyberspace", "cycle", "cycling", "cyclist", "cyte", "dad", "dailies", "daily", "damage", "damages", "damaging", "dance", "dancer", "dancing", "danger", "dare", "daring", "dark", "darkness", "darling", "dash", "data", "database", "datum", "daughter", "day", "daylight", "daytime", "deadline", "deaf", "deafen", "dean", "dear", "death", "decade", "decidedly", "decision", "decisive", "decoration", "decorations", "dedicate", "dedicated", "deep", "deepen", "deeply", "deer", "defence", "define", "defining", "deflate", "deflating", "deflection", "degree", "delegation", "delight", "delighted", "deliver", "deliveries", "delivery", "democratic", "denial", "department", "departmental", "depend", "dependant", "depletion", "deploy", "depth", "derm", "dermatous", "describe", "describing", "description", "desk", "despair", "despite", "destroy", "detail", "detailed", "details", "detector", "development", "devil", "dew", "diagnostic", "dial", "dialog", "diamond", "diaries", "diary", "dictation", "dictionaries", "dictionary", "did", "die", "diesel", "differ", "difference", "different", "difficult", "difficulties", "difficulty", "dig", "digital", "dimensional", "dine", "dining", "dinner", "dip", "diploma", "diplomas", "diplomat", "direction", "directly", "director", "directories", "directory", "dirt", "dirtied", "dirtier", "dirties", "dirtiest", "dirty", "disabilities", "disability", "disable", "disabled", "disabling", "disagree", "disagreement", "disappear", "disappearance", "disappoint", "disapprove", "disapproving", "disc", "disco", "discover", "discoveries", "discovery", "discuss", "discussion", "disease", "diseases", "disgust", "disgusting", "dish", "dishes", "dishonour", "disillusion", "disillusioned", "disk", "dislike", "disliking", "disobedience", "disobey", "disorder", "disorient", "displease", "displeasing", "dispute", "disputes", "dissatisfaction", "dissatisfied", "dissatisfier", "dissatisfies", "dissatisfy", "disservice", "distil", "distraction", "disturb", "disturbing", "dive", "dividend", "do", "doctor", "doctorate", "doctors", "document", "documents", "doe", "does", "dog", "dole", "doling", "dollar", "dom", "donation", "donations", "donkey", "door", "doors", "doorway", "dorm", "double", "doubling", "doubtless", "dove", "doving", "download", "downstairs", "downturn", "downward", "dozen", "dp", "dragon", "drank", "draw", "draws", "dream", "dress", "dressing", "dried", "drier", "dries", "driest", "drink", "drinking", "drinks", "drive", "driver", "driving", "drome", "dromous", "drop", "drop-off", "drop-out", "dropout", "drove", "drown", "drowse", "drowsiness", "drowsing", "drug", "drugs", "drum", "drunk", "dry", "dub", "duck", "dug", "duke", "dully", "duly", "dumpling", "during", "dusk", "dust", "dustbin", "dustier", "dusty", "duties", "duty", "dvd", "dying", "dynamical", "dynasties", "dynasty", "dynia", "each", "eagle", "eagling", "ean", "ear", "earlier", "earliest", "early", "earn", "earnings", "earth", "ease", "easier", "easiest", "easily", "easing", "east", "eastern", "easters", "eastward", "eastwards", "easy", "eat", "economically", "economies", "economy", "ectomy", "ed", "edit", "edition", "editor", "editorial", "educate", "educating", "educational", "educator", "ee", "eer", "effect", "effectively", "effects", "effort", "egg", "eggplant", "ego", "egyptians", "eight", "eighteen", "eighth", "eighty", "either", "eke", "elastic", "elder", "elderly", "elect", "electric", "electrical", "electrician", "electricity", "electrode", "electronic", "electronics", "element", "elemental", "elements", "elephant", "eleven", "else", "elsewhere", "email", "embark", "embassies", "embassy", "eme", "emergencies", "emergency", "emperor", "empire", "employee", "employees", "employment", "en", "enabled", "ence", "encouragement", "ency", "end", "ending", "ene", "enemies", "enemy", "energies", "energy", "enforce", "enforcing", "engagement", "engine", "engineer", "engineering", "engineers", "englishmen", "enjoy", "enjoyable", "enlarge", "enlarging", "enough", "enquire", "enquiries", "enquiring", "enquiry", "enrollment", "enrolment", "ent", "enter", "enthusiastic", "entire", "envelope", "envied", "envies", "envious", "environment", "environmental", "envy", "equipe", "er", "eraser", "ergic", "ery", "es", "escence", "escent", "ese", "especially", "esque", "ess", "essay", "est", "establish", "establishment", "esthetic", "et", "ethical", "ette", "europeans", "eve", "even", "evening", "event", "ever", "every", "everybody", "everyday", "everyone", "everything", "everywhere", "evil", "exactly", "exam", "examination", "examine", "examining", "example", "examples", "exams", "exceedingly", "except", "excessively", "excrement", "exempt", "exercise", "exercising", "exist", "existence", "existent", "existing", "expect", "expectancies", "expectancy", "expectation", "expense", "expenses", "expensive", "experience", "experiencing", "experiment", "experimental", "experimentally", "experimentation", "experiments", "expert", "explain", "explanation", "explosion", "export", "express", "expression", "extra", "extraction", "extracurricular", "extraordinarily", "extreme", "extremely", "ey", "eye", "eyebrow", "eyesight", "fabrication", "faced", "facial", "facient", "fact", "faction", "factive", "factor", "factories", "factors", "factory", "fail", "failure", "fairies", "fairness", "fairy", "falcon", "falcons", "fall", "false", "familiar", "families", "family", "famous", "fan", "far", "fare", "faring", "farm", "farmer", "farmers", "farming", "farms", "farther", "fastener", "fat", "fate", "father", "father-in-law", "fating", "faultless", "faulty", "favor", "favorite", "favour", "favourable", "favourite", "faxed", "faxes", "faxing", "fear", "fearful", "fearless", "feast", "feather", "feature", "features", "federation", "fee", "feel", "feeling", "fees", "feet", "fell", "fellow", "fellowship", "felt", "female", "feminine", "fence", "fencing", "fend", "fer", "ferous", "ferries", "ferry", "fest", "fetch", "fever", "few", "fibre", "fic", "fication", "field", "fifteen", "fifth", "fifty", "fight", "fighter", "figure", "figures", "fill", "film", "filmed", "finally", "find", "finding", "finely", "finger", "fingernail", "fingers", "fire", "firefighter", "fireman", "firemen", "fireplace", "firewood", "firework", "firing", "firm", "firmly", "firmness", "firms", "first", "first-aid", "first-rate", "fish", "fisherman", "fishermen", "fishing", "fission", "fisted", "five", "fix", "flame", "flaming", "flank", "flat", "flats", "flesh", "flew", "flies", "fling", "floor", "floors", "flourishment", "flow", "flower", "flowers", "flown", "flu", "fluency", "fluff", "flung", "fly", "flyover", "fold", "follow", "follower", "following", "fond", "food", "fool", "foot", "football", "footstep", "for", "forbes", "force", "forcing", "fore", "forehead", "foreign", "foreigner", "foreseeable", "forest", "forever", "forgave", "forget", "forgetful", "forgive", "forgiving", "forgot", "forgotten", "fork", "form", "forms", "formulation", "forthcoming", "fortnight", "fortunately", "forty", "fossil", "fossils", "fought", "found", "foundation", "founding", "four", "fourteen", "fourth", "fox", "franc", "free", "freedom", "freely", "freeway", "freeze", "freezing", "frenchmen", "frequently", "fresh", "freshen", "fridays", "fridge", "fried", "friend", "friendlier", "friendlies", "friendliest", "friendly", "friendship", "fries", "frighten", "frightful", "fro", "frock", "frog", "from", "front", "froze", "frozen", "fruit", "fry", "fuge", "ful", "fulfill", "full", "full-time", "fun", "function", "fund-raise", "fund-raising", "funeral", "funnier", "funnies", "funniest", "funny", "furnish", "furnished", "further", "furthermore", "furthest", "future", "fy", "gaily", "gain", "game", "gamic", "gaming", "gamous", "gamy", "gang", "gaol", "garage", "garaging", "garden", "gardener", "gardening", "garlic", "gas", "gate", "gather", "gathering", "gating", "gave", "gay", "geese", "gen", "gender", "genealogist", "genetic", "genic", "genous", "gentleman", "gentlemen", "gently", "geny", "geographical", "geographies", "geography", "geologies", "geology", "geometrical", "germans", "get", "ghost", "gift", "giraffe", "girl", "girlfriend", "give", "giving", "glad", "glamor", "glass", "glasshouse", "globe", "gloried", "glories", "glory", "glove", "gloving", "gnathous", "go", "goal", "goals", "goat", "goddess", "gods", "gold", "golden", "goldfish", "golf", "gon", "gonium", "gony", "good", "goodby", "goodbye", "goodness", "goods", "goose", "goosing", "got", "government", "governments", "gown", "grade", "grading", "gradual", "gradually", "graduate", "graduates", "graduation", "gram", "grammar", "grammatical", "gramme", "gramophone", "grandchild", "granddaughter", "grandfather", "grandma", "grandmother", "grandpa", "grandparent", "grandparents", "grandson", "grannies", "granny", "grant", "grants", "granular", "grape", "graph", "graphic", "graphical", "graphy", "grass", "grassier", "grassies", "grassiest", "grassy", "gray", "great", "greatly", "greed", "greeks", "greengrocer", "greet", "greeting", "grew", "grey", "grid", "grind", "grinding", "grinds", "grocer", "groceries", "grocery", "ground", "group", "groups", "grow", "growth", "gruel", "grunt", "guard", "guardian", "guess", "guest", "guests", "guidance", "guide", "guideline", "guiding", "guild", "guitar", "gun", "gunpowder", "gut", "gym", "gymnasium", "gynous", "gyny", "ha", "habit", "habits", "habitual", "had", "hair", "haircut", "half", "halve", "halves", "halving", "hand", "handbag", "handball", "handbook", "handkerchief", "handle", "handling", "handout", "handsome", "handtruck", "handwriting", "happen", "happier", "happiest", "happily", "happiness", "happy", "harassment", "harbour", "hard", "hard-work", "hard-working", "hardworking", "hare", "haring", "has", "hat", "hate", "hateful", "hating", "hats", "have", "having", "he", "head", "headache", "heading", "headline", "headlining", "headmaster", "headmistress", "headteacher", "health", "healthcare", "healthier", "healthiest", "healthy", "heap", "hear", "hearing", "heart", "heartbeat", "hearth", "heartier", "hearties", "heartiest", "hearty", "heat", "heater", "heating", "heavier", "heavies", "heaviest", "heavily", "heavy", "helicopter", "hell", "hello", "help", "helpline", "hen", "henceforth", "hens", "her", "here", "hero", "heroic", "heroin", "heroine", "hers", "herself", "hey", "hi", "high", "high-rise", "higher", "highland", "highly", "highway", "hijack", "hill", "hillside", "him", "himself", "hindrance", "hint", "hints", "hip", "hire", "hiring", "his", "historian", "historic", "historical", "histories", "history", "hit", "hitchhike", "hitchhiking", "hits", "hobbies", "hobby", "holder", "hole", "holiday", "holier", "holies", "holiest", "holing", "holy", "home", "homeland", "hometown", "homework", "homing", "honest", "honesty", "honey", "honeymoon", "honied", "honorable", "honored", "honour", "honourable", "hood", "hooray", "hop", "hope", "hopeful", "hopeless", "hoping", "horrible", "horse", "horses", "horsing", "hose", "hosing", "hospital", "hospitalities", "hospitality", "host", "hostage", "hostess", "hot", "hotdog", "hotel", "hound", "hour", "house", "household", "households", "housekeeping", "housewife", "housewives", "housework", "housing", "how", "however", "hug", "huge", "hum", "human", "humans", "humiliation", "humour", "hundred", "hungrier", "hungriest", "hungry", "hunt", "hunter", "hunting", "hurrah", "hurried", "hurries", "hurry", "hurt", "hydraulic", "hydric", "hydrocarbon", "hypocrisies", "hypocrisy", "hypotheses", "hypothesis", "hysterical", "i.e.", "ia", "ial", "ian", "iasis", "iatric", "iatrics", "iatry", "ibility", "ible", "ibly", "ic", "ical", "ically", "ice", "ice-cream", "icelands", "ician", "icier", "icing", "ics", "icy", "id", "idae", "ide", "idea", "idealism", "ideally", "ideas", "identities", "identity", "idium", "idleness", "ie", "ier", "if", "iferous", "iform", "ify", "ile", "ill", "illness", "imagination", "import", "importance", "important", "imports", "impossible", "impress", "imprison", "improper", "improve", "improvement", "improving", "in", "inaccurate", "inae", "inapt", "inasmuch", "incapable", "incher", "incline", "inclining", "include", "including", "income", "incoming", "incomplete", "incorrect", "increase", "increasing", "increasingly", "indeed", "independence", "index", "indians", "indication", "indicator", "indices", "indirect", "indoor", "indoors", "industrialize", "industrializing", "industries", "industry", "ine", "inefficient", "inexpensive", "inference", "inferencing", "infinite", "infinitely", "influence", "influencing", "inform", "information", "infrared", "infrastructure", "ing", "ink", "inlet", "inn", "innovate", "innovating", "inorganic", "input", "inquire", "inquiries", "inquiring", "inquiry", "insect", "insects", "inside", "insightful", "insistent", "insolvent", "instabilities", "instability", "installation", "instalment", "instance", "instancing", "instantly", "instead", "institute", "institutes", "institution", "institutions", "instructor", "instructors", "instrument", "instruments", "insulator", "insurance", "insure", "insuring", "intake", "intellectually", "intend", "intensities", "intensity", "interconnect", "intercourse", "interesting", "interface", "international", "internet", "interpreter", "interruption", "interview", "interviewee", "interviewer", "interviews", "into", "intonation", "introduce", "introducing", "introduction", "intrusive", "invent", "invention", "inventor", "inversely", "invest", "investigator", "investigators", "investment", "invincible", "invisible", "invitation", "invite", "inviting", "inward", "ion", "ious", "iron", "ironically", "irregularities", "irregularity", "irrespective", "is", "ise", "ish", "ising", "island", "isle", "ism", "issue", "issues", "ist", "ista", "it", "italians", "ite", "item", "items", "ition", "itious", "itis", "itol", "its", "itself", "ity", "ium", "ive", "ization", "ize", "jack", "jacket", "jail", "jam", "janitor", "japanned", "japanning", "japans", "jean", "jeans", "jeep", "jet", "jewellery", "jingle", "jingling", "job", "jobs", "joint", "joke", "joking", "journey", "joy", "joyful", "judge", "judging", "juggle", "juggling", "jump", "junior", "junk", "just", "keep", "keeper", "kelp", "kept", "key", "keys", "keyword", "keywords", "kick", "kid", "kids", "kill", "killer", "kilo", "kilogram", "kilograms", "kilometer", "kilometre", "kilowatt", "kin", "kind", "kindergarten", "kindness", "kinesis", "king", "kins", "kinship", "kiss", "kit", "kite", "kiting", "kits", "knee", "kneel", "knelt", "knew", "knife", "knifing", "knight", "knives", "knob", "knock", "knot", "know", "knowledge", "lab", "labor", "labour", "labourer", "lack", "lad", "ladder", "laded", "laden", "lades", "ladies", "lading", "lady", "lain", "lake", "lakes", "lamb", "lame", "lamentation", "laming", "landladies", "landlady", "landlord", "lane", "language", "lantern", "laptop", "large", "last", "late", "later", "latest", "latins", "latry", "laugh", "laughter", "lavatories", "lavatory", "law", "lawyer", "lax", "lay", "layoff", "lazier", "laziest", "lazy", "leader", "leaf", "leaflet", "learn", "learned", "learning", "least", "leave", "leaved", "leaves", "leaving", "lecture", "lecturing", "left", "leftover", "leg", "lemon", "lemonade", "lend", "lender", "length", "lent", "leprosy", "lepsy", "less", "lessen", "lessness", "lesson", "lessons", "lest", "let", "letter", "level", "levels", "leverage", "leveraging", "liable", "liar", "liberation", "libraries", "library", "licence", "licencing", "lick", "lid", "lie", "lieutenant", "life", "lifestyle", "lifetime", "light", "lighten", "lighter", "lightly", "lightning", "lights", "like", "likeliest", "likelihood", "likely", "likeness", "liking", "lilies", "lily", "lime", "liming", "limit", "line", "liner", "ling", "lings", "lining", "link", "lion", "lions", "lipstick", "liquor", "listen", "listener", "lit", "lite", "liter", "literature", "lith", "lithic", "litre", "little", "live", "lived", "livered", "lives", "living", "living-room", "load", "loan", "loans", "local", "location", "locations", "lock", "locker", "log", "logic", "logical", "logist", "logue", "logy", "lonelier", "loneliest", "lonely", "look", "lord", "lorries", "lorry", "lose", "losing", "loss", "lost", "loth", "loud", "loudly", "loudspeaker", "love", "lovelier", "lovelies", "loveliest", "lovely", "lover", "loving", "low", "low-risk", "lower", "loyalties", "loyalty", "luck", "luckier", "luckiest", "lucky", "luggage", "lunch", "luncheon", "ly", "lying", "lysis", "lyte", "lytic", "lyze", "machine", "machineries", "machinery", "machines", "machining", "mad", "madam", "madame", "madden", "made", "magazine", "magistrate", "magnet", "maid", "maiden", "mail", "mailbox", "mails", "main", "mainland", "mainly", "major", "majors", "make", "making", "malacia", "malaria", "male", "maltreat", "man", "manage", "management", "manager", "managerial", "managing", "mancy", "mania", "maniac", "mankind", "manlier", "manliest", "manly", "manner", "manship", "manufacturer", "many", "mar", "marathon", "mark", "market", "marketing", "marks", "marriage", "married", "marries", "marry", "marvellous", "marxisms", "marxists", "mas", "masculine", "masculinities", "masculinity", "master", "mastery", "mastia", "mat", "material", "materialism", "materials", "maternities", "maternity", "math", "mathematic", "mathematical", "maths", "matrimony", "matter", "maturation", "max", "may", "maybe", "mayor", "mazia", "me", "meadow", "meagre", "meal", "meals", "mean", "meaning", "meantime", "meanwhile", "measurable", "measure", "measurement", "measurements", "measuring", "meat", "mechanic", "mechanically", "medical", "meet", "meeting", "megaly", "meister", "melt", "member", "membership", "memorise", "memorising", "men", "ment", "mentalities", "mentality", "mentally", "mercies", "mercy", "mere", "merely", "meric", "merism", "merous", "merrier", "merriest", "merry", "mess", "message", "messaging", "messenger", "metal", "metallic", "meter", "method", "methods", "metre", "metric", "metrical", "metry", "mexicans", "mice", "microbiology", "microcomputer", "microfilm", "microphone", "microprocessor", "mid", "midday", "middle", "middling", "midmorning", "midnight", "midst", "might", "mildew", "mile", "mileage", "miles", "milky", "mill", "millimetre", "million", "mills", "mind", "mine", "miner", "minibus", "mining", "miniskirt", "minister", "minor", "minus", "mirror", "miscarriage", "mischance", "mischief", "misconceive", "misconceiving", "misdeed", "miss", "missing", "missionaries", "missionary", "mist", "mistake", "mistaken", "mistaking", "mistook", "mistress", "misunderstand", "misunderstood", "misuse", "misusing", "mix", "mixer", "mixture", "mm", "mo", "mob", "mobilize", "mobilizing", "model", "moderately", "modern", "modernization", "modesties", "modesty", "modification", "module", "mom", "momentary", "mondays", "money", "monk", "monkey", "month", "monthlies", "monthly", "moon", "mop", "moralities", "morality", "more", "moreover", "morning", "morph", "morphic", "morphous", "morphy", "moslems", "most", "motel", "mother", "motherland", "motor", "motorbike", "motorbiking", "motorcycle", "motorcycling", "motorway", "mould", "mount", "mountain", "mouse", "mousing", "moustache", "mouthful", "move", "movie", "movies", "moving", "much", "mucous", "mug", "multilateral", "multiplication", "murder", "murderer", "muscle", "muscles", "museum", "music", "musical", "musician", "must", "mustard", "my", "myself", "name", "namely", "naming", "nap", "napkin", "narrate", "narrating", "nastier", "nasties", "nastiest", "nasty", "nation", "national", "nationalities", "nationality", "native", "naturally", "nature", "naught", "naut", "nave", "navies", "navigable", "navy", "nd", "near", "nearby", "necessaries", "necessarily", "necessary", "necessitate", "necessitating", "necklace", "necklacing", "necktie", "need", "needless", "negro", "neighbore", "neighborhood", "neighboring", "neighbour", "neighbourhood", "neighbouring", "neither", "nephew", "nese", "ness", "nest", "net", "nets", "network", "neurotic", "never", "nevertheless", "new", "newly", "news", "newspaper", "newspapers", "next", "niece", "night", "nik", "nine", "nineteen", "ninety", "ninth", "no", "no.", "nobilities", "nobility", "noble", "nobodies", "nobody", "noise", "noisily", "noising", "nomial", "nomics", "nomy", "non-drinker", "none", "noodle", "noodling", "noon", "nor", "normalization", "northeast", "northern", "northward", "northwards", "northwest", "nose", "nosing", "not", "notaries", "notary", "note", "notebook", "notes", "noteworthy", "nothing", "noticeable", "notification", "notified", "notifies", "notify", "nought", "noun", "novelist", "now", "nowhere", "nuisance", "numb", "number", "numbs", "nun", "nurse", "nurseries", "nursery", "nursing", "nut", "nuts", "nylon", "obey", "object", "objective", "objectives", "oblong", "observer", "obviously", "occupant", "occupants", "occupational", "ocean", "ock", "ocrat", "ocratic", "ocular", "ode", "odinic", "odon", "odont", "odour", "odynia", "oecious", "of", "off", "offence", "office", "officer", "often", "ographer", "oh", "ohm", "oholic", "ohp", "oic", "oid", "oil", "oilfield", "okay", "ol", "ola", "olatrist", "olatry", "old", "ole", "olive", "ological", "ologist", "ology", "olus", "olympics", "oma", "ome", "omelette", "omen", "ometry", "on", "once", "one", "oneself", "onion", "online", "onlooker", "only", "ont", "onto", "onward", "onwards", "onym", "onymic", "open", "open-book", "opener", "opening", "operation", "operational", "opia", "opic", "opium", "opportunities", "opportunity", "ops", "opsia", "opsis", "opsy", "opt", "optic", "optics", "optimize", "optimizing", "option", "options", "opy", "or", "orange", "order", "ordinaries", "ordinarily", "ordinary", "organ", "organise", "organiser", "organising", "organization", "organize", "organizer", "organizing", "orial", "orium", "orphan", "ory", "ose", "oses", "osis", "other", "otherwise", "otic", "ouch", "ought", "our", "ours", "ourselves", "ous", "out", "outcast", "outdid", "outdo", "outdoor", "outer", "outlaw", "outside", "outskirt", "outwards", "over", "overcoat", "overhang", "overhead", "overhear", "overhung", "overnight", "overpass", "overran", "overrun", "overseas", "overtake", "overtaking", "overtook", "overweight", "overwhelm", "overwhelming", "owe", "owing", "own", "owner", "ownership", "ox", "oxide", "oxyl", "pacific", "packet", "pad", "page", "pages", "paging", "paid", "pail", "pain", "painful", "paint", "painter", "pair", "pal", "palace", "palm", "pancake", "panda", "pant", "paper", "paperback", "papers", "paperwork", "paradise", "paradoxical", "paradoxically", "paragraph", "paralyse", "paralysing", "paraphernalia", "parcel", "pardon", "parent", "parental", "parents", "park", "parking", "parliament", "parlor", "part", "part-time", "parter", "participant", "participants", "particularly", "parties", "partly", "partner", "party", "pass", "passenger", "passengers", "passerby", "passport", "past", "paste", "pastime", "pasting", "pat", "paternal", "paternity", "path", "pathia", "pathic", "pathy", "patient", "patients", "patric", "patry", "pattern", "patterns", "pause", "pausing", "pavement", "paw", "pay", "payable", "payoff", "pd", "pea", "peace", "peaceful", "peach", "peacock", "peanut", "pear", "peasant", "peasants", "ped", "pedlar", "pence", "pencil", "penia", "pennies", "penny", "people", "peopling", "pepper", "per", "percent", "perceptible", "perceptual", "perfectly", "perhaps", "periodically", "perk", "permanently", "perplexities", "perplexity", "person", "personal", "personally", "persuasion", "pessimistic", "pet", "petrol", "phagous", "phane", "pharmacies", "pharmacy", "phasia", "phd", "philanthropies", "philanthropy", "phile", "philia", "philiac", "philic", "philism", "philous", "phobe", "phobia", "phobic", "phone", "phone-in", "phonia", "phoning", "phony", "phore", "phoresis", "photo", "photocopied", "photocopies", "photocopy", "photoelectric", "photograph", "photographer", "photographic", "photographs", "photography", "photojournalism", "photos", "phrenia", "phyll", "phyllous", "physical", "physically", "physics", "physique", "phyte", "phytic", "pick", "pickle", "pickling", "pickup", "picnic", "picture", "pictures", "picturing", "pie", "piece", "piecing", "pieties", "piety", "pig", "pill", "pills", "pimple", "pin", "pink", "pint", "pipe", "pipeline", "pipelining", "piping", "piracies", "piracy", "piston", "pitied", "pities", "pity", "placard", "place", "placement", "places", "placing", "plan", "planetarium", "planner", "planners", "planning", "plant", "planting", "plants", "plasia", "plasm", "plast", "plasty", "plasy", "play", "player", "playground", "playmate", "playroom", "pleasant", "please", "pleased", "pleasing", "plegia", "plenty", "ples", "ploid", "plug", "plural", "plus", "plutocrat", "pnea", "pneumatic", "pneumonia", "pocket", "podium", "poem", "poetry", "poiesis", "poietic", "point", "pointed", "pointless", "police", "policeman", "policemen", "policies", "policing", "policy", "polite", "politic", "political", "politician", "polymer", "pond", "poo", "pool", "poor", "pop", "pope", "population", "porch", "pork", "port", "porter", "position", "positions", "positively", "possibilities", "possibility", "possible", "possibly", "postbox", "postcode", "postcoding", "postman", "postmen", "potato", "potion", "pounce", "pouncing", "pound", "pounds", "pour", "power", "powerful", "practice", "practicing", "practise", "practising", "pray", "prayer", "precaution", "precautions", "precedence", "prefer", "pregnancies", "pregnancy", "premier", "preparation", "prepare", "preparing", "present", "presently", "preset", "president", "prettier", "prettiest", "pretty", "prevalence", "prevention", "previously", "price", "pricing", "priest", "primarily", "prince", "princess", "principally", "print", "printed", "printer", "printing", "priorities", "priority", "prism", "prisoner", "privacies", "privacy", "prize", "prizes", "prizing", "probabilities", "probability", "probable", "probably", "probation", "problem", "problems", "process", "processing", "producer", "product", "production", "products", "profession", "professions", "professor", "profit", "profitable", "profits", "program", "programme", "programming", "programs", "prohibition", "promotion", "promptly", "pronoun", "pronounce", "pronouncing", "pronunciation", "propaganda", "properly", "proportional", "prosecutor", "prospectus", "protect", "protective", "protend", "proton", "proud", "prove", "proverb", "provide", "provided", "proving", "provost", "psychiatric", "psychiatry", "psycholinguistic", "psycholinguistics", "psychological", "pterygian", "pterygious", "pub", "public", "publicly", "publish", "pudding", "puff", "punctuate", "punctuating", "punctuation", "punish", "punishment", "puppet", "puppies", "puppy", "pure", "purely", "purest", "purpose", "purposing", "pursuit", "push", "put", "puzzle", "puzzled", "pyjamas", "quake", "quaking", "qualification", "qualifications", "qualitative", "quantified", "quantifies", "quantify", "quarrel", "quart", "quarterth", "queen", "question", "questions", "quick", "quicken", "quiet", "quit", "quite", "quiz", "rabbit", "racial", "racket", "radial", "radiator", "radio", "radioactive", "radioactivities", "radioactivity", "radish", "radium", "railroad", "railway", "rain", "raincoat", "rainforest", "rainiest", "rainwater", "rainy", "rake", "raking", "ran", "rape", "rapid", "rapidity", "rapidly", "raping", "rash", "rate", "rather", "rating", "reach", "reaction", "reactor", "read", "reader", "readers", "reading", "real", "realise", "realising", "realistic", "realities", "reality", "really", "reason", "reasonable", "reasoning", "reasons", "reassurance", "receive", "receiving", "recite", "reciting", "recognise", "recognising", "recollect", "record", "recorder", "records", "recoveries", "recovery", "recruitment", "recurrence", "recurrent", "recycle", "recycled", "recycling", "red", "referee", "referees", "reference", "referencing", "referendum", "reflectance", "reflexion", "refreshment", "refreshments", "refusal", "regard", "regarding", "regards", "regenerative", "region", "registrar", "registration", "regret", "regularities", "regularity", "regularly", "regulation", "regulations", "reinforce", "reinforced", "relate", "related", "relation", "relations", "relationship", "relative", "relatively", "relativities", "relativity", "remain", "remember", "removal", "repaid", "repair", "repairs", "repay", "repeatedly", "replacement", "replied", "replies", "reply", "report", "reporter", "reports", "repression", "repressive", "republican", "require", "requiring", "research", "researcher", "reservation", "reservior", "resident", "residents", "resign", "resist", "resource", "resources", "respectable", "respectful", "respondent", "respondents", "rest", "restaurant", "restaurants", "result", "resultant", "results", "retail", "retails", "retell", "retold", "retrospection", "return", "reunion", "reuse", "reusing", "reverent", "reviewer", "revolve", "revolving", "rewind", "rewrite", "rewriting", "rewritten", "rewrote", "rice", "rich", "ricing", "ridden", "ride", "rider", "riders", "riding", "rific", "right", "righteous", "rightist", "rigour", "rise", "rising", "risk", "risks", "river", "rivers", "road", "rob", "robber", "robberies", "robbery", "robot", "robots", "rock", "rocket", "rocks", "rode", "roller", "romans", "romantic", "room", "roommate", "root", "rose", "rotaries", "rotary", "round", "rouse", "rousing", "route", "routing", "row", "rows", "royal", "rrhagia", "rrhea", "rrhoea", "rubber", "rubies", "ruby", "rude", "rug", "rugby", "rule", "ruler", "rules", "rumour", "run", "runner", "running", "russians", "rut", "ry", "s3", "sad", "sadly", "sadness", "safari", "safely", "safety", "said", "sail", "sailing", "sailor", "sainted", "sainting", "saints", "salad", "salaries", "salary", "sales", "salesgirl", "salesman", "salesmen", "saleswoman", "saleswomen", "salt", "saltier", "salty", "salvation", "same", "sand", "sandwich", "sang", "sardine", "sat", "satisfactorily", "saturation", "saturdays", "sauce", "saucing", "sausage", "save", "saving", "saw", "say", "saying", "scape", "schoolbag", "schoolmate", "science", "scientific", "scientist", "scientists", "scold", "scope", "scopy", "score", "scores", "scotsman", "scotsmen", "scottish", "scream", "scum", "sea", "seafood", "seagull", "seaman", "seamen", "seashell", "seaside", "seat", "seats", "second", "second-hand", "secondhand", "secondly", "secretaries", "secretary", "see", "seed", "seek", "seem", "self", "self-defense", "self-discipline", "sell", "seller", "selves", "semicircle", "semiconductor", "seminar", "seminate", "senate", "send", "senior", "sense", "senseless", "sensing", "sensor", "sent", "sentence", "sentences", "separation", "series", "serpent", "servant", "serve", "service", "servicing", "serving", "set", "settlement", "settler", "seven", "seventeen", "seventh", "seventy", "several", "severely", "sewage", "sex", "sexual", "shadier", "shadiest", "shadow", "shadowier", "shadowy", "shady", "shakier", "shakiest", "shaky", "shall", "shamble", "shambling", "shame", "shameful", "shaming", "shampoo", "shanghaied", "shanghaiing", "shanghais", "shape", "shaping", "share", "sharing", "shark", "sharpener", "shave", "shaver", "shaving", "she", "sheep", "shilling", "ship", "shipbuilding", "shirt", "shirted", "shiver", "shod", "shoe", "shoes", "shoot", "shooting", "shop", "shopkeeper", "shopping", "short", "shortcoming", "shorten", "shortfall", "shorthand", "shortly", "shorts", "should", "shout", "show", "shrill", "side", "sider", "sideway", "siding", "sightseeing", "sign", "silent", "silicon", "silk", "similar", "similarities", "similarity", "similarly", "simple", "simplified", "simplifies", "simplify", "simply", "since", "sincerely", "sincerities", "sincerity", "sing", "singer", "single", "singling", "singular", "sion", "sir", "sis", "sister", "sit", "site", "sites", "sitting-room", "situate", "situated", "situation", "six", "sixteen", "sixteenth", "sixth", "sixty", "size", "sizes", "sizing", "skate", "skateboard", "skating", "ski", "skied", "skies", "skiing", "skill", "skilled", "skillfully", "skills", "skin", "skip", "skipping", "sky", "slam", "slang", "slavery", "sleep", "sleepier", "sleepies", "sleeping", "sleepy", "sleeve", "sleeving", "slept", "slow", "slowly", "small", "smellier", "smellies", "smelliest", "smelly", "smile", "smiling", "smoke", "smoker", "smokers", "smoking", "snack", "snacks", "snail", "sneaker", "sneeze", "sneezing", "snore", "snoring", "snow", "snowball", "snowiest", "snowman", "snowmen", "snowstorm", "snowy", "so", "so-called", "sob", "soccer", "social", "socialism", "socialist", "societies", "society", "sociologies", "sociology", "sock", "socket", "socks", "soda", "sofa", "soft", "softball", "soften", "softly", "softness", "software", "sold", "solid", "solvable", "some", "somebody", "somehow", "someone", "something", "sometime", "sometimes", "somewhere", "somic", "son", "song", "soon", "sophisticate", "sophisticating", "sophomore", "sophy", "sore", "sorrier", "sorrow", "sorrowful", "sorry", "sought", "sound", "source", "sources", "sourcing", "south", "southeast", "southern", "southwards", "southwest", "souvenir", "souvenirs", "soviets", "space", "spacing", "spade", "spading", "sparkle", "sparkling", "spat", "speak", "speaker", "speaking", "special", "specialist", "specialities", "speciality", "specially", "specific", "specifically", "sped", "speech", "speed", "spell", "spelling", "spend", "spending", "spent", "spermy", "spice", "spicier", "spiciest", "spicing", "spicy", "spied", "spies", "spit", "spoke", "spoken", "spokesman", "spokesmen", "spoon", "spoonful", "spoons", "sporous", "sport", "sports", "sportsman", "sportsmen", "sportswear", "spory", "spread", "sprinkle", "sprinkling", "spy", "squid", "st", "stadia", "stadium", "stage", "staging", "stainless", "stair", "stairs", "stairway", "standard", "standards", "star", "start", "starter", "starting", "stasis", "stat", "state", "statement", "statesman", "statesmen", "static", "stating", "station", "stations", "statistical", "stay", "steadily", "steamer", "steel", "steer", "steering", "step", "steps", "ster", "stereo", "stereotyped", "sterling", "steward", "stewardess", "stiffness", "stillness", "stock", "stockholder", "stocking", "stomachache", "stomy", "stone", "stones", "stoning", "stool", "stop", "stopwatch", "store", "storehouse", "stores", "storey", "storied", "stories", "storing", "stormier", "stormiest", "stormy", "story", "straighten", "strange", "stranger", "strangler", "strategic", "straw", "strawberries", "strawberry", "street", "stressful", "strictly", "strong", "stronger", "strongly", "structure", "structuring", "student", "studied", "studies", "study", "stuff", "stupid", "style", "styles", "styling", "subcommittee", "subject", "subjects", "subscript", "subscription", "subtitle", "subtitles", "subtitling", "success", "successfully", "succession", "successor", "such", "suck", "sudden", "suddenly", "suffer", "suffering", "sufficiency", "sufficiently", "suggestion", "suggestions", "suicide", "sulphur", "summarize", "summarizing", "summer", "sun", "sunburnt", "sundays", "sung", "sunnier", "sunnies", "sunniest", "sunny", "super", "superman", "supermarket", "supermen", "supersonic", "superstitious", "superstructure", "supper", "supplied", "supplies", "supply", "support", "sure", "surely", "surname", "surprise", "surprising", "surprisingly", "surround", "surrounding", "surroundings", "suspension", "swam", "swan", "swap", "sweater", "sweet", "sweeten", "sweetness", "swim", "swimming", "sword", "swum", "sydney", "syndicate", "syndicating", "system", "systematical", "systematically", "systems", "t-shirts", "table", "tables", "tablet", "tablets", "tabulate", "tabulating", "tactic", "take", "taking", "talk", "tall", "tanker", "tar", "task", "taught", "taxation", "taxi", "taxis", "taxy", "tea", "teach", "teacher", "teaching", "team", "teams", "teamwork", "technician", "technique", "techniques", "technologies", "technology", "teenager", "teeth", "telegram", "telephone", "telephoning", "television", "telex", "tell", "temperamental", "temple", "temples", "ten", "tenancies", "tenancy", "tennis", "tent", "tenth", "term", "terms", "territorial", "terrorist", "tertiaries", "tertiary", "test", "text", "textbook", "th", "than", "thank", "thankful", "thanksgiving", "that", "the", "theatre", "thecium", "their", "theirs", "them", "themselves", "then", "theological", "theorem", "theories", "theory", "therapist", "there", "therein", "thereof", "therm", "thermos", "thermy", "thesaurus", "these", "they", "thick", "thicken", "thief", "thieves", "thing", "think", "thinking", "third", "thirdly", "thirst", "thirstier", "thirstiest", "thirsty", "thirteen", "thirty", "this", "those", "though", "thought", "thoughtless", "thoughts", "thousand", "threat", "threats", "three", "thriftless", "thrill", "thriller", "throat", "through", "throughout", "thursdays", "thus", "thymia", "tick", "ticket", "tickets", "tickle", "tickling", "tie", "tiger", "tighten", "tightly", "tile", "tiles", "time", "timetable", "timetabling", "timing", "tion", "tired", "tiresome", "to", "to-be", "toast", "today", "toddle", "toddling", "together", "toilet", "token", "told", "tomb", "tome", "tomorrow", "tomy", "ton", "tone", "tones", "tonia", "tonight", "toning", "too", "took", "tool", "tools", "tooth", "toothache", "toothbrush", "toothpaste", "top", "topic", "topics", "torch", "tortoise", "tortoising", "total", "totally", "touchable", "tour", "touring", "tourism", "tourist", "tourists", "tours", "toward", "towards", "town", "toy", "toys", "trade", "trademark", "trader", "tradesman", "tradesmen", "trading", "tradition", "traditional", "tragic", "train", "trainer", "training", "trains", "tram", "transformer", "transistor", "translate", "translating", "translator", "transportation", "transverse", "trauma", "travel", "traveler", "travelers", "traveling", "treble", "trebling", "tree", "trees", "tremendously", "trend", "trends", "triangular", "tribute", "tributes", "tried", "tries", "trinity", "triple", "tripling", "triumphant", "trix", "trophic", "trophin", "trophy", "tropic", "tropin", "tropism", "tropous", "trousers", "truck", "true", "truing", "truly", "trust", "try", "tuberculosis", "tuck", "tuesdays", "tulip", "tumour", "tuna", "tunnel", "tunnels", "turbine", "turf", "turkey", "turn", "turning", "turnip", "turnover", "tween", "tweezers", "twelfth", "twelve", "twentieth", "twenty", "twice", "twilight", "twin", "twinkle", "twinkling", "two", "ty", "tying", "type", "types", "typewriter", "typing", "typist", "tyre", "ule", "ulent", "ultimately", "um", "umbrella", "unable", "unavoidable", "unbelievable", "uncertain", "uncle", "uncomfortable", "unconditional", "under", "underline", "underlining", "understand", "understanding", "underwear", "undivided", "undue", "uneasy", "unemployment", "uneven", "unexpect", "unexpected", "unfit", "unfortunate", "unhappier", "unhappiest", "unhappy", "unhealthy", "uniformly", "unimportant", "unit", "unite", "united", "uniting", "universally", "universities", "university", "unjust", "unkind", "unknown", "unlike", "unlimited", "unlock", "unluckier", "unluckiest", "unlucky", "unmarried", "unnecessary", "unorthodox", "unpaid", "unpleasant", "unreasonable", "unreliable", "unrest", "unsafe", "unsocial", "unsuccessful", "unsuitable", "untie", "until", "untrue", "untying", "unusual", "unusually", "unwilling", "up", "up-to-date", "update", "updating", "upkeep", "upon", "upper", "upstairs", "uptodate", "upward", "upwards", "uranium", "ure", "urgy", "uria", "uronic", "us", "usage", "use", "used", "useful", "user", "using", "usual", "usually", "utensil", "utensils", "utmost", "vacancies", "vacancy", "valley", "valuable", "valuation", "value", "valuing", "van", "vapour", "vase", "vcd", "veal", "vector", "velvet", "verb", "verse", "versed", "versus", "very", "vest", "veterinarian", "vice", "victim", "video", "videophone", "videos", "videotape", "videotaping", "view", "viewer", "viewpoint", "vigour", "villa", "village", "villager", "ville", "violently", "violin", "violinist", "virgin", "visa", "visas", "visible", "visit", "visitor", "visitors", "visualize", "visualizing", "vitally", "vitamin", "vitamine", "vividly", "vocabularies", "vocabulary", "voice", "voicing", "volleyball", "volunteer", "volunteers", "vorous", "voucher", "vow", "wager", "waggon", "wait", "waiter", "waitress", "wake", "waken", "waking", "walk", "walking", "walkman", "wall", "wallet", "walls", "war", "ward", "wards", "warm", "warming", "warmth", "warn", "warning", "was", "wash", "washing", "washroom", "wasp", "wasteful", "watchdog", "watchful", "water", "water-clock", "water-proof", "water-skiing", "waterfall", "watermelon", "watertight", "watery", "watt", "wave", "wavelength", "waving", "ways", "wayside", "we", "weak", "weaken", "weakness", "wealth", "wealthier", "wealthiest", "wealthy", "wear", "weatherman", "weathermen", "web", "website", "wedge", "wedging", "wednesdays", "weed", "weeds", "week", "weekday", "weekdays", "weekend", "weekends", "weeklies", "weekly", "weigh", "weight", "welcome", "welcoming", "well-known", "went", "west", "western", "westerner", "westward", "westwards", "wet", "wetland", "whale", "whales", "wharf", "wharves", "what", "whatever", "whatsoever", "wheel", "wheels", "when", "whenever", "where", "whereby", "wherever", "whether", "which", "whichever", "while", "whilst", "whip", "whirl", "whisker", "whiskies", "whisky", "white", "whitewash", "whiting", "who", "whoever", "whole", "wholly", "whom", "whose", "why", "wide", "widely", "widen", "width", "wife", "wild", "wilderness", "wilful", "will", "willing", "willingly", "willingness", "win", "wind", "windbreaker", "windmill", "window", "wine", "wing", "wining", "winner", "winter", "wipe", "wiping", "wire", "wireless", "wiring", "wisdom", "wise", "wish", "with", "within", "without", "wives", "woke", "woken", "wolf", "wollongong", "wolves", "woman", "women", "won", "wonderful", "wood", "wooden", "woodpecker", "woollen", "word", "worder", "wording", "words", "work", "workday", "worker", "workforce", "working", "workman", "workmate", "workmen", "workpiece", "workplace", "works", "workshop", "workshops", "world", "world-wide", "worn", "worried", "worries", "worry", "worse", "worst", "worth", "worthless", "worthwhile", "worthy", "would", "wound", "wounded", "wreath", "wrestle", "wrestling", "write", "writer", "writing", "written", "wrong", "wrote", "x-ray", "xerox", "xion", "yard", "year", "yearly", "yellow", "yes", "yesterday", "yet", "yl", "yoga", "yoghurt", "york", "you", "young", "your", "yours", "yourself", "yourselves", "youth", "youthful", "yummiest", "yummy", "zebra", "zero", "zip", "zipper", "zoic", "zoo", "zoology", "zoom", "zoon", "zygous", "zyme"]
# GB2312和GB12345字符集取交集,基本覆盖常用简繁体汉字,共9775字符
GB_CHARSET = ["\u0000", "\u0001", "\u0002", "\u0003", "\u0004", "\u0005", "\u0006", "\u0007", "\b", "\t", "\n", "\u000b", "\f", "\r", "\u000e", "\u000f", "\u0010", "\u0011", "\u0012", "\u0013", "\u0014", "\u0015", "\u0016", "\u0017", "\u0018", "\u0019", "\u001a", "\u001b", "\u001c", "\u001d", "\u001e", "\u001f", " ", "!", "\"", "#", "$", "%", "&", "'", "(", ")", "*", "+", ",", "-", ".", "/", "0", "1", "2", "3", "4", "5", "6", "7", "8", "9", ":", ";", "<", "=", ">", "?", "@", "A", "B", "C", "D", "E", "F", "G", "H", "I", "J", "K", "L", "M", "N", "O", "P", "Q", "R", "S", "T", "U", "V", "W", "X", "Y", "Z", "[", "\\", "]", "^", "_", "`", "a", "b", "c", "d", "e", "f", "g", "h", "i", "j", "k", "l", "m", "n", "o", "p", "q", "r", "s", "t", "u", "v", "w", "x", "y", "z", "{", "|", "}", "~", "", "¤", "§", "¨", "°", "±", "×", "à", "á", "è", "é", "ê", "ì", "í", "ò", "ó", "÷", "ù", "ú", "ü", "ā", "ē", "ě", "ī", "ō", "ū", "ǎ", "ǐ", "ǒ", "ǔ", "ǖ", "ǘ", "ǚ", "ǜ", "ˇ", "ˉ", "Α", "Β", "Γ", "Δ", "Ε", "Ζ", "Η", "Θ", "Ι", "Κ", "Λ", "Μ", "Ν", "Ξ", "Ο", "Π", "Ρ", "Σ", "Τ", "Υ", "Φ", "Χ", "Ψ", "Ω", "α", "β", "γ", "δ", "ε", "ζ", "η", "θ", "ι", "κ", "λ", "μ", "ν", "ξ", "ο", "π", "ρ", "σ", "τ", "υ", "φ", "χ", "ψ", "ω", "Ё", "А", "Б", "В", "Г", "Д", "Е", "Ж", "З", "И", "Й", "К", "Л", "М", "Н", "О", "П", "Р", "С", "Т", "У", "Ф", "Х", "Ц", "Ч", "Ш", "Щ", "Ъ", "Ы", "Ь", "Э", "Ю", "Я", "а", "б", "в", "г", "д", "е", "ж", "з", "и", "й", "к", "л", "м", "н", "о", "п", "р", "с", "т", "у", "ф", "х", "ц", "ч", "ш", "щ", "ъ", "ы", "ь", "э", "ю", "я", "ё", "―", "‖", "‘", "’", "“", "”", "…", "‰", "′", "″", "※", "℃", "№", "Ⅰ", "Ⅱ", "Ⅲ", "Ⅳ", "Ⅴ", "Ⅵ", "Ⅶ", "Ⅷ", "Ⅸ", "Ⅹ", "Ⅺ", "Ⅻ", "←", "↑", "→", "↓", "∈", "∏", "∑", "√", "∝", "∞", "∠", "∥", "∧", "∨", "∩", "∪", "∫", "∮", "∴", "∵", "∶", "∷", "∽", "≈", "≌", "≠", "≡", "≤", "≥", "≮", "≯", "⊙", "⊥", "⌒", "①", "②", "③", "④", "⑤", "⑥", "⑦", "⑧", "⑨", "⑩", "⑴", "⑵", "⑶", "⑷", "⑸", "⑹", "⑺", "⑻", "⑼", "⑽", "⑾", "⑿", "⒀", "⒁", "⒂", "⒃", "⒄", "⒅", "⒆", "⒇", "⒈", "⒉", "⒊", "⒋", "⒌", "⒍", "⒎", "⒏", "⒐", "⒑", "⒒", "⒓", "⒔", "⒕", "⒖", "⒗", "⒘", "⒙", "⒚", "⒛", "─", "━", "│", "┃", "┄", "┅", "┆", "┇", "┈", "┉", "┊", "┋", "┌", "┍", "┎", "┏", "┐", "┑", "┒", "┓", "└", "┕", "┖", "┗", "┘", "┙", "┚", "┛", "├", "┝", "┞", "┟", "┠", "┡", "┢", "┣", "┤", "┥", "┦", "┧", "┨", "┩", "┪", "┫", "┬", "┭", "┮", "┯", "┰", "┱", "┲", "┳", "┴", "┵", "┶", "┷", "┸", "┹", "┺", "┻", "┼", "┽", "┾", "┿", "╀", "╁", "╂", "╃", "╄", "╅", "╆", "╇", "╈", "╉", "╊", "╋", "■", "□", "▲", "△", "◆", "◇", "○", "◎", "●", "★", "☆", "♀", "♂", " ", "、", "。", "〃", "々", "〈", "〉", "《", "》", "「", "」", "『", "』", "【", "】", "〓", "〔", "〕", "〖", "〗", "ぁ", "あ", "ぃ", "い", "ぅ", "う", "ぇ", "え", "ぉ", "お", "か", "が", "き", "ぎ", "く", "ぐ", "け", "げ", "こ", "ご", "さ", "ざ", "し", "じ", "す", "ず", "せ", "ぜ", "そ", "ぞ", "た", "だ", "ち", "ぢ", "っ", "つ", "づ", "て", "で", "と", "ど", "な", "に", "ぬ", "ね", "の", "は", "ば", "ぱ", "ひ", "び", "ぴ", "ふ", "ぶ", "ぷ", "へ", "べ", "ぺ", "ほ", "ぼ", "ぽ", "ま", "み", "む", "め", "も", "ゃ", "や", "ゅ", "ゆ", "ょ", "よ", "ら", "り", "る", "れ", "ろ", "ゎ", "わ", "ゐ", "ゑ", "を", "ん", "ァ", "ア", "ィ", "イ", "ゥ", "ウ", "ェ", "エ", "ォ", "オ", "カ", "ガ", "キ", "ギ", "ク", "グ", "ケ", "ゲ", "コ", "ゴ", "サ", "ザ", "シ", "ジ", "ス", "ズ", "セ", "ゼ", "ソ", "ゾ", "タ", "ダ", "チ", "ヂ", "ッ", "ツ", "ヅ", "テ", "デ", "ト", "ド", "ナ", "ニ", "ヌ", "ネ", "ノ", "ハ", "バ", "パ", "ヒ", "ビ", "ピ", "フ", "ブ", "プ", "ヘ", "ベ", "ペ", "ホ", "ボ", "ポ", "マ", "ミ", "ム", "メ", "モ", "ャ", "ヤ", "ュ", "ユ", "ョ", "ヨ", "ラ", "リ", "ル", "レ", "ロ", "ヮ", "ワ", "ヰ", "ヱ", "ヲ", "ン", "ヴ", "ヵ", "ヶ", "・", "ㄅ", "ㄆ", "ㄇ", "ㄈ", "ㄉ", "ㄊ", "ㄋ", "ㄌ", "ㄍ", "ㄎ", "ㄏ", "ㄐ", "ㄑ", "ㄒ", "ㄓ", "ㄔ", "ㄕ", "ㄖ", "ㄗ", "ㄘ", "ㄙ", "ㄚ", "ㄛ", "ㄜ", "ㄝ", "ㄞ", "ㄟ", "ㄠ", "ㄡ", "ㄢ", "ㄣ", "ㄤ", "ㄥ", "ㄦ", "ㄧ", "ㄨ", "ㄩ", "㈠", "㈡", "㈢", "㈣", "㈤", "㈥", "㈦", "㈧", "㈨", "㈩", "一", "丁", "七", "万", "丈", "三", "上", "下", "丌", "不", "与", "丐", "丑", "专", "且", "丕", "世", "丘", "丙", "业", "丛", "东", "丝", "丞", "丢", "两", "严", "丧", "丨", "个", "丫", "丬", "中", "丰", "串", "临", "丶", "丸", "丹", "为", "主", "丽", "举", "丿", "乃", "久", "乇", "么", "义", "之", "乌", "乍", "乎", "乏", "乐", "乒", "乓", "乔", "乖", "乘", "乙", "乜", "九", "乞", "也", "习", "乡", "书", "乩", "买", "乱", "乳", "乾", "亂", "了", "予", "争", "事", "二", "亍", "于", "亏", "云", "互", "亓", "五", "井", "亘", "亚", "些", "亞", "亟", "亠", "亡", "亢", "交", "亥", "亦", "产", "亨", "亩", "享", "京", "亭", "亮", "亲", "亳", "亵", "人", "亻", "亿", "什", "仁", "仂", "仃", "仄", "仅", "仆", "仇", "仉", "今", "介", "仍", "从", "仑", "仓", "仔", "仕", "他", "仗", "付", "仙", "仝", "仞", "仟", "仡", "代", "令", "以", "仨", "仪", "仫", "们", "仰", "仲", "仳", "仵", "件", "价", "任", "份", "仿", "企", "伉", "伊", "伍", "伎", "伏", "伐", "休", "众", "优", "伙", "会", "伛", "伞", "伟", "传", "伢", "伤", "伥", "伦", "伧", "伪", "伫", "伯", "估", "伲", "伴", "伶", "伸", "伺", "似", "伽", "佃", "但", "佇", "位", "低", "住", "佐", "佑", "体", "何", "佗", "佘", "余", "佚", "佛", "作", "佝", "佞", "佟", "你", "佣", "佤", "佥", "佧", "佩", "佬", "佯", "佰", "佳", "佴", "佶", "佻", "佼", "佾", "使", "侃", "侄", "來", "侈", "侉", "例", "侍", "侏", "侑", "侔", "侖", "侗", "供", "依", "侠", "侣", "侥", "侦", "侧", "侨", "侩", "侪", "侬", "侮", "侯", "侵", "便", "係", "促", "俄", "俅", "俊", "俎", "俏", "俐", "俑", "俗", "俘", "俚", "俜", "保", "俞", "俟", "俠", "信", "俣", "俦", "俨", "俩", "俪", "俭", "修", "俯", "俱", "俳", "俸", "俺", "俾", "倀", "倆", "倉", "個", "倌", "倍", "倏", "們", "倒", "倔", "倘", "候", "倚", "倜", "借", "倡", "倥", "倦", "倨", "倩", "倪", "倫", "倬", "倭", "倮", "债", "值", "倾", "偃", "假", "偈", "偉", "偌", "偎", "偏", "偕", "做", "停", "健", "偬", "側", "偵", "偶", "偷", "偻", "偾", "偿", "傀", "傅", "傈", "傍", "傖", "傘", "備", "傢", "傣", "傥", "傧", "储", "傩", "催", "傭", "傲", "傳", "傴", "債", "傷", "傺", "傻", "傾", "僂", "僅", "僉", "像", "僑", "僕", "僖", "僚", "僞", "僥", "僦", "僧", "僨", "僬", "僭", "僮", "僳", "僵", "價", "僻", "儀", "儂", "億", "儆", "儇", "儈", "儉", "儋", "儐", "儒", "儔", "儕", "儘", "償", "儡", "優", "儲", "儷", "儺", "儻", "儼", "儿", "兀", "允", "元", "兄", "充", "兆", "先", "光", "克", "免", "兑", "兒", "兔", "兕", "兖", "党", "兜", "兢", "入", "全", "兩", "八", "公", "六", "兮", "兰", "共", "关", "兴", "兵", "其", "具", "典", "兹", "养", "兼", "兽", "冀", "冁", "冂", "内", "冈", "冉", "册", "再", "冒", "冕", "冖", "冗", "写", "军", "农", "冠", "冢", "冤", "冥", "冫", "冬", "冯", "冰", "冱", "冲", "决", "况", "冶", "冷", "冻", "冼", "冽", "净", "凄", "准", "凇", "凈", "凉", "凋", "凌", "凍", "减", "凑", "凛", "凝", "几", "凡", "凤", "凫", "凭", "凯", "凰", "凱", "凳", "凵", "凶", "凸", "凹", "出", "击", "凼", "函", "凿", "刀", "刁", "刂", "刃", "分", "切", "刈", "刊", "刍", "刎", "刑", "划", "刖", "列", "刘", "则", "刚", "创", "初", "删", "判", "刨", "利", "别", "刭", "刮", "到", "刳", "制", "刷", "券", "刹", "刺", "刻", "刽", "刿", "剀", "剁", "剂", "剃", "剄", "則", "削", "剋", "剌", "前", "剐", "剑", "剔", "剖", "剛", "剜", "剞", "剡", "剥", "剧", "剩", "剪", "剮", "副", "割", "剴", "創", "剽", "剿", "劁", "劂", "劃", "劇", "劈", "劉", "劊", "劌", "劍", "劐", "劑", "劓", "力", "劝", "办", "功", "加", "务", "劢", "劣", "动", "助", "努", "劫", "劬", "劭", "励", "劲", "劳", "劾", "势", "勁", "勃", "勇", "勉", "勋", "勐", "勒", "動", "勖", "勘", "務", "勛", "勝", "勞", "募", "勢", "勤", "勰", "勱", "勵", "勸", "勹", "勺", "勾", "勿", "匀", "包", "匆", "匈", "匍", "匏", "匐", "匕", "化", "北", "匙", "匚", "匝", "匠", "匡", "匣", "匦", "匪", "匭", "匮", "匯", "匱", "匹", "区", "医", "匾", "匿", "區", "十", "千", "卅", "升", "午", "卉", "半", "华", "协", "卑", "卒", "卓", "協", "单", "卖", "南", "博", "卜", "卞", "卟", "占", "卡", "卢", "卣", "卤", "卦", "卧", "卩", "卫", "卮", "卯", "印", "危", "即", "却", "卵", "卷", "卸", "卺", "卿", "厂", "厄", "厅", "历", "厉", "压", "厌", "厍", "厕", "厘", "厙", "厚", "厝", "原", "厠", "厢", "厣", "厥", "厦", "厨", "厩", "厭", "厮", "厲", "厴", "厶", "去", "县", "叁", "参", "參", "又", "叉", "及", "友", "双", "反", "发", "叔", "取", "受", "变", "叙", "叛", "叟", "叠", "叢", "口", "古", "句", "另", "叨", "叩", "只", "叫", "召", "叭", "叮", "可", "台", "叱", "史", "右", "叵", "叶", "号", "司", "叹", "叻", "叼", "叽", "吁", "吃", "各", "吆", "合", "吉", "吊", "同", "名", "后", "吏", "吐", "向", "吒", "吓", "吕", "吖", "吗", "君", "吝", "吞", "吟", "吠", "吡", "吣", "否", "吧", "吨", "吩", "含", "听", "吭", "吮", "启", "吱", "吲", "吴", "吵", "吸", "吹", "吻", "吼", "吾", "呀", "呃", "呆", "呈", "告", "呋", "呐", "呒", "呓", "呔", "呕", "呖", "呗", "员", "呙", "呛", "呜", "呢", "呤", "呦", "周", "呱", "呲", "味", "呵", "呶", "呷", "呸", "呻", "呼", "命", "咀", "咂", "咄", "咆", "咋", "和", "咎", "咏", "咐", "咒", "咔", "咕", "咖", "咙", "咚", "咛", "咝", "咣", "咤", "咦", "咧", "咨", "咩", "咪", "咫", "咬", "咭", "咯", "咱", "咳", "咴", "咸", "咻", "咼", "咽", "咿", "哀", "品", "哂", "哄", "哆", "哇", "哈", "哉", "哌", "响", "哎", "哏", "哐", "哑", "哒", "哓", "哔", "哕", "哗", "哙", "哚", "哜", "哝", "哞", "哟", "員", "哥", "哦", "哧", "哨", "哩", "哪", "哭", "哮", "哲", "哳", "哺", "哼", "哽", "哿", "唁", "唄", "唆", "唇", "唉", "唏", "唐", "唑", "唔", "唛", "唠", "唢", "唣", "唤", "唧", "唪", "唬", "售", "唯", "唰", "唱", "唳", "唷", "唼", "唾", "唿", "啁", "啃", "啄", "商", "啉", "啊", "問", "啐", "啓", "啕", "啖", "啜", "啞", "啡", "啤", "啥", "啦", "啧", "啪", "啬", "啭", "啮", "啵", "啶", "啷", "啸", "啻", "啼", "啾", "喀", "喁", "喂", "喃", "善", "喇", "喈", "喉", "喊", "喋", "喏", "喑", "喔", "喘", "喙", "喚", "喜", "喝", "喟", "喧", "喪", "喬", "單", "喱", "喲", "喳", "喵", "喷", "喹", "喻", "喽", "喾", "嗄", "嗅", "嗆", "嗇", "嗉", "嗌", "嗍", "嗎", "嗑", "嗒", "嗓", "嗔", "嗖", "嗚", "嗜", "嗝", "嗟", "嗡", "嗣", "嗤", "嗥", "嗦", "嗨", "嗩", "嗪", "嗫", "嗬", "嗯", "嗲", "嗳", "嗵", "嗶", "嗷", "嗽", "嗾", "嘀", "嘁", "嘆", "嘈", "嘉", "嘌", "嘍", "嘎", "嘏", "嘔", "嘖", "嘗", "嘘", "嘛", "嘜", "嘞", "嘟", "嘣", "嘤", "嘧", "嘩", "嘬", "嘭", "嘮", "嘯", "嘰", "嘱", "嘲", "嘴", "嘵", "嘶", "嘸", "嘹", "嘻", "嘿", "噁", "噌", "噍", "噎", "噔", "噗", "噘", "噙", "噜", "噝", "噠", "噢", "噤", "噥", "噦", "器", "噩", "噪", "噫", "噬", "噯", "噱", "噲", "噴", "噶", "噸", "噹", "噻", "噼", "嚀", "嚅", "嚆", "嚇", "嚌", "嚎", "嚏", "嚓", "嚕", "嚙", "嚣", "嚦", "嚨", "嚮", "嚯", "嚳", "嚴", "嚶", "嚷", "嚼", "囀", "囁", "囂", "囅", "囈", "囉", "囊", "囌", "囑", "囔", "囗", "囚", "四", "囝", "回", "囟", "因", "囡", "团", "囤", "囫", "园", "困", "囱", "围", "囵", "囹", "固", "国", "图", "囿", "圃", "圄", "圆", "圇", "圈", "圉", "圊", "國", "圍", "園", "圓", "圖", "團", "圜", "土", "圣", "在", "圩", "圪", "圬", "圭", "圮", "圯", "地", "圳", "圹", "场", "圻", "圾", "址", "坂", "均", "坊", "坌", "坍", "坎", "坏", "坐", "坑", "块", "坚", "坛", "坜", "坝", "坞", "坟", "坠", "坡", "坤", "坦", "坨", "坩", "坪", "坫", "坭", "坯", "坳", "坶", "坷", "坻", "坼", "垂", "垃", "垄", "垅", "垆", "型", "垌", "垒", "垓", "垛", "垠", "垡", "垢", "垣", "垤", "垦", "垧", "垩", "垫", "垭", "垮", "垲", "垴", "垸", "埂", "埃", "埋", "城", "埏", "埒", "埔", "埕", "埘", "埙", "埚", "埝", "域", "埠", "埡", "埤", "埭", "埯", "埴", "執", "埸", "培", "基", "埽", "堀", "堂", "堅", "堆", "堇", "堊", "堋", "堍", "堑", "堕", "堖", "堙", "堝", "堞", "堠", "堡", "堤", "堪", "堯", "堰", "報", "場", "堵", "塄", "塊", "塋", "塌", "塍", "塏", "塑", "塒", "塔", "塗", "塘", "塞", "塢", "塤", "塥", "填", "塬", "塵", "塹", "塾", "墀", "墁", "境", "墅", "墉", "墊", "墒", "墓", "墙", "墚", "墜", "增", "墟", "墨", "墩", "墮", "墳", "墻", "墼", "墾", "壁", "壅", "壇", "壑", "壓", "壕", "壘", "壙", "壚", "壞", "壟", "壠", "壢", "壤", "壩", "士", "壬", "壮", "壯", "声", "壳", "壶", "壹", "壺", "壽", "夂", "处", "备", "复", "夏", "夔", "夕", "外", "夙", "多", "夜", "够", "夢", "夤", "夥", "大", "天", "太", "夫", "夭", "央", "夯", "失", "头", "夷", "夸", "夹", "夺", "夼", "夾", "奁", "奂", "奄", "奇", "奈", "奉", "奋", "奎", "奏", "奐", "契", "奔", "奕", "奖", "套", "奘", "奚", "奠", "奢", "奥", "奩", "奪", "奬", "奮", "女", "奴", "奶", "奸", "她", "好", "妁", "如", "妃", "妄", "妆", "妇", "妈", "妊", "妍", "妒", "妓", "妖", "妗", "妙", "妝", "妞", "妣", "妤", "妥", "妨", "妩", "妪", "妫", "妮", "妯", "妲", "妹", "妻", "妾", "姆", "姊", "始", "姐", "姑", "姒", "姓", "委", "姗", "姘", "姚", "姜", "姝", "姣", "姥", "姨", "姬", "姹", "姻", "姿", "威", "娃", "娄", "娅", "娆", "娇", "娈", "娉", "娌", "娑", "娓", "娘", "娜", "娟", "娠", "娣", "娥", "娩", "娱", "娲", "娴", "娶", "娼", "婀", "婁", "婆", "婉", "婊", "婕", "婚", "婢", "婦", "婧", "婪", "婭", "婴", "婵", "婶", "婷", "婺", "婿", "媒", "媚", "媛", "媧", "媪", "媲", "媳", "媵", "媸", "媽", "媾", "嫁", "嫂", "嫉", "嫌", "嫒", "嫔", "嫖", "嫗", "嫘", "嫜", "嫠", "嫡", "嫣", "嫦", "嫩", "嫫", "嫱", "嫵", "嫻", "嬀", "嬈", "嬉", "嬋", "嬌", "嬖", "嬗", "嬙", "嬡", "嬪", "嬰", "嬲", "嬴", "嬷", "嬸", "孀", "孌", "子", "孑", "孓", "孔", "孕", "字", "存", "孙", "孚", "孛", "孜", "孝", "孟", "孢", "季", "孤", "孥", "学", "孩", "孪", "孫", "孬", "孰", "孱", "孳", "孵", "學", "孺", "孽", "孿", "宀", "宁", "它", "宄", "宅", "宇", "守", "安", "宋", "完", "宏", "宓", "宕", "宗", "官", "宙", "定", "宛", "宜", "宝", "实", "宠", "审", "客", "宣", "室", "宥", "宦", "宪", "宫", "宰", "害", "宴", "宵", "家", "宸", "容", "宽", "宾", "宿", "寂", "寄", "寅", "密", "寇", "富", "寐", "寒", "寓", "寝", "寞", "察", "寡", "寢", "寤", "寥", "實", "寧", "寨", "審", "寫", "寬", "寮", "寰", "寵", "寶", "寸", "对", "寺", "寻", "导", "寿", "封", "射", "将", "將", "專", "尉", "尊", "尋", "對", "導", "小", "少", "尔", "尕", "尖", "尘", "尚", "尜", "尝", "尢", "尤", "尥", "尧", "尬", "就", "尴", "尷", "尸", "尹", "尺", "尻", "尼", "尽", "尾", "尿", "局", "屁", "层", "居", "屈", "屉", "届", "屋", "屎", "屏", "屐", "屑", "展", "屙", "属", "屠", "屡", "屢", "屣", "層", "履", "屦", "屨", "屬", "屮", "屯", "山", "屹", "屺", "屿", "岁", "岂", "岈", "岌", "岍", "岐", "岑", "岔", "岖", "岗", "岘", "岙", "岚", "岛", "岜", "岡", "岢", "岣", "岩", "岫", "岬", "岭", "岱", "岳", "岵", "岷", "岸", "岽", "岿", "峁", "峄", "峋", "峒", "峙", "峡", "峤", "峥", "峦", "峨", "峪", "峭", "峰", "峴", "島", "峻", "峽", "崂", "崃", "崆", "崇", "崍", "崎", "崔", "崖", "崗", "崛", "崞", "崢", "崤", "崦", "崧", "崩", "崬", "崭", "崮", "崴", "崽", "崾", "嵇", "嵊", "嵋", "嵌", "嵐", "嵘", "嵛", "嵝", "嵩", "嵫", "嵬", "嵯", "嵴", "嶁", "嶂", "嶄", "嶇", "嶗", "嶙", "嶝", "嶠", "嶧", "嶷", "嶸", "嶺", "嶼", "巅", "巋", "巍", "巒", "巔", "巛", "川", "州", "巡", "巢", "工", "左", "巧", "巨", "巩", "巫", "差", "巯", "巰", "己", "已", "巳", "巴", "巷", "巽", "巾", "币", "市", "布", "帅", "帆", "师", "希", "帏", "帐", "帑", "帔", "帕", "帖", "帘", "帙", "帚", "帛", "帜", "帝", "帥", "带", "帧", "師", "席", "帮", "帱", "帳", "帶", "帷", "常", "帻", "帼", "帽", "幀", "幂", "幃", "幄", "幅", "幌", "幔", "幕", "幗", "幘", "幛", "幞", "幟", "幡", "幢", "幣", "幫", "幬", "干", "平", "年", "并", "幸", "幹", "幺", "幻", "幼", "幽", "幾", "广", "庀", "庄", "庆", "庇", "床", "庋", "序", "庐", "庑", "库", "应", "底", "庖", "店", "庙", "庚", "府", "庞", "废", "庠", "庥", "度", "座", "庫", "庭", "庳", "庵", "庶", "康", "庸", "庹", "庾", "廉", "廊", "廑", "廒", "廓", "廖", "廛", "廟", "廠", "廡", "廢", "廣", "廨", "廪", "廬", "廳", "廴", "延", "廷", "建", "廾", "廿", "开", "弁", "异", "弃", "弄", "弈", "弊", "弋", "式", "弑", "弓", "引", "弗", "弘", "弛", "弟", "张", "弥", "弦", "弧", "弩", "弪", "弭", "弯", "弱", "弳", "張", "弹", "强", "弼", "彀", "彆", "彈", "彌", "彎", "彐", "归", "当", "录", "彖", "彗", "彘", "彙", "彝", "彡", "形", "彤", "彦", "彩", "彪", "彬", "彭", "彰", "影", "彳", "彷", "役", "彻", "彼", "往", "征", "徂", "径", "待", "徇", "很", "徉", "徊", "律", "後", "徐", "徑", "徒", "徕", "得", "徘", "徙", "徜", "從", "徠", "御", "徨", "復", "循", "徭", "微", "徵", "德", "徹", "徼", "徽", "心", "忄", "必", "忆", "忉", "忌", "忍", "忏", "忐", "忑", "忒", "忖", "志", "忘", "忙", "忝", "忠", "忡", "忤", "忧", "忪", "快", "忭", "忮", "忱", "念", "忸", "忻", "忽", "忾", "忿", "怀", "态", "怂", "怃", "怄", "怅", "怆", "怊", "怍", "怎", "怏", "怒", "怔", "怕", "怖", "怙", "怛", "怜", "思", "怠", "怡", "急", "怦", "性", "怨", "怩", "怪", "怫", "怯", "怵", "总", "怼", "怿", "恁", "恂", "恃", "恋", "恍", "恐", "恒", "恕", "恙", "恚", "恝", "恢", "恣", "恤", "恧", "恨", "恩", "恪", "恫", "恬", "恭", "息", "恰", "恳", "恶", "恸", "恹", "恺", "恻", "恼", "恽", "恿", "悃", "悄", "悉", "悌", "悍", "悒", "悔", "悖", "悚", "悛", "悝", "悟", "悠", "患", "悦", "您", "悫", "悬", "悭", "悯", "悱", "悲", "悴", "悵", "悶", "悸", "悻", "悼", "情", "惆", "惊", "惋", "惑", "惕", "惘", "惚", "惜", "惝", "惟", "惠", "惡", "惦", "惧", "惨", "惩", "惫", "惬", "惭", "惮", "惯", "惰", "惱", "惲", "想", "惴", "惶", "惹", "惺", "惻", "愀", "愁", "愆", "愈", "愉", "愍", "愎", "意", "愕", "愚", "愛", "愜", "感", "愠", "愣", "愤", "愦", "愧", "愫", "愴", "愷", "愾", "愿", "慈", "慊", "態", "慌", "慎", "慑", "慕", "慘", "慚", "慝", "慟", "慢", "慣", "慤", "慧", "慨", "慪", "慫", "慮", "慰", "慳", "慵", "慶", "慷", "憂", "憊", "憋", "憎", "憐", "憑", "憒", "憔", "憚", "憝", "憤", "憧", "憨", "憩", "憫", "憬", "憮", "憲", "憶", "憷", "憾", "懂", "懇", "懈", "應", "懊", "懋", "懌", "懑", "懒", "懔", "懞", "懟", "懣", "懦", "懨", "懲", "懵", "懶", "懷", "懸", "懺", "懼", "懾", "懿", "戀", "戆", "戇", "戈", "戊", "戋", "戌", "戍", "戎", "戏", "成", "我", "戒", "戔", "戕", "或", "戗", "战", "戚", "戛", "戟", "戡", "戢", "戤", "戥", "戧", "戩", "截", "戬", "戮", "戰", "戲", "戳", "戴", "户", "戽", "戾", "房", "所", "扁", "扃", "扇", "扈", "扉", "手", "扌", "才", "扎", "扑", "扒", "打", "扔", "托", "扛", "扣", "扦", "执", "扩", "扪", "扫", "扬", "扭", "扮", "扯", "扰", "扳", "扶", "批", "扼", "找", "承", "技", "抄", "抉", "把", "抑", "抒", "抓", "投", "抖", "抗", "折", "抚", "抛", "抟", "抠", "抡", "抢", "护", "报", "抨", "披", "抬", "抱", "抵", "抹", "抻", "押", "抽", "抿", "拂", "拄", "担", "拆", "拇", "拈", "拉", "拊", "拌", "拍", "拎", "拐", "拒", "拓", "拔", "拖", "拗", "拘", "拙", "拚", "招", "拜", "拟", "拢", "拣", "拥", "拦", "拧", "拨", "择", "括", "拭", "拮", "拯", "拱", "拳", "拴", "拶", "拷", "拼", "拽", "拾", "拿", "持", "挂", "指", "挈", "按", "挎", "挑", "挖", "挚", "挛", "挝", "挞", "挟", "挠", "挡", "挢", "挣", "挤", "挥", "挨", "挪", "挫", "振", "挲", "挹", "挺", "挽", "挾", "捂", "捃", "捅", "捆", "捉", "捋", "捌", "捍", "捎", "捏", "捐", "捕", "捞", "损", "捡", "换", "捣", "捧", "捨", "捩", "捫", "捭", "据", "捱", "捲", "捶", "捷", "捺", "捻", "掀", "掂", "掃", "掄", "掇", "授", "掉", "掊", "掌", "掎", "掏", "掐", "排", "掖", "掘", "掙", "掠", "探", "掣", "接", "控", "推", "掩", "措", "掬", "掭", "掮", "掰", "掳", "掴", "掷", "掸", "掺", "掼", "掾", "揀", "揄", "揆", "揉", "揍", "揎", "描", "提", "插", "揖", "揚", "換", "揞", "揠", "握", "揣", "揩", "揪", "揭", "揮", "揲", "援", "揶", "揸", "揽", "揿", "搀", "搁", "搂", "搅", "搋", "搌", "損", "搏", "搐", "搓", "搔", "搗", "搛", "搜", "搞", "搠", "搡", "搦", "搪", "搬", "搭", "搴", "搶", "携", "搽", "搿", "摁", "摄", "摅", "摆", "摇", "摈", "摊", "摑", "摒", "摔", "摘", "摜", "摞", "摟", "摧", "摩", "摭", "摯", "摳", "摶", "摸", "摹", "摺", "摻", "撂", "撄", "撅", "撇", "撈", "撑", "撒", "撓", "撕", "撖", "撙", "撞", "撟", "撣", "撤", "撥", "撩", "撫", "撬", "播", "撮", "撰", "撲", "撳", "撵", "撷", "撸", "撺", "撻", "撼", "撾", "撿", "擀", "擁", "擂", "擄", "擅", "擇", "擊", "擋", "操", "擎", "擐", "擒", "擔", "擗", "擘", "據", "擞", "擠", "擢", "擤", "擦", "擬", "擯", "擰", "擱", "擲", "擴", "擷", "擺", "擻", "擼", "擾", "攀", "攄", "攆", "攉", "攏", "攒", "攔", "攖", "攘", "攙", "攛", "攝", "攢", "攣", "攤", "攥", "攪", "攫", "攬", "攮", "支", "攴", "攵", "收", "攸", "改", "攻", "放", "政", "故", "效", "敉", "敌", "敏", "救", "敕", "敖", "敗", "教", "敛", "敝", "敞", "敢", "散", "敦", "敫", "敬", "数", "敲", "整", "敵", "敷", "數", "斂", "斃", "文", "斋", "斌", "斐", "斑", "斓", "斕", "斗", "料", "斛", "斜", "斟", "斡", "斤", "斥", "斧", "斩", "斫", "斬", "断", "斯", "新", "斷", "方", "於", "施", "旁", "旃", "旄", "旅", "旆", "旋", "旌", "旎", "族", "旒", "旖", "旗", "无", "既", "日", "旦", "旧", "旨", "早", "旬", "旭", "旮", "旯", "旰", "旱", "时", "旷", "旺", "昀", "昂", "昃", "昆", "昊", "昌", "明", "昏", "易", "昔", "昕", "昙", "昝", "星", "映", "春", "昧", "昨", "昭", "是", "昱", "昴", "昵", "昶", "昼", "显", "晁", "時", "晃", "晉", "晋", "晌", "晏", "晒", "晓", "晔", "晕", "晖", "晗", "晚", "晝", "晟", "晡", "晤", "晦", "晨", "普", "景", "晰", "晴", "晶", "晷", "智", "晾", "暂", "暄", "暇", "暈", "暉", "暌", "暑", "暖", "暗", "暝", "暢", "暧", "暨", "暫", "暮", "暴", "暹", "暾", "曄", "曆", "曇", "曉", "曖", "曙", "曛", "曜", "曝", "曠", "曦", "曩", "曬", "曰", "曲", "曳", "更", "曷", "書", "曹", "曼", "曾", "替", "最", "會", "月", "有", "朊", "朋", "服", "朐", "朔", "朕", "朗", "望", "朝", "期", "朦", "朧", "木", "未", "末", "本", "札", "术", "朱", "朴", "朵", "机", "朽", "杀", "杂", "权", "杆", "杈", "杉", "杌", "李", "杏", "材", "村", "杓", "杖", "杜", "杞", "束", "杠", "条", "来", "杨", "杩", "杪", "杭", "杯", "杰", "東", "杲", "杳", "杵", "杷", "杼", "松", "板", "极", "构", "枇", "枉", "枋", "析", "枕", "林", "枘", "枚", "果", "枝", "枞", "枢", "枣", "枥", "枧", "枨", "枪", "枫", "枭", "枯", "枰", "枳", "枵", "架", "枷", "枸", "柁", "柃", "柄", "柏", "某", "柑", "柒", "染", "柔", "柘", "柙", "柚", "柜", "柝", "柞", "柠", "柢", "查", "柩", "柬", "柯", "柰", "柱", "柳", "柴", "柽", "柿", "栀", "栅", "标", "栈", "栉", "栊", "栋", "栌", "栎", "栏", "树", "栓", "栖", "栗", "栝", "校", "栩", "株", "栲", "栳", "样", "核", "根", "格", "栽", "栾", "桀", "桁", "桂", "桃", "桄", "桅", "框", "案", "桉", "桊", "桌", "桎", "桐", "桑", "桓", "桔", "桕", "桠", "桡", "桢", "档", "桤", "桥", "桦", "桧", "桨", "桩", "桫", "桴", "桶", "桷", "梁", "梃", "梅", "梆", "梏", "梓", "梗", "梘", "條", "梟", "梢", "梦", "梧", "梨", "梭", "梯", "械", "梳", "梵", "检", "棂", "棄", "棉", "棋", "棍", "棒", "棕", "棖", "棗", "棘", "棚", "棟", "棠", "棣", "棧", "森", "棰", "棱", "棲", "棵", "棹", "棺", "棼", "椁", "椅", "椋", "植", "椎", "椏", "椐", "椒", "椟", "椠", "椤", "椭", "椰", "椴", "椹", "椽", "椿", "楂", "楊", "楓", "楔", "楗", "楚", "楝", "楞", "楠", "楣", "楦", "楨", "楫", "業", "楮", "楱", "極", "楷", "楸", "楹", "楼", "榀", "概", "榄", "榆", "榇", "榈", "榉", "榍", "榔", "榕", "榘", "榛", "榜", "榧", "榨", "榪", "榫", "榭", "榮", "榱", "榴", "榷", "榻", "榿", "槁", "槊", "構", "槌", "槍", "槎", "槐", "槔", "槛", "槟", "槠", "槧", "槭", "槲", "槳", "槽", "槿", "樁", "樂", "樅", "樊", "樓", "樗", "樘", "標", "樞", "樟", "模", "樣", "樨", "横", "樯", "樱", "樵", "樸", "樹", "樺", "樽", "樾", "橄", "橇", "橈", "橋", "橐", "橘", "橙", "橛", "機", "橡", "橢", "橥", "橱", "橹", "橼", "檀", "檄", "檉", "檎", "檐", "檑", "檔", "檗", "檜", "檠", "檢", "檣", "檩", "檫", "檬", "檯", "檳", "檸", "檻", "櫃", "櫓", "櫚", "櫛", "櫝", "櫞", "櫟", "櫧", "櫨", "櫪", "櫬", "櫳", "櫸", "櫻", "欄", "權", "欏", "欒", "欖", "欞", "欠", "次", "欢", "欣", "欤", "欧", "欲", "欷", "欹", "欺", "欽", "款", "歃", "歆", "歇", "歉", "歌", "歐", "歙", "歟", "歡", "止", "正", "此", "步", "武", "歧", "歪", "歲", "歷", "歸", "歹", "死", "歼", "殁", "殂", "殃", "殄", "殆", "殇", "殉", "殊", "残", "殍", "殒", "殓", "殖", "殘", "殚", "殛", "殞", "殡", "殤", "殪", "殫", "殮", "殯", "殲", "殳", "殴", "段", "殷", "殺", "殻", "殿", "毁", "毂", "毅", "毆", "毋", "母", "每", "毒", "毓", "比", "毕", "毖", "毗", "毙", "毛", "毡", "毪", "毫", "毯", "毳", "毵", "毹", "毽", "毿", "氅", "氆", "氇", "氈", "氌", "氍", "氏", "氐", "民", "氓", "气", "氕", "氖", "氘", "氙", "氚", "氛", "氟", "氡", "氢", "氣", "氤", "氦", "氧", "氨", "氩", "氪", "氫", "氬", "氮", "氯", "氰", "氲", "水", "氵", "永", "氽", "汀", "汁", "求", "汆", "汇", "汉", "汊", "汐", "汔", "汕", "汗", "汛", "汜", "汝", "汞", "江", "池", "污", "汤", "汨", "汩", "汪", "汰", "汲", "汴", "汶", "汹", "汽", "汾", "沁", "沂", "沃", "沅", "沆", "沈", "沉", "沌", "沏", "沐", "沓", "沔", "沙", "沛", "沟", "没", "沣", "沤", "沥", "沦", "沧", "沩", "沪", "沫", "沭", "沮", "沱", "沲", "河", "沸", "油", "治", "沼", "沽", "沾", "沿", "泄", "泅", "泉", "泊", "泌", "泐", "泓", "泔", "法", "泖", "泗", "泛", "泞", "泠", "泡", "波", "泣", "泥", "注", "泪", "泫", "泮", "泯", "泰", "泱", "泳", "泵", "泶", "泷", "泸", "泺", "泻", "泼", "泽", "泾", "洁", "洄", "洇", "洋", "洌", "洎", "洒", "洗", "洙", "洚", "洛", "洞", "津", "洧", "洪", "洫", "洮", "洱", "洲", "洳", "洵", "洹", "活", "洼", "洽", "派", "流", "浃", "浅", "浆", "浇", "浈", "浊", "测", "浍", "济", "浏", "浑", "浒", "浓", "浔", "浙", "浚", "浜", "浞", "浠", "浣", "浦", "浩", "浪", "浮", "浯", "浴", "海", "浸", "浹", "浼", "涂", "涅", "涇", "消", "涉", "涌", "涎", "涑", "涓", "涔", "涕", "涛", "涝", "涞", "涟", "涠", "涡", "涣", "涤", "润", "涧", "涨", "涩", "涪", "涫", "涮", "涯", "液", "涵", "涸", "涿", "淀", "淄", "淅", "淆", "淇", "淋", "淌", "淑", "淖", "淘", "淙", "淝", "淞", "淠", "淡", "淤", "淦", "淪", "淫", "淬", "淮", "深", "淳", "淵", "淶", "混", "淹", "淺", "添", "淼", "清", "渊", "渌", "渍", "渎", "渐", "渑", "渔", "渖", "渗", "渙", "渚", "渝", "渠", "渡", "渣", "渤", "渥", "渦", "温", "渫", "測", "渭", "港", "渲", "渴", "游", "渺", "渾", "湃", "湄", "湍", "湎", "湓", "湔", "湖", "湘", "湛", "湞", "湟", "湫", "湮", "湯", "湾", "湿", "溃", "溅", "溆", "溉", "溏", "源", "準", "溘", "溜", "溝", "溟", "溢", "溥", "溧", "溪", "溯", "溱", "溲", "溴", "溶", "溷", "溺", "溻", "溽", "滁", "滂", "滄", "滅", "滇", "滋", "滌", "滎", "滏", "滑", "滓", "滔", "滕", "滗", "滚", "滞", "滟", "滠", "满", "滢", "滤", "滥", "滦", "滨", "滩", "滬", "滯", "滲", "滴", "滷", "滸", "滹", "滿", "漁", "漂", "漆", "漉", "漏", "漓", "演", "漕", "漚", "漠", "漢", "漣", "漤", "漩", "漪", "漫", "漬", "漭", "漯", "漱", "漲", "漳", "漶", "漸", "漾", "漿", "潁", "潆", "潇", "潋", "潍", "潑", "潔", "潘", "潙", "潛", "潜", "潞", "潢", "潤", "潦", "潭", "潮", "潯", "潰", "潲", "潴", "潷", "潸", "潺", "潼", "潿", "澀", "澄", "澆", "澇", "澈", "澉", "澌", "澍", "澎", "澗", "澜", "澠", "澡", "澤", "澧", "澩", "澮", "澱", "澳", "澶", "澹", "激", "濁", "濂", "濃", "濉", "濑", "濒", "濕", "濘", "濛", "濞", "濟", "濠", "濡", "濤", "濫", "濮", "濯", "濰", "濱", "濺", "濼", "濾", "瀅", "瀆", "瀉", "瀋", "瀏", "瀑", "瀕", "瀘", "瀚", "瀛", "瀝", "瀟", "瀠", "瀣", "瀧", "瀨", "瀰", "瀲", "瀵", "瀹", "瀾", "灃", "灄", "灌", "灏", "灑", "灕", "灘", "灝", "灞", "灣", "灤", "灧", "火", "灬", "灭", "灯", "灰", "灵", "灶", "灸", "灼", "灾", "灿", "炀", "炅", "炉", "炊", "炎", "炒", "炔", "炕", "炖", "炙", "炜", "炝", "炫", "炬", "炭", "炮", "炯", "炱", "炳", "炷", "炸", "点", "炻", "炼", "炽", "烀", "烁", "烂", "烃", "烈", "烊", "烏", "烘", "烙", "烛", "烟", "烤", "烦", "烧", "烨", "烩", "烫", "烬", "热", "烯", "烴", "烷", "烹", "烽", "焉", "焊", "焐", "焓", "焕", "焖", "焘", "焙", "焚", "無", "焦", "焯", "焰", "焱", "然", "煅", "煉", "煊", "煌", "煎", "煒", "煜", "煞", "煢", "煤", "煥", "煦", "照", "煨", "煩", "煬", "煮", "煲", "煳", "煸", "煺", "煽", "熄", "熊", "熏", "熒", "熔", "熗", "熘", "熙", "熟", "熠", "熨", "熬", "熱", "熳", "熵", "熹", "熾", "燁", "燃", "燈", "燎", "燒", "燔", "燕", "燙", "燜", "營", "燠", "燥", "燦", "燧", "燭", "燮", "燴", "燹", "燼", "燾", "爆", "爍", "爐", "爛", "爝", "爨", "爪", "爬", "爭", "爰", "爱", "爲", "爵", "父", "爷", "爸", "爹", "爺", "爻", "爽", "爾", "爿", "片", "版", "牌", "牍", "牒", "牖", "牘", "牙", "牛", "牝", "牟", "牡", "牢", "牦", "牧", "物", "牮", "牯", "牲", "牵", "特", "牺", "牽", "牾", "牿", "犀", "犁", "犄", "犊", "犋", "犍", "犏", "犒", "犖", "犟", "犢", "犧", "犬", "犭", "犯", "犰", "犴", "状", "犷", "犸", "犹", "狀", "狁", "狂", "狃", "狄", "狈", "狍", "狎", "狐", "狒", "狗", "狙", "狞", "狠", "狡", "狨", "狩", "独", "狭", "狮", "狯", "狰", "狱", "狲", "狳", "狴", "狷", "狸", "狹", "狺", "狻", "狼", "狽", "猁", "猃", "猊", "猎", "猓", "猕", "猖", "猗", "猙", "猛", "猜", "猝", "猞", "猡", "猢", "猥", "猩", "猪", "猫", "猬", "献", "猱", "猴", "猶", "猷", "猸", "猹", "猻", "猾", "猿", "獁", "獄", "獅", "獍", "獐", "獒", "獗", "獠", "獨", "獪", "獫", "獬", "獭", "獯", "獰", "獲", "獵", "獷", "獸", "獺", "獻", "獼", "獾", "玀", "玄", "率", "玉", "王", "玎", "玑", "玖", "玛", "玟", "玢", "玩", "玫", "玮", "环", "现", "玲", "玳", "玷", "玺", "玻", "珀", "珂", "珈", "珉", "珊", "珍", "珏", "珐", "珑", "珙", "珞", "珠", "珥", "珧", "珩", "班", "珲", "現", "球", "琅", "理", "琉", "琊", "琏", "琐", "琚", "琛", "琢", "琥", "琦", "琨", "琪", "琬", "琮", "琰", "琳", "琴", "琵", "琶", "琼", "琿", "瑁", "瑋", "瑕", "瑗", "瑙", "瑚", "瑛", "瑜", "瑞", "瑟", "瑣", "瑩", "瑪", "瑭", "瑰", "瑶", "瑷", "瑾", "璀", "璁", "璃", "璇", "璉", "璋", "璎", "璐", "璜", "璞", "璣", "璦", "璧", "璨", "璩", "環", "璺", "璽", "瓊", "瓏", "瓒", "瓔", "瓚", "瓜", "瓞", "瓠", "瓢", "瓣", "瓤", "瓦", "瓮", "瓯", "瓴", "瓶", "瓷", "瓿", "甄", "甌", "甍", "甏", "甑", "甓", "甘", "甙", "甚", "甜", "生", "産", "甥", "用", "甩", "甫", "甬", "甭", "甯", "田", "由", "甲", "申", "电", "男", "甸", "町", "画", "甾", "畀", "畅", "畈", "畋", "界", "畎", "畏", "畔", "留", "畚", "畛", "畜", "畝", "畢", "略", "畦", "番", "畫", "畲", "畴", "當", "畸", "畹", "畿", "疃", "疆", "疇", "疊", "疋", "疏", "疑", "疒", "疔", "疖", "疗", "疙", "疚", "疝", "疟", "疠", "疡", "疣", "疤", "疥", "疫", "疬", "疮", "疯", "疰", "疱", "疲", "疳", "疴", "疵", "疸", "疹", "疼", "疽", "疾", "痂", "痃", "痄", "病", "症", "痈", "痉", "痊", "痍", "痒", "痔", "痕", "痖", "痘", "痙", "痛", "痞", "痢", "痣", "痤", "痦", "痧", "痨", "痪", "痫", "痰", "痱", "痴", "痹", "痼", "痿", "瘀", "瘁", "瘂", "瘃", "瘅", "瘊", "瘋", "瘌", "瘍", "瘐", "瘓", "瘕", "瘗", "瘘", "瘙", "瘛", "瘞", "瘟", "瘠", "瘡", "瘢", "瘤", "瘥", "瘦", "瘧", "瘩", "瘪", "瘫", "瘭", "瘰", "瘳", "瘴", "瘵", "瘸", "瘻", "瘼", "瘾", "瘿", "癀", "療", "癃", "癆", "癇", "癉", "癌", "癍", "癔", "癖", "癘", "癜", "癞", "癟", "癢", "癣", "癤", "癥", "癧", "癩", "癫", "癬", "癭", "癮", "癯", "癰", "癱", "癲", "癸", "登", "發", "白", "百", "皂", "的", "皆", "皇", "皈", "皋", "皎", "皑", "皓", "皖", "皙", "皚", "皤", "皮", "皱", "皲", "皴", "皸", "皺", "皿", "盂", "盅", "盆", "盈", "益", "盍", "盎", "盏", "盐", "监", "盒", "盔", "盖", "盗", "盘", "盛", "盞", "盟", "盡", "監", "盤", "盥", "盧", "目", "盯", "盱", "盲", "直", "相", "盹", "盼", "盾", "省", "眄", "眇", "眈", "眉", "看", "眍", "眙", "眚", "真", "眠", "眢", "眦", "眨", "眩", "眭", "眯", "眵", "眶", "眷", "眸", "眺", "眼", "着", "睁", "睃", "睇", "睏", "睐", "睑", "睚", "睛", "睜", "睞", "睡", "睢", "督", "睥", "睦", "睨", "睫", "睬", "睹", "睽", "睾", "睿", "瞀", "瞄", "瞅", "瞌", "瞍", "瞎", "瞑", "瞒", "瞘", "瞞", "瞟", "瞠", "瞢", "瞥", "瞧", "瞩", "瞪", "瞬", "瞭", "瞰", "瞳", "瞵", "瞻", "瞼", "瞽", "瞿", "矇", "矍", "矗", "矚", "矛", "矜", "矢", "矣", "知", "矧", "矩", "矫", "矬", "短", "矮", "矯", "石", "矶", "矸", "矽", "矾", "矿", "砀", "码", "砂", "砉", "砌", "砍", "砑", "砒", "研", "砖", "砗", "砘", "砚", "砜", "砝", "砟", "砣", "砥", "砦", "砧", "砩", "砬", "砭", "砰", "破", "砷", "砸", "砹", "砺", "砻", "砼", "砾", "础", "硃", "硅", "硇", "硌", "硎", "硐", "硒", "硕", "硖", "硗", "硝", "硤", "硨", "硪", "硫", "硬", "硭", "确", "硯", "硷", "硼", "碇", "碉", "碌", "碍", "碎", "碑", "碓", "碗", "碘", "碚", "碛", "碜", "碟", "碡", "碣", "碥", "碧", "碩", "碭", "碰", "碱", "碲", "碳", "碴", "碸", "碹", "確", "碼", "碾", "磁", "磅", "磉", "磊", "磋", "磐", "磔", "磕", "磙", "磚", "磣", "磧", "磨", "磬", "磯", "磲", "磴", "磷", "磺", "磽", "礁", "礅", "礎", "礓", "礙", "礞", "礤", "礦", "礪", "礫", "礬", "礱", "礴", "示", "礻", "礼", "社", "祀", "祁", "祆", "祈", "祉", "祓", "祖", "祗", "祚", "祛", "祜", "祝", "神", "祟", "祠", "祢", "祥", "祧", "票", "祭", "祯", "祷", "祸", "祺", "禀", "禁", "禄", "禅", "禊", "禍", "禎", "福", "禚", "禦", "禧", "禪", "禮", "禰", "禱", "禳", "禹", "禺", "离", "禽", "禾", "秀", "私", "秃", "秆", "秉", "秋", "种", "科", "秒", "秕", "秘", "租", "秣", "秤", "秦", "秧", "秩", "秫", "秭", "积", "称", "秸", "移", "秽", "稀", "稂", "稃", "稆", "程", "稍", "税", "稔", "稗", "稚", "稞", "稠", "稣", "種", "稱", "稳", "稷", "稹", "稻", "稼", "稽", "稿", "穀", "穆", "穌", "積", "穎", "穑", "穗", "穡", "穢", "穩", "穫", "穰", "穴", "究", "穷", "穸", "穹", "空", "穿", "窀", "突", "窃", "窄", "窆", "窈", "窍", "窑", "窒", "窕", "窖", "窗", "窘", "窜", "窝", "窟", "窠", "窥", "窦", "窨", "窩", "窪", "窬", "窭", "窮", "窳", "窶", "窺", "窿", "竄", "竅", "竇", "竈", "竊", "立", "竖", "站", "竞", "竟", "章", "竣", "童", "竦", "竪", "竭", "端", "競", "竹", "竺", "竽", "竿", "笃", "笄", "笆", "笈", "笊", "笋", "笏", "笑", "笔", "笕", "笙", "笛", "笞", "笠", "笤", "笥", "符", "笨", "笪", "笫", "第", "笮", "笱", "笳", "笸", "笺", "笼", "笾", "筅", "筆", "筇", "等", "筋", "筌", "筏", "筐", "筑", "筒", "答", "策", "筘", "筚", "筛", "筝", "筠", "筢", "筧", "筮", "筱", "筲", "筵", "筷", "筹", "筻", "签", "简", "箅", "箋", "箍", "箏", "箐", "箔", "箕", "算", "箜", "箝", "管", "箢", "箦", "箧", "箨", "箩", "箪", "箫", "箬", "箭", "箱", "箴", "箸", "節", "篁", "範", "篆", "篇", "築", "篋", "篌", "篑", "篓", "篙", "篚", "篝", "篡", "篤", "篥", "篦", "篩", "篪", "篮", "篱", "篳", "篷", "篼", "篾", "簀", "簇", "簋", "簌", "簍", "簏", "簖", "簞", "簟", "簡", "簣", "簦", "簧", "簪", "簫", "簸", "簽", "簾", "簿", "籀", "籁", "籃", "籌", "籍", "籜", "籟", "籠", "籤", "籩", "籪", "籬", "籮", "籲", "米", "籴", "类", "籼", "籽", "粉", "粑", "粒", "粕", "粗", "粘", "粜", "粝", "粞", "粟", "粢", "粤", "粥", "粪", "粮", "粱", "粲", "粳", "粹", "粼", "粽", "精", "糁", "糅", "糇", "糈", "糊", "糌", "糍", "糕", "糖", "糗", "糙", "糜", "糝", "糞", "糟", "糠", "糧", "糨", "糯", "糰", "糲", "糴", "糶", "糸", "糹", "系", "糾", "紀", "紂", "約", "紅", "紆", "紇", "紈", "紉", "紊", "紋", "納", "紐", "紓", "純", "紕", "紗", "紙", "級", "紛", "紜", "素", "紡", "索", "紧", "紫", "累", "細", "紱", "紲", "紳", "紹", "紺", "紼", "紿", "絀", "終", "組", "絆", "絎", "結", "絝", "絞", "絡", "絢", "給", "絨", "絮", "統", "絲", "絳", "絶", "絷", "絹", "綁", "綃", "綆", "綈", "綉", "綏", "經", "綜", "綞", "綢", "綣", "綦", "綫", "綬", "維", "綮", "綰", "綱", "網", "綳", "綴", "綸", "綹", "綺", "綻", "綽", "綾", "綿", "緄", "緇", "緊", "緋", "緑", "緒", "緔", "緗", "緘", "緙", "緝", "緞", "締", "緡", "緣", "緦", "編", "緩", "緬", "緯", "緱", "緲", "練", "緶", "緹", "緻", "縈", "縉", "縊", "縋", "縐", "縑", "縛", "縝", "縞", "縟", "縣", "縧", "縫", "縭", "縮", "縱", "縲", "縴", "縵", "縶", "縷", "縹", "縻", "總", "績", "繁", "繅", "繆", "繇", "繒", "織", "繕", "繚", "繞", "繢", "繩", "繪", "繫", "繭", "繮", "繯", "繰", "繳", "繹", "繼", "繽", "繾", "纂", "纈", "纊", "續", "纍", "纏", "纓", "纔", "纖", "纘", "纛", "纜", "纟", "纠", "纡", "红", "纣", "纤", "纥", "约", "级", "纨", "纩", "纪", "纫", "纬", "纭", "纯", "纰", "纱", "纲", "纳", "纵", "纶", "纷", "纸", "纹", "纺", "纽", "纾", "线", "绀", "绁", "绂", "练", "组", "绅", "细", "织", "终", "绉", "绊", "绋", "绌", "绍", "绎", "经", "绐", "绑", "绒", "结", "绔", "绕", "绗", "绘", "给", "绚", "绛", "络", "绝", "绞", "统", "绠", "绡", "绢", "绣", "绥", "绦", "继", "绨", "绩", "绪", "绫", "续", "绮", "绯", "绰", "绱", "绲", "绳", "维", "绵", "绶", "绷", "绸", "绺", "绻", "综", "绽", "绾", "绿", "缀", "缁", "缂", "缃", "缄", "缅", "缆", "缇", "缈", "缉", "缋", "缌", "缍", "缎", "缏", "缑", "缒", "缓", "缔", "缕", "编", "缗", "缘", "缙", "缚", "缛", "缜", "缝", "缟", "缠", "缡", "缢", "缣", "缤", "缥", "缦", "缧", "缨", "缩", "缪", "缫", "缬", "缭", "缮", "缯", "缰", "缱", "缲", "缳", "缴", "缵", "缶", "缸", "缺", "罂", "罄", "罅", "罌", "罎", "罐", "网", "罔", "罕", "罗", "罘", "罚", "罟", "罡", "罢", "罨", "罩", "罪", "置", "罰", "罱", "署", "罴", "罷", "罹", "罾", "羁", "羅", "羆", "羈", "羊", "羌", "美", "羔", "羚", "羝", "羞", "羟", "羡", "群", "羥", "羧", "義", "羯", "羰", "羲", "羸", "羹", "羼", "羽", "羿", "翁", "翅", "翊", "翌", "翎", "習", "翔", "翕", "翘", "翟", "翠", "翡", "翥", "翦", "翩", "翮", "翰", "翱", "翳", "翹", "翻", "翼", "耀", "老", "考", "耄", "者", "耆", "耋", "而", "耍", "耐", "耒", "耔", "耕", "耖", "耗", "耘", "耙", "耜", "耠", "耢", "耥", "耦", "耧", "耨", "耩", "耪", "耬", "耮", "耱", "耳", "耵", "耶", "耷", "耸", "耻", "耽", "耿", "聂", "聃", "聆", "聊", "聋", "职", "聍", "聒", "联", "聖", "聘", "聚", "聞", "聩", "聪", "聯", "聰", "聱", "聲", "聳", "聵", "聶", "職", "聹", "聽", "聾", "聿", "肀", "肃", "肄", "肅", "肆", "肇", "肉", "肋", "肌", "肓", "肖", "肘", "肚", "肛", "肜", "肝", "肟", "肠", "股", "肢", "肤", "肥", "肩", "肪", "肫", "肭", "肮", "肯", "肱", "育", "肴", "肷", "肺", "肼", "肽", "肾", "肿", "胀", "胁", "胂", "胃", "胄", "胆", "背", "胍", "胎", "胖", "胗", "胙", "胚", "胛", "胜", "胝", "胞", "胡", "胤", "胥", "胧", "胨", "胩", "胪", "胫", "胬", "胭", "胯", "胰", "胱", "胲", "胳", "胴", "胶", "胸", "胺", "胼", "能", "脂", "脅", "脆", "脉", "脊", "脍", "脎", "脏", "脐", "脑", "脒", "脓", "脔", "脖", "脘", "脚", "脛", "脞", "脬", "脯", "脱", "脲", "脶", "脸", "脹", "脾", "腆", "腈", "腊", "腋", "腌", "腎", "腐", "腑", "腓", "腔", "腕", "腖", "腙", "腚", "腠", "腡", "腥", "腦", "腧", "腩", "腫", "腭", "腮", "腰", "腱", "腴", "腸", "腹", "腺", "腻", "腼", "腽", "腾", "腿", "膀", "膂", "膈", "膊", "膏", "膑", "膘", "膚", "膛", "膜", "膝", "膠", "膣", "膦", "膨", "膩", "膪", "膳", "膺", "膻", "膽", "膾", "膿", "臀", "臁", "臂", "臃", "臆", "臉", "臊", "臌", "臍", "臏", "臘", "臚", "臟", "臠", "臣", "臧", "臨", "自", "臬", "臭", "至", "致", "臺", "臻", "臼", "臾", "舀", "舁", "舂", "舄", "舅", "舆", "與", "興", "舉", "舊", "舌", "舍", "舐", "舒", "舔", "舛", "舜", "舞", "舟", "舡", "舢", "舣", "舨", "航", "舫", "般", "舭", "舯", "舰", "舱", "舳", "舴", "舵", "舶", "舷", "舸", "船", "舻", "舾", "艄", "艇", "艉", "艋", "艏", "艘", "艙", "艚", "艟", "艤", "艦", "艨", "艫", "艮", "良", "艰", "艱", "色", "艳", "艴", "艷", "艹", "艺", "艽", "艾", "艿", "节", "芄", "芈", "芊", "芋", "芍", "芎", "芏", "芑", "芒", "芗", "芘", "芙", "芜", "芝", "芟", "芡", "芤", "芥", "芦", "芨", "芩", "芪", "芫", "芬", "芭", "芮", "芯", "芰", "花", "芳", "芴", "芷", "芸", "芹", "芻", "芽", "芾", "苁", "苄", "苇", "苈", "苊", "苋", "苌", "苍", "苎", "苏", "苑", "苒", "苓", "苔", "苕", "苗", "苘", "苛", "苜", "苞", "苟", "苠", "苡", "苣", "苤", "若", "苦", "苧", "苫", "苯", "英", "苴", "苷", "苹", "苻", "茁", "茂", "范", "茄", "茅", "茆", "茇", "茈", "茉", "茌", "茎", "茏", "茑", "茔", "茕", "茗", "茚", "茛", "茜", "茧", "茨", "茫", "茬", "茭", "茯", "茱", "茳", "茴", "茵", "茶", "茸", "茹", "茺", "茼", "荀", "荃", "荆", "荇", "草", "荏", "荐", "荑", "荒", "荔", "荚", "荛", "荜", "荞", "荟", "荠", "荡", "荣", "荤", "荥", "荦", "荧", "荨", "荩", "荪", "荫", "荬", "荭", "荮", "药", "荷", "荸", "荻", "荼", "荽", "莅", "莆", "莉", "莊", "莎", "莒", "莓", "莖", "莘", "莛", "莜", "莞", "莠", "莢", "莧", "莨", "莩", "莪", "莫", "莰", "莱", "莲", "莳", "莴", "莶", "获", "莸", "莹", "莺", "莼", "莽", "菀", "菁", "菅", "菇", "菊", "菌", "菏", "菔", "菖", "菘", "菜", "菝", "菟", "菠", "菡", "菥", "菩", "菪", "華", "菰", "菱", "菲", "菸", "菹", "菽", "萁", "萃", "萄", "萆", "萇", "萊", "萋", "萌", "萍", "萎", "萏", "萑", "萘", "萜", "萝", "萤", "营", "萦", "萧", "萨", "萬", "萱", "萵", "萸", "萼", "落", "葆", "葉", "葑", "葒", "著", "葙", "葚", "葛", "葜", "葡", "董", "葤", "葦", "葩", "葫", "葬", "葭", "葯", "葱", "葳", "葵", "葶", "葷", "葸", "葺", "蒂", "蒇", "蒈", "蒉", "蒋", "蒌", "蒎", "蒓", "蒔", "蒗", "蒙", "蒜", "蒡", "蒯", "蒲", "蒴", "蒸", "蒹", "蒺", "蒼", "蒽", "蒿", "蓀", "蓁", "蓄", "蓉", "蓊", "蓋", "蓍", "蓐", "蓑", "蓓", "蓖", "蓝", "蓟", "蓠", "蓣", "蓥", "蓦", "蓬", "蓮", "蓯", "蓰", "蓼", "蓽", "蓿", "蔌", "蔑", "蔓", "蔔", "蔗", "蔚", "蔞", "蔟", "蔡", "蔣", "蔦", "蔫", "蔬", "蔭", "蔷", "蔸", "蔹", "蔺", "蔻", "蔼", "蔽", "蕁", "蕃", "蕆", "蕈", "蕉", "蕊", "蕎", "蕒", "蕓", "蕕", "蕖", "蕘", "蕙", "蕞", "蕢", "蕤", "蕨", "蕩", "蕪", "蕭", "蕲", "蕴", "蕷", "蕹", "蕺", "蕻", "蕾", "薄", "薅", "薇", "薈", "薊", "薌", "薏", "薑", "薔", "薛", "薜", "薟", "薤", "薦", "薨", "薩", "薪", "薮", "薯", "薰", "薷", "薹", "薺", "藁", "藉", "藍", "藎", "藏", "藐", "藓", "藕", "藜", "藝", "藤", "藥", "藩", "藪", "藴", "藶", "藹", "藺", "藻", "藿", "蘄", "蘅", "蘆", "蘇", "蘋", "蘑", "蘖", "蘚", "蘞", "蘢", "蘧", "蘩", "蘭", "蘸", "蘺", "蘼", "蘿", "虍", "虎", "虏", "虐", "虑", "虔", "處", "虚", "虜", "虞", "號", "虢", "虧", "虫", "虬", "虮", "虱", "虹", "虺", "虻", "虼", "虽", "虾", "虿", "蚀", "蚁", "蚂", "蚊", "蚋", "蚌", "蚍", "蚓", "蚕", "蚜", "蚝", "蚣", "蚤", "蚧", "蚨", "蚩", "蚪", "蚬", "蚯", "蚰", "蚱", "蚴", "蚵", "蚶", "蚺", "蛀", "蛄", "蛆", "蛇", "蛉", "蛊", "蛋", "蛎", "蛏", "蛐", "蛑", "蛔", "蛘", "蛙", "蛛", "蛞", "蛟", "蛤", "蛩", "蛭", "蛮", "蛰", "蛱", "蛲", "蛳", "蛴", "蛸", "蛹", "蛺", "蛾", "蜀", "蜂", "蜃", "蜆", "蜇", "蜈", "蜉", "蜊", "蜍", "蜒", "蜓", "蜕", "蜗", "蜘", "蜚", "蜜", "蜞", "蜡", "蜢", "蜣", "蜥", "蜩", "蜮", "蜱", "蜴", "蜷", "蜻", "蜾", "蜿", "蝇", "蝈", "蝉", "蝌", "蝎", "蝓", "蝕", "蝗", "蝙", "蝠", "蝣", "蝤", "蝥", "蝦", "蝮", "蝰", "蝴", "蝶", "蝸", "蝻", "蝼", "蝽", "蝾", "螂", "螃", "螄", "螅", "螈", "螋", "融", "螓", "螗", "螞", "螟", "螢", "螨", "螫", "螬", "螭", "螯", "螳", "螵", "螺", "螻", "螽", "蟀", "蟄", "蟆", "蟈", "蟊", "蟋", "蟎", "蟑", "蟒", "蟓", "蟛", "蟠", "蟣", "蟥", "蟪", "蟬", "蟮", "蟯", "蟲", "蟶", "蟹", "蟻", "蟾", "蠃", "蠅", "蠆", "蠊", "蠐", "蠑", "蠓", "蠕", "蠖", "蠛", "蠟", "蠡", "蠢", "蠣", "蠱", "蠲", "蠶", "蠹", "蠻", "蠼", "血", "衄", "衅", "衆", "衊", "行", "衍", "術", "衔", "街", "衙", "衛", "衝", "衡", "衢", "衣", "衤", "补", "表", "衩", "衫", "衬", "衮", "衰", "衲", "衷", "衹", "衽", "衾", "衿", "袁", "袂", "袄", "袅", "袈", "袋", "袍", "袒", "袖", "袜", "袢", "袤", "被", "袭", "袱", "袷", "袼", "裁", "裂", "装", "裆", "裉", "裊", "裎", "裏", "裒", "裔", "裕", "裘", "裙", "補", "裝", "裟", "裢", "裣", "裤", "裥", "裨", "裰", "裱", "裳", "裴", "裸", "裹", "裼", "製", "裾", "褂", "複", "褊", "褐", "褒", "褓", "褙", "褚", "褛", "褡", "褥", "褪", "褫", "褰", "褲", "褳", "褴", "褶", "褸", "褻", "襁", "襄", "襇", "襖", "襝", "襞", "襟", "襠", "襤", "襦", "襪", "襬", "襯", "襲", "襻", "西", "要", "覃", "覆", "見", "規", "覓", "視", "覘", "覡", "覦", "親", "覬", "覯", "覲", "覷", "覺", "覽", "覿", "觀", "见", "观", "规", "觅", "视", "觇", "览", "觉", "觊", "觋", "觌", "觎", "觏", "觐", "觑", "角", "觖", "觚", "觜", "觞", "解", "觥", "触", "觫", "觯", "觳", "觴", "觶", "觸", "言", "訁", "訂", "訃", "訇", "計", "訊", "訌", "討", "訐", "訓", "訕", "訖", "記", "訛", "訝", "訟", "訣", "訥", "訪", "設", "許", "訴", "訶", "診", "訾", "詁", "詆", "詈", "詎", "詐", "詒", "詔", "評", "詘", "詛", "詞", "詡", "詢", "詣", "試", "詩", "詫", "詬", "詭", "詮", "詰", "話", "該", "詳", "詵", "詹", "詼", "詿", "誄", "誅", "誆", "誇", "誉", "誊", "認", "誑", "誒", "誓", "誕", "誘", "誚", "語", "誠", "誡", "誣", "誤", "誥", "誦", "誨", "説", "誰", "課", "誶", "誹", "誼", "調", "諂", "諄", "談", "諉", "請", "諍", "諏", "諑", "諒", "論", "諗", "諛", "諜", "諞", "諢", "諤", "諦", "諧", "諫", "諭", "諮", "諱", "諳", "諶", "諷", "諸", "諺", "諼", "諾", "謀", "謁", "謂", "謄", "謅", "謇", "謊", "謎", "謐", "謔", "謖", "謗", "謙", "謚", "講", "謝", "謡", "謦", "謨", "謫", "謬", "謭", "謳", "謹", "謾", "證", "譎", "譏", "譖", "識", "譙", "譚", "譜", "警", "譫", "譬", "譯", "議", "譴", "護", "譽", "讀", "變", "讎", "讒", "讓", "讕", "讖", "讜", "讞", "讠", "计", "订", "讣", "认", "讥", "讦", "讧", "讨", "让", "讪", "讫", "训", "议", "讯", "记", "讲", "讳", "讴", "讵", "讶", "讷", "许", "讹", "论", "讼", "讽", "设", "访", "诀", "证", "诂", "诃", "评", "诅", "识", "诈", "诉", "诊", "诋", "诌", "词", "诎", "诏", "译", "诒", "诓", "诔", "试", "诖", "诗", "诘", "诙", "诚", "诛", "诜", "话", "诞", "诟", "诠", "诡", "询", "诣", "诤", "该", "详", "诧", "诨", "诩", "诫", "诬", "语", "诮", "误", "诰", "诱", "诲", "诳", "说", "诵", "诶", "请", "诸", "诹", "诺", "读", "诼", "诽", "课", "诿", "谀", "谁", "谂", "调", "谄", "谅", "谆", "谇", "谈", "谊", "谋", "谌", "谍", "谎", "谏", "谐", "谑", "谒", "谓", "谔", "谕", "谖", "谗", "谘", "谙", "谚", "谛", "谜", "谝", "谟", "谠", "谡", "谢", "谣", "谤", "谥", "谦", "谧", "谨", "谩", "谪", "谫", "谬", "谭", "谮", "谯", "谰", "谱", "谲", "谳", "谴", "谵", "谶", "谷", "豁", "豆", "豇", "豈", "豉", "豌", "豐", "豕", "豚", "象", "豢", "豪", "豫", "豳", "豸", "豹", "豺", "貂", "貅", "貉", "貊", "貌", "貔", "貘", "貝", "貞", "負", "財", "貢", "貧", "貨", "販", "貪", "貫", "責", "貯", "貰", "貲", "貳", "貴", "貶", "買", "貸", "貺", "費", "貼", "貽", "貿", "賀", "賁", "賂", "賃", "賄", "賅", "資", "賈", "賊", "賑", "賒", "賓", "賕", "賚", "賜", "賞", "賠", "賡", "賢", "賣", "賤", "賦", "賧", "質", "賫", "賬", "賭", "賴", "賺", "賻", "購", "賽", "賾", "贄", "贅", "贈", "贊", "贋", "贍", "贏", "贐", "贖", "贛", "贜", "贝", "贞", "负", "贡", "财", "责", "贤", "败", "账", "货", "质", "贩", "贪", "贫", "贬", "购", "贮", "贯", "贰", "贱", "贲", "贳", "贴", "贵", "贶", "贷", "贸", "费", "贺", "贻", "贼", "贽", "贾", "贿", "赀", "赁", "赂", "赃", "资", "赅", "赆", "赇", "赈", "赉", "赊", "赋", "赌", "赍", "赎", "赏", "赐", "赓", "赔", "赕", "赖", "赘", "赙", "赚", "赛", "赜", "赝", "赞", "赠", "赡", "赢", "赣", "赤", "赦", "赧", "赫", "赭", "走", "赳", "赴", "赵", "赶", "起", "趁", "趄", "超", "越", "趋", "趑", "趔", "趕", "趙", "趟", "趣", "趨", "趱", "趲", "足", "趴", "趵", "趸", "趺", "趼", "趾", "趿", "跃", "跄", "跆", "跋", "跌", "跎", "跏", "跑", "跖", "跗", "跚", "跛", "距", "跞", "跟", "跣", "跤", "跨", "跪", "跫", "跬", "路", "跳", "践", "跷", "跸", "跹", "跺", "跻", "跽", "踅", "踉", "踊", "踌", "踏", "踐", "踔", "踝", "踞", "踟", "踢", "踣", "踩", "踪", "踬", "踮", "踯", "踱", "踴", "踵", "踹", "踺", "踽", "蹀", "蹁", "蹂", "蹄", "蹇", "蹈", "蹉", "蹊", "蹋", "蹌", "蹑", "蹒", "蹕", "蹙", "蹣", "蹦", "蹩", "蹬", "蹭", "蹯", "蹰", "蹲", "蹴", "蹶", "蹺", "蹼", "蹿", "躁", "躅", "躇", "躉", "躊", "躋", "躍", "躏", "躐", "躑", "躒", "躓", "躔", "躚", "躜", "躞", "躡", "躥", "躦", "躪", "身", "躬", "躯", "躲", "躺", "軀", "車", "軋", "軌", "軍", "軎", "軒", "軔", "軛", "軟", "軤", "軫", "軲", "軸", "軹", "軺", "軻", "軼", "軾", "較", "輅", "輇", "載", "輊", "輒", "輔", "輕", "輛", "輜", "輝", "輞", "輟", "輥", "輦", "輩", "輪", "輯", "輳", "輸", "輻", "輾", "輿", "轂", "轄", "轅", "轆", "轉", "轍", "轎", "轔", "轟", "轡", "轢", "轤", "车", "轧", "轨", "轩", "轫", "转", "轭", "轮", "软", "轰", "轱", "轲", "轳", "轴", "轵", "轶", "轷", "轸", "轹", "轺", "轻", "轼", "载", "轾", "轿", "辁", "辂", "较", "辄", "辅", "辆", "辇", "辈", "辉", "辊", "辋", "辍", "辎", "辏", "辐", "辑", "输", "辔", "辕", "辖", "辗", "辘", "辙", "辚", "辛", "辜", "辞", "辟", "辣", "辦", "辨", "辩", "辫", "辭", "辮", "辯", "辰", "辱", "農", "辶", "边", "辽", "达", "迁", "迂", "迄", "迅", "过", "迈", "迎", "运", "近", "迓", "返", "迕", "还", "这", "进", "远", "违", "连", "迟", "迢", "迤", "迥", "迦", "迨", "迩", "迪", "迫", "迭", "迮", "述", "迳", "迴", "迷", "迸", "迹", "追", "退", "送", "适", "逃", "逄", "逅", "逆", "选", "逊", "逋", "逍", "透", "逐", "逑", "递", "途", "逕", "逖", "逗", "這", "通", "逛", "逝", "逞", "速", "造", "逡", "逢", "連", "逦", "逭", "逮", "逯", "進", "逵", "逶", "逸", "逻", "逼", "逾", "遁", "遂", "遄", "遇", "運", "遍", "過", "遏", "遐", "遑", "遒", "道", "達", "違", "遗", "遘", "遛", "遜", "遞", "遠", "遢", "遣", "遥", "遨", "適", "遭", "遮", "遲", "遴", "遵", "遷", "選", "遺", "遼", "遽", "避", "邀", "邁", "邂", "邃", "還", "邇", "邈", "邊", "邋", "邏", "邐", "邑", "邓", "邕", "邗", "邙", "邛", "邝", "邡", "邢", "那", "邦", "邪", "邬", "邮", "邯", "邰", "邱", "邳", "邴", "邵", "邶", "邸", "邹", "邺", "邻", "邾", "郁", "郄", "郅", "郇", "郊", "郎", "郏", "郐", "郑", "郓", "郗", "郛", "郜", "郝", "郟", "郡", "郢", "郦", "郧", "部", "郫", "郭", "郯", "郴", "郵", "郸", "都", "郾", "鄂", "鄄", "鄆", "鄉", "鄒", "鄔", "鄖", "鄙", "鄞", "鄢", "鄣", "鄧", "鄭", "鄯", "鄰", "鄱", "鄲", "鄴", "鄶", "鄹", "鄺", "酃", "酆", "酈", "酉", "酊", "酋", "酌", "配", "酎", "酏", "酐", "酒", "酗", "酚", "酝", "酞", "酡", "酢", "酣", "酤", "酥", "酩", "酪", "酬", "酮", "酯", "酰", "酱", "酲", "酴", "酵", "酶", "酷", "酸", "酹", "酽", "酾", "酿", "醅", "醇", "醉", "醋", "醌", "醍", "醐", "醑", "醒", "醖", "醚", "醛", "醜", "醢", "醣", "醪", "醫", "醬", "醭", "醮", "醯", "醴", "醵", "醺", "釀", "釁", "釃", "釅", "采", "釉", "释", "釋", "里", "重", "野", "量", "金", "釒", "釓", "釔", "釕", "釗", "釘", "釙", "釜", "針", "釣", "釤", "釧", "釩", "釵", "釷", "釹", "釺", "鈀", "鈁", "鈄", "鈈", "鈉", "鈍", "鈎", "鈐", "鈑", "鈔", "鈕", "鈞", "鈣", "鈥", "鈦", "鈧", "鈮", "鈰", "鈳", "鈴", "鈷", "鈸", "鈹", "鈺", "鈽", "鈾", "鈿", "鉀", "鉅", "鉈", "鉉", "鉍", "鉑", "鉕", "鉗", "鉚", "鉛", "鉞", "鉢", "鉦", "鉬", "鉭", "鉴", "鉸", "鉺", "鉻", "鉿", "銀", "銃", "銅", "銎", "銑", "銓", "銖", "銘", "銚", "銜", "銠", "銣", "銥", "銦", "銨", "銩", "銪", "銫", "銬", "銮", "銱", "銷", "銹", "銻", "銼", "鋁", "鋃", "鋅", "鋇", "鋈", "鋌", "鋏", "鋒", "鋝", "鋟", "鋣", "鋤", "鋥", "鋦", "鋨", "鋪", "鋭", "鋮", "鋯", "鋰", "鋱", "鋶", "鋸", "鋼", "錁", "錆", "錇", "錈", "錐", "錒", "錕", "錘", "錙", "錚", "錛", "錟", "錠", "錢", "錦", "錨", "錫", "錮", "錯", "録", "錳", "錶", "錸", "錾", "鍀", "鍁", "鍃", "鍆", "鍇", "鍋", "鍍", "鍔", "鍘", "鍛", "鍤", "鍥", "鍩", "鍪", "鍬", "鍰", "鍵", "鍶", "鍺", "鍾", "鎂", "鎄", "鎇", "鎊", "鎏", "鎖", "鎘", "鎢", "鎣", "鎦", "鎧", "鎩", "鎪", "鎬", "鎮", "鎰", "鎳", "鎵", "鎸", "鎿", "鏃", "鏇", "鏈", "鏊", "鏌", "鏍", "鏑", "鏖", "鏗", "鏘", "鏜", "鏝", "鏞", "鏟", "鏡", "鏢", "鏤", "鏨", "鏵", "鏷", "鏹", "鐃", "鐋", "鐐", "鐒", "鐓", "鐔", "鐘", "鐙", "鐝", "鐠", "鐦", "鐧", "鐨", "鐮", "鐲", "鐳", "鐵", "鐸", "鐺", "鐾", "鐿", "鑄", "鑊", "鑌", "鑒", "鑔", "鑠", "鑣", "鑥", "鑫", "鑭", "鑰", "鑲", "鑷", "鑹", "鑼", "鑽", "鑾", "鑿", "钅", "钆", "钇", "针", "钉", "钊", "钋", "钌", "钍", "钎", "钏", "钐", "钒", "钓", "钔", "钕", "钗", "钙", "钚", "钛", "钜", "钝", "钞", "钟", "钠", "钡", "钢", "钣", "钤", "钥", "钦", "钧", "钨", "钩", "钪", "钫", "钬", "钭", "钮", "钯", "钰", "钱", "钲", "钳", "钴", "钵", "钶", "钷", "钸", "钹", "钺", "钻", "钼", "钽", "钾", "钿", "铀", "铁", "铂", "铃", "铄", "铅", "铆", "铈", "铉", "铊", "铋", "铌", "铍", "铎", "铐", "铑", "铒", "铕", "铖", "铗", "铘", "铙", "铛", "铜", "铝", "铞", "铟", "铠", "铡", "铢", "铣", "铤", "铥", "铧", "铨", "铩", "铪", "铫", "铬", "铭", "铮", "铯", "铰", "铱", "铲", "铳", "铴", "铵", "银", "铷", "铸", "铹", "铺", "铼", "铽", "链", "铿", "销", "锁", "锂", "锃", "锄", "锅", "锆", "锇", "锈", "锉", "锊", "锋", "锌", "锍", "锎", "锏", "锐", "锑", "锒", "锓", "锔", "锕", "锖", "锗", "锘", "错", "锚", "锛", "锝", "锞", "锟", "锡", "锢", "锣", "锤", "锥", "锦", "锨", "锩", "锪", "锫", "锬", "锭", "键", "锯", "锰", "锱", "锲", "锴", "锵", "锶", "锷", "锸", "锹", "锺", "锻", "锼", "锾", "锿", "镀", "镁", "镂", "镄", "镅", "镆", "镇", "镉", "镊", "镌", "镍", "镎", "镏", "镐", "镑", "镒", "镓", "镔", "镖", "镗", "镘", "镙", "镛", "镜", "镝", "镞", "镟", "镡", "镢", "镣", "镤", "镥", "镦", "镧", "镨", "镩", "镪", "镫", "镬", "镭", "镯", "镰", "镱", "镲", "镳", "镶", "長", "长", "門", "閂", "閃", "閆", "閉", "開", "閌", "閎", "閏", "閑", "間", "閔", "閘", "閡", "閣", "閤", "閥", "閨", "閩", "閫", "閬", "閭", "閲", "閶", "閹", "閻", "閼", "閽", "閾", "閿", "闃", "闆", "闈", "闊", "闋", "闌", "闐", "闔", "闕", "闖", "關", "闞", "闡", "闢", "闥", "门", "闩", "闪", "闫", "闭", "问", "闯", "闰", "闱", "闲", "闳", "间", "闵", "闶", "闷", "闸", "闹", "闺", "闻", "闼", "闽", "闾", "阀", "阁", "阂", "阃", "阄", "阅", "阆", "阈", "阉", "阊", "阋", "阌", "阍", "阎", "阏", "阐", "阑", "阒", "阔", "阕", "阖", "阗", "阙", "阚", "阜", "阝", "队", "阡", "阢", "阪", "阮", "阱", "防", "阳", "阴", "阵", "阶", "阻", "阼", "阽", "阿", "陀", "陂", "附", "际", "陆", "陇", "陈", "陉", "陋", "陌", "降", "限", "陔", "陕", "陘", "陛", "陝", "陟", "陡", "院", "陣", "除", "陧", "陨", "险", "陪", "陬", "陰", "陲", "陳", "陴", "陵", "陶", "陷", "陸", "陽", "隅", "隆", "隈", "隉", "隊", "隋", "隍", "階", "随", "隐", "隔", "隕", "隗", "隘", "隙", "際", "障", "隧", "隨", "險", "隰", "隱", "隳", "隴", "隶", "隸", "隹", "隻", "隼", "隽", "难", "雀", "雁", "雄", "雅", "集", "雇", "雉", "雌", "雍", "雎", "雏", "雒", "雕", "雖", "雙", "雛", "雜", "雠", "離", "難", "雨", "雩", "雪", "雯", "雲", "雳", "零", "雷", "雹", "電", "雾", "需", "霁", "霄", "霆", "震", "霈", "霉", "霍", "霎", "霏", "霓", "霖", "霜", "霞", "霧", "霪", "霭", "霰", "露", "霸", "霹", "霽", "霾", "靂", "靄", "靈", "青", "靓", "靖", "静", "靚", "靛", "靜", "非", "靠", "靡", "面", "靥", "靨", "革", "靳", "靴", "靶", "靼", "鞅", "鞋", "鞍", "鞏", "鞑", "鞒", "鞔", "鞘", "鞠", "鞣", "鞦", "鞫", "鞭", "鞯", "鞲", "鞴", "鞽", "韃", "韆", "韉", "韋", "韌", "韓", "韙", "韜", "韞", "韦", "韧", "韩", "韪", "韫", "韬", "韭", "音", "韵", "韶", "響", "頁", "頂", "頃", "項", "順", "頇", "須", "頊", "頌", "頎", "頏", "預", "頑", "頒", "頓", "頗", "領", "頜", "頡", "頤", "頦", "頭", "頰", "頷", "頸", "頻", "頽", "顆", "題", "額", "顎", "顓", "顔", "願", "顙", "顛", "類", "顢", "顥", "顧", "顫", "顬", "顯", "顰", "顱", "顳", "顴", "页", "顶", "顷", "顸", "项", "顺", "须", "顼", "顽", "顾", "顿", "颀", "颁", "颂", "颃", "预", "颅", "领", "颇", "颈", "颉", "颊", "颌", "颍", "颏", "颐", "频", "颓", "颔", "颖", "颗", "题", "颚", "颛", "颜", "额", "颞", "颟", "颠", "颡", "颢", "颤", "颥", "颦", "颧", "風", "颮", "颯", "颱", "颳", "颶", "颼", "飄", "飆", "飈", "风", "飑", "飒", "飓", "飕", "飘", "飙", "飚", "飛", "飞", "食", "飠", "飢", "飧", "飨", "飩", "飪", "飫", "飭", "飯", "飲", "飴", "飼", "飽", "飾", "餃", "餅", "餉", "養", "餌", "餍", "餐", "餑", "餒", "餓", "餘", "餛", "餞", "餡", "館", "餮", "餳", "餷", "餼", "餾", "餿", "饃", "饅", "饈", "饉", "饊", "饋", "饌", "饑", "饒", "饔", "饕", "饗", "饜", "饞", "饢", "饣", "饥", "饧", "饨", "饩", "饪", "饫", "饬", "饭", "饮", "饯", "饰", "饱", "饲", "饴", "饵", "饶", "饷", "饺", "饼", "饽", "饿", "馀", "馁", "馄", "馅", "馆", "馇", "馈", "馊", "馋", "馍", "馏", "馐", "馑", "馒", "馓", "馔", "馕", "首", "馗", "馘", "香", "馥", "馨", "馬", "馭", "馮", "馱", "馳", "馴", "駁", "駐", "駑", "駒", "駔", "駕", "駘", "駙", "駛", "駝", "駟", "駡", "駢", "駭", "駱", "駿", "騁", "騅", "騍", "騎", "騏", "騖", "騙", "騫", "騭", "騮", "騰", "騶", "騷", "騸", "騾", "驀", "驁", "驂", "驃", "驄", "驅", "驊", "驍", "驏", "驕", "驗", "驚", "驛", "驟", "驢", "驤", "驥", "驪", "马", "驭", "驮", "驯", "驰", "驱", "驳", "驴", "驵", "驶", "驷", "驸", "驹", "驺", "驻", "驼", "驽", "驾", "驿", "骀", "骁", "骂", "骄", "骅", "骆", "骇", "骈", "骊", "骋", "验", "骏", "骐", "骑", "骒", "骓", "骖", "骗", "骘", "骚", "骛", "骜", "骝", "骞", "骟", "骠", "骡", "骢", "骣", "骤", "骥", "骧", "骨", "骯", "骰", "骱", "骶", "骷", "骸", "骺", "骼", "髀", "髁", "髂", "髅", "髋", "髌", "髏", "髑", "髒", "髓", "體", "髕", "髖", "高", "髟", "髡", "髦", "髫", "髭", "髮", "髯", "髹", "髻", "鬃", "鬆", "鬈", "鬍", "鬏", "鬓", "鬚", "鬟", "鬢", "鬣", "鬥", "鬧", "鬩", "鬮", "鬯", "鬱", "鬲", "鬻", "鬼", "魁", "魂", "魃", "魄", "魅", "魇", "魈", "魉", "魍", "魎", "魏", "魑", "魔", "魘", "魚", "魯", "魴", "魷", "鮁", "鮃", "鮎", "鮐", "鮑", "鮒", "鮚", "鮝", "鮞", "鮪", "鮫", "鮭", "鮮", "鯀", "鯁", "鯇", "鯉", "鯊", "鯔", "鯖", "鯛", "鯝", "鯡", "鯢", "鯤", "鯧", "鯨", "鯪", "鯫", "鯰", "鯴", "鯽", "鯿", "鰈", "鰉", "鰍", "鰐", "鰒", "鰓", "鰠", "鰣", "鰥", "鰨", "鰩", "鰭", "鰱", "鰲", "鰳", "鰵", "鰷", "鰹", "鰻", "鰾", "鱅", "鱈", "鱉", "鱒", "鱔", "鱖", "鱗", "鱘", "鱝", "鱟", "鱧", "鱭", "鱸", "鱺", "鱼", "鱿", "鲁", "鲂", "鲅", "鲆", "鲇", "鲈", "鲋", "鲍", "鲎", "鲐", "鲑", "鲒", "鲔", "鲕", "鲚", "鲛", "鲜", "鲞", "鲟", "鲠", "鲡", "鲢", "鲣", "鲤", "鲥", "鲦", "鲧", "鲨", "鲩", "鲫", "鲭", "鲮", "鲰", "鲱", "鲲", "鲳", "鲴", "鲵", "鲶", "鲷", "鲸", "鲺", "鲻", "鲼", "鲽", "鳃", "鳄", "鳅", "鳆", "鳇", "鳊", "鳋", "鳌", "鳍", "鳎", "鳏", "鳐", "鳓", "鳔", "鳕", "鳖", "鳗", "鳘", "鳙", "鳜", "鳝", "鳞", "鳟", "鳢", "鳥", "鳩", "鳬", "鳳", "鳴", "鳶", "鴆", "鴇", "鴉", "鴕", "鴛", "鴝", "鴟", "鴣", "鴦", "鴨", "鴯", "鴰", "鴻", "鴿", "鵂", "鵑", "鵒", "鵓", "鵜", "鵝", "鵠", "鵡", "鵪", "鵬", "鵯", "鵲", "鶇", "鶉", "鶓", "鶘", "鶚", "鶥", "鶩", "鶯", "鶴", "鶻", "鶼", "鷀", "鷂", "鷄", "鷓", "鷗", "鷙", "鷚", "鷥", "鷦", "鷯", "鷲", "鷳", "鷸", "鷹", "鷺", "鸌", "鸕", "鸚", "鸛", "鸝", "鸞", "鸟", "鸠", "鸡", "鸢", "鸣", "鸥", "鸦", "鸨", "鸩", "鸪", "鸫", "鸬", "鸭", "鸯", "鸱", "鸲", "鸳", "鸵", "鸶", "鸷", "鸸", "鸹", "鸺", "鸽", "鸾", "鸿", "鹁", "鹂", "鹃", "鹄", "鹅", "鹆", "鹇", "鹈", "鹉", "鹊", "鹋", "鹌", "鹎", "鹏", "鹑", "鹕", "鹗", "鹘", "鹚", "鹛", "鹜", "鹞", "鹣", "鹤", "鹦", "鹧", "鹨", "鹩", "鹪", "鹫", "鹬", "鹭", "鹰", "鹱", "鹳", "鹵", "鹹", "鹺", "鹼", "鹽", "鹾", "鹿", "麂", "麇", "麈", "麋", "麒", "麓", "麗", "麝", "麟", "麥", "麦", "麩", "麯", "麴", "麵", "麸", "麻", "麽", "麾", "黄", "黉", "黌", "黍", "黎", "黏", "黑", "黔", "默", "黛", "黜", "黝", "點", "黟", "黠", "黢", "黥", "黧", "黨", "黩", "黪", "黯", "黲", "黴", "黷", "黹", "黻", "黼", "黽", "黾", "黿", "鼉", "鼋", "鼍", "鼎", "鼐", "鼓", "鼕", "鼗", "鼙", "鼠", "鼢", "鼬", "鼯", "鼷", "鼹", "鼻", "鼽", "鼾", "齄", "齊", "齋", "齏", "齐", "齑", "齒", "齔", "齙", "齜", "齟", "齠", "齡", "齣", "齦", "齪", "齬", "齲", "齷", "齿", "龀", "龃", "龄", "龅", "龆", "龇", "龈", "龉", "龊", "龋", "龌", "龍", "龐", "龔", "龕", "龙", "龚", "龛", "龜", "龟", "龠", "!", """, "#", "$", "%", "&", "'", "(", ")", "*", "+", ",", "-", ".", "/", "0", "1", "2", "3", "4", "5", "6", "7", "8", "9", ":", ";", "<", "=", ">", "?", "@", "A", "B", "C", "D", "E", "F", "G", "H", "I", "J", "K", "L", "M", "N", "O", "P", "Q", "R", "S", "T", "U", "V", "W", "X", "Y", "Z", "[", "\", "]", "^", "_", "`", "a", "b", "c", "d", "e", "f", "g", "h", "i", "j", "k", "l", "m", "n", "o", "p", "q", "r", "s", "t", "u", "v", "w", "x", "y", "z", "{", "|", "}", "~", "¢", "£", " ̄", "¥"]
class BPE_Tokenizer:
def __init__(self, *, pat_str: str, mergeable_ranks: dict[bytes, int], vocab_size: int) -> None:
"""Creates an Encoding object."""
# A regex pattern string that is used to split the input text
self.pat_str = pat_str
# A dictionary mapping token bytes to their ranks. The ranks correspond to merge priority
self.mergeable_ranks = mergeable_ranks
self.vocab_size = vocab_size
self._decoder = {token: token_bytes for token_bytes, token in mergeable_ranks.items()}
self._pat = regex.compile(pat_str)
def encode(self, text: str, visualise: Optional[bool] = False) -> list[int]:
# Use the regex to split the text into (approximately) words
words = self._pat.findall(text)
tokens = []
for word in words:
# Turn each word into tokens, using the byte pair encoding algorithm
word_bytes = word.encode("utf-8")
word_tokens = bpe_encode(self.mergeable_ranks, word_bytes, visualise=visualise)
tokens.extend(word_tokens)
return tokens
def decode_bytes(self, tokens: list[int]) -> bytes:
return b"".join(self._decoder[token] for token in tokens)
def decode(self, tokens: list[int]) -> str:
return self.decode_bytes(tokens).decode("utf-8", errors="replace")
def decode_tokens_bytes(self, tokens: list[int]) -> list[bytes]:
return [self._decoder[token] for token in tokens]
def dump(self, bpe_file_path):
with blobfile.BlobFile(bpe_file_path, "wb") as f:
f.write(self.vocab_size)
f.write(self.pat_str)
for token, rank in sorted(self.mergeable_ranks.items(), key=lambda x: x[1]):
f.write(base64.b64encode(token) + b" " + str(rank).encode() + b"\n")
@staticmethod
def train(training_data: str, vocab_size: int, pat_str: str):
mergeable_ranks = bpe_train(data=training_data, vocab_size=vocab_size, pat_str=pat_str, visualise=True)
return BPE_Tokenizer(pat_str=pat_str, mergeable_ranks=mergeable_ranks, vocab_size=vocab_size)
@staticmethod
def load(bpe_file_path):
with blobfile.BlobFile(bpe_file_path, "rb") as f:
vocab_size = int(f.readline())
pat_str = str(f.readline())
contents = f.read()
mergeable_ranks = {
base64.b64decode(token): int(rank)
for token, rank in (line.split() for line in contents.splitlines() if line)
}
return BPE_Tokenizer(pat_str=pat_str, mergeable_ranks=mergeable_ranks, vocab_size=vocab_size)
def bpe_encode(mergeable_ranks: dict[bytes, int], input: bytes, visualise: Optional[bool] = False) -> list[int]:
parts = [bytes([b]) for b in input]
while True:
if visualise:
visualise_tokens(parts)
# Iterate over all pairs and find the pair we want to merge the most
min_idx = None
min_rank = None
for i, pair in enumerate(zip(parts[:-1], parts[1:])):
rank = mergeable_ranks.get(pair[0] + pair[1])
if rank is not None and (min_rank is None or rank < min_rank):
min_idx = i
min_rank = rank
# If there were no pairs we could merge, we're done!
if min_rank is None:
break
assert min_idx is not None
# Otherwise, merge that pair and leave the rest unchanged. Then repeat.
parts = parts[:min_idx] + [parts[min_idx] + parts[min_idx + 1]] + parts[min_idx + 2 :]
if visualise:
print()
tokens = [mergeable_ranks[part] for part in parts]
return tokens
def bpe_train(data: str, vocab_size: int, pat_str: str, visualise: Optional[bool] = False) -> dict[bytes, int]:
# First, add tokens for each individual byte value
if vocab_size < 2**8:
raise ValueError("vocab_size must be at least 256, so we can encode all bytes")
ranks = {}
for i in range(2**8):
ranks[bytes([i])] = i
# Splinter up our data into lists of bytes
# data = "Hello world"
# words = [
# [b'H', b'e', b'l', b'l', b'o'],
# [b' ', b'w', b'o', b'r', b'l', b'd']
# ]
words: list[list[bytes]] = [
[bytes([b]) for b in word.encode("utf-8")] for word in regex.findall(pat_str, data)
]
# Now, use our data to figure out which merges we should make
while len(ranks) < vocab_size:
# Find the most common pair. This will become our next token
stats = collections.Counter()
for piece in words:
for pair in zip(piece[:-1], piece[1:]):
stats[pair] += 1
most_common_pair = max(stats, key=lambda x: stats[x])
token_bytes = most_common_pair[0] + most_common_pair[1]
token = len(ranks)
# Add the new token!
ranks[token_bytes] = token
# Now merge that most common pair in all the words. That is, update our training data
# to reflect our decision to make that pair into a new token.
new_words = []
for word in words:
new_word = []
i = 0
while i < len(word) - 1:
if (word[i], word[i + 1]) == most_common_pair:
# We found our pair! Merge it
new_word.append(token_bytes)
i += 2
else:
new_word.append(word[i])
i += 1
if i == len(word) - 1:
new_word.append(word[i])
new_words.append(new_word)
words = new_words
# See the intermediate merges play out!
if visualise:
print(f"The current most common pair is {most_common_pair[0]} + {most_common_pair[1]}")
print(f"So we made {token_bytes} our {len(ranks)}th token")
print("Now the first fifty words in our training data look like:")
visualise_tokens([token for word in words[:50] for token in word])
print("\n")
return ranks
def visualise_tokens(token_values: list[bytes]) -> None:
background = [f"\u001b[48;5;{i}m" for i in [167, 179, 185, 77, 80, 68, 134]]
# If token boundaries do not occur at unicode character boundaries, it's unclear how best to
# visualise the token. Here, we'll just use the unicode replacement character to represent some
# fraction of a character.
unicode_token_values = [x.decode("utf-8", errors="replace") for x in token_values]
running_length = 0
last_color = None
for token in unicode_token_values:
color = background[running_length % len(background)]
if color == last_color:
color = background[(running_length + 1) % len(background)]
assert color != last_color
last_color = color
running_length += len(token)
print(color + token, end="")
print("\u001b[0m")
def train_simple_encoding():
gpt2_pattern = (
r"""'s|'t|'re|'ve|'m|'ll|'d| ?[\p{L}]+| ?[\p{N}]+| ?[^\s\p{L}\p{N}]+|\s+(?!\S)|\s+"""
)
with open("/home/bd4sur/ai/Nano/dataset/pretrain-psycho.txt", "r") as f:
data = f.read()
enc = BPE_Tokenizer.train(data, vocab_size=4096, pat_str=gpt2_pattern)
# enc = BPE_Tokenizer.load("/home/bd4sur/ai/Nano/dataset/cl100k_base.txt")
enc.dump("/home/bd4sur/ai/Nano/dataset/bpe.txt")
inputstr = """以前(初中、小学)老师形容我们听不懂课或者神游卖呆的状态就用“鸭子听雷”,以前不懂,前几天懂了。这个说法好像分布很广"""
tokens = enc.encode(inputstr)
print(len(inputstr))
print(len(tokens))
print(tokens)
print(enc.decode(tokens))
return enc
class TrieTree:
def __init__(self, vocab):
self.root = {}
self.max_token_length = 0
self.END_CHAR = "__end__"
for word in vocab:
self.max_token_length = len(word) if len(word) > self.max_token_length else self.max_token_length
current_dict = self.root
for character in word:
current_dict = current_dict.setdefault(character, {})
current_dict[self.END_CHAR] = self.END_CHAR
def match(self, token):
current_dict = self.root
for character in token:
if character not in current_dict:
return False
current_dict = current_dict[character]
return self.END_CHAR in current_dict
def tokenize(self, text):
tokens = []
while len(text) > 0:
for n in range(self.max_token_length, 0, -1):
prefix = text[:n]
if n == 1 or self.match(prefix) == True:
tokens.append(prefix)
text = text[n:]
break
return tokens
class Tokenizer:
def __init__(self, special_tokens=None):
# self.bpe_tokenizer = BPE_Tokenizer.load(os.path.join(os.path.dirname(__file__), 'dataset/cl100k_base.txt'))
# self.bpe_tokenizer = tiktoken.get_encoding("cl100k_base")
self.config = None
self.stoi = {}
self.itos = []
self.vocab_size = 0 # self.bpe_tokenizer.vocab_size
self.special_tokens = special_tokens if special_tokens is not None else {
"<|padding|>": 0,
"<|unknown|>": 1,
"<|bos|>": 2,
"<|eos|>": 3,
"<|instruct_mark|>": 4,
"<|response_mark|>": 5,
"<|BD4SUR|>": 6
}
self.trie = None
def _build(self, tokens):
# 为特殊词元预留位置
itos = [0] * (len(self.special_tokens))
for i,c in enumerate(self.special_tokens):
itos[i] = c
itos = itos + sorted(tokens)
self.vocab_size = len(itos)
self.itos = itos
self.stoi = { ch:i for i,ch in enumerate(itos) }
self.trie = TrieTree(self.itos)
self.config = {
"vocab_size": self.vocab_size,
"stoi": self.stoi,
"itos": self.itos,
"special_tokens": self.special_tokens
}
# encoder: take a string, output a list of integers
def encode(self, text):
tlist = self.trie.tokenize(text)
idlist = []
for c in tlist:
if c in self.stoi:
idlist.append(self.stoi[c])
else:
idlist.append(self.special_tokens["<|unknown|>"])
return idlist
# decoder: take a list of integers, output a string
def decode(self, token_list):
# return self.bpe_tokenizer.decode(token_list)
return ''.join([self.itos[i] for i in token_list])
def load_from_config_file(self, config_path):
# self.bpe_tokenizer = BPE_Tokenizer.load(config_path)
with open(config_path, "r", encoding="utf-8") as f:
config = json.load(f)
self.config = config
self.vocab_size = config["vocab_size"]
self.stoi = config["stoi"]
self.itos = config["itos"]
self.special_tokens = config["special_tokens"]
self.trie = TrieTree(self.itos)
def load_from_config_dict(self, config_dict):
self.config = config_dict
self.vocab_size = config_dict["vocab_size"]
self.stoi = config_dict["stoi"]
self.itos = config_dict["itos"]
self.special_tokens = config_dict["special_tokens"]
self.trie = TrieTree(self.itos)
def dump_config_file(self, config_path):
with open(config_path, 'w') as f:
json.dump(self.config, f)
def build_32768(self, config_path):
# 为Unicode字符预留位置
unicode_range = [
[0x0000, 0x04ff], # 基本字符
[0x2000, 0x2bff], # 标点、符号、图形(包括部分emoji)
[0x3000, 0x312f], # 假名、注音符号
[0x4e00, 0x9fff], # CJK统一汉字
[0xff00, 0xffff], # 全角字母数字
# [0x1d400, 0x1d7ff], # 变体字母数字
[0x1d7e2, 0x1d7ff], # 变体字母数字
# [0x1f100, 0x1f1ff], # 带圈字母数字补充
[0x1f300, 0x1f9ff] # 大部分emoji
]
unicode_charset = []
for r in unicode_range:
for c in range(r[0], r[1]+1):
unicode_charset.append(chr(c))
tokens = EN_PRESET_TOKENS + unicode_charset
self._build(tokens)
with open(config_path, 'w') as f:
json.dump(self.config, f, ensure_ascii=True)
def build_16384(self, config_path):
unicode_range = [
[0x0000, 0x04ff], # 基本字符
[0x2000, 0x20bf], # 部分标点、符号、图形(包括部分emoji)
[0x2100, 0x210f], # 部分标点、符号、图形(包括部分emoji)
[0x2190, 0x21ff], # 部分标点、符号、图形(包括部分emoji)
[0x2200, 0x2211], # 部分标点、符号、图形(包括部分emoji)
[0x2460, 0x2473], # 部分标点、符号、图形(包括部分emoji)
[0x3000, 0x312f], # 假名、注音符号
[0xff00, 0xffff], # 全角字母数字
]
unicode_charset = []
for r in unicode_range:
for c in range(r[0], r[1]+1):
unicode_charset.append(chr(c))
tokens = sorted(list(set(GB_CHARSET + EN_PRESET_TOKENS + unicode_charset)))
self._build(tokens)
with open(config_path, 'w') as f:
json.dump(self.config, f, ensure_ascii=True)
# 根据已有文本建立编码器,并保存到配置文件
def build_from_text(self, text, config_path):
charset = sorted(list(set(text)))
self._build(charset)
with open(config_path, 'w') as f:
json.dump(self.config, f)
# 根据文件内容建立编码器
def build_from_files(self, text_path_list, config_path):
def read_chunk(filepath, chunk_size=65536):
with open(filepath, mode="r", encoding="utf-8") as f:
while True:
chunk = f.read(chunk_size)
if not chunk:
return
yield chunk
charset = set({})
chunk_size = 100000
for textpath in text_path_list:
print(f"Processing `{textpath}`")
print(f" Calculating character number ... ", end="")
with os.popen(f"wc -m {textpath}") as f:
res = f.readlines()[0]
char_num = int(res.split(" ")[0])
print(f"{char_num:,}")
print(f" Collecting all unique Unicode characters in `{textpath}` ... ")
text_iterator = read_chunk(textpath, chunk_size=chunk_size)
for chunk in tqdm(text_iterator, total=int(char_num/chunk_size)):
charset = charset.union(set(chunk))
self._build(charset)
with open(config_path, 'w') as f:
json.dump(self.config, f, ensure_ascii=True)
if __name__ == "__main__":
# train_simple_encoding()
tokenizer = Tokenizer()
# tokenizer.build_32768(f"tokenizer_32768.json")
tokenizer.build_16384(f"tokenizer_16384.json")
print(f"VocabSize = {tokenizer.vocab_size}")
input_text = "人类(包括BD4SUR的操作员)的<|unknown|>本质是<|response_mark|>复读机!<|eos|><|padding|><|padding|>\nFour score and seven years ago our fathers brought forth on this continent, a new nation, conceived in Liberty, and dedicated to the proposition that all men are created equal ... that this nation, under God, shall have a new birth of freedom—and that government of the people, by the people, for the people, shall not perish from the earth. \n《现代汉语常用词表》是中国国家语言文字工作委员会组织的一个研制项目,项目于1998年7月启动,目的是推广规范汉字,帮助国内的语文教育和研究。是已经公布的《现代汉语常用字表》等配套规范。目前最新的版本为2021年8月出版的第二版。《现代汉语常用词表(第2版)》由李行健和苏新春主编,是根据《现代汉语常用词表(草案)》为基础的修订版,书中收录56790个常用词语。增加了《草稿》漏收的词语1050个,包括暴走、充电宝等。删掉原版220个陈旧、冷僻、罕用的词语,如本市、秀拔等。修改了部分词语的读音和词形,如“下工夫”改为“下功夫”等。该版本厦门大学人文学院部分博士生参与到修订工作中。"
ids = tokenizer.encode(input_text)
output_text = tokenizer.decode(ids)
print(f"是否无损?{input_text == output_text}")
# print(ids)
print(output_text)
print(f"压缩率 = {len(ids) / len(output_text)}")