Skip to content

Latest commit

 

History

History
49 lines (46 loc) · 2.07 KB

README.md

File metadata and controls

49 lines (46 loc) · 2.07 KB

Bisem中文语义查错系统

简介:

第一部分:构建语义语料库,其中包含了构建名词动词搭配语料库和构建知网义原语料库;数据来源:
1.GoogleBooksNgramViewer:http://storage.googleapis.com/books/ngrams/books/datasetsv2.html
2.旧版知网义原语料库:http://download.csdn.net/detail/firparks/9814417
第二部分:构建语义级查错模块,其主要是利用知网义原语料库进行动词名词抽取,并判断义项是否存在义原搭配关系,给出待纠错的位置;
第三部分:构建web访问模块,其中主要是利用web.py框架进行设计。

部署流程

1.下载:
wget https://codeload.github.com/xuepeilei/Bisem/zip/master

2.解压:
unzip Bisem-master.zip -d ~/

3.切换到执行目录:
cd ~/Bisem/code/

4.设置Python环境变量:
export PYTHONPATH=$PYTHONPATH:~/Bisem/code/

5.创建数据库文件(请替换"mysql_password"为你的MYSQL数据库的密码)并输出日志到~/Bisem/log/bisem.log文件:
nohup python createDB.py mysql_password > ../log/bisem.log 2>&1 &

6.漫长的等待(1核2G跑1.5h)

7.更改程序中数据库连接文件(替换用户名&密码):
vim ./DB/com.py

8.运行web服务器:
nohup python runServer.py >> ../log/bisem.log 2>&1 &

9.访问页面:
在浏览器内输入:http://服务器IP:8080

另:
错误1:ModuleNotFoundError: No module named 'xxx'
解决1:export PYTHONPATH=$PYTHONPATH:~/Bisem/code/

注:
程序中使用的python版本为python2.7
程序中使用的第三方包(如果本地没有,请使用pip安装):jieba pymysql web.py
程序中两个重要文件的位置:~/Bisem/code/createDB.py ~/Bisem/code/runServer.py

测试用例

错误语句:那个男人戴着帽子和鞋子出门了
查错语句:那个男人 "戴" 着帽子和 "鞋子出门" 了