README.md
README.md
1.GoogleBooksNgramViewer:http://storage.googleapis.com/books/ngrams/books/datasetsv2.html
2.旧版知网义原语料库:http://download.csdn.net/detail/firparks/9814417
第二部分:构建语义级查错模块,其主要是利用知网义原语料库进行动词名词抽取,并判断义项是否存在义原搭配关系,给出待纠错的位置;
第三部分:构建web访问模块,其中主要是利用web.py框架进行设计。
1.下载:
wget https://codeload.github.com/xuepeilei/Bisem/zip/master
2.解压:
unzip Bisem-master.zip -d ~/
3.切换到执行目录:
cd ~/Bisem/code/
4.设置Python环境变量:
export PYTHONPATH=$PYTHONPATH:~/Bisem/code/
5.创建数据库文件(请替换"mysql_password"为你的MYSQL数据库的密码)并输出日志到~/Bisem/log/bisem.log文件:
nohup python createDB.py mysql_password > ../log/bisem.log 2>&1 &
6.漫长的等待(1核2G跑1.5h)
7.更改程序中数据库连接文件(替换用户名&密码):
vim ./DB/com.py
8.运行web服务器:
nohup python runServer.py >> ../log/bisem.log 2>&1 &
9.访问页面:
在浏览器内输入:http://服务器IP:8080
另:
错误1:ModuleNotFoundError: No module named 'xxx'
解决1:export PYTHONPATH=$PYTHONPATH:~/Bisem/code/
注:
程序中使用的python版本为python2.7
程序中使用的第三方包(如果本地没有,请使用pip安装):jieba pymysql web.py
程序中两个重要文件的位置:~/Bisem/code/createDB.py ~/Bisem/code/runServer.py
错误语句:那个男人戴着帽子和鞋子出门了
查错语句:那个男人 "戴" 着帽子和 "鞋子出门" 了