我正在尝试使用Python的NLTK包。我尝试使用下载NLTK nltk.download()
。我收到这种错误消息。如何解决这个问题呢?谢谢。
我使用的系统是在VMware下安装的Ubuntu。IDE是Spyder。
使用后nltk.download('all')
,它可以下载一些软件包,但是下载时会收到错误消息oanc_masc
要下载特定的数据集/模型,请使用nltk.download()
函数,例如,如果您要下载punkt
句子标记器,请使用:
$ python3
>>> import nltk
>>> nltk.download('punkt')
如果不确定所需的数据/模型,则可以使用以下数据和模型的基本列表开始:
>>> import nltk
>>> nltk.download('popular')
它将下载“流行”资源列表。
确保您拥有最新版本,NLTK
因为它总是在不断改进并不断维护:
$ pip install --upgrade nltk
如果有人避免nltk
从https://stackoverflow.com/a/38135306/610569上从下载较大的数据集而避免错误
$ rm /Users/<your_username>/nltk_data/corpora/panlex_lite.zip
$ rm -r /Users/<your_username>/nltk_data/corpora/panlex_lite
$ python
>>> import nltk
>>> dler = nltk.downloader.Downloader()
>>> dler._update_index()
>>> dler._status_cache['panlex_lite'] = 'installed' # Trick the index to treat panlex_lite as it's already installed.
>>> dler.download('popular')
如果有人要查找nltk_data
目录,请参阅https://stackoverflow.com/a/36383314/610569
并配置nltk_data
路径,请参见https://stackoverflow.com/a/22987374/610569
谢谢回复。我尝试了nltk.download('all'),它成功地下载了一些软件包,但是在下载与oasc_masc相关的某件事时卡住了,我在原始文章中包含了相关的屏幕截图。
您的nltk是什么版本?这在您的终端上的输出是什么
python -c "import nltk; print nltk.__version__"
?嗨,@ alvas,我在Ubuntu上使用nltk.download('all')时遇到类似的问题,除了我收到HTTP错误404:在IDLE和命令行中均未找到。我的NLTK版本是2.0b9。您有什么想法吗?
@Joansy,请更新您的NLTK。
sudo pip install nltk
或sudo apt-get install python-nltk
。更新后,问题应自行解决。否则,您将不得不手动设置URL。尝试先更新NLTK,如果它不起作用,然后再次返回=)