温馨提示:本文翻译自stackoverflow.com,查看原文请点击:python - downloading error using nltk.download()
nltk python python-2.7 spyder ubuntu

python - 使用nltk.download()下载错误

发布于 2020-04-08 00:15:01

我正在尝试使用Python的NLTK包。我尝试使用下载NLTK nltk.download()我收到这种错误消息。如何解决这个问题呢?谢谢。

我使用的系统是在VMware下安装的Ubuntu。IDE是Spyder。

在此处输入图片说明

使用后nltk.download('all'),它可以下载一些软件包,但是下载时会收到错误消息oanc_masc

在此处输入图片说明

查看更多

提问者
user288609
被浏览
152
alvas 2017-07-28 00:08

要下载特定的数据集/模型,请使用nltk.download()函数,例如,如果您要下载punkt句子标记器,请使用:

$ python3
>>> import nltk
>>> nltk.download('punkt')

如果不确定所需的数据/模型,则可以使用以下数据和模型的基本列表开始:

>>> import nltk
>>> nltk.download('popular')

它将下载“流行”资源列表。

确保您拥有最新版本,NLTK因为它总是在不断改进并不断维护:

$ pip install --upgrade nltk

已编辑

如果有人避免nltkhttps://stackoverflow.com/a/38135306/610569上从下载较大的数据集而避免错误

$ rm /Users/<your_username>/nltk_data/corpora/panlex_lite.zip
$ rm -r /Users/<your_username>/nltk_data/corpora/panlex_lite
$ python

>>> import nltk
>>> dler = nltk.downloader.Downloader()
>>> dler._update_index()
>>> dler._status_cache['panlex_lite'] = 'installed' # Trick the index to treat panlex_lite as it's already installed.
>>> dler.download('popular')

如果有人要查找nltk_data目录,请参阅https://stackoverflow.com/a/36383314/610569

并配置nltk_data路径,请参见https://stackoverflow.com/a/22987374/610569