我是linux的初学者。您能帮我如何将html页面转换为文本文件吗?该文本文件将从网页中删除所有图像和链接。我只想使用bash命令,而不要使用html到文本转换工具。举例来说,我想将Google搜索结果的第一页转换为“计算机”。
谢谢
查看更多
我使用python-boilerpipe,到目前为止效果很好。