其他 - 如何在Python中使用ElementTree通过RDF解析XML文档？

发布于 2020-04-20 15:59:42

我有xml这样的：

<?xml version="1.0" encoding="utf-8"?>
<rdf:RDF xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#" xmlns="http://purl.org/rss/1.0/" xmlns:dc="http://purl.org/dc/elements/1.1/">
 <channel rdf:about="https://pracujwit.pl/rss/all/">
  <description>Najnowsze oferty</description>
  <link>https://pracujwit.pl/</link>
  <title>Pracuj w IT</title>
  <dc:date>05-02-2020</dc:date>
  <items>
   <rdf:Seq>
    <rdf:li rdf:resource="https://pracujwit.pl/job/192829/bi-consultant-at-primaris/"/>
    <rdf:li rdf:resource="https://pracujwit.pl/job/192827/senior-python-developer-100-zdalnie-at-newperspective/"/>
    <rdf:li rdf:resource="https://pracujwit.pl/job/192826/kierownik-projektu-it-at-comarch-sa/"/>
   </rdf:Seq>
  </items>
 </channel>
 <item rdf:about="https://pracujwit.pl/job/192829/bi-consultant-at-primaris/">
  <description><![CDATA[<strong>Lokalizacja:</strong> Warszawa<br /><strong>Firma:</strong> Primaris<br /><strong>Oferta:</strong><br /><br /><br /><a href="https://pracujwit.pl/job/192829//">Aplikuj online</a><br />]]></description>
  <link>https://pracujwit.pl/job/192829/bi-consultant-at-primaris/</link>
  <title><![CDATA[BI Consultant]]></title>
  <company><![CDATA[Primaris]]></company>
  <location><![CDATA[Warszawa]]></location>
  <dc:date>2020-02-04 15:12:32</dc:date>
 </item>
 <item rdf:about="https://pracujwit.pl/job/192827/senior-python-developer-100-zdalnie-at-newperspective/">
  <description><![CDATA[<strong>Lokalizacja:</strong> <br /><strong>Firma:</strong> NewPerspective <br /><strong>Oferta:</strong><br /><br /><br /><a href="https://pracujwit.pl/job/192827//">Aplikuj online</a><br />]]></description>
  <link>https://pracujwit.pl/job/192827/senior-python-developer-100-zdalnie-at-newperspective/</link>
  <title><![CDATA[Senior Python Developer / 100% zdalnie]]></title>
  <company><![CDATA[NewPerspective ]]></company>
  <location><![CDATA[]]></location>
  <dc:date>2020-02-04 11:45:34</dc:date>
 </item>
 <item rdf:about="https://pracujwit.pl/job/192826/kierownik-projektu-it-at-comarch-sa/">
  <description><![CDATA[<strong>Lokalizacja:</strong> Kraków<br /><strong>Firma:</strong> Comarch SA<br /><strong>Oferta:</strong><br /><br /><br /><a href="https://pracujwit.pl/job/192826//">Aplikuj online</a><br />]]></description>
  <link>https://pracujwit.pl/job/192826/kierownik-projektu-it-at-comarch-sa/</link>
  <title><![CDATA[Kierownik Projektu IT]]></title>
  <company><![CDATA[Comarch SA]]></company>
  <location><![CDATA[Kraków]]></location>
  <dc:date>2020-02-04 09:33:05</dc:date>
 </item>
</rdf:RDF>

我将其保存到文件“ xml_rdf.txt”。我通常将解析器编码为XML，如下所示：

import xml.etree.ElementTree as ET

path = 'path/to/xml_rdf.txt'
xml_tree = ET.parse(path/to/xml_rdf.txt)

for item in xml_tree.iter('item'):
    print(item)

但是在这种情况下，我没有任何物品。我知道在XML解析器上指定名称空间的方法，但是在这种情况下，我遇到了问题。我尝试……

ns = {"dcterms": "http://purl.org/rss/1.0/"}
for item in xml_tree.iter('dcterms:item'):
    print(item)

但同一个故事，没有项目。

有人知道如何处理吗？

提问者

Bob

被浏览

查看英文版

查看原文

其他 - 如何在Python中使用ElementTree通过RDF解析XML文档？

热门帖子

相关问题

热门github