Ideone.com

fork download

copy

from lxml.html import fromstring
 
html = '''
<html>
 
<head>
  <title>TEST</title>
</head>
 
<body>
  <h1>Test tzw. <em>tag soup</em></h1>
  <p>Przykładowy paragraf. (brak /p)
  <ul>
    <li>Pierwszy wpis(brak /li)
    <li>Drugi <em>wpis</em></li>
    <li>Wiecej wpisow 1</li>
    <li>Wiecej wpisow 2</li>
    <li>Wiecej wpisow 3(brak /li)
    <li>Wiecej wpisow 4</li>
  </ul>
 
  <ol>
    <li>AA(brak /li)
    <li>BB <em>em</em></li>
    <li>CC</li>
    <li>DD</li>
    <li>EE(brak /li)
    <li>FF</li>
  </ol>
</body>
 
</html>
'''
 
h = fromstring(html)
 
print 'Szukamy elemntow listy numerowanej'
print 'Bez normalizacji:'
for e in h.xpath('//ol/li'):
	print '[[' + e.text_content() + ']]'
 
print 'Z normalizacja:'
for e in h.xpath('//ol/li'):
	print '[[' + e.xpath('normalize-space()') + ']]'

Success #stdin #stdout 0.12s 14256KB

stdin

copy

Standard input is empty

stdout

copy

Szukamy elemntow listy numerowanej
Bez normalizacji:
[[AA(brak /li)
    ]]
[[BB em]]
[[CC]]
[[DD]]
[[EE(brak /li)
    ]]
[[FF]]
Z normalizacja:
[[AA(brak /li)]]
[[BB em]]
[[CC]]
[[DD]]
[[EE(brak /li)]]
[[FF]]

https://ideone.com/eTXx5v

language:

Python (cpython 2.7.16)

created:

visibility:

secret

Share or Embed source code

Discover > Sphere Engine API

The brand new service which powers Ideone!

Discover > IDE Widget

Widget for compiling and running the source code in a web browser!

Discover > Sphere Engine API

Discover > IDE Widget

Choose your language