HTMLのタグを取り除く

作るの面倒だな、どこかにあるだろうなあ、と探してみるとこういうのが見つかった。

http://svn.gaplan.org/gaplan/trunk/wepylog/tools.py

この中のstriptagで解決。感謝。

追記:2008.2.7

久しぶりに探してみると、サイト自体がなくなっている。こっちで代用。 http://www.zope.org/Members/chrisw/StripOGram

追記:2009.10.7

最近は、BeautifulSoupとかlxmlを使うのが良さそう。

http://www.ghastlyfop.com/blog/2008/12/strip-html-tags-from-string-python.htmlより

from BeautifulSoup import BeautifulSoup
''.join(BeautifulSoup(page).findAll(text=True))

質問者もコメントしている人もオーバーヘッドが気に入らないっていってるけれど、僕の使い方では問題なし。

Related posts:

  1. WebFaction blog / Control panel demo

コメントを残す

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です

*

次のHTML タグと属性が使えます: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <strike> <strong>